2022年9月29日木曜日

p値の大小からももちろん、統計的有意性の強弱を言うのをそもそもやめましょう

このエントリーをはてなブックマークに追加
Pocket

エーザイの内藤晴夫代表執行役CEOが、アルツハイマー病治療薬の治験で「主要評価項目に据えた「投与開始から18か月時点のCDR-SB」は、p値が「0.00005」となり、「私も長い間この仕事に携わっているが、このようなp値を見たのは初めて。非常に高い統計学的有意性と言えると思う」と有用性を強調した」事で*1、SNSの統計学クラスターがざわついている。

10%,5%,1%有意を、それぞれ*,**,***とアスタリスクの数で3段階に分けて推定結果の表に同時に記入する慣習からかこういう事はいいがちで、私もどこかで言ってしまっている気もするのだが、厳密には誤りだ。p値は統計学的仮説検定で用いる概念だが、統計的有意性は棄却域を下回るか上回るか、あるかないかだけなので、p値は統計的有意性の強弱を示す値ではない*2。主要評価項目の他、副次評価項目でも統計的有意性が確認されているわけだし、「今まで見たことが無いぐらい、はっきり有効性が示された。」と曖昧なことを言っておけば良かった。

ところで、近年、アルツハイマー病の原因が本当にアミロイドβなのか疑われていることもあり*3、この抗アミドイドβ薬の治験の結果は驚きがある。主要評価項目の臨床的認知症重症度判定尺度(Clinical Dementia Rating Sum of Boxes:CDR-SB; 0,0.5,1,2,3の5段階評価)での軽度認知症患者が悪化する率を27%抑制できたことが臨床的にどういう意味を持つか、臨床現場の医師に解説して欲しい。

*1エーザイ・内藤CEO 早期ADでレカネマブのP3が主要評価項目達成「このようなP値見たのは初めて!」 | ニュース | ミクスOnline

*2帰無仮説が真だと仮定したときに、推定量かより極端な効果量が推定される相対頻度の意味の確率がp値である。また、推定された効果量が大きくても、標本標準偏差が小さくても、サンプルサイズが大きくてもp値は小さくなるので、効果量や有用性とは異なる概念。

p値のよくある誤用についてはオープンアクセスの解説論文がある:Greenland, Senn, Rothman et al. (2016) "Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations," Eur J Epidemiol, Vol.31(4), pp.337-50

*3「アルツハイマー病は脳疾患ではないかもしれない」との仮説|ニューズウィーク日本版 オフィシャルサイト

0 コメント:

コメントを投稿