2011年12月14日水曜日

「統計学的に安全」とは言えない

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

経済学者を自称する池田信夫氏がブログのエントリー『「きっぱりはっきり」の誘惑』で、統計学への無理解を晒している。帰無仮説を棄却するか否かと言う、統計学の検定プロセスを理解していないからだ。

池田氏は、低レベル放射線被害の健康被害に関して、広島・長崎LSSデータでは「リスクが小さすぎて統計的に有意な結果が出ない」と言う正しい指摘のあとに、

自然科学では、億単位のサンプルは(分子の数など)普通にあるが、人間の社会では統計的に有意な結果を出せるサンプルはほとんどないので、計量経済学でも複数の仮説が成立してしまう。疫学も同じで、被爆者のような精度の高いサンプルでも、「微量放射線は有害だ」という仮説も「有害ではない」という仮説も棄却できない。
ともっともらしいが、統計学的に奇妙な事を言っている。統計学で厳密に危険などを示す検定の手順を認識していない。

1. 統計学では「リスク・ゼロ」の棄却を試みる

統計学では結論を出すために「検定」を行う。検定では、帰無仮説(H0)を棄却できるか否かを調べる。リスクの検定では、H0はリスクがゼロになる。H0が棄却されれば、リスクがゼロではない、つまりリスクがある事になる。H0が棄却できないときは、リスクがゼロでは無いとは言えないと言う、分かりづらい結論がもたらされる。

2. 統計学では「リスク有り」は棄却できない

H0を「リスク有り」にすれば話が分かりやすくなるが、現実的にそれはできない。「リスクがゼロ」は値が0で一つを棄却すればいいが、「リスク有り」は正の実数全てを棄却しないといけない。つまり無限の数を棄却しないといけないので、統計学では「リスク有り」は棄却できない。

3. 膨大な数の高精度のサンプルを集めても同じ

厳密な頻度主義者的なアプローチを取る限り、どんなに精度の高い膨大なサンプルを集めても、H0を棄却したら危険性は主張できるが、H0を棄却しないからと言って安全性は主張できない事は変わらない。統計的手法で無害を立証できないのは、サンプル数の問題ではなくて、統計学的検定方法に由来する問題だ。

4. リスク・ゼロだと“見なす”事はされている

実用上「リスクがゼロでは無いとは言えない」では役に立たないので、十分な精度のサンプル数が適切な分析方法で評価されている場合はリスクがゼロだと見なすか、観測されたごく僅かな大きさのリスクを正しいとして扱う事が慣例となっている。前者の例としては長崎大学山下俊一教授の解釈が、後者の例としては年間100~200mSvの被曝では野菜不足とほぼ同じリスクなどと言う表現があげられる(関連記事:年間被曝1mSv~20mSvの発がん確率は1.00064倍~1.0128倍?)。

5. 一般に学術論文では有意性無しでは何も主張できない

池田氏は「人間の社会では統計的に有意な結果を出せるサンプルはほとんどないので、計量経済学でも複数の仮説が成立」とも主張するが、これは間違っている。有意性が無ければ仮説は支持されないので、膨大な数のある計量分析を用いた実証研究では大半は有意性のある分析結果を示している。本ブログでも、だいこん需要の価格弾力性電気代の所得効果を推定したが、係数≠0を示すことが重要か否かはともかく、100に満たないサンプルだが有意性のある数字は計測できている。なお有意性の水準は差があって、素粒子物理は相当に厳しく、疫学や経済学は緩くなっている。

安全性の問題は有意性が無いことを示せないといけないので、難しい解釈問題を引き起こすわけだ。

6. 非専門家が統計学的な言い回しに苛立ちを覚えるのも当然

安全性の問題では、統計学を知る専門家が安全とは言い切れない構造的な問題がそこにある。ある程度の権威になれば、相対危険度/寄与危険度が極端に小さい場合は安全と言い切ることが許されるが、統計学の厳密な運用とは言えない。

一般の人は「安全」ではなく「リスクがゼロでは無いとは言えない」と言う表現に苛立ちを覚えているように思える。これは上述の通りテクニカルに帰無仮説に危険を設定でき無い事がもたらしていて、専門家の間でも違和感を持つ人は多い。計量経済学をかじった事のある人は、一次同時条件、単位根、H統計量などの検定で、検定結果の解釈に不透明さ感じた事があるはずだ。

7. 区間推定を行うと分かりやすくなる

この問題に特効薬は無いが、点推定ではなくて、区間推定を行う事で随分と分かりやすくなる。「リスクがゼロでは無いとは言えない」と言うよりも、99%の確率で発がん確率を-0.9~1.0%増加させると言う方が納得しやすい。同様に「リスクが有る」と言う結論でも、点推定で0.15%と言うよりも、95%信頼区間で0.1%~0.2%の寄与危険度があると言う方が、冷静に受け入れやすいであろう。

0 コメント:

コメントを投稿