リスク分析のプロの林岳彦氏が「なぜリスク分析のプロは仮説検定を使わないのか(ややマニア向け)」と言うエントリーをあげており、一つの方法としてブートストラップ法で平均値の推定値の分布を求めておき、それを元に金勘定と言うリスク計算を行うことを紹介している。楽しく拝読させて頂いたのだが、色々と疑問が沸いてきたので列挙してみたい。
1. ブートストラップ法やベイズ法を前提におく必要はあるのか?
内容は勉強になるのだが、ブートストラップ法もベイズ法も本質的には関係ないような気がする。母平均によって収益が変化すると仮定して、推定量の分布から期待収益を求めているのだが、標準誤差が出れば推定量の分布が出るので、古典的な統計学の範囲でも計算はできる。大半のケースでt分布を頭から仮定してしまう古典的な手法と異なり、推定量の分布に対して仮定を置かなくて済むことが利点なのだと思うが、そういう説明が欲しいところ。
2. 有意性検定でも効果量は評価しているのではないか?
さて、林氏はエントリーのリンク先で「リスク評価においては有意性検定は極めて有害なので即刻追放すべし」と主張していて、こちらも話として面白い。しかし、その理由の一つとして『(2)「効果の大きさ」に関する議論が抜け落ちてしまう』と言うのがあるのだが、これは少し誤解を招きそうだ。例えばt検定に使うt値の分子は[標本平均値]-[帰無仮説の値]、つまり「効果の大きさ」となっており、効果の大きさは評価されている。
3. 有意性が無い微小な効果量を評価していいのか?
もちろん効果量が評価されるといっても、標本分散との相対的なものだ。統計的に有意であっても、その効果量が小さすぎて実利的な意味が無いと言うケースは多々ある。しかし、その逆を気にするべきかが良く分からない。観測数が何万、何十万もあって標本分散が小さくなっているのに有意性が出ないケースでは、「効果の大きさ」が小さすぎることを意味する。推定統計量の分布が左右に伸びきっているときに、僅かな平均値をもとに議論を展開していいのであろうか*1
4. 推定量の分布の尖度は評価しなくていいのか?
左右に伸びきった推定量の分布からリスク計算を行う事は、リスクを評価を過大にミス・リーディングしたりしないであろうか。xを推定量とし、f(x)をその確率密度関数、g(x)を実害を表す関数とすると、∫g(x)f(x)dxがリスクとして計算される。g(x)がxに比例するときに、この計算結果だけを見てしまうと、分布の尖度は評価されない。効果があるのか無いのかはっきりしない場合も、あるのがはっきりしている場合も、同じだけのリスクと評価しうることになる。
5. まとめ
リスク分析の分野で統計的検定を使わないことに異論があるわけではないが、分布をそのまま扱うことが、分布にある情報を全て織り込んだ判断を下せるという事ではない。リスク分析のプロの皆様が、それをどう考えているのかは気になった。とりあえず黙って「入門リスク分析―基礎から実践」を読めという事な気もするが、後で思い出すようにメモしておきたい。メモしたことに安心して忘れ去りそうだけれども。
0 コメント:
コメントを投稿