2020年12月28日月曜日

尤度原理の是非は自明ではないし、プラグマティストの統計学ユーザーにとっては実益が無い議論

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

統計学を専門としない数学者が、尤度原理はトンデモで、それを教えるのもトンデモと言い出している。すっかり頑固な頻度主義者といった趣きで、勢いあまって尤度原理に従っている統計手法はトンデモとまで言っている気がするのはさておき、「主義にこだわるより、適切な数学的法則を…」と言っていた人が、統計的推測が持つべき性質を考える統計哲学、主義の論争にに踏み込んで来たのは興味深い。しかし、無理に尤度原理を否定しようという試みに、実益はない。

1. 尤度原理の是非は容易には論証できない

尤度原理は、雑に言えば、観測データに含まれるパラメーターのすべての情報は尤度関数から得られると言う命題*1。弱い尤度原理と強い尤度原理の2種類があって、2つの尤度関数に定数倍の違いしかなければ、統計的推論は同じにならなければいけないと言う強い尤度原理が批判されている。強い尤度原理は、Birnbaumの定義したバージョンの十分原理と弱い条件付け原理から導出される定理なわけで数学的には正しい*2わけだが、直感的に受け入れ難い事例がある。

例として最尤法を考えよう。成功確率をpとして、二項分布になる12回試行で3回成功の尤度₁₂C₃p³(1-p)⁹と、負の二項分布になる3回成功するまで12回試行の尤度₁₁C₂p²(1-p)⁹pの停止規則が異なる2つの尤度は、定数倍違うだけなので、成功確率pの最尤推定量(ベイズ推定であれば事後分布)は同じだ。一方、標本と母集団の期待値が同じである最小分散不偏推定量はそれぞれ3/12と2/11で異なる。最尤法は不偏推定とは限らない。

強い尤度原理はトンデモと高らかに宣言したくなるが、今日の時点では十分原理と弱い条件付け原理から導出される命題なので、十分原理か弱い条件付け原理がおかしいかを検討しないといけない。十分原理は、仮定している分布のデータから推定されるパラメーター*3が、十分統計量の定義から十分統計量で決まっているような話で、トートロジー的に隙が無い。弱い条件付け原理も、実施される確率はあったが実際には実施されなかった実験を考慮しない推定と、考慮した推定の結果が同じでなければならないと言う話で、少なくとも直観的には否定し難い要請だ。また、尤度原理に即しておけば、原理が一貫した推論を用いることができる。

強い尤度原理を受け入れるべきであろうか。上述の例では不偏推定量を否定する事になってしまう。極端なことを考えると不偏推定だからと言って望ましいとは言えない*4のだが、不偏推定量を拒絶するのは勇気がいる。こういうわけで、尤度主義の是非は容易には論証できない。

2. 統計学利用者には実益が無い議論

尤度原理にまつわる諸所の議論は、統計的推測が持つべき性質を考える統計哲学の話そのもので、興味深い。MayoがBirnbaumの証明を誤りとしたが、それはMayoとBirnbaumの定義が異なるためで、Mayoの議論の方に混乱が見られる・・・と言うような話は、哲学あるあるだ。しかし、統計学ユーザーからすれば、尤度原理は手法の性質を示す分類のようなもので、その善し悪しを考える必要はない。

あらゆる人々が常に尤度原理に従わないといけないと教えているわけではない*5と言うか、尤度原理に従わない頻度論の統計的仮説検定は絶対に使うななどとは言われていない。逆に、尤度原理に従っている統計手法を否定する必要も無い。最尤法も不偏推定量ではないが、有効推定量が存在すれば漸近的に有効だし、そう大外ししたパラメーターが推定されるわけではない。もちろん、性質は知っておく必要があるが、統計ユーザーは利用する統計手法の性質についてよく学んでいることになっている。ベイズ推定やそのための広く使える情報量規準(WAIC)のように、尤度(と事前分布の積)を積分して1に正規化した情報で成り立っている手法を全部捨てる必要は無い*6

統計哲学を議論してはいけないわけではないが、数理的に考えても決着がつかない上に、統計学者/統計哲学者の間でも明確な合意がとれない所謂「主義」の話をがんばって議論する御利益は極めて薄い。統計学利用者にとってはどんな性質を持つ分析方法を使っているか把握できていれば十分なわけで、尤度原理というか十分原理と弱い条件付け原理の是非を考えるのは実践的ではない。

*1ジョージア工科大学のレクチャーノートには「尤度原理.パラーメーターθの推論において,データxが観察されたあと,すべての関係する実験情報は観測されたxによる尤度関数の中にある.さらに,相互に比例した2つの尤度関数は,θに関して同じ情報を持つ(拙訳)」とあった。

*2Tarotan氏が議論を整理している:「もしも『十分原理』および『弱い条件付け原理』に私が従うならば,『強い尤度原理』にも私は従うことになる」ってどういう意味なの?(暫定版) - Tarotanのブログ

*3分布の特定に三次モーメントを見る必要があるので、十分統計量だけでは不十分というような話が展開されているのを見かけたが、パラメーターの推定に関しての定義である。

*4美添 (2009)「経済と統計の間で」のp.21にある例が分かりやすい。

*5通常の統計学のカリキュラムでは、まず尤度原理に従わない頻度主義の統計学を学ぶ事になる。その後、尤度原理を教わるわけだが、規範的に受け取ることは無いはずだ。

*6赤池情報量規準(AIC)も「導出の基本概念を尤度原理とKullback-Leibler情報量に置き」とされるので尤度原理に即しているはずと言うか、尤度関数で求めたパラメーターでの尤度を使って計算される。

0 コメント:

コメントを投稿