2014年7月22日火曜日

単なる統計使いを少しだけ誠実にしてくれる「科学と証拠─統計の哲学入門」

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

戦後、W・エドワーズ・デミングが生産現場に品質管理の概念を持ち込み、最近はデータサイエンティストが名乗る人が大量に蓄積されたデータを分析する事が流行っているので、日本にも学術分野に限らず統計ユーザーは少なく無い。最尤法、階層ベイズ、仮説検定と言った手法が駆使されている。しかし、それらの手法は必ずしも一貫した哲学によって裏打ちされているものではない事を知らない人は多いかも知れない。

道具として統計学を用いている人々の多くは、データへの適合度など実務的な機能や性能に関心が集中し、その背景にある統計哲学には注意は払っていないように思える。しかし、日々の業務としてはそれでいいのかも知れないが、自らが用いている科学的方法論に関心が無いと言うのも不誠実であろう。そこには規範的な問題があるからだ。「科学と証拠─統計の哲学入門」は、統計と言うツールの背景にある哲学を詳しく解説した本で、統計ユーザーを少しだけ誠実にしてくれる。

1. 生物学の本の中の統計哲学の部分の抄訳

邦訳なのだが、原著Evidence and Evolution: The Logic Behind the Scienceの第1章のみを訳出した変則的な本である。訳者解説を見ると、第一章の統計哲学の部分は独立しており広い層の関心を惹きつけるであろう一方で、第二章以降は生物学に特化した内容になり読者層が限定される可能性があったので、著者の了解をとった上で抄訳としたとある。また、原著者は生物学者ではあるが、統計学における業績もあり、本書のテーマに相応しい力量があるそうだ。なお、34頁68項目の訳注がつけられており、日本語版の方がより読み込みたい人に応えるものになっている。

2. 難しくはないが、事前知識は必要

内容を見ていくと、統計哲学と言っても教科書でさっと触れられるベイズ主義(と聞きなれない尤度主義)や頻度主義を詳しく説明、比較している。具体例も豊富で、抽象的に思える数式に振り回されることもない。ただし、議論している主題は初歩的な内容ではない。ある程度の事前知識は要求されている。初学者が本書を読もうとするのかは疑問だが、統計学用語に自信が無い人は「統計学入門」と「道具としてのベイズ統計」は読んでおいた方が良いと思う。

3. ベイズ主義と頻度主義を詳しく説明・比較

前半では、ベイズ主義における事前確率がどういうものであるのか*1、事前確率が定義できない*2ときにどう考えればよいのか、有意検定や仮説検定の解釈とはどのようなものであるのか、そしてベイズ主義と頻度主義がどのような点で異なるかなどが説明されている。特に統計学や計量分析の本でベイズ主義と頻度主義の違いを延々と説明していることは少ないと思うが、本書は以下のような事例で分かりやすく解説してくれる。

第1種の誤り(偽陽性)と第2種の誤り(偽陰性)が、(0.01 0.02)と(0.001 0.902)の二つの検査方法を比較しよう。頻度主義者には前者と後者は明確に異なる。偽陰性が0.902もあったら、検査として機能しないわけだ。しかし、ベイズ(/尤度)主義には前者も後者も同じになる。尤度比{真陽性(=1-偽陰性)/偽陽性}をとると、同じになるからだ。ベイジアンは偽陰性の大きさだけで、偽陽性を参照しない事は無い。全証拠の原則が守られる。

コイン投げで(1)m回の施行で表がn回出たときと、(2)表がn回出るまで続けてm回で終わったときを比較しよう。ベイジアンは仮説(表が出る確率p)の選択に対し尤度比が同じになるので同じであると考える一方、頻度主義者は仮説検定のための二つで有意水準が変わるため(1)と(2)は異なると考える。停止規則に依存するわけだ。

有意検定や仮説検定で悩む人もそれなりいるし、前半部分の議論だけでも目を通す価値はあるであろう。後半では、モデル選択理論として赤池情報量規準(AIC)を中心に議論が進み、やや実用的な側面が増してくる。ベイズ情報量基準(BIC)の違いも示されるが、AICの特性もあってベイズ主義者と頻度主義者の相違を議論すると言う風でもないが、多くの分野の統計ユーザーがAICを利用していることを考えると、必要な議論なのかも知れない。ただし最後の章は、ベイジアンと頻度主義者のアプローチの違いの実例に戻る。

まとめると本書は、統計手法の本でも統計理論の本でもなく、ベイズ/尤度主義と頻度主義のそれぞれの統計哲学とその相違を説明した本になる。

4. 最低限の統計哲学に触れることができる

やや偏見のある言い方だが、道具として統計学を用いている人々は、ベイジアンや頻度主義者の哲学的議論に注意を払っていない事が多いと思う。科学的方法として統計学を用いているのに、規範的な側面には注意を払っていないわけだ。これは目的に対して必要十分な姿勢とも言えるのだが、不誠実な統計学の利用態度とも言えるであろう。場合によってはベイジアン的なアプローチで分析しているはずなのに、頻度主義者的な手法を混ぜてしまい、哲学的に混乱したことをしてしまうかも知れない。しかし、本書を読めば最低限の統計哲学に触れることはできるので、多少の誠実さを身に付けることができると思う。自分がやっている事がどちらのアプローチになるのかは、認識できるようになるはずだ。少なくとも安易に「俺ベイジアン」と言うのが危険な事が分かると思う。沈黙は金(´・ω・`)

*1コイン投げによるラプラスの継起の規則は、ベイズ主義が求める事前確率の特性を平易に理解させてくれる。事前確率は必ず存在する必要があり、導き出される事後確率が正しい期待値に収束していくが、最も高い尤度の事後確率を導出するわけではない。

*2事前確率の客観的基礎を欠いておりストレート規則が妥当な場合は、確率の公理に従ういかなる事前分布も存在しないことになり、ベイジアンの方法は困難になる。

0 コメント:

コメントを投稿