2016年8月6日土曜日

統計的仮説検定の基礎が身につく「サンプルサイズの決め方」

このエントリーをはてなブックマークに追加
Pocket

現在、第二次統計学ブームの最中と言って過言ではないと思う。第一統計学ブームは、戦後、進駐軍がデミングを招いて製造業に統計的な品質管理手法を広めた頃で*1、今はサービス業などでも統計的な分析の利用が一般化しつつあるようだ*2。目新しいモノが好かれるのでベイジアンが言及される事が多いのだが、階層ベイズのような煩雑なモノを使う必要も無く、従来型の、つまり頻度主義的なアプローチで間に合うことは多い。しかし、頻度主義者の基本は統計的検定となるわけだが、そこを十分に理解している人は、意外に少ないかも知れない。学部の統計学の教科書でも、仮説検定に割り当てているページ数はそう多くはない*3

仮説検定は基本であると同時に、中心的問題であり続ける。生命科学などのラボ内の実験など処置群と比較群を単純に比較すれば済む場合などは、平均や分散の差の検定以上の小難しい統計手法など必要なかったりすることも多い。そして、複雑な事象を分析するために重回帰分析などを用いても、推定値にt検定なりをかけ無いと解釈できないので、使わないことは無い。

この仮説検定、統計解析パッケージが自動でやってくれるので、知識があやふやでも何か数字は出せるのだが、サンプルサイズが小さすぎるといった誤った利用が無いわけではない。第一種と第二種の過誤について、すぐ混乱してしまうのは私だけでは無いはずだ。検出力に至っては、自分で計算してみた記憶が無い*4。ある分析をするのに必要な観測数はどれぐらいにすべきかと言った、計画立案に必要な情報を計算し、それをしっかり説明できるかと言うと、心もとない所は少なからずある。

そんな人にぴったりの教材があった。「サンプルサイズの決め方」と言う名称の通り、観測数と第一種と第二種の過誤の話が中心なのだが、前段として、二種類の過誤と有意水準と検出力がどういうものかを説明し、確率分布の基本的事項を確認した上で、基本的な検定方法の詳しい説明がされている。大抵の統計解析では、この本で説明されているt検定とF検定で間に合うと思う。分析手法によっては、ちょっと聞きなれない分布を仮定した上で検定を行う必要があったりするが、そういうモノもt検定やF検定の手続きにならっているものだ。この本で、t検定とF検定に習熟しておいて損は無いであろう。なお、微分積分の知識があれば読むことができ、線形代数の知識は求められない。また、章末問題と解答がついているので、理解を深めやすい。第3章以降は検定パターンにあわせて説明がされているので、全部を精読する必要も無いであろう。統計ユーザー向きのテキストになっている。

経済データのように取得するサンプルサイズは決まっているモノを扱い、かつ高度な計量手法を使いたいといった人は、ここにあまり学習時間を費やす気にはなれないかも知れないが、実験やアンケート調査の計画を立てる人は、費用見積もりの観点からこういう話は大事だと思う。自分で実験や調査などをしない人でも、この世には胡散臭い実験や調査は溢れているので、こういう話を知っておく方が良いであろう。サンプルサイズ、もしくはその中のサブサンプルサイズが小さすぎるような事は、そこそこある。逆に、サンプルが小さすぎると言う批判を検討したら、ギリギリ十分な観測数になっており、批判が不適当と言うこともある。実際のところ機械的に求まる数字なのではあるけれども、一度は学んでおかないと、なかなか上手く運用は出来ないと言うことなのであろう。

*1同時期に社会調査においても知識が大きく刷新された(関連記事:世論調査とは何だろうか ─ 斜めに見るとバイアスに悩まされるもの)。

*2あなたの勤務先はそうでなくても、わざわざ申告しなくても良い。

*3学部で使う代表的な教科書だと思われる「統計学入門」でも第12章で20ページ割いているに過ぎない。

*4分野ごとに利用される有意水準がだいたい決まっていて、選択肢が無いのでこうなる。しかし、第2種の誤り、つまり偽陰性が発生する確率に注意を払っていないので、大雑把過ぎると思う人もいるであろう。帰無仮説が棄却されなかったと言う説明は誤りではないのだが、どれぐらいの確率で偶然そうなってしまうのかは把握しておくべきかも知れない。

0 コメント:

コメントを投稿