2018年3月19日月曜日

理工系のラボで使われている統計学的仮説検定

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

日本農芸化学会の学会誌「化学と生物」に連載された「統計検定を理解せずに使っている人のために」が人気になっていた。理工系の研究室で使われている統計学的仮説検定を正しく使うために解説するもので、分散と不偏分散の違いぐらいから、パラトリック検定とノンパラメトリック検定、多重比較の適切な運用方法まで解説されている。頻度主義者の見解で*1、細かい所が気にならなくも無いのだが*2、平均的な理工系がどんな統計をどんな風に使っているのかが分かるようになっている。

文系だと正規分布を導出し、χ二乗分布を導出し、t分布を導出し・・・と言うような、順序だった学習は、基礎学力的に厳しいところがある。正規分布の導出に微分方程式の他、ガウス積分が使われるし、χ二乗分布の導出もガンマ関数の知識や積分の変数変換が必要になったりする。これらは学部の一般教養の微積分のテキストの一番最後まで行けば何とか間に合うが、モーメント母関数の異なる確率密度関数のモーメント母関数は異なると言う性質を証明するにはラプラス変換の知識が要る。モーメント母関数が使えないと、中心極限定理の説明ができない。統計学を学ぶ前に、大学を卒業してしまいそうだ。大学院ではともかく、学部では導出を説明せず実践に走る傾向があるので、大数の法則と中心極限定理を取り違えるような間違いが多発する。

理工系だと無問題かと言うと、そうもいかない。やはり他に覚える事が多いのであろう。「ダメな統計学」でも色々と指摘されているのではあるが、やはり「impact factorの高いジャーナルの論文でも,これでよいのかと思われるような統計検定法が見受けられる」と言い切っており、必ずしも適切に統計が運用されていないことが分かる。日本呼吸器学会が声明*3で加熱式たばこも燃焼式と同様に有害物質を出す根拠として参照していた論文が、観測回数が加熱式4・燃焼式1で、加熱式の95%信頼区間を出すと-38μg~640μgと統計的に非常に苦しいものであった*4のを思い出す。ここまでひどいのは少ないと思うが、多重比較あたりはよく間違えるポイントになるようだ。

教育上の不足とは言えないが、ある種の知識の偏重もある。経済学や疫学をやっている人は気づくと思うが、理工系のラボでは実験でデータ自体が統制されている事が前提なので、経済学や疫学では特に気にされる同時性(内生性)や潜在変数に対して配慮する技法は全く触れられていない。話題の文書は仮説検定に焦点をあてているので、探せばもっと違いはあるであろう。そもそも回帰などしなくても十分研究が進められると言うのが、化学と生物における統計解析の特徴と言えるかも知れない。

なお、「pairedのほうがunpaired t testよりも有意差が得られやすい」ような検出力至上主義的な記述が散見されるが、偽陰性最小化モチベーションは理文問わず観測される。

*1Ⅲの図41の有意性が出るまで観測数を増やしていくのは偽陽性になるのでいけないと言う停止規則は頻度主義者の言い分で、ベイジアンだと無問題になる(関連記事:単なる統計使いを少しだけ誠実にしてくれる「科学と証拠─統計の哲学入門」)。

*2標本数nではなくて観測数n、正規性の検定は正規分布を棄却するものであって示すものではない・・・と言いたくなるところがあった。

*3非燃焼・加熱式タバコや電子タバコに関する日本呼吸器学会の見解

*4関連記事:ある医学雑誌で報告された加熱式たばこが排出するニコチンの量のイカサマ感

0 コメント:

コメントを投稿