2023年2月15日水曜日

理工系ラボの皆さんにお勧めしたい統計手法

このエントリーをはてなブックマークに追加
Pocket

理工系のラボの統計解析では実験計画をどうするかの方が成果を大きく左右するためか、出てきたデータの統計解析はよく考えずに慣習に沿っている面がある。国内外の理工系ラボの向けの実践ガイドラインチートペーパーを見ると、古臭く問題含みの方法を説明していることもある。

古臭いチートペーパーで紹介されていたよろしくない慣習で思いついたところを挙げると、

1. 標本が正規分布に従わないかも知れないのに、F検定をかける
等分散性を調べるF検定は正規分布か同じ尖度の分布でないと機能しない。Levene's test(Rではlawstat::levene.testで行なえる)か、O'Neill (2014)で紹介されている尖度で自由度を補正したF検定を用いる必要がある*1
2. F検定で等分散性を確認してからスチューデントのt検定とウェルチのt検定を選ぶ
常にウェルチのt検定をかけるのが望ましい。この手順では偽陽性が増えるし、等分散でウェルチのt検定をかけて生じる問題はない。
3. 標本が正規分布か確認してから、t検定をかける
シャピロ=ウィルク検定などによる正規分布かの確認は不要。中心極限定理があるので、期待値がある分布に従うのであればt検定を使う事ができる。遠くに外れ値があるなどコーシー分布の可能性がある場合以外は、利用に問題はない。
4. ウィルコクソンの順位和検定/マン=ウィットニーのU検定をかける
Brunner-Munzel検定に乗り換えよう。ノンパラ手法ランク検定*2のU検定はt検定と異なり遠くに外れ値があるコーシー分布などでも使える一方、2標本の分散と観測数の差が大きいと精度が落ちる。Brunner-Munzel検定であれば、分散と観測数の差で生じる精度落ちの心配はない。
5. 信頼区間で標本と標本を比較する
信頼区間はt検定の棄却域に対応するが、あくまで定数を棄却するか否かに対応しているのであって、標本と標本を比較した図にならない。箱ヒゲ図を描いて別に検定を行なうか、ウェルチのt検定に対応する上に多重比較補正をかけてくれるガブリエル比較区間(rgabriel)を描いておこう。

ことがあげられる。幾つかはもう廃れているはず。さすがに大手をふって結果が判明したあとに仮説を作る行為(HARKing)を推奨していたりはしなかったが*3、統計学不適切運用は他にもいろいろとある。え、そもそも統計的仮説検定がよくない?(∩゚д゚)アーアーきこえなーい

リストした事項を改善するのは難しくない。等分散性や正規性の確認はやめるだけなので手間が減るし、ルビーン検定とブルンナー=ムンツェル検定への乗り換えコストは一行コマンドを置き換えるだけだ。ガブリエル比較区間もきっとそうでもない。

はずれ値に強いランク基準線形モデル推定はいかがですか?

今日はルビーン検定、ブルンナー=ムンツェル検定、ガブリエル比較区間に加えて、さらにランク基準線形モデル推定(Rank-based Estimation for Linear Models)の利用を推奨したい。

ランダム化比較実験の結果であっても、性別などの統制変数を含めて統計解析を行なうことがあるが、二標本検定には統制変数を含める事ができない。対応のあるデータセットをつくれば性別などの影響は制御できるが、その場合も性別などの影響を推定することができない。一般線形回帰(OLS)をおこないときもあるはずだが、U検定が重視される場では、OLSの利用前提が満たされているとは見做せない。

ランク基準線形モデル推定は、ランクを用いた線形回帰で一致推定量を計算する手法で、OLSでは一致推定量が得られない誤差項がコーシー分布である場合なども、頑強な結果を示してくれる。RではRfitパッケージ*4で実行ができるが、説明変数のt値が出てきて、F検定によるモデル選択を行なう事ができ、多重比較補正付きの一元配置分散分析、n元配置分散分析にも対応している。利用の手間隙も線形回帰(i.e. lm)と同程度で済む。

出てきてから10年ちょっと経った手法なので、意識の高い理工系ラボの皆さんには周知かも知れないが、国内外の理工系ラボの向けの実践統計手法ガイドラインでは言及が無かったのでお勧めしておきたい。私も昨日まで知らなかったけれども('-' )\(--;)BAKI

*1尖度で自由度を補正したF検定による等分散性の検証 - 餡子付゛録゛

*22標本それぞれからの観測値X₁,X₂においてP(X₁<X₂) + P(X₁=X₂)/2 = 0.5を帰無仮説とする。

*3自分で追試をしっかりしろと書いてあるチートペーパーもあった。これは探求的な実験の後に仮説をたてて、その仮説を検証する実験を行なうことで、HARKingにならないようにしているとも言える。

*4Rfit: Rank-based Estimati... The R Journal

コーシー分布も扱えるランク基準線形モデル推定(Rank-based Estimation for Linear Models) - 餡子付゛録゛

コーシー分布とのつきあい方

0 コメント:

コメントを投稿