2013年7月12日金曜日

「月の魔力」を統計学的に批判すると

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

月齢と人間行動に相関があるので、月の引力が人間行動に影響を及ぼしていると言う説があると言う*1。「月の魔力」と言うらしいのだが、これを「疑似科学ニュース」で、統計だけでは否定するのは困難だと主張している。しかし、この事例では統計的に肯定されているわけでもない。

「月の魔力」は、統計学的に仮説を支持するデータが得られていない。月齢と人間行動の関係を示すデータがあったとしても、月の引力と人間行動の関係を示すデータが無いからだ。月の引力を一定にした状態と、月の引力を変化させた場合で、人間行動に変化が無いかランダム化比較実験(RCT)*2を行う必要がある。人類には無理。

統計学的に議論をすると、「月の魔力」を裏づけるデータが無いで話は終わる。動物実験を行おうにも、月の引力の変化を排除する方法が無い*3のでどうにもならない。同様にコホートを用いても、月の引力の影響は全員にかかってくるので比較のしようがない。低線量放射線ならば動物実験もできるし、フィールド・データで被爆量の差異もあるが、月の引力はそうではない。

良くある“逆は成立せず”と言う議論でもある。月の引力が原因としても、月齢と人間行動の相関を説明できるのは確かだが、月齢と人間行動の相関は、様々な可能性で説明ができる。ぱっと思いつく限りでも、夜の明るさやによる人間行動の変化、信じられている迷信による影響などが上げられるであろう。

「月の魔力」は仮説としては神秘的で面白いのだが、こういう主張が統計学的に肯定される可能性は、ほぼ無い。「月の魔力」の場合は、統計的に言えることと、その主張の間に飛躍がある。何はともあれ主張者が論理の飛躍をするケースがあるからと言って、統計的に示唆されている他の現象をモデルレスだと否定しようと言うのは、問題だ*4

追記(2013/07/12 16:00):科学や統計のイロハ的な部分だが、疑問が投げかけられたので補足。

月齢と人間の行動の相関データだけではダメで、月の引力と人間の行動の相関データがなければならないという。なぜそうなるのか、さっぱりわからない。

仮説と変数の対応関係が間接的過ぎると、論が飛躍してしまう。

例えば上図のように、観測データの間に複数の要素があるとすると、月齢→人間行動のデータが幾らあっても、計量的には引力経由なのか、明るさ経由なのかが判別できない。

曇りの日などを利用して、明るさをコントロールしたら・・・と思うかも知れないが、天候も独立した要因であろうし、次に心理的影響のように新たな要素が出てくる。だから統計学の大家フィッシャーは、ランダム化比較試験(RCT)を行えと主張していた。

「月の魔力」の主張者は、引力→人間行動のデータを示す必要があるわけだが、それを怠っているわけだ。技術的に不可能なわけだが。どちらにしろ統計学的には信じるに足る材料が無い。「月の魔力」の場合は、統計的根拠しかないので、ここで終わる。

追記(2013/07/12 17:25):勘違いがあったので追記。

え?この件については、俺は統計で否定しているつもりなのだが。だって科学の話ぜんぜん使ってないよね。

これは失礼。「有意性があるというデータだけを見せられれば、」の節でモデルが要ると主張していたので。

追記(2013/07/12 20:30):「引力」の用語定義は原著に当たっていないのでスルーさせてもらって、科学的方法論の部分を補足。

それは引力にも作用Aと作用Bがあって、作用A経由なのか、作用B経由なのか、判断できないんじゃないの?

一般には引力で作用Aや作用Bは考えないが、もしあったとしても、引力が原因なのは変わらない。月齢と引力は一対一の関係とは言えないから、月齢との相関データでは引力が原因とは言えない。

| だから統計学の大家フィッシャーは、ランダム化比較試験(RCT)を行えと主張していた。
引力経由だろうが明るさ経由だろうが、RCTは有効なんじゃないの?

ランダムにT群とC群に分けて、T群にだけ引力や明かりを与えることができるのであれば、RCTは実行できる。T群にだけ“月齢変化による引力”を与えることが出来ればいいわけだが。

あなたの理屈だと、放射線の影響も、実は放射線には作用Aと作用Bがあって、放射線→癌になるを示すだけではだめでってことになるだろうね。

ランダムにT群とC群に分けて、T群にだけ放射線をあてれば、他のがん要因が不明でも放射線の効果を見ることができる。少なくとも動物実験では、放射線の効果を見ることはできる。

| だからそれと月の魔力の話や身長と学力の話は、本質的に何が違うのか?ってことなのだけどね。
の質問に答えてくれない・答えられないわけだよね?

例えば被曝の影響の場合だと放射線そのものを使った動物実験が行える。カドミウムやダイオキシンでも動物実験は行っている。つまり、RCTが行えるか否かが大きな違いになる。なお、身長と学力の場合は分散分析なども可能だし、成長が止まる年齢での比較をしても良いが、「月の魔力」の場合は、全ての固体に等しく影響があり、分析が不可能になるので、この二つの差も大きい。

追記(2013/07/13 02:00):返事が来たので返事。

月齢と人間の行動の相関の話なんだけど?月齢と人間の行動なら1対1の関係になるんじゃないの?

月の引力と人間の行動の相関の話にならないと指摘している。

自分の書いたことを忘れてるの?なんでコロコロと支離滅裂なほど話を変えるのだろう。広島・長崎のデータのRCTが使えるわけ?使えないならそもそも、あなたの理屈だとそんなデータ意味がないわけだよね。

何度も書いているのだが、動物実験のRCTの結果と、広島・長崎LSSコホートの結果が一致するから線量率効果に説得力があると指摘している。動物実験を取り上げるときと、広島・長崎LSSコホートを取り上げるときがあるが、この二つが相反するわけではない。まさか今まで、二種類の手段で確認されているから信頼性が高いと言う議論を理解していなかったのであろうか。

あなたの理屈だと、結局人体実験するしかないんじゃないの?

科学的な決定打としては人体実験なのは間違いない。一般には次点として、動物実験のRCTの結果と、疫学データをつき合わせることが行われている。この次点の方法で、線量率効果は確認され、LNT仮説は棄却された。

もちろん我々は経験的にそれを知っているが、それは統計とは別な話。成長が止まるというモデルを持っているから。

まず、「なお、」とつけたのだが、RCTが使えないから同じではなく、身長と成績であればRCT以外の方法がある事を説明したに過ぎない。次に、計量モデルを工夫する事を今までも否定して来てはいない。あと、身長と年齢の関係は、人間成長モデルと言ってもおかしくはないが、統計的に知っている経験則だから。

あと身長と学力を分散分析云々というのは、どう分析すると何がわかるの?

分散分析に関しては「統計的消去で擬似相関を見抜こう!」と言うエントリーが秀逸だったので、拝読を。どちらの方が誤差なく説明できるか検定できる。

よくわからんが、月齢で差があるというのだから、違う月齢で比較すればいいんじゃないの?

違う月齢だと、引力以外の要素(e.g.月明かり)も同時に変化するから、識別が出来なくなる。身長と学力の関係であれば、身長以外の要素が、身長と連動するわけでもない。ゆえに、上述の分散分析が使える。

なんで「もし自分がこの情報を知らなかったら」という仮定で思考実験ができないのか不思議。

その思考実験をすると、(なぜか疑似科学ニュースは「あなたの理屈」と表現するが)フィッシャーのRCT以外は信じない(=コホート分析による喫煙の害も信じない)に到達するわけだ。

これまでのuncorrelatedの説明は見るからに行き当たりばったり。

6月25日に『立証したと証拠を出してきたら、統計分析が正しいか、追試で同じ結果が出るかを・・・確認する。』『疫学データなどは適切な処理が困難な事も多く、ランダム化比較試験(RCT)など、データ取得手法自体を工夫するほうが望ましい事も多い。』と書いたのだが、それと一貫しないようなことを書いているであろうか。むしろ、ずっと同じ事を指摘し続けているはずだ。

このエントリーは仮説と変数の対応関係の問題だから、トピックとしては初になるが、以前と矛盾した内容になっているわけではない。

追記(2013/07/13 17:41):相変わらず、疑似科学ニュースはRCTが理解できていないようなので追記。

それではダメだね。いかなる場合も「モデルは必須だ」と考えてもらわないと。表現が微妙だけど、「否定していない」というのはそういう意味?

ランダム化比較試験(RCT)が出来れば、恣意的に計量モデルを工夫しなくても済む。そうでないと、工夫する必要と、その妥当性の是非が問題になる。

*1原文にあたらず「『月の魔力』アーノルド・L.リーバー - Augustrait」を参照しただけなので、誤解があるかも知れない。

*2RCTであれば、交絡効果を考えずに、因果関係を主張できるようになる(関連記事:汝、ランダム化比較試験を知ることなく現代科学を語ることなかれ)。

*3緯度が異なる二地点では一日の重力の影響は異なるので、例えば北極と赤道で比較実験を行うと言う方法はあるかも知れない・・・とも思ったのだが、地球自体の重力差を排除できない。

*4生理作用が不明な現象は多々あって、公害問題などの多くが、統計的で示唆される経験則のみで現象を認められている。被曝による発がん率増加も詳しいメカニズムは不明で、広島・長崎LSSデータと言うコホート分析によって支えられている。

0 コメント:

コメントを投稿