2013年6月29日土曜日

理論と現実が矛盾したら、理論が間違っている

このエントリーをはてなブックマークに追加
Pocket

疑似科学ニュースから科学と統計は同じものだと考えているのかと言う質問が来ていて、実は回答済み*1なので様子見していたのだが、再回答してみたい。理論と現実が矛盾したら、常に理論が間違っていると考えている。

現実の観測には困難が付きまとうわけで、バイアスや誤差を考えると観測データを信じていいのかと言う問題は残る。統計学が観測データの見方を教えてくれるわけだが、データが限られている場合は限界がある。それでも実験データ、疫学データなど複数の分析結果が同じ方向を向いていて、それが理論と相反していれば、理論が間違っていると考える方が妥当なはずだ。

1. 統計データにも信頼性の差がある

統計や計量は、誤差などを含む観測データから「事象」を切り出す手法だが、信頼性の高いランダム化対照実験(RCT*2もあれば、解釈に注意がいる単回帰分析まで手法は幅広い。現実優先と言っても、計量データにも重みがあると言う事だ。

2. 実験データは信頼性が高く、疫学データは低い

平易に書けば、実験データは信頼性が高く、疫学データは信頼性が低い。実験室では様々な要因をコントロールする事が可能だが、社会データは様々な要因によって決定されるからだ。いつも空気抵抗バイアスの話しが出てくるが、実験室では傾斜で空気抵抗を減らすことも、空気を抜くこともできる。実験室のRCTならば理屈抜き、ブラックボックスありで信用され、そこから因果関係を見出すこともされている(e.g. 薬剤)。

3. LNT仮説が統計データでどう表されるか?

低線量でのLNT仮説を計量的に評価するのは簡単だ。LNT仮説の主張は、ERR = α・D(ERR:過剰相対リスク, D:被曝量, α:係数)でシンプルだ。このLNT仮説を検討するには、式を書き直してERR = α・D + β・D2の追加された係数βが幾つになるかを見ればいい。β≠0ならば、線量率効果が確認され、LNT仮説は棄却される。なお統計学上の処理の話だが、当てはまりがちょっと良くなるだけなら、β≠0にはならない。

4. 閾値説とホルミシス効果は対立仮説ではない

どうも疑似科学ニュースは、口語体で柔軟にLNT仮説を様々に解釈しようとしている気がするのだが、線量率効果を無視した線量比例の健康被害であるのは疑いの余地は無い。線量率効果があったらLNT仮説は棄却される。また、閾値説とホルミシス効果は対立仮説ではない。ホルミシス効果はα<0、β>0になる。

5. 実験データはLNT仮説を棄却

まず、実験データを見てみよう。ランダム化対照実験は信頼性が高く、これで示された結果は理論モデルよりも信頼される。古瀬らの研究がそれだが、そこでは線量率効果係数(DDREF)は2.1~3.3と推定されている。DDREFは大雑把に1 + β/α・D*になるので、β≠0が示された。ネズミではLNT仮説は成立しない。

6. 広島・長崎LSSデータはLNT仮説を棄却

次に、疫学データを見てみよう。広島・長崎LSSデータは信頼性に疑問が無いわけでは無いが、唯一存在する人間の健康被害の大規模データセットで、ICRPの分析ではDDREFは2になるそうだ。なおD*を幾つにとるか、被曝量の上限を幾つにとるかでDDREFは変化するが、β≠0が示されたのは間違い無い。恐らく人間でもLNT仮説は成立しない。

7. 除去できないバイアスは線量率効果

疑似科学ニュースはLNT仮説はバイアスが除去できれば当てはまるはずだと言う主張だが、少なくとも実験データの方はバイアスが入る余地が少ない。また、計量分析が重要と言う流れで論理的な話になってしまうが、DNA損傷がLNT仮説の根拠だと言うのであれば、ネズミと人間の差は無いはずだ。除去できないバイアスこそが、線量率効果を表しているように思える。

8. LNTモデルは数式からして改良しづらい

ここも誤解されているようなので言及しておくが、LNTモデルは改良しづらい。線量率効果一つ入っただけで、もう一次線形(Linear)でなくなってしまうからだ。被曝間隔があくとリスクが減るとなっても成立しなくなる。数学上の問題だが、モデルが適合できる幅が極端に狭い。

9. 科学的にはLNT仮説は望みがとても薄い

まとめると、ネズミではLNT仮説は成立しておらず、恐らく人間でもLNT仮説は成立していない。人間でランダム化対照実験を行っていないので断定はできないのだが、データ的にLNT仮説を弁護する方法は人体実験を要求するしかない。最近の分子生物学だと病気になる前の変化も感知できるらしいが、今は無理難題と言っていいであろう。理論と現実が矛盾したら、理論が間違っていると言う立場から見れば、LNTは望みがとても薄い仮説だ*3。改良の余地も、ほとんど無い。

10. 疑似科学ニュースの言う「論理モデル」とは?

本題は以上だが、触れておきたいことがある。疑似科学ニュースの言う「論理モデル」と言う単語が良く分からない。理論的にと言う意味ならば数理モデルを示すべきでは無いであろうか。放射線量、DNA損傷率、発がん率、平均余命などのパラメーターの関係が数式で示されている必要がある。LNT仮説に関して、そのようなものは無いはずなのだが。

11. ガリレオやニュートンが記述したのは数理モデル

良く例として出されるニュートン力学による惑星軌道モデル(N体問題)は、微分方程式モデルになっており、運動方程式と万有引力の法則で惑星軌道を説明している。数式を使ってモデルの要素間の関係を明らかにしないと、現代的な理論にはならない。

ところで冒頭部分のプロット画像は、RでN体問題をプロットしたものである(関連記事:Rで多体問題を数値解析)。気付いていた?

追記(2013/06/30 19:06):もともとLNTモデルは疫学的リスク推定に使えるほど、信頼性が無いと言う指摘をしていたはず・・・と思いつつ返事。

| 放射線量、DNA損傷率、発がん率、平均余命などのパラメーターの比例関係が数式で示されている必要がある。LNT仮説に関して、そのようなものは無いはずなのだが。
言ってる意味がよくわからないが、上に列挙されている候補なら、LNT説の場合、放射線量=DNA損傷率=発癌率というではないの?

DNA損傷率=発癌率と言う部分が、モデルで説明されているわけでは無く、ブラックボックスになっている。結局、細部には言及せず、放射線量と発癌率の関係だけを見ているわけだ。

どんなモデルもブラックボックスに行き着くわけだが、単なる計量モデルのように見える。

問題は補正部分のモデルが確立されていないという話をしている。

LNTモデルが有力だと言う主張では無く、分子生物学的な知見を積み重ねて線量率効果を説明したモデルの構築が望ましいと言う主張であれば、大きな反論は無い。低線量域でのLNT仮説は科学的な信憑性が無いと言うのが、そもそもの指摘だ。

ただし、往々にして実験結果があっても理論的な説明がついていない現象は多く、それらも科学的には現象として認められている。経験則も科学として扱われてきた。薬の効能(e.g.アスピリン)や、銀の減菌効果などが身近な例であろう。低レベル放射線の健康被害が、経験則だけで結論されてもおかしい話でもない。

追記(2013/06/30 23:40):疑似科学ニュースはLNT仮説だけ甘めに見て、批判的思考を失ってしまっていはいないであろうか?

科学というのはそういうもの。わからない部分を切り捨てるから、シンプルなモデル(法則)が作れるのであって、そうやって科学は進歩してきた。

LNTモデルにブラックボックスが許されて、非線形モデルにブラックボックスが許されない理由は何であろうか?

どちらもブラックボックスを抱えるのであれば、実験や疫学のデータでもっともらしい方を選ぶべきでは無いであろうか?

科学的に存在が分かっている線量率効果を切り捨てているLNTモデルは、科学的だと言えるであろうか?

現状はLNTモデルが有力だ、と付け加えてくれれば、同意するのだが。

線量率効果が実験データや疫学データで確かめられている以上、それによって否定されるLNTモデルが有力と言う結論には全くならないであろう。アリバイのある被疑者を、他の被疑者の証拠が不十分だからと言って、犯罪者と見なすことはできない。

LNTモデルより完成度の高いモデルができて、データとも一致度が高ければ、みんなそっちのモデルを支持すると思うよ。

“みんな”か否かは分からないが、フランスの医学アカデミー、科学アカデミー、米国エネルギー省、米国保健物理学会は低線量域のLNT仮説を否定している。また、ICRPは線量率効果を考えた上で、非線形モデルを推定した上でDDREFを導入し、不連続なLNTモデルを利用している(下図参照)。

テクニカルな議論だが、DDREFが採用されるという事は、リスク評価においては非線形モデルを支持すると言う事に注意して欲しい。

DNAを破壊するのにボールを投げる時、ボールを投げた量が多いほど、それに比例してDNAが破壊されるというモデルは、人間の日常感覚にあうと思うがね。

その日常感覚が、実験室のデータと疫学データから示される線量率効果で否定されている。アリストテレスの理屈を否定したガリレオのように、事象を謙虚に受け止めるべきでは無いであろうか?

DNAの修復機能ならなぜそれが直線的ではないのか?

フィードバック効果が直線的に働く事例は余り無いと思うので非直感的だとも思わないが、次のように説明はされている。DNA修復機構の時間あたりの処理能力に限界があり、一定以上のペースでDNA異常が発生すると未処理の異常がたまっていくそうだ(Berkeley Lab News Center)。

何はともあれ数理モデルの構築を目的にしましょうと言う事は、実験や疫学データの結論を無視していいと言うことにはならない。線量率効果は実験や疫学データで支持されており、線量率効果があればLNT仮説は自動的に否定される。

追記(2013/07/01 15:10):線量率効果係数(DDREF)の存在こそが定量化されている証左なわけだと思いつつ返事。

だからそれを定量的に検証できるところまで落とし込まないと、評価できないじゃん。

2Gy照射後は15 RIF/Gyの修復ペースで、0.1Gy照射後は64 RIF/Gyの修復ペースだと定量的に書いてある。

何はともあれ放射線 → DNA異常、放射線 → DNA修復ペース、放射線 → ガン化、放射線 → 余命は定量的な研究成果はあるようだ。

追記(2013/07/01 18:34):科学を語るのであれば、微分方程式モデルや統計学に習熟している方が良いのでは無いかと思うこの頃。

たとえば1次式で近似するのと2次式で近似するのと3次次式やもっと複雑な式で近似するのと、どれが正しいかをどうやって判断するの?一般に高い次数で近似したほうがデータとの一致度は高くなるよね。3次式よりも2次式で近似すべきだ、と何を根拠に判断するのか?

t検定、F検定と言うのがあって、統計学的に判断できる。説明変数が、誤差以上の説明力の向上をもたらしかと言う検定。なお二次式にすると重相関係数は必ず向上するが、自由度調整済み重相関係数は低下するケースもある。

追記(2013/07/02 01:50):分析者が想定した計量モデルが無いと計量分析が行えないのは正しいが、二つの計量モデル(e.g. LNTか非線形)の選択は、統計学的に行える。

議論の最初の頃に同じ事を言ったと思うけど(俺の話は一応全部つながっているのだが、1つのことを話すとあなたは前のことを忘れてしまわれる)、点と点を直線なり曲線なりで結ぶ時、その間がなめらかな連続的な変化だと考える根拠はなんなのか?やっぱ暗黙のうちに何かしらモデルを想定しているからじゃないの?

ERR = α・Dか、ERR = α・D + β・D2かは、t検定やF検定、そして自由度調整済み決定係数などで比較でき、統計学的に判断される。ロジスティック回帰と線形回帰のどちらがもっともらしいかも、尤度比検定などで判断することができる。

本文に「当てはまりがちょっと良くなるだけなら、β≠0にはならない」と、それとなく示唆しておいたのだが。

否定されていない。なんども言うけれど、データとの一致度が低い程度では、科学的に否定されたとは言わない。否定したいのであれば、同じようなモデルを作ること。

幾ら強弁しても、データから統計学的にLNTモデルと非線形モデルの比較を行い、非線形モデルが採用されている。つまり、低線量のLNT仮説がデータ分析と一致しない事は、実験データ、疫学データから示されている。

投げたボールが描く放物線だって、結果が放物線になるという前提があればこそ、放物線で近似し、残りは誤差(空気抵抗や風向きとかのせい)だと、考えるわけで。

一般に「誤差」は対称分布するので、バイアスと言わないと語弊があると思われる。

慣性の法則が空気抵抗でバイアスがあると言えば、明確に現象を説明している。空気抵抗と慣性の法則のは並び立つからだ。LNT仮説に謎のバイアスがあると言えば現象を説明できていないし、線量率効果だと説明するとLNT仮説を否定することになる。

なお本文で「ランダム化対照実験(RCT)」を示唆しておいたが、この方法をとれればバイアスの大部分をコントロールすることができる。つまり実験データでは、原則としてバイアスは入らないと考える。

なお、議論の始まりの方の6月21日のエントリーを見直したが、少なくとも本文に「閾値」と言う単語は使っていない。

*1疑似科学を統計学的に否定すべき理由

*2同じような個体を多数用意して、コントロール群とトリートメント群にランダムに分ける。コントロール群には何もせず、トリートメント群に「何か」をする。コントロール群とトリートメント群に何かの差が無いかを観察する。

*3これは防護基準としてはLNTモデルを否定するものではない。合計の被曝量だけ管理をすればよく、線量率効果を考えると、線量、線量率、日時を細かく管理する必要があるからだ。

2 コメント:

Unknown さんのコメント...

突然横から失礼します。疑似科学ニュースとのやりとりを拝見していたものです。全くの専門外なので見当違いなことを書いているかもしれません。
「モデル」について議論されておりますが、疑似科学ニュースさんの仰るモデルというのは
例えば弾道の軌道計算のように背後にある運動法則から演繹的に導かれるものをさす一方で、
このLNT仮説というのは統計から回帰して得られたものにすぎないと思うのですが。だから「仮説」と言われているのではないかと。(全くの素人なのでここは本当に見当違いの可能性大ですが)
よって低線量域での現象を説明できないならば、その部分に関しては棄却しても当然ではないでしょうか。また疑似科学ニュースさんは摩擦や抵抗に例えていますが、摩擦や抵抗といったもので説明不可能だからこその棄却です。
ただこの仮説は安全側にバイアスがかかっているので、予防原則の観点から使いやすく、実際に実務で使わているのでしょう。

以上、失礼しました。

uncorrelated さんのコメント...

>> mic james さん
コメントありがとうございます。そういう事だとは思いますが、なかなか納得はしてもらえません(笑)

コメントを投稿