2015年2月14日土曜日

偽科学の信奉者は大数の法則も妄想で語る

このエントリーをはてなブックマークに追加
Pocket

統計用語やその定義を確認してから色々と妄想すれば良いと思うのだが、疑似科学ニュースのメカAG氏が「ノイズに対して大数の法則を適用することはできない」と主張している。なかなかの偽科学っぷりで興味深い。

通常、時系列に入るホワイトノイズは正規分布するので、大数の法則に従って期待値であるゼロに平均回帰する。確率変数で大数の法則に従わないのは、期待値が無いコーシー分布のような特異なケースに限られる。これは数学的に証明されている話*1で、議論の余地は無い。

さらに「ノイズに大数の法則を適用するのではなく、見たい特徴(この場合なら中・長期的変動)に対して適用しなければならない」ともっと謎な事も言っているのだが、期待値がある確率分布に従う値を集めれば大数の法則は常に働くので、適用するも何も無い。集計でノイズが平均回帰しているとき、それ以外の要素も平均回帰している*2。だからこそ差がはっきり見えて来るわけだが。

入門統計学」にもこの辺の話は紹介してあるはずなので常識に近いわけだが、なぜ言葉の意味を妄想しはじめるのか。メカAG氏は何年間も「モデルが大事」と言い続けている。しかし、まともに確率モデルを考察する気も学習する気も無いのが興味深い。知識が浅いと、面白みの無い事も多いと思うのだが。

何はともあれ大数の法則が働かないと主張するのであれば、時系列データに入るノイズが期待値がある確率分布には従わないことを立証しないといけない*3。なお「季節調整値に月単位の精度を求めることにどれだけ意味があるんでしょうかね」と言い出したのはメカAG氏なので、本来ならばメカAG氏の方が就業者数の月次データに重大な(ノイズではなく)バイアスが含まれること立証する義務がある*4。「モデルが大事」と言うのであれば、数理的にモデルを整理し、計量分析をかけて示して欲しい。

おまけ:前のエントリーに追記しておいたが、分析に必要な標本サイズは単月の標準偏差と偽陰性の確率から計算できる。差が無い事は統計学の仮説検定では示せないため*5、ある程度の標本数があれば差を認めずに解釈することになる。なおシミュレーションに関しては、標本数(n <- 24)や標準偏差(sd=x.sd*2)を変えれば、差が見えてくるケースと見えてこないケースがあるので、直感的理解のために提示した。想定標準偏差は、実データの値にあわせてある。

追記(2015/02/15 10:00):メカAG氏が確率・統計の知識が無いことを披露し続けている。また、「モデルが大事」と言い続けてきたのに、モデルを考えることは断固拒絶するようだ。

ノイズと非ノイズの分離に大数の法則は使えないといってるのだが。

これは思い込み。差分⊿x(t)=ε+η(n)を考えよう。εはホワイトノイズ、η(n)が月次バイアス、nが月。ここで無数の観測数があると、大数の法則でεはゼロに平均回帰する。η(n)は存在すればゼロではない。だからE[⊿x(t)]≒E[η(n)]となる。「モデルが大事」と言うならば、モデルを考えるべき。

なお、示した集計では絶対値の平均をとっている。|ε|の平均はゼロ以外に収束することになり、E[|⊿x(t)|]≒E[|ε|]+E[|η(n)|]となる。しかし、E[|ε|]は全ての月で同一であるから、月ごとのE[|⊿x(t)|]の違いはE[|η(n)|]によるものになる。モデルを考えれば、ノイズと非ノイズの分離が不要な事も分かる。

ノイズ+中長期変動の標準偏差だろう、と。ここで必要なのは中長期変動の標準偏差。

これも勝手な妄想。上述の通りノイズがゼロに平均回帰すれば、中長期変動が残るというモデルになる。ノイズが平均回帰している程度が問題になるから、誤差項の標準偏差で決定される。中長期変動は非確率変数であっても問題ない。

非ノイズがどういう分布になるのか想定せずに、正規分布に対してノイズの範囲(誤差)をどう決めるのか…。

非ノイズの分布は強く仮定する必要が無い。観測したいのはη(1)、η(2)、η(3)・・・に差があるかどうかだけだからだ。「ノイズの範囲」は有意水準の意味だと思うが、後述するが、これは標準誤差と慣習から定まる。

そういう定量的な基準なしに棒グラフを見て「なんとなく同じ」「大きい」「小さい」という主観的感覚的判断が、ダメなんだよ

定量的な基準は明確であろう。η(1)=η(2)=…=η(12)が帰無仮説になる。24年分の標準偏差が約3.5と言うことは、ある月の|⊿x(t)|の平均値が偶然で他より10.5大きい確率は0.14%、7大きい確率は2.27%、3.5大きい確率は15.87%程度になる。有意水準は1%、5%、10%で見るのが慣習だが、観測値は±5の範囲で収まっている。帰無仮説は棄却できない。

追記(2015/02/15 10:39):メカAG氏はゼロ金利制約下でのMSのMB弾力性の推定値が0.008を小さいと書いたのが主観的だとずっと批判し続けているが、ゼロ金利ではないときはだいたい1であったし、限界まで量的緩和をしても政策目標に届かないことにもなるから、理由が無いわけではない。後者はエントリー中に明記してあるのだが。

追記(2015/02/15 20:29):反論が無いのでメカAG氏もノイズに関する妄想を辞めたようだが、まだ偽科学の信奉者らしい言説を続けているので、繰り返しだが指摘しておきたい。

最初に指摘しておくが、メカAG氏の主張を否定するのは容易だ。メカAG氏はその主張を裏付ける統計も、数理モデルも提示していない。

経済学者や市場関係者は月次でデータ分析をしていて、それには雇用データも含まれる。メカAG氏と同様の見解を主張する人もいない。

雇用の月次データに精度が無いと主張するメカAG氏が、精度が何を意味するのか、数理的にどう表現されるのか、計量的にどう検定できるのかを示す義務がある。

次に仮説検定について補足しよう。統計哲学的には帰無仮説の採択はできない。しかし以前のエントリーでも指摘しているが、一定以上の観測数があるのに有意性が無いものは、慣習的に効果が無いと見なす(e.g. ジャック=ベラ検定や共和分検定)。

無論、一定以上の観測数があっても、効果量が大きくないと偽陰性になる。しかし、ごく僅かな効果量を検出したいわけではない。回帰分析に大きな影響を与える階段状でない事を確認すれば十分だ。階段状ならば、以下の1月のように、ある月が他の月の6倍になるが、そうではない。

メカAG氏はシミュレーションで標準偏差を2倍にしたのが主観的と言っていたが、客観的には6倍にすべきだったというのであれば認めざるを得ない。なお、ある月が他の月の2倍以上であると言う帰無仮説は棄却できるし、ある月の変動がゼロであると言う帰無仮説も棄却できる。良く考えたら階段状の否定なのだから、η(1)=η(2)=…=η(12)ではなくて、η(n)=0を見るべきだった。ここは訂正しておく。

だから「1」と「0.008」が大差ないか、質的に異なるほどの差があるかを、なにを持って判断しているのか?ということを言ってるのだが…。

量的基準の話が質的に摩り替わっているが、弾力性が1と言うことはマネタリーベースがマネーストックの制約になっていて、それ未満では他が制約になっていることを示す。だから質的には全く違う。「モデルが大事」と言い続ける人には、弾力性が1は定数倍で比例する関係を意味する事に気づいて欲しい。

なお推定量からそのまま計算した予測が気に入らないようだが、推定量の意味を理解するためだから追加的な仮定を入れるわけにはいかない。弾力性が量的緩和にあわせて1から0.008まで低下した事を加味すると、もっと簡単に限界に達するわけだが。

追記(2015/02/16 10:00):計算に誤りがあったので訂正しておきたい。一階差分の24年分の標準偏差は約3.5だが、絶対値の標準偏差は約2.13で、取り違いがあった。ある月の|⊿x(t)|の平均は9.00から16.76、±4.24の範囲になる。2σラインを超える異常値はない。また、ゼロを棄却できない月も無いので、就業者数の推移が階段状ではないと言う結論は変わらない。

追記(2015/02/16 11:26):多少は回復したかなと思ったが、メカAG氏の認知的不協和がまた悪化してきたようだ。

自分がこの部分にうまく反論できてないのをわかってるから、話題にしたがらないのだろう?

まず、メカAG氏が引用している図を描いたのが私なので、話題にしたがらないと言うのはおかしい。次に、観測データは階段状にならない事は示しており、メカAG氏も「1年を通じて雇用は変動する」と反論を認めている。

さて、メカAG氏はデータではなく雇用主の意思決定が階段状であると主張しているわけだが、計量分析にどう影響するかが明確ではない。計量分析は観察できるデータを処理するので、メカAG氏の想定が観察されるデータにどう影響するのか、メカAG氏は示さないといけない。偽科学の信奉者は、モデルを使って主張を明確にする事は無いが。

基本的に論証はストイックでなければならない。成り立つことを示す場合はできるだけ確実な根拠のみを使う。

食物に毒性がないというのを統計的検定で議論すると面白い事になるので、考察されると良いと思う。厳密には毒性があるのかも知れないが、あっても効果量が小さいので無視されている。なお、ゼロは棄却できるので、観測データが階段状であることは棄却されている。

ICRPの防護モデルが一つしかないという事実からずっと逃げているメカAG氏が質問を直視する事は無いであろうが、雇用主の意思決定が階段状であるときに、どのようにデータを霍乱するか示すべきであろう。

追記(2015/02/25 03:32):疑似科学ニュースのメカAG氏が帰無仮説を棄却できない場合の解釈への反論で、さらに無知を晒す議論を始めたのでコメントしておきたい。

あるモデルAが成り立つ確率を80%とする。別なモデルBが成り立つ確率は残り20%ではない。60%かもしれないし、90%かもしれない。ようするにそれぞれ独立だということ。あくまでモデルに対して誤差を計算する。別なモデルを想定すれば誤差の計算も変わる。そして60%のモデルよりも90%モデルが優れているというわけでもない。

まず、帰無仮説と対立仮説は背反関係で、独立したモデルではないことが認識できていない。次に、モデル採択に関しては、確率(と言うか尤度)とモデルの複雑さに応じて、赤池情報量規準やベイズ情報量規準などの目安でモデル採択を行なう。つまり、科学の世界では簡素で誤差が少ないモデルが優れていると見なされている。

このように他の多くの人間と同様に、uncorrelatedは実際にはなにかしら自分の価値観(主観)でモデルを想定しているにもかかわらず、それを認めず、あたかも天与のごとくデータから必然的に導き出されたものだと偽っている(自分自身をも偽ってるのかもしれない)のが問題なわけ。

モデルについては、SPLINE REGRESSIONとAR(1)とランダムウォークの三種類の可能性を議論していて、モデル選択のエラーを無視しているわけではない。SPLINE REGRESSIONの妥当性について気になるようだが、それは批判対象の計量モデルを改良したものに過ぎないことは説明したはずだ。2/10のエントリーの追記(2015/02/14 01:22)で「議論の最初のエントリーは目視で線を引いていいのかと言う疑問を投げかけるのが目的だった」と書いておいた。

直線による近似よりも二次曲線による近似の方が誤差が少ないというなら、なぜ三次曲線で近似しないのか?と。その方が誤差は少なくなる。

以前から何度も指摘しているが、モデルが複雑になると自由度が低下するために、統計的検定などでモデルが採択される確率は減る。上述の情報量規準でもペナルティーがつく。学部の統計学でも自由度調整済決定係数などは教えているはずなのだが、履修されていなかったのであろうか?

俺の主張の中の「分析結果への影響」の部分が明確でないというのは、まさに「わからない」というのが主張だから。わかるなら補正すればいいわけで、わからないから補正できない、すなわち精度が確保できないということ。

つまりメカAG氏は自身が主張している現象が、計量データにどう影響するか全く分からないが、とにかく精度が無いと思うので、計量分析が不可能であると主張していることになる。なお、計量分析に悪影響が無い事を証明しろと言うのは、悪魔の証明と言われる偽科学の信奉者が良く使う論法だ。

月単位の精度が確保できると主張しているのだから、こうした影響がゼロか、十分小さいか、補正可能ということを示さなければならない。

月次のデータがあって毎月変化がある事、標準誤差の大きさが一定以下である事を示しているのだから、十分であろう。不十分であると言うならば、データに「精度」があることを証明してから分析している研究を紹介して欲しい。なお、そこに情報が無いのであれば誤差項で全てが説明され、何も統計的有意性は出てこない。

何はともあれ確率・統計は歴史も古く理論的にも確立している分野なので、思いつきを並べ立てる前に学習される事をお勧めする。科学読本ではなくて科学の領域に踏み込むので、それなりハードワークにはなると思うが。

追記(2015/03/12 16:00):統計学を学ばず統計学を語るのが止まらないメカAG氏だが、また大数の法則を無視したことを言っているので、そこは指摘しておきたい。

たとえばノイズを考慮せずに微分しても、ノイズが強調されるだけで有効な傾向を示さないとか、普通に使っていれば当然知っているはずのセオリー

正規分布に従う二つの誤差εとηを考えると、その差分ε-ηも正規分布になる。良くある確率の計算問題だ。これによって、データを増やしていけば大数の法則に従い平均値にあるノイズの影響は減る。なお、前にも指摘したが、差分と微分は異なる概念で、見ているデータは差分だ。

なぜメカAG氏は「モデルが大事」と言いながら、主張を数理モデルを使って検討しようとしないのであろうか。言うだけでは無く実際にモデルに親しんで欲しいと思う。なお「普通に使っていれば」と言うが、単位根の問題で時系列データでは差分を取ることが多い。疑似科学の信奉者が妄想から「普通」を主張するのは常々だが。

ところで、十分な観測数があるときに帰無仮説を棄却できないときの解釈が気に入らないようだが、区間推定を考えると理解しやすいかも知れない。区間推定の幅は、観測数が増えるほど大数の法則で狭くなる。帰無仮説が棄却できないというのは、区間推定の中心付近にゼロがあることを意味する。しかし、観測数が100のときと観測数が10,000のときでは、区間推定の幅は大きく異なる。解釈も変えるべきでは無いであろうか?

以前にも言及しておいたが、統計哲学的には同じであるべきかも知れないが、実際の科学研究では十分な観測数があるときには、ホメオパシーの効果のように帰無仮説が採用されることもある。日本学術会議は声明で「ホメオパシーの治療効果は科学的に明確に否定されている」と断言をした。

*1大数の法則を紹介したテキストは数多くあるが、例えば『測度から確率へ』を参照。

*2絶対値の平均値をとった集計では、ゼロではない期待値に平均回帰していく。

*3差分のヒストグラムを書いてみると、正規分布をしているように見える(だからランダムウォークの方が妥当と言う批判もある)。

*4そもそもメカAG氏がバイアスがあると思っているのも分からない。季節バイアスを主張しているわけではなく、(恐らく構造変化を意味する)中長期的変動がほとんど無いと言っているからだ。なお、構造変化が数年に一度であっても、構造変化の前後の観測値が十分にあればよいので、それが計測できないわけではない。そう言えば最初のエントリーのグラフに、誤差を考慮して区間推定を書いておいたことにメカAG氏は気づいていない気がして来た。

*5以前にも指摘しておいたが、帰無仮説はゼロ=差が無いになり、それを棄却できる否かが対立仮説になるからだ。

0 コメント:

コメントを投稿