そんなわけが無いが、元官僚の高橋洋一氏がそう主張している*1。経済評論家の池田信夫氏の『「相関」というのは、45度線になったときが最も高く、垂直または水平になったときはゼロ(相関なし)』と同じぐらい確率・統計的に問題があると思われる。
まずは相関係数だが、確率では無いものとして定義された数字であって、定義から確率として扱えない。ベイズの主観的確率は、確率として定義してあるものを使うわけで、確立の公理を満たしている。勝手な判断をしていいと言うわけではない。
主観的確率も、少なくとも実用上は、口語で言うような主観ではない。経験ベイズで事前分布を主観的に置くわけだが確率分布しか置けないし、推定されたモデルから解釈できることは、モデルの形に依存する。当てはまりの良さも、検定される。
教科書的なベーシックな話を吹っ飛ばして実データに気ままな解釈を与える所は、高橋洋一氏と池田信夫氏は良く似ている。先日も池田氏が高橋氏がデータを切り取ってグラフの見栄えを良くしたと批判していたのだが、微妙なグラフなのに計算せずに「ほとんど相関がない」と言い切っているし、時系列データで単純に相関を見る危険性は無視している*3。
*1何かの壮大な冗談かも知れないが、確かにそうツイートしている。
確率・統計で、客観的なものだけで論じようとするのが伝統的確率・統計、主観的なものも含めていいのがベイジアンともいえるが、私は両刀遣い。問題によって使い分けている。政策決定のような意思決定ではベイジアンによらざるを得ないことも多い。相関係数の解釈、意味も人によっていろいろでもいい
— 高橋洋一(嘉悦大)さん (@YoichiTakahashi) 2013年6月11日
なお、高橋洋一氏がした具体的な解釈は「相関係数は0.91です。これは、日本でマネタリーベースを増やせば、およそ9割方は予想インフレ率も6ヶ月後には上昇する」である。
*2データを標準化しておけばそうなると弁護する人もいるのだが、その場合は相関係数がゼロでも垂直にならない(関連記事:池田信夫と相関係数と45度線)。
*3時間に相関している二つの時系列データで相関係数をとると、因果関係が全く無くても高い値が出やすい(関連記事:時系列データの相関係数はあてにならない)
3 コメント:
質問よろしいでしょうか。
引用されたツイートを見る限りでは、「相関係数は確率」とはどこにも書いてないようにみえますが、池田洋一氏はどこでそう主張されたのでしょうか。
>>牛 さん
以下の部分がそれになります。
> 黒田・岩田緩和の成功確率はおよそ9割
http://synodos.jp/newbook/4387
http://synodos.jp/newbook/4387/2
> 相関係数は0.91です。これは、日本でマネタリーベースを増やせば、およそ9割方は予想インフレ率も6ヶ月後には上昇する
早速のご回答ありがとうございます。拝見します。
コメントを投稿