2013年3月24日日曜日

池田信夫と相関係数と45度線

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

以前から経済評論家の池田信夫氏が統計学に疎いのでは無いかと言う指摘があって、その代表的な問題にSmith(2006)で指摘されていた以下のフィリップス曲線に関する説明がある(池田信夫 blog(旧館))。

ここでの池田氏の説明が意味不明な所が多々あり、先日の元官僚の高橋洋一氏の回帰分析を酷評する池田氏も他人の事は言えないのでは無いかと思う人もいたようだ。

フィリップス曲線も知らないで「これはひどい」とか言っている人もいるようだけど、「相関」というのは、45度線になったときが最も高く、垂直または水平になったときはゼロ(相関なし)です。

この説明がおかしい事は、統計学の授業をとった人だとすぐに分かると思う。全ての観測値が回帰直線上に乗っていれば相関係数が1なのであって、回帰直線の傾きは関係ない。また、「45度線」は経済学では原点を通るy=xの線である事が多く、切片項も忘れているような気がしなくも無い。

例として、グラフでは回帰直線が45度線になる係数1で相関係数が1未満ののグラフを描いてみよう。切片-0.011868、係数1.000000、相関係数0.887981*1で、書けた。

1. 実は標準化すれば係数=相関係数になる

嫌味なネットの住民は上の池田氏の発言を良く揶揄するのだが、データを標準化しておけば切片の傾きが1のときに45度線になると擁護する人が現れた。

最初、意味が分からなかったのだが、変数をxとy、誤差項ε、回帰式をy=β01x+εとしたときに、分散をVar(x)とVar(y)、共分散をCov(x, y)とすると、相関係数はCov(x,y)/{√Var(x)・√Var(y)}になり、係数β1がCov(x, y)/Var(x)になる。ここで標準化しておけば、Var(x)=Var(y)=1になるので、相関係数と係数β1は一致する。だから相関係数が1ならば、係数β1も1になるわけだ。

2. 池田信夫氏はそんな事を言っていたっけ?

池田信夫氏のブログのエントリーでは、データを標準化したときにそうなるとも、上述の定義式から導かれる理由も示唆していない。もちろんフィリップス曲線のグラフも標準化したデータなどは用いていない。しかも問題を指摘された後に、以下のように言っている。

ご親切にありがとう。そんなことわかってますよ。逆にいえば、直線であれば座標軸を適当にとれば45度線になるので、私の言明も間違っていません。

座標軸を適当にとれば45度線になるのは確かだが、45度線になったからと言って相関係数が1になるわけでもない。やっぱり分かっていないのでは無いであろうか。追記での弁解が待たれる。

追記(2013/06/12 11:30):標準化した場合は、Cov(x,y)が1が最大なので、決して垂直にならない。やはり標準化の事など考えていなかったと思われる。

*1データはxが(1,2,3,4,5,6,7,8,9,10)、yが(1.72249213635857,4.35102626553146,0.23223806526099,4.50359576946755,4.80314810341847,5.43461480511717,4.88032853660248,7.97124742722619,9.17035511200771,11.8122676296325)である。

0 コメント:

コメントを投稿