2011年12月13日火曜日

だいこんで学ぶ計量経済学

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

経済学にも色々とある。事実解明的/規範的なアプローチの違い、理論/計量/現地調査などの手法の違い、ミクロ/マクロなどの分野の違いがあげられる。ミクロ/マクロの理論は教科書を通じて学びやすいが、どういうものか理解されづらいのは計量経済学(Econometrics)だ。

学術以外での計量分析の存在感はとても薄く、実際の研究成果が紹介されるケースも少なく、露出度の高い経済評論家は存在を認知しているのかも疑わしいぐらいだ。緻密なデータ分析を背景とした主張をするブロガーも余り見たことが無い。このように世間での認知度が低いものではあるが、実際の分析手順を見ると実感が沸きやすいものではある。だいこんの需給と価格で、ミクロの計量手法を紹介してみたい。

1. 検証仮説を考える

計量の実証研究の仮説の自由度は高い。ただし、分析結果は経済理論との整合性を考えつつ解釈する事が慣例であるため、そこを考えて計量モデルを選択する。ある程度は経済理論に詳しい事が求められる。

ここでは、だいこん価格が上がると、だいこん需要が減ると言う仮説を検証してみよう。ごくごく当たり前の現象の検証だ。

しかし、上のグラフを見てもらえば分かるが、季節変動の影響を大きく受けるため、出荷量と価格の関係は明確ではない。そういう意味では、学術論文にできる価値は無いのであろうが、ごくごく当たり前の法則も計量的に実証する意味はある。

2. だいこんの栽培方法や流通状態を調べる

栽培方法や流通状態は推定モデルの決定で重要な役割を果たす。秋冬だいこん・春だいこん・夏だいこんと分類され年中出荷されている事、3~4か月の栽培期間がかかること、北海道や九州で栽培されただいこんが関東に出荷されている事等は計量分析に必要な情報になる。

この他にも水吐けの良い土壌が適している事など、付帯情報は多く知る方が望ましい。本当に地域研究をしている人々は、マニアックに色々と知っている。ただし、検証仮説に関係の無い情報は論文などでは切り捨てる必要があるので、厳密には『無駄』となる。

それでも今回の分析の場合では、例えば通年で見ると宮崎県のだいこん出荷数は1番ではないなどの分析とは外れた知識も、知っておく方が望ましいであろう。

2010年だいこん年間出荷上位都道府県
順位 都道府県 作付面積(ha) 収穫量(t) 出荷量(t)
1 北海道 3902 161960 148390
2 千葉 3108 163482 147471
3 青森 3179 125900 112500
2010年秋冬だいこん出荷上位都道府県
順位 都道府県 作付面積(ha) 収穫量(t) 出荷量(t)
1 宮崎 2060 103400 90500
2 千葉 1810 93200 83900
3 神奈川 1050 88700 83800
2010年春だいこん生産上位都道府県
順位 都道府県 作付面積(ha) 収穫量(t) 出荷量(t)
1 千葉 1260 69400 62900
2 青森 519 25100 22900
3 長崎 250 20100 18500
2010年夏だいこん出荷上位都道府県
順位 都道府県 作付面積(ha) 収穫量(t) 出荷量(t)
1 北海道 2790 112200 104500
2 青森 1600 58100 52600
3 群馬 345 13900 12700
出所) 農林水産省ウェブページ - 作況調査(野菜)

3. 大雑把な推定モデルを、同時性を考慮しつつ決める

第1節と第2節での作業を考慮しつつ、推定モデルを考えよう。基本的には、出荷量 = β0 + β1・価格 + εで重回帰分析をすれば良い。β0は切片項、β1は推定される係数、εは誤差項だ。しかし、需要と供給は価格で決定される一方で、価格も需要と供給で決定されるので、同時性の問題がある。

経済データは、実験によってデータを取れるわけではないので、同時性、不均一分散、系列相関などの推定結果に影響を及ぼすノイズを含む可能性がある。これらの問題を放置するわけにはいかない。例えば同時性があると一致推定量が得られなくなるため、分析結果の信頼性を大きく損なってしまう。大学院の計量経済学のクラスでは、これらの問題が引き起こす事象と、それをコントロールするテクニックを学ぶ事になる。

だいこんの需給と価格の同時性の問題は、二段階最小二乗法(TSLS)と言うありふれたテクニックでコントロールできる。従属変数に影響される説明変数を内生変数と言うが、この内生性を操作変数と呼ばれる他の変数でコントロールするテクニックだ。教科書的には天候がよく知られており、降水量と日照量を用いる事にしよう。

なお、より高度で最近の研究では一般化しているGMMは、出荷量の変化は大きく無いので不均一分散の影響は少ないと仮定し、テレビ番組などの影響で何ヶ月もだいこん需要が増すような系列相関は無いと仮定して利用しなかった。

4. データセットを収拾する

2004年~2010年の7年間の月次データをそろえてみよう。農林水産省/統計情報は、かなり豊富な情報を提供している。品目別分類の野菜から青果物卸売市場調査をたどる事ができ、青果物流通統計月報から卸売数量と卸売価格を入手できる。2009年以前のデータは「青果物産地別卸売統計 - 野菜の主要消費地域別・産地別の卸売数量及び卸売価格」からかき集めてくる。各地の数量と価格を掛け算して合計しているだけだが。

気象データは気象庁の気象統計情報から気温・湿度・降水量の月次ダウンロードしてくる。だいこんの生育期間からすると、最大で4ヶ月程度は気象の影響を受けるであろうから、当月と過去三ヶ月分の気象データをデータセットに加えておく。

5. 各種のテストを乗り越えて、推定モデルを確定する

第3節で推定モデルを大雑把に決めたが、推定モデルは修正する必要がある。季節の影響をコントロールするために月次ダミーは必要であろうし、生活習慣の変化に伴うだいこん需要の低下傾向をコントロールするために年次ダミーも必要であろう。さらに、需要の価格弾力性の計算が容易なように、変数は対数化しておく。

そして操作変数を選択する。操作変数(IV)は条件を満たすか厳密にテストしておく必要がある。まず、だいこん価格と相関がある必要があり、弱相関テストでH0を棄却する必要がある。次に、だいこん需要の影響を受けない変数である必要があり、過剰識別検定をH0を棄却しない必要がある。最後に通常の重回帰分析(OLS)とTSLSに変化が無いと意味が無いので、DWH検定のH0を棄却する必要がある。同様の分析で、妥当な操作変数が見つからないケースは多々ある。

実際の所、三種類の検定をパスする操作変数を特定している研究は少ないかも知れないが、下っ端の研究者が適当な事をすると怒られるので、フォーマルに変数を探した方が良い。幸い、だいこん価格の操作変数としては、出荷月の降水量と出荷三ヶ月前の日照時間が計量的に妥当なものだと判明した。なお全国の天候を代表するデータとして千葉県を採用している。恣意的に思われるかも知れないが、東京都の気象データでも分析結果に大きな違いは無い。

追記(2011/12/13 14:30):推定式に所得を加えないと過小定式化バイアスが生じると指摘があったが、今回の分析では年次ダミーで所得をコントロールしているため、推定結果に大きな問題は生じないと見なしている。

6. 推定結果を整理する

詳細は実際のデータセットとRによる分析スクリプト(ziphg)で確認して欲しいが、推定結果は以下の表のようになる。なお標準偏差、t値、P値は分野横断的に使われる統計用語だ。また年次ダミーが2004年から入っているのは奇妙に思えるかも知れないが、だいこんの栽培実態にあわせて9月を年はじめとしている。

だいこん供給量と価格
係数 標準誤差 t値 P値
切片項 12.54 0.44 28.42 0.00 ***
log(価格) -0.33 0.10 -3.21 0.00 ***
2月 0.03 0.03 0.94 0.35
3月 0.10 0.03 3.01 0.00 ***
4月 0.05 0.04 1.11 0.27
5月 -0.02 0.03 -0.66 0.51
6月 -0.06 0.03 -1.98 0.05 *
7月 -0.04 0.03 -1.27 0.21
8月 0.06 0.04 1.52 0.13
9月 0.28 0.04 7.31 0.00 ***
10月 0.40 0.03 12.65 0.00 ***
11月 0.13 0.03 4.86 0.00 ***
12月 0.11 0.03 3.48 0.00 ***
2004年 -0.03 0.02 -1.36 0.18
2005年 0.01 0.02 0.55 0.59
2006年 -0.14 0.03 -4.30 0.00 ***
2007年 -0.08 0.02 -3.25 0.00 ***
2008年 -0.08 0.02 -3.74 0.00 ***
2009年 -0.10 0.02 -4.61 0.00 ***
2010年 -0.05 0.04 -1.37 0.18
注) 被説明変数はlog(供給量)。***は1%有意、**は5%有意、*は10%有意。弱相関テストはP値0.004025でH0を棄却、過剰識別テストはP値0.83026でH0を棄却せず、DWH検定はP値0.07120723でH0を棄却。

log(価格)の係数が点推定で-0.33、標準偏差から区間推定を行っても95%信頼区間で-0.314~-0.350となっている。対数化モデルにしてあるので、これはこのまま需要の価格弾力性になる。価格が2倍になると、需要が33%下落することを意味する。だいこん農家がカルテルを結んで価格を引き上げると、収益を増やす事ができると言う事だ。これは実際にだいこん豊作時に全国のJA等が出荷制限を行うので、意外な結果ではないであろう。需要の価格弾力性は、課税したときの影響などを予想するのにも使う事ができる(関連記事:小宮山提案たばこ1箱700円は妥当な増税)。

7. だいこん計量分析が教えてくれること

たかが「だいこんの供給量と価格」の分析を行うのも、それなりの手間と知識が必要だ。そして分析を評価するにしろ、知識が無いと適切なものかが分からなくなる。上の分析ももっともらしく検定をかけているが、本当の青果市場の専門家には疑問が出てくるものかも知れない。学術的に何かを主張するのは骨が折れる。

それでも仮説をデータで検定できると言うのは、議論をクリアにするのに有用だ。以前のエントリー「電気代の所得効果を経済学的に推定する」では、電気代が人頭税だと主張するブロガーの主張を計量経済学的に検証し、否定してみた。小難しい話は往々にして実態を無視している事が多いが、データ分析はそれらの真実味を教えてくれる。

国際機関や政府刊行物でも計量分析を見かける事も増えてきた。諸外国や政府の陰謀を信じる人は、それらの分析結果に騙されないように、計量分析の知識も入れておいた方が良いであろう。

8. 計量経済学を学ぶには

大半のケースでは一般均衡理論やゲーム理論は必ずしも必要無いが、生産者理論や消費者理論などのミクロ/マクロ経済学の知識は必須だ。もちろん分析分野の理論や先行研究は知っておく必要がある。その上で、統計学や計量経済学の教科書を読み進めていく必要がある。分野ごとに用いる計量テクニックは異なるため最終的には分析対象ごとのテキストが必要になるし、最新の分析手法を利用したい場合は学術論文を読む必要が出てくる。さらに実際に分析するには、統計解析パッケージを使える必要もある。とても当たり前に思える事を説明するのに、多大な労力が必要だ。ブログを書いている経済評論家が計量経済学に言及しないのは、こういう労力が参入障壁になっているのかも知れない。

0 コメント:

コメントを投稿