以前に濱口氏が紹介していた社会学者の柴田悠氏の「自殺率に対する積極的労働市場政策の効果」*1が、「失業率上昇率の増減」が自殺率に影響を与えると書いてあるらしいところが気になったので拝読してみた。うわ、本当に書いてある。これ失業率が安定さえしていれば、50%の国と3%の国で自殺率が変わらないと言う意味なのだが、大丈夫なのであろうか。他の部分も気になったので、コピーしたついでに通読してみた。社会学でこういう計量分析をする人は少ないのであろうが、全般的におかしい事になっている。
1. 柴田(2014)と先行研究
論文の背景を説明しておこう。近年の日本の自殺率上昇は広く関心がもたれる所だ。学術的には澤田・崔・菅野(2010)、澤田・上田・松林(2013)などの研究があり、計量的に失業など経済的状況と自殺が関係を持つことが示唆されている。柴田(2014)は、これらを前提に公的な職業訓練・就職支援・雇用助成を実施する積極的労働市場政策(ALMP)と失業率の関係を、視点として「孤立」を重視しつつ、議論している。
追記(2014/08/05 09:41):本エントリーに関して柴田悠氏からメールを頂いた。『社会学評論』の字数制限(2万字)が厳しく、19,923字を使ってしまっているので記述が十分できない面があったそうだ。経済学の雑誌だと、もう少しページ数をかけることが多いので、かなりお気の毒な感じがする。
2. 経済的状況ではなく「孤立」が論点
柴田(2014)は自己言及できていないのだが、「孤立」を重視している所は特色で、それが分析の混乱を招いているように思える。澤田・上田・松林(2013)の第5章が良く似た先行研究になるが、そこでは離婚率や都市化と言う社会的属性*2はあるものの、孤立と言う議論は無い。社会学らしく孤立に論点があるのは良いのだが、経済的影響を無視しているのは問題であろう。ALMPにしろ再就職を容易にしたり、就業先を作ったりするわけで、直接的には孤立と言うより失業対策でしか無いからだ。
3. 都道府県で効果が確認されても、それは日本全体ではない?
柴田(2014)の研究モチベーションはおかしい事になっている。澤田・上田・松林(2013)の第5章の分析は、年次ダミーが入っているので、ALMP(失業対策費)の日本全体への効果は測定できていないと議論しているのだが、間違いでは無いであろうか。まず、パネルデータの固定効果モデルではあるが、失業対策費の係数は日本全体で一つである。これは日本全体の効果に他ならない。年次ダミーを入れて効果が確認できると言う事は、失業対策費が年次ダミーよりも良く自殺率を説明すると言うだけだ。年々と失業対策費が増加もしくは減少していれば多重共線する可能性はあるが、1975年から2008年までの長い期間をとっており*3、その可能性は低いであろう。
4. 仮説や主張と計量モデルの乖離
柴田(2014)は、仮説や主張と計量モデルに乖離があって残念な感じになっている。
貧困者の孤立を緩和すると主張しているのだが、被説明変数は自殺率である。ALMPの増加によって、自殺する経済的理由が減るのか、社会的理由が減るのか識別されていない。視点として「孤立」を持ち込んでいるわけだから、論文全体として大きな問題を孕んでいる。孤立が自殺を増やすという議論、ALMPが貧困者の孤立を減らすと言う議論があれば良いのだが、何も無い。天下り的に「孤立した貧困者が社会経済的に包摂され,彼らの自殺が減る」とあるだけだ。ここは致命的に思う人も多いのでは無いであろうか。
経済における貧困者の比率を表す代理変数として、仕事を探している無職者の比率である完全失業率が適切だと言うのに異論は無い。しかし、冒頭で指摘した通り、「失業率上昇率の増減」で良いのかは疑わしい。「前年の失業率がたとえば5%だったのか15%だったのかで,新たに失業した1%相当の者が置かれる社会的状況は異なる」と言うのは、社会的スティグマを意識していることは分かるのだが、賃金収入が無くなるのは同じだし、再就職の可能性を考えると経済的状況15%の方が悪い。計量的には上手く両者を識別する変数を探すべきであった*4。
計量手法を見ていくと、内生性のコントロールに気を使ったものになっているが、内生性に関する議論が薄い。「自殺率が失業率などに与える逆の因果(失業者が自殺することによる失業率低下など)を統制」とあるのだが*5、全ての変数に自明な逆の因果があるわけでもなく、個別に議論していっても良かったのでは無いであろうか。特にALMPと自殺率の関係を見ているわけだから、ALMPの額がいかに決定されるかはもっと議論があっても良いはずだ。
5. 妥当性に疑問が残る計量手法
何はともあれ柴田(2014)は、OECD26カ国のデータでALMPが自殺率に及ぼす影響を示そうと努力している。しかし、Arellano and Bond (1991)の差分GMM推定と言うお洒落なツール*6を使っているのだが、道具に振り回されている感がある。これは同時性、誤差項の自己系列相関などの様々なバイアスをコントロールできる一方で、検出力が低いとされているものだ。それらしい分析結果を出すのは大変だっただろうなと思う反面、細部を見ていくと粗が見つかる。
- 1. データ分析期間に恣意性が見られる
- 簡素なモデルから複雑なモデルまで6種類の分析が行われている*7。しかし、なぜか分析期間が一致しない。しかも、簡単なモデルの方が分析期間が短くなっている。通常は複雑なモデルの方が必要な変数が多くなるので、昔のデータが取れないと言う事が多いはずだ。観測数も最もシンプルなモデル1が少なくなっている。ちょっと理解できない状況なのだが、分析期間についての説明は無い。
追記(2014/08/05 11:25):モデル間の自由度を揃えるために推定期間を調整したそうだ。注10に書いてあった。ただし、差読者の意向らしいが、妥当性には大きな疑問が残る。
- 2. 操作変数と過剰識別検定にある疑問
- どれが外生変数で、どれが内生変数なのか議論が無い。操作変数についても、判然としない。推定式から考えるに、全て内生変数として扱われており、それらのための操作変数として過去の変数の値が全て推定に用いられている。2期前、3期前の変数だけではなく、遡れる限り全てだ。しかし、推定結果の表に「操作変数の数」が示されているのだが、全てのモデルで操作変数の数は観測数+1となっており、説明変数の数に関係ないように思える。
追記(2014/08/05 09:41):この点については、メールでのやり取りについて幾つか確認できたことがあるので、追記しておきたい。Stataの出力結果の一部を拝見したのだが、Arellano and Bond (1991)の標準的な手順に従った分析になっているので、ここの部分は論文全体には影響しない。
全て内生変数として扱うのは通例なのだが、論文中の操作変数の記述には問題がある。自己ラグ項と個別効果の相関から発生する同時性バイアスの制御に使うGMM-typeな内生変数と、説明変数と誤差項との相関から発生する同時性バイアスの制御に使うStandardな内生変数がある(Drukker(2008))が、論文中ではStandardの説明もGMM-typeと同様にしている。
操作変数の数については、Stataのxtabondコマンドの出力をそのまま転載しているので、柴田氏の作業に大きな問題があったとは言えない。ただし、上述資料から類推される操作変数の数、その他の分析結果の操作変数の数から考えると、やはり異常な値に思えるので、ここの検証は必要であろう。
追記(2014/08/06 05:39):操作変数の数については、Stataの挙動の理解への問題だった模様。論文では1980年から2007年のデータがあり、1980年から1991年までを分析対象期間の開始年としている。しかし、データセットは1960年から2007年のデータで整備されており、GMM-typeの操作変数として、観測数によって制限される投入限界数まで、ずっと過去の期間まで使われていたらしい。
- 過剰識別検定が恣意的に運用されている気がする。著者は5%有意でなければ問題ないとしているが、モデル2から5は10%有意で過剰識別が検出されている。そもそも、もっとも基本的なモデルで過剰識別があって他が問題ないと言えるのであろうか。操作変数を過去1期に絞って丁度識別にして、原理的に過剰識別が生じないようにするなど、もう少し工夫があっても良いのでは無いであろうか。
- 3. 多重共線している可能性が残る
- 国特有線形時間傾向が全てのモデルに入っているのに注意が必要に思える。どういう意図で入れたのかが明確にされていないのだが、1人あたりGDPなど年々と上昇する値と多重共線する可能性がある。また、モデル1から6まで全ての推定で使われているので、頑強性も確認されていない。解釈も難しいので入れない方が良いように思える。
追記(2014/08/06 05:40):論文には記載していないが、頑強性は確認しているそうだ。
- 4. マイナーだが意味不明な説明
- 「また1人当たりGDPが増えると,分母のGDPが増えることによりALMP支出(対GDP比)は減る可能性がある.」とあるのだが、ALMPは下級財と言うわけでもないだろうし理解できない。GDPが増えて防衛費の対GDP比が減ったなんて聞いたことが無いのだが。
- 「Neumayer(2003)の結果では,1人当たりGDPの負の効果に加えて,1人当たりGDPの2乗項が男性自殺率に正の効果を示した(…).そのため2乗項(…)も投入した.」は、先行研究にあるから入れた、理由は不明と言われている気がする。もっとまともな説明が欲しい。
- 「動学的1階階差一般化積率法(GMM)」は表記としておかしいと思われる。差分をとらないGMMもあるし、最近はSystem GMMなどもあるからだ。
端的に言うと、「色々と説明変数に放り込んで見ました!」と言う感じになっているのだが、もう少し思慮深さをアピールしてもらいたい。
5. まとめ
全般的に粗があるわけだが、実際の分析は積極的労働市場政策と自殺率の国際比較をしているわけで、問題意識にある「貧困者の孤立」を議論できていないところがもっとも気になった。ここは掲載拒否の十分な理由になるはずだ。積極的労働市場政策の実態についての説明も、もっと欲しい。どういう原理で孤立を防ぐのか。
計量分析に関しては、「失業率上昇率の増減」以外は単なる記述ミスなのか、推定結果に大きな影響がある部分なのかは分からないが、もう少し丁寧に行う必要があるであろう。系列相関が気になったのかも知れないが、複雑で不明瞭な分析よりは、単純で明瞭な分析をお勧めしたい。
*1柴田(2014)「自殺率に対する積極的労働市場政策の効果――OECD26ヵ国1980~2007年のパネルデータ分析」『社会学評論』, 257号
*2非経済変数とは言い切れないことに注意する必要がある。離婚率は女性の自殺率に影響するため経済的状況の悪化を意味するとも言えるし、都市化の進展も求職の容易化から経済的なメリットも意味するからだ。
*3ここまで長い期間であれば、むしろ都道府県ごとにある固定効果が変化している可能性があるが、Arellano and Bond(1991)の差分GMMでも同様の結果が得られているとあるので、この問題はない。
*4破壊的なことばかり書いているが、改善する余地はあったはずだ。例えばALMPの失業率と自殺率への影響をそれぞれ見て、自殺率にだけ影響があるのであれば、経済的と言うより社会的効果が大きく、孤立の緩和が重要であると議論できたかも知れない。貧困者の「孤立」を議論したければ、「孤立」が影響していると思える分析手法を模索するべきだ。
*5なお失業者のうち自殺に至るのは1%もなく、内生性が大きな問題になるのかは疑問がある。
*6Yt - Yt-1=β0 + β1(Yt-1 - Yt-2) + β2(Xt - Xt-1) + εのように階差をとったモデルを一般化積率法(GMM)で推定することで、固定効果、内生性や誤差項の自己系列相関をコントロールできる。
*7複雑なモデルだけあればいいように思えるかも知れないが、変数を落とした分析は多重共線性などの影響を確認でき、頑強性の検証になる
0 コメント:
コメントを投稿