2022年6月4日土曜日

あるポルノ視聴が性犯罪を減らしていそうだ論文の計量分析の問題点

このエントリーをはてなブックマークに追加
Pocket

ポルノ利用が性犯罪を減らす可能性はそこそこ高い。ここ何十年間で世界中でポルノ視聴は容易になり、ポルノの製作数も飛躍的に増えている一方、性犯罪は劇的に減っている。しかし、時系列のデータなので、ポルノ視聴が影響したのか、他の要素が影響したのか統計的に判別することは容易ではない。相関を示すことができても、因果を示すのは大変だ。相関を示すことすら、上手くできないこともある。

1. なぜか信頼できると誤認されていた

ある気鋭のネット論客が「めちゃくちゃ念入り」としている論文Kendall (2007) "Pornography, Rape, and the Internet"も粗が多い残念な分析になっていた。この論文はディスカッションペーパーで、上手く研究が進めばどこかの学術雑誌に掲載されているはずだが、そこまで行けなかったようだ*1。既にネット論客の人とはディスカッションをしたのだけれども、だらだら話し過ぎたので、どういう問題があるかをまてめておきたい。

2. 一見、高度な分析がされている

Kendall (2007)はアメリカの州ごとの強姦発生率とインターネット利用率を、固定効果モデルで分析した論文だ。州ダミーと年ダミーが入っているので、強姦発生率に関係のある州ごとの分析期間中は変化しない観察不能な変数、全国を通じて一定の年ごとの欠落変数は観察不能なまま制御できていると見做せる。データセットは1998年か2003年の5年間で、差分をとることで州固定効果を制御したため*2、観測数は51州×4=204となっている。こう書くと因果は無理でも相関は上手く示せそうなのだが、細部を見ていくとできていない。

3. 説明変数と問題意識の乖離

推定結果としてはインターネット利用率が増えるほど、強姦発生率が下がることが確認された。著者はこの結果をインターネット利用率が増えるほど、ポルノ視聴が増えて、強姦発生率が下がると解釈している。ここで問題が出る。インターネット利用はポルノ視聴に限らない。ヒキコモリになって外出しなくなれば事件に会う可能性は減るし、マッチングアプリが充実すれば好意がはっきりしない相手と無理に性行為をする意欲が落ちるかも知れない*3。間接的な説明変数を用いているので、欠落変数バイアスが入り込む余地が大きい*4

4. それは説明変数ではなくて従属変数

説明変数の選択も大変よろしくない。説明変数に犯罪による実効中絶率がある。強姦率が高くなれば犯罪被害者の中絶率も高くなるわけで、明らかに内生性があって線形回帰の前提条件を満たさない。同時性バイアスとも呼ばれる問題だ*5。ネット利用率にかかるバイアスの方向は係数がゼロに近くなるか、符号が反転する方向になる。推定の頑強性をテストするために、実効中絶率を除いた回帰分析をして欲しく、実際に補完的な分析ではそうているのだが、主要な分析では行っていない。なお問題関心のある説明変数に無関係な調査変数(probe variables)を被説明変数にして、誤まって有意性が出たりしないか確かめるnegative controlsが行われているのだが、この中絶率がテストを無意味にしている可能性もある。

5. 説明変数を無闇に増やしすぎ

さらに、多重共線性の疑惑がある。この論文の主要な*6説明変数は家計のインターネット利用率になるわけだが、家計のコンピューター保有率と低学歴率(% residents with education < 9 years)の2つの説明変数が強く相関することが予想される。サンプルサイズも204あるし、本当に多重共線性が推定を撹乱しているとは限らない。しかし、VIFや交差検証(CV)は無い*7。2007年ぐらいはこれらの分析は流行っていなかった気もするが、頑強性テストと言って説明変数を落として推定の安定性を見たりすることはあったが、それもされていない。もっと昔風の説明変数間の相関係数表もない。

6. まとめ

計量経済学の教科書に必ず載っている問題を列挙せざるをえないわけで、ほとんど論拠にならない論文だ。ポルノ視聴が賢者タイム効果や一般女性の魅力低減効果で性犯罪を減らす可能性は大いにある。実際に、ここ数十年でポルノ産業は拡大し、性犯罪は多くの国で減少した。しかし、これらと整合的な結論になっているからと言って、分析方法が粗すぎの論文は根拠にしてはいけない。

*1Resultsの節にMethodologyの内容があって、論文の形式もまだ整っていない。著者の名前で掲載論文を探したのだが、同じものは無さそうであった。

*2with-in推定にする方が推定結果が良いことが多い気がするが、差分を取っている。

*3逆に、見知らぬ相手とあうので危険性が増す可能性も、新たな異性と出会う回数が増えて、それぞれの出会いが安全性が増していても、全体ではリスクが増える可能性もある。

なお、2006年版をアップデートしたらしき2007年版のKendall (2007)に、Raphael and Winter-Ebmer (2001)"Identifying the Effect of Unemployment on Crime," Journal of Law and Economics, Vol.44, pp.259–283に男女間の対面交流の数が強姦被害の重要な決定要因と書いてあるような説明があったので、Raphael and Winter-Ebmer (2001)を確認したのだが、各種犯罪率を失業率とアルコール消費量で回帰している分析になっていて、該当する説明変数は無さそうであった。

*4ただしKendall (2007)は、ありうる欠落変数バイアスはポルノの性犯罪抑制効果を打ち消す働きになっていると予想している。

*5詳細は計量経済学の教科書を読んで欲しいのだが、従属変数が説明変数に作用する逆の因果があると、説明変数と誤差項の共分散が非ゼロになり、回帰分析の前提条件が満たされなくなって、一致推定量が得られなくなる。こういう場合は説明変数と相関するが、従属変数に影響されない操作変数を探してくるか、部分識別と言って、バイアスが入ることを前提に解釈を試みることになる。なお、ポルノ視聴と強姦の関係は符号なども未知なのでバイアスの方向も分からない。

*6コントロールのために入れているだけの説明変数の間は、多重共線性があっても問題はない。

*7多重共線性が確認されれば、説明変数を減らす他、主成分回帰を試みるなどの方法がある。主観確率を工夫してベイズ推定する手もある。固定効果モデルにしているのだから、推定を撹乱しそうな説明変数を無理に入れなくていいので、減らすことを推奨するが。

0 コメント:

コメントを投稿