2016年9月7日水曜日

社会学者の卵の古谷有希子のデタラメな数字について

このエントリーをはてなブックマークに追加
Pocket

ask.fmで「強姦被害者を黙らせる日本 女性を抑圧する社会ほど、強姦事件の認知件数が少ないことを示すデータ」と言う社会学者の卵の古谷有希子氏のエッセイについてどう思うか質問を受けたので、古谷氏が収拾したデータを著しく不適切に扱っている上に、仮に分析が適切でも結論を支持するものにはならない事を指摘したい。社会学としては問題ないのかも知れないが、社会科学としては一般誌向けの記事としても問題であろう。

1. 数字の取り扱いについて

古谷有希子氏はOECDのGender, Institutions and Development Database 2014 (GID-DB)UNODCのRape at the national level, number of police-recorded offencesをデータソースとして使っていると思われる。「男女不平等な家族法」はDiscriminatory family codeの誤訳で、「女性の身体に対する抑圧の度合い」はRestricted physical integrityの意訳?であろう。「男女不平等な政治・市民状況」はRestricted civil libertiesを見ていると思われる。古谷氏が示している日本の数字から合致するので、ほぼ間違いないと思う。なお、古谷氏は明記していないが10万人あたりの強姦発生件数は2003年から2014年の平均値のデータを使っていると思われる。

さて、古谷氏が提示しているグラフのうち三つを観てみよう(クリックで拡大)。

「女性に対して差別的な家族制度(夫婦同姓などもその一つ)がある国ほど強姦認知件数は少なくなっています」のように古谷氏は説明するのだが、相関係数や係数のP値を明らかにしていない。統計的な有意性は無いと想像される。後の方で別の指標に関して「統計的にも有意なレベル」とあるので、言及していないと言うことはそういう事であろう。本当に無いのか確認してみようとして、古谷氏の数字の扱いがデタラメなことに気づいた。

古谷氏は「分析にはデータが揃っている33カ国を使用」としているのだが、OECD加盟国では無いロシア(Russia)が混じっている。さらに、Discriminatory family codeとRestricted physical integrityが揃っている国は、日本を含めてかなり減る。日本もReproductive autonomyが欠損値「..」なっているので、データが揃っていない国になってしまう。Reproductive autonomyは除外したが書くのを忘れたとしても、他の項目が抜けている国は多い。日本の数値を作るために合算したと思われる項目に欠損値がある国は、Australia、Austria、Belgium、Czech Republic、Denmark、Greece、Hungary、Iceland、Ireland、Israel、Italy、Korea、Latvia、Luxembourg、Portugal、Slovak Republicの16カ国に及ぶ。なお「..」を0として扱った気がするのだが、この場合はKoreaは除外されない。

さらに、OECDのデータセットでは三つのカテゴリーの合算値は表に掲載していない。恐らく0~1の間を取る結婚可能年齢の男女差(Legal age of marriage)と、上限の無い家事分担の男女比(Unpaid care work)をそのまま足しても意味がないからだと思うのだが、古谷氏はウェイトについては何も考察しないで足している。

ここまでで古谷有希子氏がデタラメを書いていることは確定なのだが、欠損値が無い国で主張が成立するかはチェックしてみた。

  • 「男女不平等な家族法」(Discriminatory family code)は、26カ国のデータが使え、相関係数0.09311、説明変数の係数は-2.283、P値は0.129578
  • 「女性の身体に対する抑圧の度合い」(Restricted physical integrity)は、20カ国のデータが使え、相関係数0.06754、説明変数の係数は-6.265、P値は0.2685
  • 「男女不平等な政治・市民状況」(Restricted civil liberties)は、33カ国のデータが使え、相関係数0.01043、説明変数の係数は2.578、P値は0.572
  • 三つを同時に説明変数とする重回帰分析は、19カ国のデータが使え、相関係数0.1826、説明変数の係数はそれぞれ-2.9274、0.2664、9.2701、P値はそれぞれ0.239、0.972、0.262

以上の考察から古谷有希子氏が論拠にしている数字はデタラメだと言わざるを得ない。学部生が卒論の作成途中でこういうデータを作ることはままあるのだが、ちょっと問題であろう。

2. データ分析と結論の乖離

論理的にもおかしい事になっている。仮に古谷有希子氏が使った説明変数の係数がマイナスでP値が0.1未満であれば、「女性を抑圧する社会ほど、強姦事件の認知件数が少ない」と言い張る事はできるであろう。しかし、「男女不平等な社会が、強姦の告発を妨げている」「強姦事件認知件数を押し下げている原因=強姦事件の被害者が声を上げにくい状況」は全く主張できない。色々な可能性が考えられるからだ。本当に強姦が少ない可能性もある。女性を抑圧する社会であれば、女性は外部労働など公の場に出る頻度が低くなるので、性的暴行を受けうる時間が少なくなる。

分析の方向性がそもそも良くない。古谷有希子氏が主張しているのは、女性を抑圧する社会であるほど強姦事件の暗数が大きくなると言うことなのだから、明らかになった強姦事件の件数である認知件数を分析しても意味がないのだ。つまり、やっている事は無駄である。暴行発生件数を相関係数0.9ぐらいで説明できる強力な説明変数があって、日本の数字がその予測値から大きく乖離していれば話は別だが、国別の集計データにそんなものは無いであろう。強姦被害者のその後の扱いの比較などを調べる方が可能性が高い。

3. 同時性(因果関係の方向)

社会学者は因果関係の方向に注意を払わない事が多いので指摘しておくが、Restricted physical integrityの中のLaws on domestic violence、Laws on rape、Laws on sexual harassmentには同時性の問題がある。ある種の犯罪が多いと、それに対する処罰が厳しくなって行く事が十分にあり得る。つまり、Laws on ~(数値が高いほど犯罪者に甘い)と強姦事件発生率に負の相関があったとしても不自然とは言い切れない。なお、実際、この三項目の合算値は負の相関を持っている。そもそも相関も無いので過剰な指摘な気もするが、この三項目を含むRestricted physical integrityは、他に操作変数などが無いのであれば、使うべきでは無いであろう。

4. データソースと参考文献

細かい事なのだが、本文中で言及していない文献は参考文献に載せる必要はなく、参考文献に依拠した記述であれば本文中にそれを明記すべき。グラフにはそれぞれ出所を書く事が望ましい。さらに、国際機関は色々なデータセットを出しているので、どのデータセットの何の項目を拾ったのか、容易に追跡できるようにしておくべきであろう。また、United Kingdomの強姦件数は三つに分かれているので平均値を取るなりしたと思うが、その辺も可能な限り明記すべきである。

0 コメント:

コメントを投稿