2015年10月4日日曜日

産経世論調査を笑う前に

このエントリーをはてなブックマークに追加
Pocket

統計学を学ぼう。ask.fmで『産経世論調査を巡る毎日との批判合戦で産経が「自爆」(笑)』と言うエントリーを紹介されたのだが、毎日新聞・平田崇浩氏が恐らく「意義」を「有意性」と書き間違えて産経新聞の記事への批判を行い、産経新聞・酒井充氏もポイントの掴みづらい反論を行い、そしてブログ主のkojitaken氏が、統計的な有意性が何かを理解しないまま、産経新聞をアホと笑っている。

1. なぜか議題になった百分率の表記

統計的に有意とは、仮定する分布からは観測値が偶然であるとは言い難い確率で生じるとき、つまり有意水準以下であるときに言う。平田氏が「参加したと答えた推定人数わずか34人を母数に、支持政党の内訳をパーセンテージで、しかも小数点以下まで算出することに統計的な有意性はほとんどない」と指摘しているわけだが、意味不明である。「有意性」は「意義」の書き間違いでは無いであろうか。

酒井氏も「産経・FNNの合同世論調査は、全ての数値について原則、小数点第1位まで記している」と意図が掴みづらい事を言っている。百分率の表記は通例に従ったものなので、小数点以下の数字の大小で議論しているわけではないと言う事であろうか。しかし百分率の表記に関係なく、統計的に有意な差があるとしっかり書いて欲しい。そうでないと、kojitaken氏が行っているような、平田氏の指摘への回答になっていないと批判を招く。

2. 統計的有意性は計算でき、有意性はある

ブログ主のkojitaken氏は、公開されている情報で統計的な有意性が計算できる事に気づいていないようだ。計算をしたら、百分率の表記やデモ参加者の人数が、議論全体を左右する問題では無い事が分かる。実は1000名の調査対象者全体の傾向は公表されており、例えば共産党の支持率は5.4%と分かる。デモ参加者34人が調査対象者全体と同じような支持政党の傾向を持つとすれば、期待値は1.836人。分散は二項分布なので1.737。2σライン、だいたい95%を有意水準と見なすと、1.836±2.636人を超える共産支持者が観測されたら、統計的に有意と言って良いであろう。実際のデモ参加者の共産党支持者数は14人。調査対象者全体とデモ参加者の支持政党には統計的に有意な差がある。

3. まとめ

毎日新聞・平田氏の指摘には『この調査結果にゆがみがないと仮定すれば、「安保法案に対する世論の反発の大きさを示した」と書かなければならない』「デモ参加者に野党支持者が多いことには何の驚きもない」と妥当なものも含まれているが、この百分率を小数点以下まで表示することの是非を持ち出した事以外にも、統計学に関わる記述には疑問がある*1

産経FNN合同世論調査にはRDDの原データに入るバイアスの除去のための調整が適切に行われていない可能性があるし、記事で母集団を代表している標本集団を「一般市民」と形容するのは辞めて欲しいのだが、デタラメな批判をして良いと言うわけでもない。産経新聞をアホと笑う前に、統計学を学ぼう。

*1「調査に応じた人の割合を有権者全体にそのまま当てはめること自体に無理がある」と言ったら、全ての世論調査を元にした議論が成り立たない。「そのまま」が、バイアス除去のための統計処理を行っていない状態と言う意味ではないであろうし。

0 コメント:

コメントを投稿