2015年9月3日木曜日

世論調査とは何だろうか ─ 斜めに見るとバイアスに悩まされるもの

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

政治談議が大好きなおっさんはこの世に多いが、声が大きい人の話が多数派の意見とは限らない。彼らが信頼おけないとして、自分の感性が世間の感性と思い込めるほど能天気でもない。やはり世間の皆様が社会や政治にどう言う見解を持っているのか、知りたいわけだ。そこで世論調査に頼ることになるわけだが、意外に世論調査がどういうものか分かっていない人は多い。そういう人に向けた本を、NHKで世論調査に携わってきた岩本裕氏が書いている。「世論調査とは何だろうか」は、ある部分の記述を除けば、全般的にオススメできる良書だ。

民主制度の政治家は、選挙によって有権者の支持を確認するわけだが、選挙結果によって得られる情報は限られている。有権者が特定政党の選挙公約の全てを支持しているとは限らない。有権者の意向を知ると言う意味では選挙に限界はあり、それを補うものとして世論調査が機能しており、政権の命運を左右するものにもなっている。本書は、こんな風な話で世論調査の重要性を述べた後に、歴史や問題点を延々と述べていく構成になっている。前半の章では歴史的な話、前半の章では世論調査に入りやすい問題点の記述が多い。

日本の世論調査は大雑把に二度、大きな変革があったそうだ。一つは、第二次世界大戦後の占領下で、GHQが米国でもまだ一般化していなかった最先端の調査方法をメディアに教えることにより、低いコストで精確な調査が行えるようになった。輿論と言う漢字が難しいからと制限されたので、世論と言う当て字が作られもしたが。一つは、2001年頃から計算機によって乱数生成した電話番号を用いた電話調査(RDD)を導入するメディアが増えて*1、精度はともかく、さらに低いコストで迅速な調査が行えるようになった。リアルタイム性が出てきたと言っていいであろう。

今はRDD全盛期なのだが、本書はその問題点を詳細に指摘している。ケータイ電話しか持っていない世帯は抜けてしまうことや、ケータイ電話にかけたとしても応答してくれる人に偏りが出る事などだ。リアルタイム性を重視し過ぎて、平日の夜だけの調査になってしまっていて、忙しい会社員が漏れるバイアスが予想されるものもあるらしい。これもRDDだけではなく世論調査に入りやすい問題ではあるが、質問文が不適切で恣意的なことによるバイアスもある。

世論調査に入りやすいバイアスについては各所で取り上げられている。誘導質問や質問順序、中間選択肢によるバイアス(P.130--149)については、念入りに説明されている。調査主体への偏見や、調査員の主観や都合によるバイアス(P.65、P.159)、面接/配布回収/郵便/電話の調査方法によるバイアス(P.158)や、調査方法に影響される本音では無く建前を言ってしまうバイアス(P.156)、調査主体の意にそぐわない行為を報告しない回答バイアス(P.184)、出口調査に入る支持政党によって期日前投票の利用率が異なる「公明バイアス」・自民党支持層の高齢女性が回答を敬遠する「おばあちゃんバイアス」(P.74)が説明されていた。他人への信頼感が増していると言う結果に対して、他人を信頼する人が回答し、そうでない人は拒否したため、世相を反映しなかった可能性があると言う、セレクション・バイアスの話もあった(P.227--228)。

調査の解釈についても色々と説明がある。やはり調査バイアスに関連した記述が多いが、それ以外にも触れられている。誤差に関して、NHKで不必要に視聴率に一喜一憂していた著者の経験や(P.174--179)、NHKでの調査結果の報道の仕方が著者が行ったときより改善されていること(P.180--181)が紹介されているのは、実務に携わってきた著者ならではの記述であろう。また、年齢で見ると変化しているように見える意識が、世代(生年)で見ると変化していない(P.159--171)と言うのは、コホート分析につながる発想なので知っておく方が良いであろう。もちろん擬似相関の話も書いてある(P.188-196)。

インターネット調査やビッグデータ*2、さらには討論型世論調査の問題点やポジティブな将来性についても触れられているし、新書らしい面もある。テレビの番組制作に携わってきたためか、特に討論型世論調査については一家言あるようだ(P.225)。学者が書いているわけではないが、世論調査に関するポイントは抑えていると思うし、全般的にオススメできる良書だと思う。さて冒頭で触れた「ある部分の記述」だが、中心極限定理と大数の法則を取り違えている気がする記述がある*3。確率の話は本題ではないので、読み飛ばす人が多い気もするが。

*1住民台帳による電話による調査は90年代から行われていたそうだ。

*2テキストマイニング技術を応用したデータベースと言う意味で使われている。

*3中心極限定理を「サンプルの平均が,元の集団の平均にかなり近づく」(P.47)と解釈しているのだが、中心極限定理は標本の平均値が正規分布をすると言っているのであって、標本の平均値が母集団の期待値に収束すると主張するのは大数の法則である。

また、次の行にある「サンプルの中の割合も元の集団の割合に従う」は、上の解釈から直ちに導かれる自明な話ではない。違うカタチの分布でも同じ平均を持ちうるからだ。ただし指示関数を使って短く証明する事はできるであろう。ある任意の値a未満で0、a以上で1をとる指示関数の平均値は、a以上の確率に一致する。大数の法則から標本の指示関数の平均値は、母集団の指示関数の平均値に確率収束するから、標本分布のa以上の確率は母集団のa以上の確率に確率収束し、ここでaは任意の値なので標本分布全体が母集団分布に確率収束することが分かる。あっているのか?これヽ(´ー`)ノ

言い間違いの類であろう。著者が不勉強だったり不誠実だったりするわけではないと思う。統計士を取得したそうだし、信頼区間の重なりが必ずしも有意差を表さないと、少なくない研究者が不正確に扱っている部分を、正確に描写している部分もある(P.180)。なお、この信頼区間の議論のテクニカルな詳細は「ダメな統計学」の第6章を参照のこと。

0 コメント:

コメントを投稿