2012年1月15日日曜日

集団的知能の限界

このエントリーをはてなブックマークに追加
Pocket

SNSの普及でインターネット上には多様な意見が氾濫するようになった。巨大なデータベースになっている。そしてテキスト・マイニング技術の発達で、このデータベースは効率的に利用できるようになった。検索サーバーを通して必要そうな情報に高速に辿り着けるようになった事はもちろん、検索キーワードのトレンドも可視化(Google Trends)され、Twitterの情報で流行予測や選挙予報をするなどの応用もされはじめている(クチコミ@参院選2010)。

1. 集団的知能は「正解」が分かるときに機能する

これらの応用事例には一つ特徴があって、“正解”が分かる事に適用されている。流行や選挙は事後的に結果が判明するし、検索サーバーも検索結果が妥当なものかは、主観的にでも判断は可能であろう。不適切な結果が出るシステムであれば、それは改修・修正される。ゆえに、意見・見解の集約は行わない。対立する意見があった場合、どちらが正しいか判別する方法が無いからだ。単純なアルゴリズムとして多数決が思いつくかも知れないが、多数決が正しい意見を採用するとは限らない。

2. 「多様な意見」の集約は大きな課題

スコット・ペイジの『「多様な意見」はなぜ正しいのか』で紹介されている多様性予測定理を見ていると、インターネットの氾濫した「多様な意見」には大きな潜在的価値があるように思えてくる。しかし、『意見共有で「集団の知恵」が低下:研究結果』『「集団的知能」を決めるのは「個々のIQ」より社会性』と言う記事を見る限り、「多様な意見」の集約が大きな課題だ。集約方法が不適切だと正解に辿り着かないし、また意見集約によって正解に辿り着くのかも疑問が残る。

3. 意見だけでは、正解を特定するアルゴリズムは開発不可能

意見集約方法の開発が、個別のケースでは完全に不可能だとは思わない。折り紙の作り方で意見が割れている場合は、実際に折ってみたら結果が出る。パズルの類も解いてみたら分かるであろう。問題は、正解が分からないケースで意見を集約方法があるかだ。数学的に正解と意見の関係を記述してみよう。

f:正解 → [意見1, 意見2, ・・・, 意見n]

インターネットと言うデータベースは、整理されれば[意見1, ・・・, 意見n]で構成されている閉集合になる。n個の意見は、恐らく正解から誤解や間違えで分化したもので、数学的に言えば関数(f)が誤解や間違えを付与している事になる。主張者の肩書きや経歴などの属性情報が無ければ、この関数の情報は無い。

ここで意見集約に必要なアルゴリズムは、n個の意見から正解を導き出す逆関数(f-1)となる。正解、関数、意見の三要素がそこにある。意見しか分からなければ、三つの要素のうち一つしか情報として存在しない。正解と関数が分からないのに、逆関数を特定できるものであろうか?

4. 政治的意思決定に「多様な意見の集約物」は使えるか?

上に述べた、ごく当たり前のデータマイニング技術の限界を考慮すると、政治的意思決定にデータ・マイニング技術は使えない。ところが政治的にインターネットと言うデータベースを扱えないかと、文芸評論家の東浩紀氏が「一般意志2.0」を提唱している(関連記事:一般意志2.0に漂う素人臭)。

正解を「一般意思」、意見を「特殊意思」、集合[意見1, ・・・, 意見n]を「全体意思」と読み替えれば、東氏の「一般意志2.0」に対応した分析になっている事が分かるであろう。そして、その構造的な欠陥は自明に近い。そもそも政治的な意見を集約して正解を導き出す事が困難な事は、アローの不可能性定理で示されている。

東氏はベクトルとかスカラーとか言い出して導出可能な雰囲気を醸しだしているわけだが、定式化に失敗している。そもそも[意見1, ・・・, 意見n]の大半のケースは方向を持った距離空間では無い。つまりベクトルでもスカラーでもない。アイドル・グループで誰が一番可愛いか言い合ったときに、数値的に比較するのはナンセンスであろう。また意見の一致する部分が採択されるわけでもない。昼食に「味噌ラーメン」「塩ラーメン」「チャーハン」で意見が割れたときに、何故か「チャーハン」が採択されるケースだってあるはずだ。

もっとも東浩紀氏の「一般意志2.0」は、ルソーの「一般意思」とは大きく異なり、政治的意思決定において最優先されるものではない。熟議も否定していないし、政治家や官僚が「一般意志2.0」に逆らう事も否定されていないからだ。そういう意味では「一般意志2.0」は「正解」で無くてもいいと言う大きな逃げ道があるわけだが、「一般意志2.0」は政治的意思決定に使えないと言う事になるので、その価値は大きく落ちてしまう。

5. 政治に「正解」はあるか?

事後的に政策評価を行えば、政治的「正解」とインターネット上の意見の関係が分かると思うかも知れない。それは方向性としては正しいが、「正解」の評価方法が確立していないので、大きな困難を持つ。経済成長や国民の幸福度などの社会の評価基準は多くあるし、多くの事例で事後的な政策評価は、少なからず意見が割れている。

6. テキスト・マイニング技術の応用範囲は広がる

テキスト・マイニング技術には明らかに限界があるものの、「正解」が分かる特定状況では意見集約方法の開発余地はあるわけで、従来は直感や売上データからしか推測がつかなかった事象に、新たな側面から分析を行えるメリットがある。そういう意味では、今後も応用範囲は広がっていくであろう。しかし、正解が分からない分野では、人気投票的な結果以上の何かを得ることはできない。

0 コメント:

コメントを投稿