2018年6月28日木曜日

あずまん、囚人のジレンマの囚人は、相棒の供述に関係なく自白するから

このエントリーをはてなブックマークに追加
Pocket

文芸評論家の東浩紀氏が、「“首相の嘘”は囚人のジレンマ状況から生まれた構造的なもの」だと言い出している。

ゲーム理論を持ち出すのはよいのだが、ゲームの構造をはっきり認識すれば曖昧さが排除されて明確な議論になるはずなのに、ポストモダン的に情緒あふれる話になっていると言うか、その前に説明がおかしい事になっているので指摘したい。

1. 囚人のジレンマの囚人は相棒の供述に関係なく自白する

具体的には以下の部分なのだが、分かりづらいが正しくない。

囚人のジレンマという言葉がある。ばらばらに収監された2人の囚人は、相互不信にとらわれた結果、双方にとって不利な決断を下すことがある。その状況を意味する、ゲーム理論上のモデルである。

二名が共謀して犯罪を犯して収監されたときに、二人とも黙秘を行なえば二人とも微罪で済むが、どちらか片方が自白を行なえば自白した方は無罪で黙秘した方は極刑になり、両方が自白すると二人とも重罪になるときに、二人がばらばらに取り調べを受けており、相手の供述を知る事ができないと言うような話を書かないと、読者は理屈が分からないだろうし、共犯者への不信感が決断に影響すると言う説明はおかしい。

囚人のジレンマもナッシュ非協力ゲームなので、共犯関係にある二人の囚人はそれぞれ最も自分に有利な決断を下す。共犯者が黙秘のとき、自分は自白が有利になり、共犯者が自白のときも、自白が有利になるため、二人はそれぞれ共犯者の決断に関わらず自白を決断をする。自白が強支配戦略なのだ。そして、二人とも利他的に黙秘するときよりも、二人とも利己的に振舞った結果、重い刑罰を受けることになる。

囚人のジレンマの囚人たちは、寓話の中の犯罪者らしく利己的*1なので、共犯者が黙秘すると思っていても、自分が無罪を勝ち取るために相手の不利益を承知で自白して、共犯者を裏切る。なお、非対称ゲームでは、両方の支配戦略が自白である必要は無いが、それでもどちらか片方のプレイヤーは、相手の戦略に関わらず自分の戦略が決定される必要がある。

ナッシュ均衡一般の説明としては、プレイヤーは他のプレイヤーの戦略を予想して自らの戦略を決定するのだが、囚人のジレンマでは他のプレイヤーの全ての戦略に対して一つの最適な戦略があるのだ。予想はしているが、予想は行動を変化させない。

上に引用した部分だけ書き損じただけかなと思ったのだが、以下の部分も相手側の行動に応じて自分の行動を変えるような話になっている。

野党は、与党は嘘つきで、倒すためなら手段を選ぶべきではないと考えている。与党は、野党は悪質なクレーマーで、少しでも弱みを見せたら終わりだと考えている。結果として、与党は不必要な嘘をつき、野党は国民向けのアピールに終始し、政治は空転し続けている。

それっぽい説明なのだが、「結果として」の前後が逆であるべきだ。「与党は不必要な嘘をつき、野党は国民向けのアピールに終始」するので、「野党は、与党は嘘つき」「与党は、野党は悪質なクレーマー」と考えるようになるのだから。

2. 囚人のジレンマの解消方法は色々

実は、教科書的ではない囚人のジレンマを考えれば、東浩紀氏の言っているような話を作ることもできる。野党がクレーマー戦略に頼るので首相は嘘をついただけで、野党がクレーマー戦略を取らないのであれば正直であったと仮定されており、首相には支配戦略の無い、以下のような非対称ゲームを考えればよい。

首相,与党
正直 嘘付
野党 普通 (2,2) (0,0)
クレーマー戦略 (3,0) (1,1)

(野党の利得, 首相の利得)になっているのに注意してもらうと、野党が強支配戦略のクレーム戦略をとる一方、首相は野党のその出方に対応して嘘をつくことになる。

ただし、東浩紀氏の「野党勢力が拡大し、クレーマー戦略に頼らなくてよくなる」のが囚人のジレンマの解消と言う主張は支持されない。確かに野党の利得が変われば均衡は変化するが、嘘がばれたら即辞任のような厳しい制裁によって首相が嘘をつく利得が大きく減少しても均衡は変化するからだ。

囚人のジレンマが繰り返しゲームの中のものであれば、将来利得にかかる割引因子が大きくしてやれば、つまり与野党が近視眼的でなくせば、フォーク定理により繰り返される囚人のジレンマは脱出できる。将来の選挙前に過去の与野党の発言を振り返るような特集を、メディアが行なえば良いかも知れない。

3. そもそも囚人のジレンマ的状況にあるのか?

東浩紀氏が、野党が森友・加計学園問題で政府非難を繰り返し、安倍総理が嘘をつき財務省が公文書改ざんに至った状況を嫌っているのは分かるが、野党が森友・加計学園問題に触れず、安倍総理も正直な状態が与野党にとって今より望ましいとは限らない。政府との対立点を出していかないと野党の支持は伸びないので、政府が追求すべき失態を犯してくれる方が望ましい。無風状態よりは今の方が望ましいはずだ。

ゲーム理論を持ち出すのであれば、2×2の標準型表現のような単純なものでも、想定しているゲームの構造を整理し、その中の利得の理由付けを考えてもらいたい。野党の勢力が強くなったら、政府非難の手が緩くなる理屈が良く分かりません。

*1刑務所に収監されている人々にゲーム理論に基づく実験を行なうと、大学生と比較して利他的に振舞うと言う報告もある。

0 コメント:

コメントを投稿