2016年4月6日水曜日

人はなぜ協調するのか ─ くり返しゲーム理論入門 ─

著名ゲーム理論家の神取道宏・東京大学大学教授の昨年出た薄い本、『人はなぜ協調するのか ─ くり返しゲーム理論入門 ─』がネット界隈で評判だったので拝読してみた。装本からしてそう書店には流通していないと思うが、ワンショットのナッシュ均衡ぐらいを知っていれば読めるので、長期の人間関係を描写する繰り返しゲームにちょっと興味がある人にはお勧めだ。81ページと簡潔な割りに平易なので、本書の「はじめに」に書かれた狙い通り、経済理論を専門としない人に良い冊子になっていると思う。経済学徒でもバリバリとゲーム理論を研究していない人であれば、前半の考え方の部分も含めて勉強になると思う。

第1章で念入りに、くり返しゲームを理論的に分析する理由、均衡に至る調整過程ではなく均衡を中心に分析が行われている理由、今までの研究で分かっている基本的な事を説明している。端的に言えば協調関係を説明するのが目的だが、進化ゲームなどの議論と異なり、社会の中の人間は相手の行動を先読みして出し抜こうとする面があるので、決まった調整過程を繰り返すシミュレーション通りには振舞わない。だから理論的に理由をはっきりさせないと、一般的な洞察を引き出す事はできないし、均衡に至る調整過程も出し抜きを許さない均衡で無ければいけないので、均衡ではない均衡への調整過程を考えることは難問になっている。衒学的な感じもするが、社会でくり返し観察される安定した行動パターンは均衡になっている可能性が高く、人聞の行動が均衡から外れてい場合でも、均衡状態を分析の参照点とし使うことで現実の理解が深まるそうだ。

第2章では、くり返しゲームを理論的に分析するための基本ツールである「l回逸脱の原理」を証明した後に「フォーク定理」を証明している。第1章で、同じ利得を達成する均衡戦略はたくさんあり、すべての均衡戦略が完全に知られているわけではないが、均衡戦略を見つけ出す便利なテクニツクが開発されており、それによって均衡で達成できる利得の範囲が正確に分かっている事が紹介されているのだが、それを具体的に説明している。この章から教科書と言う感じになる。やはりチマチマと証明を追いかけないと、何か学んだ気にならない。なお、フォーク定理にも色々とバージョンがあるのだが、他の教科書では完全フォーク定理と言われているものが紹介されている。何かこだわりがありそうなのだが、その理由は書かれていなかった。本書の目的からすると複数紹介する必要は無いだけの事かも知れないが。

第3章では、不完全観測(imperfect monitoring)を取り上げている。他人が過去のステージ・ゲームで取った行動を直接観察できない状況の分析だ。入門レベルのゲーム理論の本では、くり返しゲームの章があっても触れている事はほとんど無い*1ので、分野外から見ると新鮮味がある。「はじめに」の記述から考えると、大学院レベルの本でもほとんど記述は無いと思う。正しい例えか自信は無いのだが、銭形警部にルパン三世が逮捕されたとして、それが峰不二子が裏切ったためかどうか確実には分からないときに、今後も永久に泥棒家業を続けるルパン一味が、峰不二子に何か制裁を決断するような状況である。ルパン逮捕と言う情報を、ルパン一味と峰不二子が同じように知るような状態が公的不完全観測で、音信不通や風聞などでそれぞれが独自に相手が行った行動の手がかりを得るのが私的不完全観測。何か変な気がするが、私の頭ではこの程度の理解しかできなかった。それはさておき、公的不完全観測の方は研究が一段落している一方、私的不完全観測の方は、だいぶ研究が進んで来て日本人の研究者の貢献も紹介されているが、頑強な均衡戦略が見つかっていないなど、まだ残された課題は多そうである。著者も執筆段階で研究に取り組んでいる事が紹介されている。

数学的にそんなに難しい話も無く、かなり軽快に読めるテキストだと思う。個人的にはかなり面白くて、そうストレス無く一気に読みきることができた。ただし、頭の中に何か残っていると言うわけでは無い(´・ω・`)ショボーン

*1手元にあった「ゲーム理論」「経済学のためのゲーム理論入門」を確認した。情報不完備ゲームはあるのだが、これはくり返しゲームの話ではない。他のテキストも似たような構成だと思われる。

0 件のコメント:

コメントを投稿