囚人のジレンマ。ここを間違える!ここが分からない!
囚人のジレンマに関する解説は、ネット上に数多くあります。そこでここでは、少し視点を変え、多くの人が分からなかったり、間違えたりすることについて、解説していきたいと思います。
囚人のジレンマとは
囚人のジレンマは、ゲーム理論の中で、もっとも有名な例と言えるでしょう。
2人のプレイヤーが「協力するか」「協力しないか」を選ぶ問題で、以下の3つの条件が成立するときに、それは囚人のジレンマと呼ばれます。
(1)相手が協力するならば、自分は協力しないほうが良い。
(2)相手が協力しなくても、自分は協力しないほうが良い。
(3)しかし各プレイヤーは、2人が協力しないよりは、2人が協力したほうが良い。
(1)と(2)から、相手が何を選んでも自分は「協力する」より「協力しない」ほうが良いので、2人は協力しないことを選択します。しかしその結果が2人が協力することよりも悪くなっているために問題となるわけです。
ここで 「協力する」ことはゲーム理論では支配戦略と呼ばれます。支配戦略は、相手が何を選んでも、自分にとって他の選択より良い選択です。このことから支配戦略を選ぶことは自明のように思えるのですが、 囚人のジレンマを考えると支配戦略を選ぶことが必ずしも自明では思えなくなります。
囚人のジレンマの例
この問題が興味を持たれるのは、社会や経済や政治の問題にこのジレンマが多く現れるからです。例えば
- 2国間の軍備拡張の問題。相手国が軍備拡張しない場合、自国だけが軍備拡張をすれば相手に外交上優位な立場に立てる。相手国が軍備拡張しない場合は、自分も拡張して追いつかなければ、相手に優位に立たれてしまう。しかし、両国とも拡張すると、拡張前と力のバランスは変わらず、ただ軍事費だけが増えてしまう(核兵器の問題にも同様な文脈が使われます)。
- 安売りの問題。競争関係にある2店舗が、顧客を取り合うために、商品の価格を現状維持とするか、安売りをするかの問題。相手が現状維持の場合、自分だけが安売りをすれば顧客を奪い売上が増えるので、安売りをしたほうが良い。相手が安売りをしている場合、自分だけが現状維持をすると顧客を奪われ売上が減少するので、こちらも安売りをしたほうが良い。しかし両者が安売りをすると、顧客を奪うことはできず、価格の低下で売上だけが減ってしまう。
と言った現象です。なお安売りの問題は、安売りをしている企業にとっては問題ですが、消費者にとってはそれ以上に恩恵があります。市場の価格競争は、囚人のジレンマという構造を利用して消費者の厚生を高める仕組みだと言うこともできます。
囚人のジレンマの由来
この問題が囚人のジレンマと呼ばれるのは、タッカー(A。 Tucker。カルーッシュ・クーン・タッカー条件(Karush-Kuhn-Tucker condition)のタッカーです)という数学者が上の状況を以下のようなストーリーで表現したことが由来であると言われています(以下はタッカーのオリジナルのストーリーとは違います)。
(囚人ジレンマ ストーリー)重罪を犯しているが、証拠が不十分なため軽微な罪で逮捕されている2人の囚人がいる。彼らは別々な部屋で取引を持ちかけられる「お前だけが重罪について自白すれば無罪にしてやる」。
もし2人が黙秘を続けると、軽微な罪で懲役1年である。しかし1人が自白し、1人が黙秘をすると、自白した方は釈放、黙秘した方は(捜査に協力しないことで罪が重くなり)懲役10年。しかし両方が自白すると(重罪で)懲役5年になる。
さて、あなたが囚人ならば自白したほうが良いか、黙秘したほうが良いか?
この状況を表にすると、以下のようになります。
先に述べた「協力すること」を「黙秘」に、「協力しないこと」を「自白」に置き換えると、囚人のジレンマの3条件に当てはまることが分かります。すなわち、
(1)各囚人は、相手が黙秘するなら、自分は自白するほうが良い。
(2)各囚人は、相手が自白するとしても、自分は自白するほうが良い。
(3)しかし各囚人は、2人が自白するよりは、2人が黙秘したほうが良い。
相手が黙秘しても自白しても、自分は黙秘するより自白するほうが良いので、2人は自白を選びます。しかし、その結果は2人が黙秘するよりも悪くなります。
囚人のジレンマ:ここを間違える!ここが分からない!
囚人のジレンマに関する解説は、ネット上に数多くあります。そこでここでは、少し視点を変え、多くの人が間違いやすいポイントについて解説していきます。
コーディネーションゲームと間違えるな
以下の3つが成立するゲームを考えます。
(1)各プレイヤーは、相手が協力するならば、自分は協力したほうが良い。
(2)各プレイヤーは、相手が協力しないならば、自分は協力しないほうが良い。
(3)しかし各プレイヤーは、2人が協力しないよりは、2人が協力したほうが良い。
(1)と(2)が成立するゲームは、コーディネーションゲーム(調整ゲーム、協調ゲーム)と呼ばれます。しかも、(3)が加わると、囚人のジレンマに似てきます(パレート順位付きコーディネーションゲーム)。例としてあげられるのは、トイレットペーパーの買い占めや銀行の取り付け騒ぎです。
- トイレットペーパーの買い占めの例:地震などの大災害時に、しばしば問題となる現象。相手が必要外のトイレットペーパーを買いにスーパーに走らない(協力する)ならば、自分も買い占めに走らない方が良い。しかし、相手が買いに出るならば(協力しない)、ペーパーはなくなってしまうから、自分もお店に買いに行った方が良い。結果として、全員が落ち着いて協力し、買いに走らないほうが、全員が買いに行って紙が不足するよりも良い。
囚人のジレンマと(2)と(3)は同じなのですが、(1)が違います。囚人のジレンマと言われている現象で、コーディネーションゲームと間違えられているものも多くあります。
ナッシュ均衡?支配戦略?
囚人のジレンマで両者が協力しないというのはナッシュ均衡だ、と言われます。これは、間違いではないのですが、正確には囚人のジレンマの解は支配戦略と呼ばれ、ナッシュ均衡よりも「強い解」になります。
両者の違いは以下のようになります。
- 支配戦略とは「相手が何を選んだとしても、自分はそれを選ぶことが、他の戦略よりも良い戦略」です。囚人のジレンマでは、相手が協力しても、協力しなくても、自分は協力しない方が良い。つまり相手が何を選んでも「協力しない」ことが支配戦略となります。
- ナッシュ均衡は、「相手がそのナッシュ均衡を選んでいるときには、自分にとって、それを選ぶことが他の戦略よりも良いような、戦略の組合せ」です。トイレットペーパーの買い占めなどのコーディネーションゲームでは、「相手が協力しないならば、自分にとっても協力しない方が良い」となっています。これがナッシュ均衡です。支配戦略との違いは、相手が何を選んでも、それを選ぶことが良いとは限らない、ということになります。
- あと支配戦略は、プレイヤー1人の戦略として決まります。囚人のジレンマでは「協力しない」が支配戦略です。これに対してナッシュ均衡は「戦略の組合せ」として決まります。トイレットペーパーの買い占めなどのコーディネーションゲームにおいて、各プレイヤーにとって「協力しない」「協力する」が単独で「ナッシュ均衡」になるわけではありません。「皆が協力しないことを選ぶこと」「皆が協力することを選ぶこと」がナッシュ均衡です。このようにゲーム理論では、ひとりひとりのプレイヤーが選ぶもの(戦略)と、すべてのプレイヤーが選んだ戦略の組(戦略プロファイル)を区別することが重要です。
「全員が支配戦略を選んだ戦略の組合せ」はナッシュ均衡になります。「相手が何を選んでも、それを選べば良い戦略」ならば、当然「相手がナッシュ均衡の戦略を選んでも、それを選べば良い戦略」になるからです。
3人以上だと共有地の悲劇と呼ばれる!
2人ではなく3人以上の多人数版の囚人のジレンマは共有地の悲劇と呼ばれます。まあ、3人以上でも「多人数の囚人のジレンマ」と呼ばれることもあります。
囚人のジレンマの繰り返し
囚人のジレンマは、本来なら協力することが望ましい2人が協力しない方が良いという結果になってしまうジレンマです。これは、協力することをコミットするような契約(協力しなければ罰金を払うなど)を結ぶことで解決できる可能性がありますが、国家間の関係のように、このような契約を結ぶことが難しい場合もあります。このような場合、囚人のジレンマの状況は1回きりではなく、長期間に継続する問題でもあります。このような長期間に続く囚人のジレンマは、囚人のジレンマを何度も繰り返すようなゲームだと考え、繰り返しゲームという枠組みで分析されます。
囚人のジレンマのブックガイド
- 囚人のジレンマ--フォンノイマンとゲームの理論 (1995)、ウィリアム・パウンドストーン(著)、松浦俊輔(訳)、青土社、ISBN:4791753607
- まさに「囚人のジレンマ」をタイトルにした本だが、それのみではなくゲーム理論の歴史と逸話に、ゲーム理論の初歩的な考え方を絡めた読み物である、ゲーム理論とは何かを知る入門書としても面白い。囚人のジレンマの誕生や囚人のジレンマに関する多くの研究について知ることができる。キューバ危機ではノイマン自身が原子力安全委員会の委員長として、ソ連とアメリカの囚人のジレンマにどう対応したかなどが興味深く記されている。原著は W. Poundstone, Prisonaer’s Dillemma (1992), Doubleday.
- つきあい方の科学―バクテリアから国際関係まで (1984)、ロバート・アクセルロッド (著)、Robert Axelrod (原著)、松田 裕之 (翻訳)、Minerva21世紀ライブラリー(ミネルヴァ書房)、ISBN:4623029239。
- 「囚人のジレンマ」の研究の中で、一般の人に有名で影響が強く、分かりやすいのはロバート・アクセエルロッドのコンピュータプログラムどうしのトーナメントによる実験であろう。この本は、その詳細をな結果や経緯をもとに、囚人のジレンマ研究のビジネスへの応用が解かれている。
- 信頼の構造--こころと社会の進化ゲーム (1998)、山岸敏男(著)、東京大学出版会、ISBN:413011086
- 社会心理学の立場から実験やゲーム理論の成果などをふまえて囚人のジレンマや社会的ジレンマがどのように起こり、どのように解決されるかの要因を探り、分かりやすく解説した本。馴れ合いや安易な集団主義に警告を発し、真の信頼関係を築くために何が必要なのかを語る。出版当時は、これからの日本がどうあるべきかを示唆すると共に実験経済学などの方面を踏まえて、これからのゲーム理論がどのように進むべきかも考えさせられた。
- 社会的ジレンマ--環境破壊からいじめまで(2000)、山岸敏男(著)、PHP新書、ISBN:4569611745
- 前述の本が社会的ジレンマ研究のサーベイや実験経過などを理論的に解説する研究者向けの本であるのに対して、同著者のこの本は社会的ジレンマとその解決を一般向けに解説した本であった。
- 対立と協調の科学-エージェント・ベース・モデルによる複雑系の解明 (2003)、ロバート・アクセルロッド (著)、寺野 隆雄 (翻訳)、ダイヤモンド社、\3800、ISBN:447819047X ロバート・アクセルロッド最新刊