戦略10以下の2人戦略形ゲームのナッシュ均衡を(混合戦略まで含めて)すべて計算するプログラムなど、趣味で作ったweb上の計算アプリケーションを提供しています。
- ナッシュ均衡計算プログラム
- 2人戦略形ゲームのナッシュ均衡を全列挙する計算アプリです(戦略は10以下)。
- 逆行列計算
- ナッシュ均衡の計算プログラムを作るときに、練習として作ったものです。
Navigator to Game Theory
ゲーム理論関係
戦略10以下の2人戦略形ゲームのナッシュ均衡を(混合戦略まで含めて)すべて計算するプログラムなど、趣味で作ったweb上の計算アプリケーションを提供しています。
2020年コロナ対応でオンデマンドにした大学の講義動画をyoutubeに公開しています。以下は、そのタイトルの一覧です。
部分ゲーム完全均衡について、ざっくりと説明します。
部分ゲーム完全均衡(Subgame Perfect Equilibrium, SPE)とは「ある点から後がゲーム(部分ゲーム)とみなせるときには、プレイヤーはそのゲームのナッシュ均衡を選んでいる」と考えるゲームの解です。
次のようなゲームを考えてみましょう。
このゲームは最初にプレイヤー1がYかNかを選択。Nを選べば右上の戦略形ゲーム(同時ゲーム)に突入し、Nを選べばゲームは終了してプレイヤー1と2の利得が共に2となるゲームです。
このゲームの解はどうなると予想されるでしょう?プレイヤー1は最初の点で、Yを選んだときに、その結果がどうなるかを予想しなければなりません。右上の戦略形ゲームでは、ナッシュ均衡は(B,B)なので、プレイヤー1の利得は1になると予想されます。
このことからプレイヤー1は最初の点でYを選べば利得は1、Nを選べば利得は2になるのでNを選ぶと考えられます。部分ゲーム完全均衡は「プレイヤー1は最初の点でYを選び、次の戦略形ゲームでプレイヤー1と2は共にBを選ぶ」となります。
部分ゲーム完全均衡を正確に学ぶためには、(1)展開形ゲームはどのように書けて、それを戦略形ゲームに変換するにはどうするのか、(2)展開形ゲームにおいて、ある点から後をゲーム(部分ゲーム)とみなせるのはどういうときか、を学ぶ必要があります。それはまた今度にします。今はこちらの動画を参考にしてください。
部分ゲーム完全均衡はナッシュ均衡の1つ(精緻化されたもの)です。例を使って、(ボンヤリとですが)説明してみましょう。
次のゲームを考えます。
このゲームは、プレイヤー1がUかDを選び、プレイヤー2がLかRを選ぶ戦略形ゲーム(同時のゲーム)と考えることもできます。
ここで「交互にプレイする展開形ゲームを、同時にプレイする戦略形ゲームに変換できるのか?」という疑問があるかと思います。確かにそこが最大のポイントですね。確かにプレイヤー2は、プレイヤー1がDを選んだのを知ってから、LかRを選ぶわけです。しかし、プレイヤー2はゲームが始まる前に「もしプレイヤー1がDを選んだらどうするか」を決めておくことはできるはずです。またプレイヤー1は、「もしDを選んだらプレイヤー2はどうするか」を推測しなければ自分の選択を決めることができません。プレイヤー1の頭の中では、プレイヤー2がどうするかは、自分が選択をする前(ゲームが始まる前)に決まっていなければなりません。このように展開形ゲームでは「すべてのプレイが行われる前に、各プレイヤーはどの点で何が選ばれるかを決定しておく」として、戦略形ゲームとして考えることができるわけです。
この戦略形ゲームのナッシュ均衡は(U,L)と(D,R)の2つです。
一方、このゲームの部分ゲーム完全均衡はどうなるでしょう。プレイヤー2が行動する点は部分ゲームと考えることができます。プレイヤー2はLを選べば利得1、Rを選べば利得2ですからRを選びます。このプレイヤー2の行動を推測すると、プレイヤー1はDを選びます。
ナッシュ均衡がすべて、部分ゲーム完全均衡になるわけではありません。ここで、部分ゲーム完全均衡ではない(U,L)というナッシュ均衡が、どういうものかを考えてみましょう。図では以下のようになりますね。
このナッシュ均衡では、各プレイヤーが(U,L)が起こると予想しています。プレイヤー2は、プレイヤー1がUを選ぶと予想すれば、Lを選んでもRを選んでも利得は同じなので、Lを選んでも悪くはありません。そして、プレイヤー1は、プレイヤー2がLを選ぶと予想すれば、Uを選ぶことが最適です。したがって、この戦略の組は「すべてのプレイヤーにとって、相手がその戦略を選ぶならば、自分にとって最適な戦略を選んでいる」ようなナッシュ均衡になるのです。
確かにプレイヤー2は「プレイヤー1がUを選んだと予想したときは、Lを選んでもRを選んでも利得は同じ」です。しかし、このゲームは同時のゲームではありません。予想ではなく、実際にプレイヤー1がDを選んだ場合には、プレイヤー2は、もはやLを選ばずRを選ぶでしょう。
このように展開形ゲームを戦略形ゲームに変換すると、「プレイヤーが選択した行動の情報」を考慮せずに、プレイヤーの推測を考えることになってしまうように見えます(そう見えますが、本当にそうかどうかは、難しいところです)。
そのため、変換した戦略形ゲームのナッシュ均衡をそのまま解として考えると不完全で、展開形ゲームの構造を考慮して、ナッシュ均衡の中から適切でない解を除く必要があります。これを均衡の精緻化(equilibrium refinement)と呼びます。部分ゲーム完全均衡はナッシュ均衡の精緻化による解の1つです。
ゲーム理論に関する一般向けの投稿や講演の履歴、インタビュー記事などをまとめています。(研究業績に記したものと、一部重複があります)
大学での講義(教育履歴、非常勤講師等)は、別にしてこちらにまとめています。
ゲーム理論において、間違いられやすい用語は「協力ゲーム」だ。
多くの場合、世の中の状況は「競争」と「協力」に分けられる。
そこで、一般の人(?)は、競争を非協力ゲーム、協力や協調を協力ゲームと呼びがちだ。
呼びがちな人にとって競争とは、「一方が勝ち、一方が負ける」ような状況、例えば、将棋とか囲碁などの遊戯の<ゲーム>、スポーツなどを意味している。
一方、協力とは、交渉とかコーディネーションや囚人のジレンマなどなど、両者の行動によっては、良くなるウィンウィンの状態が存在する状況を意味しているように思える。
ゲーム理論では、上記の状況は両方とも非協力ゲームとして分析される。
あえて上記の状況を呼ぶのならば、競争はゼロサムゲームで、協力はノンゼロサムゲームである。
非協力ゲームと協力ゲームとは何かについては、別の記事に書いてあるが、ここでは使われている用語から見分ける方法を書いておこう。
利得行列、戦略、行動、ゲームの木、ナッシュ均衡、進化などの用語が使われているならば、それは非協力ゲーム。
特性関数、コア、シャープレイ値、仁などの用語が使われていれば、それは協力ゲームである。
2023年9月に非常勤で集中講義を予定している静岡大学工学部数理システム工学科の講義「社会システム工学」の講義情報です。ゲーム理論を講義します。
受講生の皆さんはLecShizu(静岡大学LMSサイト@工学部)の情報も参考にしてください。宿題や演習もそちらにあります。
以下の講義資料は、変更されることがあります。
オンデマンド学習について
すべてではありませんが、講義内容に沿った動画をオンデマンドで見ることができます。以下を参照してください。
http://nabenavi.net/gametheory/
この動画は文系(東京都立大学経済経営学部)向けのものなので、本講義にある「数式の表記について」という部分に対応している動画はありません。しかし、宿題や演習には十分対応できると思います。以下には、講義内容とURLの対応表があります。
裳華房から2021年秋に出版された「一歩ずつ学ぶ ゲーム理論-数理で導く戦略的意思決定-」のページです。
本にはいくつか誤りがあり、ご迷惑をおかけしています。以下に正誤表(PDF)があります。
ご指摘いただいた方々、特に千葉大学の岸本先生とそのゼミの皆さんには感謝致します。
各章末の演習問題で、難しいと思われる問題や、詳しい説明が必要と考えられる問題についての解説(PDF)です。
なお、裳華房の本書のWebページにも同じものが掲載されています。
「ゼミナールゲーム理論入門」は、図や数値例でゲーム理論の考え方を学ぶようになっていますが、概念の定義は言葉だけでなされています。また、独占やクールノー競争、オークションなど、経済学的な例をやや多く用いています。
これに対して「一歩ずつ学ぶ ゲーム理論」は、企画段階では「理工系のためのゲーム理論入門」という名前であったように、概念の定義に数式も用い、その意味を図や数値例で理解して、(まさに一歩づつ)ゲーム理論を学ぶようになっています。道路の混雑、交渉、投票、コーディネーションなど、例も盛り込んではあるものの、理論を学ぶことに重点を置いています。また「ゼミナール…」より、ややページ数を少なくしています。
オークション理論を勉強するために参考となる本をいくつか紹介します。
単一財オークション理論では、商品に対して入札者がどのような価値を持っているかによってモデル化が異なります。ここではそれと勝者の呪いについて説明します。
独立私的価値(Independent Private Value, IPV)モデルは、個人によって商品の評価額(=価値)が異なるモデル、他者と自分の評価額が独立しているモデルです。スターやアイドルの所持品や遺品、絵画や骨董品のように「他人にとっては値打ちがなくても、自分にとっては値打ちがある」と言った商品に対して適用されます。この場合、入札者の評価額は入札者自身が分かっており、他者の評価額や情報に影響を受けません。
これに対し、すべての人にとって商品の本来の評価額が同じと考えるモデルを共通価値(Common Value, CV)モデルと呼びます。 ただし入札者はその評価額を正確に見積もることができず、人によって「誤差」が生じます。これは石油や鉱山の採掘権、転売を目的とした商品の入札などに当てはまるモデルです。石油の採掘権(=油田)の評価額は、そこから採掘される油田の埋蔵量☓原油価格によって一意に決まります(採掘にかかるコストを考慮するときもある)。しかし、埋蔵量がどのくらいあるのか、原油価格がどのくらいになるかの予想が人によってずれる(誤差を持つ)ため、入札者がその油田に対して持つ評価額がずれてくるわけです。また転売目的に商品を落札するときは、転売時の商品価格が評価額となるはずです。最終的にこれは一意に決まりますが、入札時の予想は人によって異なるため評価額がずれてくるわけです。
一般的には、個人の評価額は不確実で他者の評価額い依存・相関すると考える相互価値依存モデル(Interdependent Value)と呼ばれるモデルもあり、共通価値モデルはこの特殊な場合として考えることができます。
共通価値モデルにおいては、一番高く商品を評価した入札者が、落札して商品を手に入れます。しかし、一般的にその商品の「共通価値=正しい価値」は、すべての入札者の評価額の平均値に近いと考えられ、一番高く商品を評価した入札者は商品を過大に評価しています。落札価格が実際の商品の価値を上回っている可能性もあり、このとき落札者は実際の商品の価値を知ったときに、それよりも高い価格で商品を買ってしまったと後悔することが予想されます。これを勝者の呪い(winner’s curse)と言います。
私が共通価値モデルの話で思い浮かべるのは、「群衆の智慧(ジェームズ・スロウィッキー)」の冒頭に出てくる「雄牛の重さ当てコンテスト」の話です。
1906年にイギリスの科学者フランシス・ゴールドンは、イングランド西部の見本市における「雄牛の重さ当てコンテスト」で、ある調査をしました。このコンテストは、800人の参加者が「雄牛の重さ」を推測し、一番正解に近い人が商品をもらえる、というものでした。コンテストの参加者800人の予測のうち、判読不能な13人を除き787人の平均値を調べた結果、その平均値は1197ポンドでしたが(※1)、雄牛の実際の重さは1198ポンドで、ほとんど一致していたというものです。
この話は集合知=群衆の知恵の代表例として知られています。これはこれで面白くて話したいこともたくさんあるのですが、それはまた別の機会に。
さて、このコンテストが雄牛のオークションであったら、どうでしょうか? 牛肉1ポンドの価格はだいたい決まっているはずなので、 正しい雄牛の価格は牛肉1198ポンド分の「共通価値」になるはずです。そして、それは全員の予想の平均値とほぼ同じになります。しかしオークションを落札する人は、この雄牛の重さをもっとも重く予想した人になり、たぶんその人は落札後に勝者の呪いを持つことになるでしょう。
その商品の価値は一意に決まっていても不確実性があり、その価値を参加者が誤差を持って観察する場合は(ガウスを信じるなら)、参加者の評価額は以下の正規分布のように分布するはずです。
もっとも高い評価額は平均値=真の評価額よりも、必ず高いところにあります。もしセカンドプライスオークションの説明で述べたように、参加者が自分の評価額を正直に入札したら、落札者は必ず勝者の呪いを起こすことになります。
このことから共通価値モデルでは「セカンドプライスオークションでは、参加者が自分の評価額を正直に入札する」ということは成り立たないことが分かります。合理的な入札者は、自分が勝者になっても勝者の呪いが起きないように、自分の評価額よりも低く入札を行うという結果が得られます。
※1 ゴールドンは実際は中央値を用いていたそうです(Wallis, 2014)。
日経MJ 「デマ拡散で買い占め」のワケ:識者に聞く対処法で、トイレットペーパーの買い占めと協調ゲーム・合理的群衆行動との関係を解説しました。