グリコ・チョコレート・パイナップルゲームのゲーム理論による解

「グリコ・パイナップル・チョコレート」は, 古くから知られ,今も子どもたちが遊んでいるのを見かける.このゲームは多くの者の興味を引くようで,考察しているホームページや文献はいくつか見られるが,ゲーム理論として,正しく解かれたものは(自分が知る限り)存在しない.2019年度の渡辺ゼミの卒論で,上野陽菜さんがこの問題に取り組んでくれたので,ここに発表しておく.

本来は日本OR学会の2020年春季研究発表会で発表する予定であったが,コロナウィルス問題で学会が中止になったものである.

はじめに

「グリコ・パイナップル・チョコレート」はスタート地点からじゃんけんをして,グー(以下G)で勝てば「グリコ」で3歩進み,チョキ(以下C)かパー(以下P)で勝てば「チヨコレイト」「パイナツプル」で6歩進んで,先にゴールしたほうが勝ち,というゲームである.古くから知られていて,私が子供の頃,50年くらい前には既に存在していたが,今でも子どもたちが遊んでいるのを見かける.この記事では,この「グリコ・チョコレート・パイナップル」ゲームの2人のときのゲーム理論における解を解析する

もし,この2人ゲームの利得行列を図1の左側(進む歩数,進まれた歩数が利得)と考えるならば,ナッシュ均衡(零和ゲームなのでマキシミニ戦略と同じ)は「G,C,Pを2/5,2/5,1/5で出す」ことが解になる.また右側と考えるならば「G,C,Pを1/4,1/2,1/4で出す」ことが解になる.

図1:誤った利得行列の例

ちなみに右側は拙著「ゼミナールゲーム理論入門」に載っていて,求め方も(丁寧に)解説している.初心者にゲーム理論への興味を湧かせるために,このような例を用いたのだが,いつの間にかこの例が広まってしまった.中には「この解はおかしい」という人まで現れてしまった.おかしいのは分かってて「このような利得だと考えると」と文をつけているのにである.いつか,これを正しておかなければ死ねないと,ずっと思っていた.本稿を仕上げることで,やっと死ねる.

図1のような利得行列は間違いである.その理由の1つ目は,このゲームは元々「先にゴールしたほうが勝ち」と言うゲームで,結果は「勝ち」「負け」しかなく,進んだ歩数は利得ではないからである.3とか6などの数値は意味がなく,勝つか負けるかしかないはずずだ.

もう1つ重要なことは,このゲームは相手と自分が立っている位置によって,戦略は異なるということである.これを確認するには2人ともあと三歩以内でゴールできるという状態を想定すれば良い.このときは3歩でも6歩でもゴールでき,G,C,Pは同じ効果を持つ(与える利得は同じ).このときの均衡は普通のじゃんけんと同じ「G,C,Pを1/3ずつ出す」となることは明らかだ.すなわち,このゲームにおける均衡戦略は「お互いが,あと何歩でゴールできるか」という状態に依存する.

ここではゲームを「先にゴールすれば勝ち,ゴールされれば負け」と考え,「勝てば利得が1,負ければ利得が-1」の2人零和ゲームと考える.そして2人のゴールまでの距離を状態変数としたゲーム(マルコフゲーム)と捉え,定式化して分析する.

問題のモデル化

このゲームを2人零和ゲームと考え,以下のようにモデル化する.

  • 計算を単純にするため,3歩を1ステップと考える.
  • 2人のプレイヤーが,ゴールのNステップ前の距離からじゃんけんをはじめ,Gで勝つと1ステップ,C,Pで勝つと2ステップ進む.あいこだと,どちらも進まない.
  • 先にどちらかがゴールすればゲームが終了する.先にゴールした方は勝ちで利得1を獲得し,ゴールされた方は負けで利得-1とする.
  • 「行き過ぎ」は考えない.ピッタリゴールしなくても勝ちとする.例えば1ステップ前からCで2ステップ進んでも,勝利とする.
  • 時間経過による利得の割引は考えない.

プレイヤー1が,あと\(n\)ステップ,プレイヤー2があと\(m\)ステップでゴールする状態を\((n,m)\)( \(1 \leq n,m \leq N\))で表す.状態\((n,m)\)で,どちらかのプレイヤーが勝つと状態が遷移し,あいこだと同じ状態に留まる.たとえば状態\((10,9)\)のとき,プレイヤー1がパーで勝てば状態\((8,9)\)に遷移する.

状態\((n,m)\)でプレイヤーが直面するゲームのナッシュ均衡(マキシミニ戦略でもある)における,プレイヤー1の期待利得(ゲームの値)を\(v_{n,m}\)とする.

\(n=0,-1\)または\(m=0,-1\)の場合にはゲームが決着し値が定まっている.これが再帰的に問題を解く初期状態となる.すなわち
\( \begin{align}
v_{0,m}=v_{-1,m}=1 & v_{n,0}=v_{n,-1}=-1 \tag{1}
\end{align} \)
(\(1 \leq n,m \leq N\))とする.

このとき状態\((n,m)\)におけるゲームのプレイヤー1の利得は,以下の表となることが分かる.

状態(\(n,m\))におけるプレイヤー1の利得表

零和ゲームであることから,プレイヤー2の利得は,上記行列に-1を乗じたものとなる.

問題の解法

ゲーム\((n,m)\)のプレイヤー1の均衡戦略とゲームの値\(v_{n,m}\)を求める.なお,ここでプレイヤー2の戦略は,状態\((m,n)\) でのプレイヤー1の戦略と同じになる.

プレイヤー1が均衡において,G,C,Pを出す確率(混合戦略)を\(q_G,q_C,q_P\)とする.このときプレイヤー2がG,C,Pを出したときのプレイヤー1の期待利得を\(E_G,E_C,E_P\)とすると,
\( \begin{align}
E_G=q_Gv_{n,m}+q_Cv_{n,m-1}+q_Pv_{n-2,m} \\
E_C=q_Gv_{n-1,m}+q_Cv_{n,m}+q_Pv_{n,m-2} \\
E_P=q_Gv_{n,m-2}+q_Cv_{n-2,m}+q_Pv_{n,m}
\end{align} \)
となる.

ここでナッシュ均衡では
\[
E_G=E_C=E_P=v_{n,m} \tag{2}
\]
が成立する.

上記の理由を正確に説明すると長くなるため端折って説明する.このゲームには,純粋戦略のナッシュ均衡はない.そして,これから1つの戦略に確率0を割り当てる(つまり2つの戦略のみに確率を割り当てる)ような混合戦略を用いたナッシュ均衡が存在しないことも分かる.ナッシュ均衡は必ず存在するので,このゲームにはすべての戦略に正の確率を割り振るような混合戦略(完全混合戦略と呼ぶ)のナッシュ均衡しかないことが分かる.

しかし,もし均衡で\(E_G=E_C=E_P\)でなければ,低い期待利得になる戦略に確率0を割り当てることが最適反応戦略となるため,上記のことに矛盾するからである.これから
\(E_G=E_C=E_P\)が得られて,期待利得\(v_{n,m}\)もこれと等しくなることが分かる.これより式(2)を得る.

式(2)に対して,式(1)を初期条件として用いて,\(q_G,q_C,q_P\)と\(v_{n,m}\)を求めることで,再帰的に期待利得\(v_{n,m}\)と均衡戦略を求めることができる.しかしこの方程式は\(v_{n,m}\)に関ずる非線形方程式(3次方程式)になるため,数値的に解くこととする.

なお\(q_G,q_C,q_P\)はプレイヤー2の均衡戦略であるが(ナッシュ均衡は,プレイヤー1の期待利得を考えることで,プレイヤー2の戦略が求められる,こちらを参照),\(n\)と\(m\)を入れ替えてプレイヤー1の戦略を求める.

計算結果

まずプレイヤー1の期待利得について,基本的な確認をしてみる.

図1は,プレイヤー2のゴールまでステップ数\(m\)を横軸に取り,プレイヤー1のゴールまでのステップ数\(n\)ごとにプレイヤー1の期待利得を示したものである(\(n=1\dots,10\)).

図1:プレイヤー1の期待利得(プレイヤー1の勝つ確率と同じ)

プレイヤー1の期待利得を\(v\)とするとき,プレイヤー1の勝利確率\(p\)は
\[ p=\frac{1}{2}\left(v+1\right) \]
で与えられるので,図1はプレイヤー1が勝利確率と考えることもできる.

表1はプレイヤー1の勝利確率である.例えば自分があと1ステップ(3歩)でゴールでき,相手が2ステップ(6歩)のとき((n=1,m=2)),相手はチョキかパーで勝てば逆転勝利できる位置にあるが,自分の勝利確率は63%(2/3),相手は37%(1/3)である.

表1:プレイヤー1の勝利確率

これらから,次のことが確認できる.

  • プレイヤー1もプレイヤー2も同じ位置にいるとき(\(n=m\)),プレイヤーの勝つ確率は同じ(期待利得は0, 勝つ確率は0.5で等しい).
  • プレイヤー1の位置を固定すると(\(n\)のグラフを固定),プレイヤー2の位置がゴールから遠くなればなるほど(\(m\)が増加するほど),プレイヤー1の勝利確率は高くなり,
  • プレイヤー2の位置を固定すると(\(m\)の値を固定),プレイヤー1の位置がゴールから遠くなればなるほど(\(n\)が増加するほど),プレイヤー1の勝利確率は低くなる.

次に戦略について見ていこう.計算から次のようなことが分かった.

  • プレイヤー1の戦略に対し,グーとチョキを入れ替えるとプレイヤー2の戦略となる.パーの戦略は同じになる.
  • パーを出す確率は,グーやチョキよりも低い.グーとチョキのどちらが高いかは,状態によって変化する

これらはたぶん均衡を求める式を丁寧に調べると証明できるのであろうが,やっていない.

さて,図2は\(m=1\)(プレイヤー2があと1ステップでゴールするとき) の両プレイヤーの戦略を,プレイヤー1の位置\(n\)を横軸としてグラフにしたものである.このゲームの特徴がよく現れている.

図2:あと1ステップ(3歩)でプレイヤー2がゴールするとき

先に予想したとおり,2人ともあと1ステップでゴールできる場合( \(n=m=1\))では,G,C,Pを出す確率は\(1/3\)となり,普通のじゃんけんと同じになることが分かる.それ以外では,プレイヤー1はグーを出す確率が高く,プレイヤー2はチョキを出す確率が高い.プレイヤー2はあと1ステップでゴールできるので,グーよりもチョキやパーを出すことで有利にならないため,相手に2ステップ進ませることを何としても避けたい.そのためチョキを出してプレイヤー1がチョキやパーで進むことを阻止したいわけだ.プレイヤー1はそれを読み込むと,グーを出す確率を高くして,1ステップだけ進んでおこうとして,それが均衡となる.プレイヤー1の位置が2ステップのとき\(n=1,m=2\)では,それが最も顕著に現れ(プレイヤー2は1ステップでゴールできるにも関わらず,プレイヤー1に2ステップ進まれると逆転負けする),プレイヤー1がグーを出す確率(=プレイヤー2がチョキを出す確率)は0.52にまで上昇する.

図3は\(m=5\)(プレイヤー2があと5ステップでゴールするとき) のグラフである.

図2:あと5ステップ(15歩)でプレイヤー2がゴールするとき

この例から分かるように,均衡戦略は次の2つの要因に影響される.

(1)ゴールまでの距離:プレイヤー1がゴールから離れるほど,グーを出す確率が増加しチョキを出す確率が減少する(プレイヤー2はチョキを出す確率が増加し,グーを出す確率が減少する). プレイヤー1がゴールから遠いとき,プレイヤー2はプレイヤー1が2ステップ進むことを避けるためチョキを出す確率を高め,それをプレイヤー1が読み込みグーを出す確率が高くなることを表している.相手がゴールより遠いときには逆転させないように1ステップづつ進ませる(自分がゴールから遠いときには1ステップづつ進む)戦略となる.同じ位置 \(n=m\) にいるときはグーとチョキを出す確率が同じになるので,基本的には勝っているときはチョキを出す確率が高く,負けているときはグーを出す確率が高くなる.

(2)奇数と偶数ステップの効果:プレイヤー1は偶数ステップではグーを出す確率が増加し,チョキを出す確率が減少する.先に見たようにプレイヤー1が残り2ステップでゴールする場合\(n=2\),プレイヤー2はプレイヤー1が2ステップ進んで一気にゴールすることを阻止するためチョキを出す確率を高めるので,プレイヤー1はそれを読み込んでグーを出す確率を高める.これと同様の理由が再帰的に続くと考えられる.例えばプレイヤー1が残り3ステップと4ステップのときを考えると,どちらも1回ではゴールできず,少なくとも2回で勝たなければゴールできない.プレイヤー1が残り4ステップのとき,一気に2ステップ進まれると,残り1回で勝つチャンスがプレイヤー1に生まれるが,1ステップでは少なくともあと2回勝たなければダメなままである.これに対しプレイヤー1が残り3ステップのときは,1ステップ進んでも,2ステップ進んでも残り1回で勝つチャンスがプレイヤー1に生まれる.つまりプレイヤー2としては,プレイヤー1が偶数ステップのときに2ステップ進むことを阻止したいインセンティブが強くなる.それをプレイヤー1が読み込む結果だと思われる.

上記の2つの要因によって図3の戦略は解釈できると思われる.

  • \(n=m=1\)ではG,C,Pを出す確率は\(1/3\)となる.
  • \(n=m\)ではグーとチョキを出す確率が同じ.
  • \(n=m\)として,\(n,m\)を大きくすると,均衡戦略は図1の左側の利得行列のナッシュ均衡である\(2/5,2/5,1/5\)に近づくことが分かる.

最後の結果から,巷で言われる(?)図1の左側の利得行列の計算も,あながち間違っているわけではないと言える.

まとめ

以上,グリコ,チョコレート,パイナップルの解をゲーム理論で解析した.なおこの確率はナッシュ均衡の確率を計算したものであり,相手がナッシュ均衡に従わない場合は必勝戦略とならないことに注意したい.例えば,チョキばかり出してくる馬鹿な相手に,上記の結果で勝負するよりは,グーを出したほうが良い.

この混合戦略のナッシュ均衡は,自分がナッシュ均衡に従っているならば,相手が何を出して来ようが,均衡における自分の期待確率を同じにしていることに注目したい.つまり自分が勝っているとき(相手よりも先に進んでいるとき)は均衡に従えば,相手が何を出そうが自分の有利さをそのまま保つことができる.これに対し,自分が負けているとき(相手が先に進んでいるとき)は均衡に従うと,相手が何を出しても自分の不利さをそのまま保つような戦略になってしまっている.そこで実践的な意味では,自分が先に進んでいるときは上記の確率に従い,負けているときは相手が均衡戦略から外れ,デタラメに出すことを期待して他の戦略を用いたほうが良いだろう.上記の偶数・奇数ステップでの知見を逆手に取り,自分が偶数ステップにいるときチョキの確率を高めて,2ステップ進む確率を高めたほうが良いかもしれない.

混合戦略のナッシュ均衡が何を意味しているのかは,混合戦略の項に少し記したが,私自身も理解していないことがいくつかある.これらは機会を見て,追加していきたい.

調整ゲーム

調整ゲームとは

調整ゲームはコーディネーションゲーム(coordination game)の翻訳で,協調ゲームと訳されることもあります.ざっくり言うと「他人と同じ行動を選ぶことが良い」ようなゲームです.結果となるナッシュ均衡は「全員が同じ行動を選ぶ」となるので(確率を用いる混合戦略を除く),結果の候補が複数あることになります(複数均衡).

女と男の戦い

ゲーム理論で最初に習う2人調整ゲームは, 以下のストーリーで表される女と男の戦い(battle of sexes)です(変な名前!でも昔は「両性の戦い」と訳されていました.これだとさらに意味不明です).

アリスと文太は,禅寺かショッピングセンターに行く.2人は相手の行動を知らずに,どちらに行くかを選ぶ.アリスと文太は,お互いが好意を抱いているので同じ場所を選べば利得1を獲得し,さらにそれが自分が好きな場所ならば利得にもう1点が加わり2になる.違う場所を選んでしまうと(たとえ好きな場所に行ったとしても)利得は0である.

「女と男がいて,お互い同じ場所に行きたい.できれば自分の行きたいところがいい!」というそれだけのゲームです.男女が武闘しているわけではありません.この状況を利得行列にすると,以下のようになります.

女と男の戦い(battle of sexes)

この状況では,各プレイヤー(アリスと文太)はそれぞれ
(1)相手が禅を選ぶなら自分も禅を選ぶほうが良く
(2)相手がショッピングを選ぶなら,自分もショッピングを選んだほうが良い
となり,「相手と同じ行動を選ぶことが良い」となります.これが調整ゲームです.

調整ゲームの例

  • どのSNSに参加するか,という問題.自分の友人が皆んなFaceBookを選んでいるならばFBを,インスタグラムを選んでいるならインスタを選ぶことが良い.このように商品に正の外部性(自分が購入する財から得る効用は,他の消費者がそれを多く選んでいるほど高くなる)があるときの消費者の選択は調整ゲームになります.
  • 技術規格のデファクトスタンダード問題.かつてビデオデッキの開発において,各企業はVHS方式とベータ方式のどちらの規格を選ぶかという問題に直面しました.企業の選択は,多くの企業が選択するものと同じ規格を選択したほうが有利になります(wikipedia デファクトスタンダード
  • 同窓会の参加.皆んなが参加するならば,自分も参加したほうが良いけど,皆んなが参加しないなら,自分も参加しないほうが良い.
  • 右側通行か左側通行か.細い道を車ですれ違うとき,右に避けるか左に避けるか.お互いに右か左か同じルールを選ばないと衝突してしまう.

調整ゲームのバリエーション

先ほどの「女と男の戦い」では,相手と同じ行動を選ぶことが良いわけですが,各プレイヤーは,どの結果が最良であるかが異なっています.アリスにとっては2人が禅を選ぶことが,文太には2人がショッピングを選ぶことが良いわけです.このような調整ゲームは非対称(asymmetric)であると言われます.これに対して「どの結果でも,2人が会えさえすれば同じ(1点)」のように,結果に差がなく,行動が一致さえすれば良いゲームは対称(symmetric)な調整ゲーム,純粋調整ゲーム(pure coordination game),またはマッチングゲーム(matching game)と呼ばれます(Camerar 2003).

2人とも禅が好きで,禅寺で会えれば1点,ショッピング・センターで会えれば2点,のようなゲームも考えられます.このゲームでは,行動が一致しないより一致したほうが良いのですが,一致したときに皆にとって利得が高い場合と低い場合があります.このようなゲームには,定着した呼び名はありません.ここではTremblay and Horton(2012)に従いパレート調整ゲーム(Pareto coordination game)と呼んでおきます.

調整ゲームのバリエーション

調整ゲームの解

調整ゲームでは,すべてのプレイヤーが同じ行動を選択することがゲームの解であるナッシュ均衡になります(他に確率を用いて選択を行う混合戦略のナッシュ均衡もあります).例えば上述の女と男の戦いでは

(A)アリスも文太も禅寺に行く
(B)アリスも文太もショッピングに行く

という2つのナッシュ均衡があります(他に混合戦略のナッシュ均衡がある⇒最後の「注意点」を参照せよ).実際にナッシュ均衡の求め方にしたがって利得に下線を引くと以下の図となり,両プレイヤーの利得に下線が引いてある戦略の組は,上記の(A)と(B)であることが分かります.

女と男の戦いのナッシュ均衡

このように調整ゲームでは複数のナッシュ均衡が存在し,その中でどれを起こりうる結果である「ゲームの解」とするのか,という問題が起きます.この問題は均衡選択の問題と呼ばれ,ゲーム理論の大きな研究テーマです.

このときその中の1つのナッシュ均衡が起きるとすべてのプレイヤーが共通な認識で予測できるような理由があるならば,それは解となりえます.このような皆が共通して結果として予測できるような点はフォーカルポイントと呼ばれます(Schelling (1960)).フォーカルポイントは,「社会慣習」や「これまで繰り返しプレイされてきて培われた経験」などによって形成されると言えます.

例えば上記の男と女の戦いでは,2人はいつも禅に行くことになっている(という慣習や経験があれば,2人は迷うことなく禅を選ぶでしょう.また,そのような経験がなくても「レディファースト」 (アリスに文太が譲る)という慣習があれば,やはり2人は禅を選ぶことになります.文太は,本当は2人でショッピングに行ったほうが良いのですが,アリスが禅に行くと予測するなら,ショッピングよりは禅が良い選択であり,アリスも文太が禅に行くと予測できるなら禅に行くことが良い選択です.つまりナッシュ均衡の定義である 「相手がそのナッシュ均衡の行動を選ぶなら,自分もそのナッシュ均衡の行動を選ぶことが一番良い」という条件を満たすことになります.

これに対して,上記のように2人が共通して予測できるフォーカルポイントがなければ,ナッシュ均衡は実現できるとは限りません.上記のようなゲームを実験室でやらせるとお互いが異なる行動を選び0点を食らってしまう結果も多く見られます.私も講義中にこの実験をやらせてみますが,うまくコーディネイトできるときもあれば,そうでない場合も多いです.うまくコーディネイトできない場合には,(当然ですが) 次の2つのパターンがあります:
・お互いに,自分が高い得点(2点)を選び合ってしまう.アリスが禅を,文太がショッピングを選び,お互いに0点を食らってしまう.
・お互いに,相手に高い得点を取らせようと譲ってしまう.アリスがショッピングを,文太が禅を選び,お互いに0点を食らってしまう.(私は「賢者の贈り物」パターンと呼んでいます.)

パレート調整ゲームでは,一般的にはプレイヤーにとって利得が高い<良い>ナッシュ均衡(パレート優位な均衡と呼ばれる) が望ましく,単純に考えるとそれが実現されると予想されますが,何らかの理由で両者にとって利得が低い<悪い>ナッシュ均衡が実現することも,十分あり得ます.先ほどの例2だと,2人ともショッピングに行くことで利得2が達成できるためこれが<良い>ナッシュ均衡ですが,例えば2人とも毎週毎週ずーっと禅寺に行っていることが定着していて,「相手は禅寺に行く」「相手は自分も禅寺に行くと予想するだろう」と考えれば(2人ともショッピングに行くほうが楽しいと分かっていても)禅寺に行くと考えられます.

調整ゲームにおいて,ナッシュ均衡が実現しない問題,ナッシュ均衡が実現してもパレート優位なナッシュ均衡が実現しない問題は,調整の失敗(coordination failure)と呼ばれます.

フォーカルポイントの例

単純なマッチングゲームでは,さまざまなフォーカルポイントがあると予想されますSchelling(1960)は,以下のようなゲームを(インフォーマルに)実験したようです.

  • 表(head)か裏(tail)のどちらかを選べ.2人が同じものを選んだら賞金をあげよう.
  • 好きな正の番号を選べ.2人が同じものを選んだら賞金をあげよう.
  • ニューヨークのどこかで待ち合わせをする.どこで待ち合わせをするか選べ.

何を選んでも良いのですが,お互いに同じものを選ぶと良いので「調整ゲーム」であることが分かります.賞金に差もなく個人で選ぶと良いものに違いもないので,マッチングゲームですね.

Schelling(1960)によると最初のゲームでは42人中36人がheadを,2番めのゲームでは40%が「1」を選んだといいいます.3番めの質問では多数がGrand Central StationのInformation boothだとされています.

Mehta, Starmer and Sugden (1994)は,このような実験を精緻に行っています.この研究では被験者は2つのグループに分けられ,1つのグループC (Coordination)では「(ランダムに選ばれた)相手と同じものを選んだら賞金を与える」とされ,もう1つのグループP(Picking)では「何を選んでも賞金を与えるので,好きなものを選べ」としています.上記の最初の質問では,グループCでは87%,グループPでは76%がheadを選びそれほど差がないのに対して,2番めの質問では,グループCで選ばれたのは「1」が40%に選ばれて一番多く(「7」が2番めで14%),グループPでは「7」が一番多く11%になっています.このことからある種の質問に対して,「自分が好きなもの」を選ぶのではなく「相手と同じものを選ぶためには何が良いか」を考えてそれを選ぶというフォーカルポイントが存在するということが分かります.

SchellingやMehta達は言及していないのですが,実験結果のデータを見て私が感じたのは「皆が同じものを選ぶと賞金をあげる」と言っているのに,自分が好きな数や場所を選ぶ被験者は,少数ながら必ずいるんだな…ということです.ルールが理解できていないのか,それとも何か意図があるのか.「フォーカルポイントに従う」という行動は,「大勢」や「傾向」ではありますが,それに逆らう(理解できない?従わない?)個の存在も無視できず,それはやはり「少数」や「個性」や「多様性」と言う社会科学の重要なテーマに繋がるのだな,と思いました.

注意点

  • ここでは2人ゲームと多人数のゲームを曖昧に扱ってきましたが,厳密には分けて考えることが必要です.
  • ここでは確率を使わない行動の選択(純粋戦略)のみを考えましたが,調整ゲームには各プレイヤーが確率を使って行動を選択する混合戦略を用いたナッシュ均衡もあります.例えば女と男の戦いの例だと「アリスは禅を2/3,ショッピングを1/3で選び,文太は禅を1/3,ショッピングを2/3で選ぶ」というナッシュ均衡があります.例1のマッチングゲームだと「アリスも文太も,禅とショッピングを1/2ずつ選ぶ」というナッシュ均衡があります.
  • 相手と異なる行動を選ぶことが良いゲーム(チキンゲーム・混雑ゲーム)も広義の調整ゲームとみなされる場合があります.これはゲームの文脈を1回限りの2人のゲームと見做すか,多人数で長期間に渡って行われるゲームと考えるかで異なってきます.
  • 調整ゲームにおいて「複数の均衡の中でどれが起きるか」という問題は,ゲーム理論における均衡選択という理論によって分析されており,リスク支配という概念によって起きる結果が選ばれます.

参考文献

  • Camerar (2003), Behavioral Game Theory: Experiments in Strategic Interaction, Princeton Univercity Press.
  • Mehta, Starmer, Sugden (1994), The nature of salience: An experimental investigation of pure coordination games, The American Economic Review, Vol.84, No.3, pp.658-673.
  • Schelling(1960), The strategy of conflict, Harvard Univercity Press.
  • Tremblay and Tremblay (2012), New Perspectives on Industrial Organization: With Contributions from Behavioral Economics and Game Theory, Springer.

クールノー競争とベルトラン競争関連のページ

クールノー競争とベルトラン競争に関して来られる方が多いので,関連する資料をまとめておきます.

初歩から学ぶゲーム理論-web講義:関連ページ

講義資料(ゼミナールゲーム理論入門:第5章)

首都大学東京「ゲーム理論1」の講義資料から,テキストである「ゼミナールゲーム理論入門」の第5章講義する部分のスライドです.テキストの内容に沿っています.クールノー競争,ベルトラン競争,シュタッケルベルグ競争に相当する部分です.
数値例と演習になります.文字式による一般的な計算はORセミナーのスライドのほうがいいです.

講義資料(ORセミナー)

「技術者のためのゲーム理論の基礎(2)-初歩から学ぶクールノー競争とベルトラン競争」スライド

  • 2015年のORセミナーでの講演を修正したものです.理系の技術者を対象にクールノー競争やベルトラン競争を講義し,そこから経営戦略論や産業組織論を学ぶことにつなげようというねらいです.ORセミナー2014年「技術者のためのゲーム理論の基礎(1)」のゲーム理論入門はこちらにあります.

クールノー競争とベルトラン競争入門(4):最適反応関数で理解するクールノー競争

クールノー競争の価格・生産量と社会的総余剰では,2社のクールノー競争におけるクールノー均衡を求める方法を説明しました.ここではそれを「最適反応曲線」(反応曲線,最適反応関数)と呼ばれる図で説明し,ナッシュ均衡との関連をより明確にします.

モデルの設定(再掲)

クールノー競争の価格・生産量と社会的総余剰で説明した設定を再掲します.そこから読んでいる方は,ここは飛ばして構いません.

  • 同じ製品を販売している企業AとB.
  • AとBの生産量をそれぞれ\(x_A,x_B\)とする.
  • 市場全体の生産量を\(x=x_A+x_B\)とし,その価格\(p\)は$$p=a-bx$$で与えられるとする.
  • 製品1単位の費用(限界費用)はAもBも\(c\)で同じとする.
  • 企業Aの利益を\(\pi_A\)とおく.$$\pi_A=px_A-cx_A$$.
  • 企業Aの利益\(\pi_A\)を最大にする\(x_A\)を考える.\(p=a-bx\)を代入し,\(x=x_A+x_B\)に注意すると\[ \begin{align} \pi_A &=\{a-b(x_A+x_B)\}x_A-cx_A\\&=-bx_A^2-bx_Ax_B+(a-c)x_A \tag{1} \end{align}\]とる.
  • 式(1)を最大にする\(x_A\)を求めるため,\(x_A\)で微分して0になるところを求める.(1)を\(x_A\)で微分すると,\(-2bx_A-bx_B+(a-c)\).したがって\[-2bx_A-bx_B+(a-c)=0\]を解けば良く,これより\[x_A=-\frac{1}{2}x_B+\frac{a-c}{2b} \tag{2}\]となる.
  • 企業Bの利益を\(\pi_B\)とおく.$$\pi_B=px_B-cx_B$$.
  • 企業Bの利益\(\pi_B\)を最大にする\(x_B\)を求めると,\[x_B=-\frac{1}{2}x_A+\frac{a-c}{2b} \tag{3}\]となる.
  • 式(2)と式(3)を,それぞれ「企業Aの最適反応関数」「企業Bの最適反応関数」と呼びます.
  • 式(2)は企業Bの生産量\(x_B)\が与えられたときに,企業Aの利益を最大にする企業Aの生産量を表しています.
  • 式(3)は企業Aの生産量\(x_A)\が与えられたときに,企業Bの利益を最大にする企業Bの生産量を表しています.

最適反応関数を図で書く-最適反応曲線

上記の最適反応関数を横軸に(x_A),縦軸に(x_B)にした図(グラフ)に描いてみます.まず式(3)の企業Bの最適反応関数から考えてみます(⇒なぜなら,左辺は縦軸,右辺は横軸のグラフに慣れている人が多いからです).式(3)のグラフを書いてみると,以下のようになります.

企業Bの最適反応曲線

この式は切片が\(\frac{a-c}{2}\}で,傾きが-1/2の右下がりの直線になります.これは企業Aの生産量が与えられると,そのとき企業Bの利益が最大になる生産量がいくつであるかを示す曲線になるわけです.企業Bは,もし企業Aの生産量が決まれば,自分がもっとも利益が高くなる生産量が分かるわけですが,企業Aの生産量は決まっていません.そこでこれに式(2)の企業Aの最適反応曲線を描き,重ねてみます.

 

企業Aと企業Bの最適反応曲線

企業Aは,企業Bと縦軸と横軸が逆になりますね.切片と傾きは同じです.企業Aは,もし企業Bの生産量が決まれば,自分の利益を最大にする生産量が分かるわけですが,企業Bの生産量は決まっていません.

企業Bの生産量が決まらないと企業Aの生産量が決まらず,企業Aの生産量が決まらないと企業Bの生産量が決まらない.そこで「お互いが最適反応となる生産量の組」を選び合うことが答となると考えます.これがナッシュ均衡,またはクールノー均衡(またはクールノー=ナッシュ均衡)と呼ばれるものです.

ナッシュ均衡は20世紀半ばにゲーム理論で考えられたものですが,寡占市場の分析に限ると,それより100年以上も前にクールノーが上記の解を考えていたことによるため,このように呼ばれます.

お互いが最適反応となる生産量の組は,両方の直線が交わった点です(次の図).この点は,式(2)と式(3)の連立方程式を解くことによって求められます.これを求めると,\[x_A=x_B=\frac{a-c}{3}\]となります.

 

クールノー均衡

以下も参考にして下さい.

ナッシュ均衡の求め方:2人ゲームの利得行列の場合

ここではゲーム理論におけるナッシュ均衡を求める方法について.「プレイヤーが2人で混合戦略(確率を用いる戦略)を考えない場合」について説明します.ゲーム理論の基本中の基本と言えます.

  • 混合戦略(確率を用いる戦略)のナッシュ均衡の求め方はこちら
  • クールノー均衡の求め方はこちら
  • ナッシュ均衡とは何かはこちら
  • ナッシュ均衡の概念を理解するおけいこはこちら

ナッシュ均衡の求め方

ナッシュ均衡は「すべてのプレイヤーが最適反応戦略(利得が最も高くなる戦略)を選び合う戦略の組み合わせ」ですから,以下の方法で求めることができます.

  • STEP1 プレイヤー1の立場で考える.
    • 相手(プレイヤー2)のすべての戦略に対して,プレイヤー1がもっとも利得が高くなる戦略をチェックする(プレイヤー1の最適反応戦略).ここでは利得に下線を引く.
  • STEP2 プレイヤー1の立場でチェックが終わったら,プレイヤー2の立場で考える.
    • 相手(プレイヤー1)のすべての戦略に対して,プレイヤー2がもっとも利得が高くなる戦略をチェックする(プレイヤー2の最適反応戦略).ここでは利得に下線を引く.
  • STEP3 すべてのチェックが終わったら,両プレイヤーの利得に下線が引かれているのがナッシュ均衡.(利得ではなく,戦略の組であることに注意!)

例題

以下の利得行列でナッシュ均衡を求めてみましょう.

ナッシュ均衡を求めてみよう

今回は,ナッシュ均衡を求める手順を習得することが目的なので,ストーリーは特につけずに,単なる記号で利得行列を考えます.利得行列の読み方が不安,分からないって方は,こちらをご覧ください.

STEP1 まず,プレイヤー1の立場で考えます.相手(プレイヤー2)のすべての戦略に対して,プレイヤー1がもっとも利得が高くなる戦略(最適反応戦略)をチェックし,利得の下に下線を引いて行きます.

1.1 プレイヤー2がLという戦略を選んだ場合を考えます.プレイヤー1はTを選べば利得3,Bを選べば利得2です.したがってプレイヤー1はTを選びます(TがLに対する最適反応戦略).そこでTを選んだ時の利得3に下線を引きます.

プレイヤー2のLに対するプレイヤー1の最適反応戦略はT

1.2 プレイヤー2がMという戦略を選んだら?プレイヤー1はTを選べば利得0,Bを選べば利得1です.したがってプレイヤー1はBを選びます(BがMに対する最適反応戦略).そこでBの利得1に下線を引きます.

プレイヤー2のMに対するプレイヤー1の最適反応戦略はB

1.3 最後にプレイヤー2がRという戦略を選んだ場合を考えます.プレイヤー1はTを選んでも,Bを選んでも利得は2で同じです.この場合はTとBの利得2の両方に下線を引きます( TもBもRに対する最適反応戦略).

プレイヤー2のRに対するプレイヤー1の最適反応戦略はTとB

STEP2 プレイヤー1に対する検討が終わったので,次にプレイヤー2の立場で考えます.相手(プレイヤー1)のすべての戦略に対して,プレイヤー2の利得がもっとも高くなる戦略(最適反応戦略)をチェックし,利得に下線を引いて行きます.

2.1 プレイヤー1がTという戦略を選んだ場合を考えます.プレイヤー2はLを選べば利得4,Mを選べば利得2,Rを選べば利得0です.したがってプレイヤー2はLを選びます(LがTに対する最適反応戦略).そこでLの利得4に下線を引きます.

プレイヤー1のTに対するプレイヤー2の最適反応戦略はL

2.2 最後にプレイヤー1がBという戦略を選んだ場合を考えます.プレイヤー2はLを選べば利得2,Mを選べば利得3,Rを選べば利得9です.したがってプレイヤー2はRを選びます(RがBに対する最適反応戦略).そこでRの利得9の下に線を引きます.

プレイヤー1のBに対するプレイヤー2の最適反応戦略はR

STEP3これでプレイヤー1とプレイヤー2のすべてのチェックが終わりました.プレイヤーの両方の利得に下線が引かれている戦略の組がナッシュ均衡です!「

ナッシュ均衡は(T,L)と(B,R)

ナッシュ均衡は「プレイヤー1はTを選び,プレイヤー2はLを選ぶ」「プレイヤー1はBを選び,プレイヤー2はRを選ぶ」の2つです.このようにナッシュ均衡は複数出てくる場合があります(これが悩みの種).これを(T,L)と(B,R)のように,ベクトルのように書く場合もあります.

ナッシュ均衡は「戦略の組 (profile of strategies)」なので,戦略の組として答えます.「ナッシュ均衡は(3,4)と(2,9)です」などと答えては間違いです.それは利得の組ですから.「Tがナッシュ均衡」などと答えても間違いです.Tはプレイヤー1の戦略(a strategy of player 1)です.戦略の組み合わせではありません.

クールノー競争とベルトラン競争入門(3):クールノー競争の価格・生産量と社会的総余剰

独占市場における価格と生産量の決定を理解したとして,ここでは2社のクールノー競争の価格と生産量の決定,および社会的総余剰の計算について説明します.

クールノー競争の価格と生産量の決定:モデル

ここでは同質財を販売している2社の生産量競争を考えます.一般にクールノー競争と呼ばれるのは,このモデルです(不完全競争市場の分類).

  • 企業AとBが同じ製品(同質財)を販売するとします.AとBの生産量をそれぞれ\(x_A,x_B\)とし,AとBは\(x_A,x_B\)を決定するとしましょう.
  • 市場全体の生産量を\(x=x_A+x_B\)に対して,その価格\(p\)は$$p=a-bx$$で与えられるとします.
  • ここで製品を1単位の費用(限界費用)はAもBも\(c\)で同じであり,生産量にかかわらず一定とします.簡単にするため固定費は考えません.
  • AとBは利益を最大にすると考えます.AとBは,生産量\(x_A,x_B\)をいくらにするでしょうか.

問題の解法

問題は以下のようにして解くことができます.

  • 企業Aの利益を\(\pi_A\)とおく.ここで(利益)=(収入)-(費用)であり,収入は(価格)\(\times\)(生産量),費用は(限界費用)\(\times\)(生産量)となります.したがって$$\pi_A=px_A-cx_A$$となります.
  • この\(\pi_A\)を最大にする\(x_A\)を考えます.そこで\(p=a-bx\)を代入し,さらに\(x=x_A+x_B\)に注意すると\[ \begin{align} \pi_A &= px_A-cx_A \\ &=(a-bx)x_A-cx_A \\&=
    \{a-b(x_A+x_B)\}x_A-cx_A\\&=-bx_A^2-bx_Ax_B+(a-c)x_A \tag{1} \end{align}\]となります.
  • この式(1)を最大にする\(x_A\)を求めるには,ざっくり言うと\(x_A\)で微分
    (正確には偏微分)して0になるところを求めれば良い.(1)を\(x_A\)で微分すると,\(-2bx_A-bx_B+(a-c)\)となります.したがって\[-2bx_A-bx_B+(a-c)=0\]を解けば良く,これより\[x_A=-\frac{1}{2}x_B+\frac{a-c}{2b} \tag{2}\]となります.
  • 式(2)は,企業Aの最適反応関数と呼ばれます.式(2)は\(x_B\)が与えられたときに企業Aの利益を最大にする企業Aの生産量を表しています.したがって,企業Bの生産量が決まれば,企業Aとの最適な生産量(答)が決まるのですが,企業Bの生産量がいくらになるか分かりません.そこで企業Bが利益を最大にする生産量を同様に求めてみます.
  • 企業Bの利益を\(\pi_B\)とおきます.$$\pi_B=px_B-cx_B$$であり,企業Aの場合と同様に\(p=a-bx\)を代入して計算し,$$\pi_B=-bx_B^2-bx_Ax_B+(a-c)x_B$$を得ます.さらに\(x_B\)で微分して0になるところを求めると,\[x_B=-\frac{1}{2}x_A+\frac{a-c}{2b} \tag{3}\]となります.
  • この式(3)は,企業Bの最適反応関数と呼ばれます.企業Aと同様に\(x_A\)が与えられたときに,企業Bの利益を最大にする企業Bの生産量を表しています.
  • ここで,企業Aは企業Bの生産量が分からなければ,利益を最大にする生産量が分からず,企業Bは企業Aの生産量が分からなければ,利益を最大にする生産量が分かりません.ここでゲーム理論のナッシュ均衡の概念により解を求めるわけです.ナッシュ均衡は,お互いが最適反応戦略を選び合うような戦略の組み合わせで,ここでは式(2)と式(3)を同時に満たす\(x_A\),\(x_B\)となります.
  • 式(2)と式(3)を同時に満たす\(x_A\),\(x_B\)は,これらを連立方程式で解くことによって求められます.式(3)の\(x_B\)を式(2)に代入して計算すると\(x_A=-\frac{1}{4}x_A+\frac{a-c}{4b}\)となり,これから\(x_A=\frac{a-c}{3b}\)を得ます.またこれを式(2)に代入して,\(x_B=\frac{a-c}{3b}\)を得ます.
    このときの価格は\[p=a-bx=a-b(x_A+x_B)=\frac{a+2c}{3} \]となります.
  • このとき企業Aの利益は\[ \begin{align} \pi_A &= px_A-cx_A =(p-c)x_A\\ &=\left(\frac{a+2c}{3}-c\right)\left(\frac{a-c}{3b}\right)=\frac{(a-c)^2}{9b} \end{align}\] となります.同様に企業Bの利益も同じになります.

まとめますと,クールノー競争における企業Aと企業Bの生産量は\(x_A=x_B=\frac{a-c}{3b}\)となります.これをクールノー均衡と呼びます.クールノー均衡における価格は\(p=\frac{a+2c}{3}\),各企業の利益は\(\pi_A=\pi_B=\frac{(a-c)^2}{9b}\)となります.

消費者余剰,社会的総余剰

独占市場における,消費者余剰,生産者余剰,社会的総余剰について示します.

市場全体の取引量が\(x=x_A+x_B=\frac{2(a-c)}{3b}\)であることに注意すると,上記で求めたクールノー競争の価格と生産量と企業の限界費用は,以下の図で示すことができます.

クールノー競争における生産量・価格・社会的総余剰

消費者余剰は,図の青色で示された部分の三角形です.

三角形の底辺の長さは\(\frac{2(a-c)}{3b}\),高さは\[ a-\frac{a+2c}{3}=\frac{2(a-c)}{3} \]ですから,三角形の面積は\[ \frac{1}{2} \times\frac{2(a-c)}{3b} \times \frac{2(a-c)}{3}=\frac{2(a-c)^2}{9b} \]となります.

企業の利益は,図の緑色の部分の長方形の面積です.

長方形の高さ(価格-限界費用)は,\(\frac{a+2c}{3}-c=\frac{a-c}{3}\),ヨコの長さは\(\frac{2(a-c)}{3b}\)ですので,長方形の面積は\[\frac{a-c}{3}\times\frac{2(a-c)}{3b}=\frac{2(a-c)^2}{9b}\]となります.先に求めた企業の利益を合計した値(\(\pi_A+\pi_B\))と一致することがわかりますね.これを生産者余剰とも呼びます.

社会的総余剰は,消費者余剰と生産者余剰の総和です.したがって社会的総余剰は
\[\frac{2(a-c)^2}{9b}+\frac{2(a-c)^2}{9b}=\frac{4(a-c)^2}{9b}\]です.

クールノー競争とベルトラン競争入門(2):独占市場の価格・生産量と社会的総余剰

クールノー競争は,2社以上の企業が利益を最大化するように生産量を決める生産量競争です.その考え方の基本となるのは,企業が1社のときの独占市場の生産量決定です.1社のときが分からないで,2社以上の場合が分かることがあろうか.いやない.(反語).ここでは独占市場において,生産量と価格がどのように決定されるかを示します.

独占市場の価格と生産量の決定:モデル

ここでは以下の例を考えます.

  • 企業Aがある製品を独占的に販売しているとし,その生産量\(x\)を決定するとしましょう.
  • 生産量\(x\)に対して,その価格\(p\)は$$p=a-bx$$で与えられるとします.
    • ここでは生産量=需要量(取引量)となるように価格が決定されるとします.すなわち在庫は考えず,すべての生産量が売り切るように価格がつくと考えます.
    • したがって,たくさん生産すると取引量は多いのですが,価格が下がり,儲かりません.価格を高くしようとすると少なく生産しなければならず,その生産量が少なすぎても儲かりません.すなわち,価格と生産量の間にトレードオフがあり,そのもとで,企業Aは生産量\(x\)を決定する問題を考えます.
    • なお「価格が\(p\)のとき,需要を\(x\)とすると,\(x=\alpha – \beta p\)となる」のように,需要関数が与えられる場合もあります.その場合は, 生産量=需要量(販売量)となることから,\(x\)を生産量と考えて,\(p=(\alpha/\beta)-(1/\beta)x\)のように\(p\)の式に変換すれば良いわけです.\(a=\alpha/\beta\),\(1/\beta\)とおくと,上記の設定になります.
  • ここで製品を1単位売る費用(限界費用)は\(c\)とし一定とします.簡単にするため固定費は考えません.
  • 企業Aとは利益を最大にするように,この製品の生産量\(x\)を決定するとします.\(x\)はいくらになるでしょうか.

問題の解法

問題は以下のようにして解くことができます.

  • 企業Aの利益を\(\pi\)とおく.ここで(利益)=(収入)-(費用)であり,収入は(価格)\(\times\)(生産量),費用は(限界費用)\(\times\)(生産量)となります.したがって$$\pi=px-cx$$となります.
  • この\(\pi\)を最大にする\(x\)を求めれば良いわけです.そこで \(p=a-bx\) を代入して\(x\)だけの式にすると\[ \begin{align} \pi &= px-cx \\ &=(a-bx)x-cx \\&=-bx^2+(a-c)x \end{align}\]となります.
  • この式を最大にする\(x\)を求めるには,ざっくり言うと\(x\)で微分して0になるところを求めれば良い.\(-bx^2+(a-c)x\)を \(x\)で微分すると,\(-2bx+(a-c)\)となります.したがって\[ -2bx+(a-c)=0 \]を解けば良く,これより\(x=\frac{a-c}{2b}\)が求める生産量(最適生産量)となります.
  • このときの価格は,\(p=a-bx^*=\frac{a+c}{2}\)となります.
  • このとき企業の利益は\[ \begin{align} \pi &= px-cx =(p-c)x \\ &=(
    \frac{a+c}{2}-c)(\frac{a-c}{2b})=\frac{(a-c)^2}{4b} \end{align}\] となります.

消費者余剰,社会的総余剰

独占市場における,消費者余剰,生産者余剰,社会的総余剰について示します.

上記で求めた独占市場の価格と生産量と企業の限界費用は,以下の図で示すことができます.

独占市場における消費者余剰・生産者余剰

消費者余剰は,図の青色で示された部分の三角形です.

(なぜこの部分が消費者余剰になるかは,ミクロ経済学のテキストなどを参照してください.なお拙著「ゼミナールゲーム理論入門」の5章にも,独占やクールノー競争での消費者余剰や社会的総余剰の数値例による初歩的な解説があります).

三角形の底辺の長さは\(\frac{a-c}{2b}\),高さは\[ a-\frac{a+c}{2}=\frac{a-c}{2} \]ですから,三角形の面積は\[ \frac{1}{2} \times\frac{a-c}{2b} \times \frac{a-c}{2}=\frac{(a-c)^2}{8b} \]となります.

企業の利益は,図の緑色の部分の長方形の面積です.

なぜかと言うと,製品1単位の利益は長方形の高さ(価格-限界費用)になり,これに長方形のヨコの長さ(取引量)をかけたものが利益となるからです.なお

長方形の高さ(価格-限界費用)は,\(\frac{a+c}{2}-c=\frac{a-c}{2}\),ヨコの長さは\(\frac{a-c}{2b}\)ですので,長方形の面積は\[\frac{a-c}{2}\times\frac{a-c}{2}=\frac{(a-c)^2}{4b}\]となります.先に求めた値と一致しますね.これを企業の生産者余剰とも呼びます.

社会的総余剰は,消費者余剰と生産者余剰の総和です.したがって社会的総余剰は
\[\frac{(a-c)^2}{8b}+\frac{(a-c)^2}{4b}=\frac{3(a-c)^2}{8b}\]です.

クールノー競争とベルトラン競争入門(1):不完全競争市場

クールノー競争とベルトラン競争って何なのか?って,話から始めます.計算から行きたい人は独占市場の価格決定へ行くと良いでしょう.

完全競争市場と不完全競争市場

経済学では,最初に完全競争市場(perfectly competitive market)という市場を学びます.そこでは

  • 消費者や企業は多数いて,価格受容者(その行動によって価格が変化しない)
  • 企業は価格を所与とし,生産量を決めて,利益を最大化する
  • 企業は限界費用と価格が等しくなるように生産量を決める
  • 分析道具は,需要曲線と供給曲線 (部分均衡)で,需要曲線と供給曲線が交わったとこで価格と取引量が決まる

とされています.これは「古典的な」市場理論と言えるもので,経済学の考え方の基礎となります.農業なんかだとこの考えは当てはまるし(キャベツの生産者は,自分の生産によって,市場のキャベツの価格が変化するとは思わないでしょう),経済学が作られた頃は企業とか今のようではなかったし,このように単純化すると経済の問題をシンプルに扱うことができるのでうれしいっす.しかし,

企業は価格を所与として,生産量を決めて,利益を最大化する

という部分は,現在の経済ではとても問題となります.実際に,現在の多くの市場では,企業は価格を所与だと考えているとは思わないでしょう.自分自身が価格を決めたり,もしくは自身の生産が価格に影響を及ぼすことを考慮したりして,意思決定をする場合が多いと思われます.

そこで近年の経済学の研究では,不完全競争市場(imperfectly competitive market)を考えることが多いです.これは企業の数が1つ(独占市場)だったり,2つ(複占市場)だったり,少数(寡占市場)だったりする市場です.ここでは企業を価格決定者であると考え,企業の行動によって価格が決まります.

企業が1つの独占市場の問題は簡単でしたが,2つ以上のときは企業の相互作用がどのように価格や生産量に影響を及ぼすかを考えなければなりません.このとき中心となるのはゲーム理論であり,これによって不完全競争市場は大きく発展し,産業組織論(政策が企業の行動にどのように影響を及ぼす考えたりする)国際経済学などの分野に大きく応用され,近年は経営戦略にも応用されるようになったのでした.

クールノー競争とベルトラン競争

ざっくりいうと,2社以上の企業の不完全競争市場を扱うモデルのうち,クールノー競争は企業が生産量を決定するモデル(生産量競争)で,ベルトラン競争は企業が価格を決定するモデル(価格競争)です.

クールノー競争:各企業は生産量を決定する(生産量競争)
ベルトラン競争:各企業は価格を決定する(価格競争)

このとき各企業が生産する財が同質財か,異質財か,でモデルが大きく分かれます.

同質財の市場と言うのは,すべての企業が生産する財が全く同じで,消費者は企業ごとの財の区別をしません.生産量競争では,全企業が生産した財の合計(=市場全体の生産量)によって財の価格が決まり,その価格はすべての企業の財の価格になると考えます.価格競争では,一番安い価格をつけた企業からすべての消費者は財を買うと考えます.各企業の財は1つの市場,1つの需要曲線で表現されます.

異質財の市場は製品が差別化された市場です.各企業ごとに別の市場があり,相手企業の価格や生産量は,自企業の製品の需要量に影響を及ぼしますが,その需要関数は各企業ごとに与えられます.

通常,クールノー競争と言うと同質財のクールノー競争を指します.これに対し,ベルトラン競争は同質財と異質財の両方を指すことが多いようです.

クールノー競争 vs ベルトラン競争

ゲーム理論では,各プレイヤーが行動するタイミングは,ゲームを決める重要な要素です.上記のモデルは,企業は,相手企業の価格や生産量を知らずに,自社の価格や生産量を決定すると考えています.言わば「同時に」決定すると考えています.

これに対して,各企業が逐次的に価格や生産量を決定するモデルもあります.2社の生産量競争で,1社が先に生産量を決定し(先手),それを見てもう1社が生産量を決定するモデルはシュタッケルベルグ(Stackelberg)競争と呼ばれます.

クールノー競争:2社が同時に生産量を決める
シュタッケルベルグ競争:2社が先手と後手で逐次的に生産量を決める

2社が先手と後手で価格を決めるモデルもありますが,特に名前はついていません.

次は独占市場の価格・生産量と社会的総余剰へ.

ナッシュ均衡を理解する演習(1)

利得行列や数式を用いずにナッシュ均衡を理解する

ゲーム理論の解はナッシュ均衡こちらで説明)です.「ゲーム理論が少し分かった!」と思えるためには,ナッシュ均衡が理解できていなければなりません.しかし,よくあるゲーム理論の教え方では,ナッシュ均衡は利得行列を使って説明され,プレイヤーの利得が数式や数値や表で与えられて,それを機械的に計算しナッシュ均衡を求める人が多い気がしています.

利得行列からナッシュ均衡を求める方法はこちら(ナッシュ均衡の求め方:2人ゲームの利得行列の場合).

しかし,それで正しくナッシュ均衡の概念が理解できたと考えられるでしょうか?(いやない,反語).ここでは,数式や表を用いない例題でナッシュ均衡を理解していきましょう.

まずナッシュ均衡の定義をおさらいしましょう.ナッシュ均衡とは,

どのプレイヤーも,他のプレイヤーがそのナッシュ均衡の戦略を選んでいるならば,自分はそのナッシュ均衡の戦略を選ぶことが利得がもっとも高くなる.

です.つまり,

どのプレイヤーも,他のプレイヤーがそのナッシュ均衡の戦略を選んでいるならば,自分はそのナッシュ均衡の戦略以外を選ぶと,利得が同じか低くなる(高くなることはない)

ということです.この「同じか低くなる」と言うのは1つのポイントです.相手の戦略に対し,利得が最大になる戦略が1つならば「低くなる」で良いのですが,最大となる戦略が<同点>で2つ以上あるときは,「低くなるか同じ」 です.

なお「利得が高くなる」とは,プレイヤーにとって「良い」とか「好ましい」ということです.

2人ゲームの例

2人ゲームで練習してみましょう.なお以下では確率で戦略を選ぶ「混合戦略」は考えません.

練習1:アリスと文太は,禅寺かショッピングモールへ行く.アリスは禅が好きで,文太の行動に関わらず禅寺のほうがショッピングモールより良いと考えている.その中でどちらに行っても,文太に会えないよりは会える方が良いと考えている.一方,文太はどちらに行くかより,アリスに会えることが大切である.そして,アリスに会えたなら,ショッピングモールのほうが禅寺よりもいい.アリスに会えないときも同じである.以下から,ナッシュ均衡を選べ.複数あるときはすべて選び,ないときは「なし」と答えよ.
(A)2人とも禅寺へ行く
(B)アリスは禅寺へ,文太はショッピングモールへ行く
(C)アリスはショピングモールへ,文太は禅寺へ行く
(D)2人ともショッピングモールへ行く

正解は(A).(A)では,どちらのプレイヤーも,自分だけが行動を変えると利得が小さくなるのでナッシュ均衡です.(B)では文太は禅寺へ行ったほうが利得が高くなりますし,(C)と(D)では,アリスは禅寺へ行ったほうが利得が高くなります.したがってナッシュ均衡ではありません.

なお(C)で「文太はショッピングモールに行ったほうが利得が高くなるのでナッシュ均衡ではない」としても良いです.「ナッシュ均衡ではない」ことを示すには,選択を変えると利得が高くなるプレイヤーが1人でもいることを示せば良いので,アリスと文太の両方について言わなくても,どちらか1人で良いわけです.なお上記の場合,アリスにとって禅寺に行くことは支配戦略です.支配戦略がある場合は,ナッシュ均衡では必ずその戦略が選ばれます.

次はどうでしょうか?

練習2:アリスと文太は,禅寺かショッピングモールへ行く.アリスも文太も,お互いのことが大好きで,どちらに行くかよりも,相手に会えるほうが大切である.ただし,アリスは,会えたときも会えないときも,禅寺のほうがショピングモールよりも良く,文太はショッピングモールのほうが禅寺よりも良い.以下から,ナッシュ均衡を選べ.複数あるときはすべて選び,ないときは「なし」と答えよ.
(A)2人とも禅寺へ行く
(B)アリスは禅寺へ,文太はショッピングモールへ行く
(C)アリスはショピングモールへ,文太は禅寺へ行く
(D)2人ともショッピングモールへ行く

正解は(A)か(D).2人が会えている(A)と(D)では,どちらか一方だけが行動を変えると,そのプレイヤーの利得が小さくなるのでナッシュ均衡です.(B)と(C)で,どちらか一方だけが行動を変えると,そのプレイヤーの利得が高くなるのでナッシュ均衡ではありません

さてさて,次はどうでしょうか?

練習3:アリスと文太は,禅寺かショッピングモールへ行く.アリスは文太が大好きで,どこに行くかよりも文太に会えることが大切.そして,その中で会えても会えなくても,禅寺のほうがショピングモールよりも良いと考えている.文太は残念ながらアリスが嫌いで,どこに行くかよりもアリスに会わないほうが会えるより絶対良いと考えている.その中で,会えたときも会えないときも,禅寺よりショピングモールのほうが良い.以下から,ナッシュ均衡を選べ.複数あるときはすべて選び,ないときは「なし」と答えよ.
(A)2人とも禅寺へ行く
(B)アリスは禅寺へ,文太はショッピングモールへ行く
(C)アリスはショピングモールへ,文太は禅寺へ行く
(D)2人ともショッピングモールへ行く

この場合はナッシュ均衡は「なし」です.2人が会えている(A)と(D)では,文太が行動を変えると会えなくなって利得が高くなり,2人が会えていない(B)と(C)では,アリスが行動を変えると高くなるので,どれもナッシュ均衡ではありません.(なおこのような場合も確率で戦略を選ぶ混合戦略を用いると,ナッシュ均衡がありますが,その場合は利得を数値で表さなければ確率が計算できません).

3人以上のゲームの例

ナッシュ均衡についての理解が深まってきたでしょうか?それでは3人以上の例を考えて,練習してみましょう.まず簡単な「多数決」を考えてみましょう.

練習4:(奇数人での多数決) 5人で「海」か「山」を選ぶ. 多い人数が選んだ方を選ぶと勝ち,少ない人数が選んだ言葉を選ぶと負け.当然,勝つほうが負けるより良いとします.以下から,ナッシュ均衡を選べ.複数あるときはすべて選び,ないときは「なし」を選べ.
(A) なし
(B) 全員が「海」を選ぶ
(C) 4人が「海」,1人が「山」を選ぶ
(D) 3人が「海」,2人が「山」を選ぶ
(E) 2人が「海」,3人が「山」を選ぶ
(F) 1人が「海」,4人が「山」を選ぶ
(G) 全員が「山」を選ぶ

正解は(B)と(G)です. 全員が同じ言葉を選ぶ(B)と(G)では,どの人も他者の選択はそのままで自分の選択を変えると利得が低くなるので,ナッシュ均衡です.それ以外では,少数派になっているプレイヤーは,他者の選択がそのままのときに自分の選択だけを変えると多数派となり,利得が高くなるので,ナッシュ均衡ではありません.

では,次はどうでしょう.ライアーゲームの最初に出てくる「少数決」です.少数派になったほうが勝ちです.

練習5:(奇数人の少数決) 5人で「海」か「山」を選ぶ.少ない人数が選んだ方を選ぶと勝ちで, 多い人数が選んだ方を選ぶと負け.以下から,ナッシュ均衡を選べ.複数あるときはすべて選び,ないときは「なし」を選べ.
(A) なし
(B) 全員が「海」を選ぶ
(C) 4人が「海」,1人が「山」を選ぶ
(D) 3人が「海」,2人が「山」を選ぶ
(E) 2人が「海」,3人が「山」を選ぶ
(F) 1人が「海」,4人が「山」を選ぶ
(G) 全員が「山」を選ぶ

正解は(D)と(E)です.それ以外では,多数派になっている人は,自分だけの選択を変えると少数派となり利得が高くなりますので,ナッシュ均衡ではありません.

これに対し(D)と(E)では,すべてのプレイヤーが自分だけ選択を変えても利得が高くならない(同じか低くなる)のでナッシュ均衡です.なぜかと言うと,少数派となったプレイヤーは自分の選択を変えると多数派になり利得が下がりますし,多数派のプレイヤーは自分だけが選択を変えても,やはり多数派になってしまい(多数派が変わってしまいます)利得は同じになります.

もうお腹いっぱいでしょうかね?それでは,最後の問題です.

練習6:(7人じゃんけん)7人でじゃんけんをします.もちろんすべてのプレイヤーは,勝ち,あいこ,負けの順に良い(利得が高い)とします.
(A) なし
(B) 7人ともにグーを出す
(C) 3人がグー,4人がパーを出す
(D) 1人がグー,2人がパー,4人がチョキを出す
(E) 2人がグー,2人がパー,3人がチョキを出す
(F) 3人がグー,2人がパー,2人がチョキを出す

答えは(E)と(F)です!(B)「7人ともにグーを出す」や (C)「3人がグー,4人がパーを出す」では,グーの人がパーに変えることで負けから勝ちに転じて利得が高くなります.また(D)「1人がグー,2人がパー,4人がチョキ」では,グーの人がチョキに手を変えると,アイコから勝ちに転じて利得が高くなります.したがってナッシュ均衡ではありません.しかし(E)と(F)の場合は,どの人も自分だけが手を変えても,あいこからあいこになるだけで利得は高くなりません.したがって,(E)と(F)はナッシュ均衡です.

ナッシュ均衡(ざっくりした説明)

ここではまずナッシュ均衡について,ざっくり説明します.

  • ナッシュ均衡の求め方(2人ゲームの利得行列)はこちらのページで.
  • クールノー均衡はこっち.
  • 定義などは,また後ほど.

ナッシュ均衡とは

ゲーム理論におけるナッシュ均衡とは,ざっくりいうと

どのプレイヤーも,自分だけでは,それ以上利得が大きくできない状態

です.「状態」って言い方は不正確過ぎるか.もう少し正確に言うと,ナッシュ均衡とは

どのプレイヤーも,他のプレイヤーがそのナッシュ均衡の戦略を選んでいるもとでは,その戦略が一番利得が高くなる(他の戦略では利得が同じか低くなる)

ような戦略の組です.あんまり変わんないか.

ナッシュ均衡の例

例を挙げましょう(これは支配戦略の例で,客数を変えたものです).

2つのコンビニ,セレブ(セレブイレブン)とファミモ(ファミリーモール)が,まだコンビニがないA駅とB駅のどちらか一方に出店しようと考えている.コンビニを1日に利用する客はA駅が600人,B駅が750人である.セレブとファミモがもし違う駅を選べば,利用客を独占できる.しかし同じ駅に出店すると,ファミモが人気で,ファミモはセレブの2倍の客数を獲得できる.すなわち両方がA駅に出店すると,セレブ200人,ファミモ400人.B駅に出店すると,セレブ250人,ファミモ500人である.ここで客数を利得と考える.セレブとファミモはどちらの駅に出店するだろうか?

このゲームを利得行列で書くと下のようになります

ナッシュ均衡の例

例えば「セレブとファミモが共にA駅を選ぶこと」はナッシュ均衡ではありません.なぜならセレブは,ファミモがA駅を選んでいるなら,B駅に変えたほうが利得が高くなるからです.このように,他のプレイヤーの戦略が変わらないもとで,あるプレイヤーが選択を変えると利得が高くなるならば,その戦略の組はナッシュ均衡ではありません.

ナッシュ均衡ではない

これに対し,例えば「セレブがA駅,ファミモがB駅を選ぶこと」はナッシュ均衡です.なぜならセレブもファミモも,相手がそれを選んでいる限り,自分の利得をもっとも高くしているからです.つまりナッシュ均衡では,

どのプレイヤーも(相手がその戦略を選んでいるならば),それ以上利得を高くできない (他の戦略では利得が同じか低くなる)

と言うことになります.

ナッシュ均衡である

ナッシュ均衡は2つ以上あるときもある

しかしこの例では「セレブがA駅,ファミモがB駅を選ぶこと」だけではなく,
「セレブがB駅,ファミモがA駅を選ぶこと」 もナッシュ均衡になることが分かります.つまりナッシュ均衡は1つとは限らず,2つ以上ある場合もあります.このときどちらをゲーム理論の解とすべきかは難しい問題で,これは「均衡選択」と呼ばれる理論と「均衡精緻化」と呼ばれる理論で考えられています(2つの違いを説明するのはちょっと難しい)これはまた別の機会に.

ナッシュ均衡がなぜ解なのか

ナッシュ均衡以外が結果として予測されたとします.このとき,もしすべてのプレイヤーがその予測を知ったならば,少なくとも1人はその予測から違う行動を取ることで利得を高くすることができるはずです.そのプレイヤーは,ナッシュ均衡と違う行動を取るでしょうから,もはやその予測は当たりません.このことから,ゲームの結果の予測をプレイヤーが知っても結果が成り立つためには,その予測はナッシュ均衡でなければならないはずです.(「じゃんけんの必勝法と行動ファイナンス・行動経済学」も参考にしてください)

注意点と補足

  • すべてのプレイヤーが支配戦略を選んでいるときはナッシュ均衡になります.これはナッシュ均衡の特殊ケースと考えられます.したがって囚人のジレンマの結果もナッシュ均衡であると言えます.
  • 上記の点から考えると,じゃんけんにはナッシュ均衡がありませんが,確率を用いる「混合戦略」を考えるとナッシュ均衡が存在します.このような混合戦略まで考えると,すべてのn人有限ゲームにナッシュ均衡が存在します.この素晴らしい定理を誰が証明したかは,よく考えれば分かるはずである.これによって,その人はノーベル経済学賞を受賞しています.私ではありません.
  • ナッシュ均衡が分かったような気がしない?もう少し理解を深めたい?ではナッシュ均衡のおけいこ(1)で練習しましょう.
  • 2人ゲームの利得行列でのナッシュ均衡の求め方はこちら
  • クールノー均衡はこっち.