支配戦略

支配戦略とは

戦略形ゲームにおいては、各プレイヤーがどの戦略(選択、行動、代替案)を選ぶかを決めることが分析の主たる目的となります。

このとき1人のプレイヤーに対して

自分以外のプレイヤーが何を選んでも、自分の他の戦略よりも良い戦略(利得を高くする戦略)

があれば、その戦略を(そのプレイヤーの)支配戦略と呼びます。
プレイヤーに支配戦略があれば、そのプレイヤーはその支配戦略を選ぶと考えます。

支配戦略の例

例を挙げましょう。

支配戦略の例(コンビニ戦争2):2つのコンビニ、セレブ(セレブイレブン)とファミモ(ファミリーモール)が、まだコンビニがないA駅とB駅のどちらか一方に出店しようと考えている。コンビニを1日に利用する客はA駅が1200人、B駅が300人である。セレブとファミモがもし違う駅を選べば、利用客を独占できる。しかし同じ駅に出店すると、ファミモが人気で、ファミモはセレブの2倍の客数を獲得できる。すなわち両方がA駅に出店すると、セレブ400人、ファミモ800人。B駅に出店すると、セレブ100人、ファミモ200人である。ここで客数を利得と考える。セレブとファミモはどちらの駅に出店するだろうか?

ゲーム理論を持ち出すまでもなく、ちょっと考えるとセレブもファミモもA駅を選ぶことが分かるでしょう。B駅を独占しても高々300人ですからね。でも最初はこの例から始めましょう。

このゲームを利得行列で書くと下のようになります。

コンビニ戦争2

このときセレブの視点に立ってみましょう。セレブは

  • ファミモがA駅を選ぶならB駅(300)よりA駅(400)を選ぶほうが良い。
  • セレブは、ファミモがB駅を選んでも B駅(100)よりA駅(1200)を選ぶほうが良い。

と言うことが分かります。セレブは、ファミモが何を選んでも、B駅よりはA駅の方が良い戦略です。したがってA駅はセレブの支配戦略です(以下の図)。

セレブの支配戦略

同様に ファミモの視点に立って考えてみます。

ファミモの支配戦略

セレブは、ファミモが何を選んでも、B駅よりはA駅の方が良い戦略です。したがってA駅はセレブの支配戦略です。

もしすべてのプレイヤーに支配戦略があれば、すべてのプレイヤーが支配戦略を選ぶことがゲームの答となり、そのゲームは解けたことになると言えるでしょう。今回の例では、セレブもファミモも支配戦略はA駅でしたから、両方ともA駅を選ぶと予測でき、ゲームは解けたことになります。

支配戦略はゲーム理論における「強い解」

支配戦略は、相手の選択に関わらず、自分にとって他の選択より良いような選択がある場合です。このときプレイヤーは、相手や自分にとっての知識が完全でなくても行動を確定することができます。例えば、

(禅が好きなアリス)アリスと文太は、それぞれ禅寺に行くか、ショッピングセンターに行くか悩んでいる。アリスはとにかく禅寺に行きたいので、文太が禅寺に行っても行かなくても、ショッピングセンターよりは禅寺がいい。

この場合、アリスにとって禅寺に行くことが支配戦略になり、アリスは禅寺に行くことが確定します(だから「悩んでいる」って問題設定はおかしいんだけど)。しかも

  • 文太の利得は全く分かっていない。つまりプレイヤーに支配戦略があれば、相手の行動どころか、利得さえ分からなくても、そのプレイヤーの行動は確定する。
  • アリスも結果に対する好みがすべて確定しているわけではない。例えば「文太と一緒に禅寺に行くこと」と「アリスだけが禅寺に行き、文太はショッピングセンターに行くこと」のどちらが良いかは問題には定められていない(文太が好きなのか、嫌いなのか?)。つまりプレイヤーは、相手の選択それぞれに対する自分の好みだけが分かっていれば行動は確定する。

ということになります。つまり支配戦略があれば、細かい情報はなくてもプレイヤーはそれを選ぶことになります。このことは、支配戦略によるプレイヤーの行動の予測は、かなり確かなものになっているということで、支配戦略がないゲーム(その解はナッシュ均衡)よりも、より確からしい予測を与えているということになります。

  • 「禅が好きなアリス」は文太の好みが分からないと、文太が何を選ぶかは分からない。この例の続きは(未完)。
  • 支配戦略がない場合は、ゲームの解としてはナッシュ均衡を考えることになる。

このように支配戦略があればゲームの解は自明なように思えますが、必ずしもそうではないように見えるゲームがあります。それが囚人のジレンマであり、共有地の悲劇です。

戦略形ゲームとは?利得行列とは?

戦略形ゲームは、展開形ゲームと並ぶ非協力ゲームの表現形式です(参照:戦略形ゲームと展開形ゲーム)。戦略形ゲームは、プレイヤー、戦略、利得の3つの要素から構成されます。すべてのプレイヤーは同時に戦略を選び、その結果、各プレイヤーの利得が決まります。

戦略形ゲームの例

戦略形ゲームの例として、次のような問題を考えてみましょう。

戦略形ゲームの例(コンビニ戦争1):2つのコンビニ、セレブ(セレブイレブン)とファミモ(ファミリーモール)が、まだコンビニがないA駅とB駅のどちらか一方に出店しようと考えている。コンビニを1日に利用する客はA駅が600人、B駅が300人である。セレブとファミモがもし違う駅を選べば、利用客を独占できる。しかし同じ駅に出店すると、ファミモが人気で、ファミモはセレブの2倍の客数を獲得できる。すなわち両方がA駅に出店すると、セレブ200人、ファミモ400人。B駅に出店すると、セレブ100人、ファミモ200人である。ここで客数を利得と考える。セレブとファミモはどちらの駅に出店するだろうか?

本題に入る前に言っておきたいのですが、別にこのページはコンビニの戦略の話をしたいのではなくて、ゲーム理論とは何かを話すための「例」ですからね。「両方に出店するというのはないのでしょうか」とか聞く人がいるけど(本当にたくさんいる)、そうしたければ、そういう例を勝手に考えてください。むかし、あるビジネス系の雑誌に、こういう例を出したら、雑誌の編集部の人がコンビニの会社の人に聞きに行って、そしたら「うちには『客を取り合う』という発想はない。2つのコンビニに同じ駅に出店すると集積効果があって、利用客は増える」とか言われてしまったのですが、そうならば、そういう例を作ればいいですよ。でも増えたりしたら、例として分かりにくいじゃないですか。ここはリアリティを求めてるんじゃなくて、わかりやすい例にしてるんです。

で、本題です。上記の例の場合、戦略形ゲームの3要素(プレイヤー、戦略、利得)は

  • プレイヤー:セレブとファミモ
  • セレブの戦略:A駅に出店する、B駅に出店する
  • ファミモの戦略:A駅に出店する、B駅に出店する
  • 利得:上記に書かれている客数

のようになります。このようにプレイヤーが2人のゲームを2人ゲームと呼び、その中でも両プレイヤーの戦略の数が2つの場合は2✕2ゲーム(ツーバイツーゲーム、と呼ぶ)と呼ばれます。2✕2ゲームは、戦略形ゲームの中で最も簡単なゲームであると言えます。

「利得は上記に書かれている」と言われても見にくいので、このような2人戦略形ゲームを表すには、以下のような利得行列という表を使います。

利得行列

この表では、セレブが行(水平方向)を選択し、ファミモが列(垂直方向)を選択し、交わったセルの左側の数値がセレブの利得、右側の数値がファミモの利得を表します。例えば、セレブがA駅、ファミモがB駅を選ぶと…

セレブがA駅、ファミモがB駅を選択

このようになり、セレブの利得が600、ファミモの利得が300になることが分かります。

利得行列にはいろいろな書き方があり、下の図のようにセルを左下と右上に区切り、左下に第1プレイヤー(行を選ぶプレイヤー、今回はセレブ)の利得、右上に第2プレイヤーの利得を書く場合もあります。

利得行列の別の書き方

ゲームを解く

戦略形ゲームにおいて、「プレイヤーが選ぶ戦略の組合せはどこになるのか」を求めることをゲームを解くと呼びます。ゲームを解くポイントは、支配戦略とナッシュ均衡です。

戦略形ゲームと展開形ゲーム

ものすごく乱暴に言うと「ゲーム理論(非協力ゲーム)には、戦略形ゲーム展開形ゲームがあり、戦略形ゲームは利得行列で表し、展開形ゲームはゲームの木で表す」ということになります。乱暴すぎて、かなり間違ってますが、最初から細かいことは覚えられないので、ざっくりこうしておきましょう。

さらに戦略形と展開形について、初めて学ぶときは

  • 戦略形ゲームは、プレイヤーが同時に行動を選ぶ「同時ゲーム」。代表的なゲームはじゃんけんなど。
  • 展開形ゲームは、プレイヤーが順番で行動を選ぶ「交互ゲーム」を含む「すべてのゲームを表現する」ゲーム。代表的なゲームはチェスや将棋など。

くらいに考えると良いです。これも乱暴すぎますけど。

ゲーム理論では「同時か、逐次か」と言った「時間」が重要なのではなく、相手の行動が観察できるかどうかが重要です。例えば、2人でじゃんけんをするとき、

  1. まず1人(先手)が相手に分からないように「ぐー、ちょき、ぱー」のどれかを選んで紙に書いて封筒に入れ、
  2. もう1人(後手)は封筒を開けずに 後から「ぐー、ちょき、ぱー」を選び
  3. 先手の書いた紙が公表されて勝負をする

としましょう。この場合は、時間としては交互に行動していますが、同時にじゃんけんをしているのと変わりありません(同時にじゃんけんすると、後出しっぽくなる人がいるのを考えると、こっちのほうがずっと「同時」かも知れない) 。先手は後手の行動を知らず、後手も先手の行動を知りません。この場合は戦略形ゲームになっていると言えます。

同時のゲームとは時間を指しているのではない

このように(すべてのプレイヤーが)他のプレイヤーの行動が観察できずに行動を選ぶ場合は戦略形ゲームです。オークションや競りを例に挙げれば、封印された紙に価格を書いて、最後に競り人がそれを開いて一番高額の人に出品された物を売る、と言った「封印入札」なども戦略形ゲームの典型的な例と言えます。

これに対して、チェスや将棋や囲碁では、自分より前に行動した人がどのような行動をしたかがすべて分かります。このようなゲームは完全情報ゲームと呼ばれますが、展開形ゲームで分析されるゲームの代表例です。オークションや競りでは、オークションハウスでの絵画の取引やマグロの競りなど、誰かが値段をつけたのを見て、それより高く買いたい人は更に高い価格をつける...などの「イングリッシュオークション」は展開形ゲームの典型例と言えます。同じ競りやオークションでも、ルールや形式によって違うゲームと考えられる点に注意です。

戦略形ゲームは「利得行列」と呼ばれる道具を用いて表現し、展開形ゲームは「ゲームの木」と言う道具を用いて表現します。戦略形ゲームと展開形ゲームについては、別の投稿で詳しく説明します。

非協力ゲームと協力ゲーム

ゲーム理論は非協力ゲーム(non-cooperative game)協力ゲーム(cooperative game)の2つの理論に分けられます。

ゲーム理論は、経済学の中で大きく発展したのですが、その経済学の中で扱われているのは、ほとんど非協力ゲームです。このため「ゲーム理論」と言う言葉は、非協力ゲームのことを指すことも多いです。実際に、ゲーム理論の代表的なテキストTadelis(2012)、Fudenberug and Tirole(1991) などでも協力ゲームは扱われていません。これに対し、近年ゲーム理論の研究が盛んな計算機科学の分野では、協力ゲームもそれなりに扱われ、研究されているように見えます。

非協力ゲームと協力ゲームの違い

非協力ゲームでは、プレイヤーが利得が大きくなるように行動を選びます。そして、各プレイヤーが行動を選んだ組み合わせに対し、プレイヤーの利得が与えられています。その中で、プレイヤーがどのように行動するかを明らかにすることが非協力ゲームの目的であると言えます。例えば非協力ゲームの代表的な例である囚人のジレンマは:

  • プレイヤーはA君、B君の2人
  • 各プレイヤーは「協力する」か「協力しない」かの2つの行動から1つを選ぶ
  • 各プレイヤーは次の順番に結果を好む
    • 自分が協力せず、相手が協力すれば 4点
    • 自分も相手も協力すると 3点
    • 自分も相手も協力しないと 0点
    • 自分は協力して、相手が協力しないと 1点

のような感じです。利得行列と呼ばれる表で、これを表すと以下のようになります。

囚人のジレンマの例

というモデルです。ここではプレイヤーの行動と、その行動の帰結に対して、自分が何を好むかが与えられています。このような設定で、各プレイヤーがどのような行動を選ぶのかを明らかにすることが非協力ゲームであると言えます。

これに対し協力ゲームは、プレイヤーの提携(集合、結託、グループなどと呼ばれる)に対する利益が与えられています。例えば、

  • プレイヤーはA君、B君、C君の3人。大道芸をして稼ごうとしている。
  • A君、B君、C君は1人ずつだと1日の利益は、それぞれ2千円、3千円、5千円
  • A君とB君が一緒に組むと(これが「提携」)利益は1万5千円になる、B君とC君だと1万円、A君とC君だと2万円。
  • A君、B君、C君が3人で組むと、利益は3万円

と言ったモデルです。上記の設定は利得行列の代わりに、以下のような表で書くことができます。

協力ゲームの特性関数

上記の表は特性関数と呼ばれることから(本当は表ではなく、関数で書く)、協力ゲームは特性関数形ゲームとも呼ばれます。

非協力ゲームと違い、プレイヤーには選ぶ「行動」がなく、提携に対する利益だけが与えられています。このような設定で、全体の利益を個人にどう配分するべきか(配分されるのか)、を明らかにすることが協力ゲームであると言えます。 上記であれば3人で協力して2万円の利益が得られたときに、その利益はA,B,Cにどのように分配されるのか、を明らかにすることが協力ゲームの目的であると言えます。

※「どのような提携が最終的に組まれるのか(全体提携が組まれるのか)」「そのとき利益はどのように分配されるのか」 を問題にすることもある。

なぜこのような違いが?

協力ゲームの特性関数は、もともとは非協力ゲームをベースにもとにして作られていました。例えば上の囚人のジレンマで特性関数を作ってみましょう。(本当は3人のゲームでやりたいのですが、3人の非協力ゲームや利得行列はややこしいので。)

各プレイヤーは個人では、最低限の利得として0を獲得できます。一方、2人が協力すると合計の利益として6が獲得できます。したがって、囚人のジレンマの特性関数は

囚人のジレンマの特性関数

と書けます.

あれれ「書けます」とは言ったものの、本当にこれでいいのでしょうか?実は、ここに3つの問題点があることが分かります。

問題点1:全体の提携の利益を6にしているが、そもそも2人が協力できるなら囚人のジレンマなんて考える必要がない!個人の利益も0でいいの?

協力ゲームでは、提携の利益が本当に実現するのか、という問題が残ります。このため協力ゲームは提携を組んだときにその提携の利益が確実に得られる「拘束的合意」と呼ばれる合意が存在することが、前提になっているとも言われます。

このようにもともとは協力ゲームは、非協力ゲームの設定が与えられ、そこから各提携の利益が拘束的合意を前提に導かれるという形式が、出発点でした。しかしそれならば、その非協力ゲーム自身を分析して、それを個人の分配そのものと考えれば良いので、なんで非協力ゲームを考える必要があるの?、というわけです。

問題点2:提携の利益を考えるときに2人の利益を足している

これ足せるの?そして分配するときに、足した合計の利益を分けられるの?という問題があります。これについては、ゲーム理論における効用とは何か、というさらに深い問題に入り込まなければならないので、ここでは省略します。このような特性関数ゲームでは、各プレイヤーにとって価値尺度を共通して測れる(貨幣のような)別払い(side payment)と呼ばれる方法が存在することが前提とされます。

問題点3:たとえ拘束的合意と別払いがあったとしても、3人以上のゲームで、提携内と提携外でプレイヤーが何を選んだ場合を、提携の利益と考えるのか?

という問題があります。例えばA,B,Cの3人がいてAとBの提携の利益を求めたいとき、拘束的合意があって、AとBは2人の合計利益を最大にするように行動すると仮定しても、Cがどの行動を選ぶかで利益が異なってしまいます。

フォン・ノイマンとモルゲンシュテルンが考えた古典的なゲーム理論では、提携をまとめて1人のプレイヤーと考え、提携外のプレイヤーをまとめて1人のプレイヤーと考え、問題を2人ゲームに帰着させました。そして、そのゲームの解を提携の利益としています。しかし、その考えでいいのかという問題はありますし、フォン・ノイマン達が考えたゲームは零和ゲームだったので、2人ゲームの解のプレイヤーの利益は一意に決まるのですが、非零和ゲームではナッシュ均衡は複数あることもあり、利得も一意には決まりません。

協力ゲームは規範的な問題には効果的

目的によっては、協力ゲームのようなモデル化が便利な場合もあります。特に「どのような行動が選ばれて、どのような利益が得られるか」という「どうなるか(記述的理論)」ではなく、「提携ごとの利益から、どのように利益が各プレイヤーに配分されるべきか」という「どうあるべきか(規範的理論)」として活用できることが、協力ゲームの利点でもあります。

協力ゲームも非協力ゲームも、共にゲーム理論として発展してゆくべきだと私は考えています。

一般の方に向けた原稿など

  • ゲーム理論に関する一般向けの文章など(査読なし論文)はこちら
  •  特に最近のリスト
    • 「初歩から学ぶゲーム理論 ―ORにおけるゲーム理論入門―」、オペレーションズリサーチ、2015年6月号.
    • 「企業経営に活かすゲーム理論(前・後編)」、渡辺隆裕、調査月報、10月号,38-43, 11月号,38-43, 2014。
    • 「ゲーム理論入門/「ゲーム理論」は数学か?」、渡辺隆裕、数学セミナー、2014年10月号、 636号、ゲーム理論の数理。
    • 「経済学では公共工事をどうみるか」(もし経済学で日本の公共工事を論じたら第1回) 建設マネジメント技術, 3-6, 2013.
    • 「囚人のジレンマから見る価格競争」(もし経済学で日本の公共工事を論じたら第2回), 建設マネジメント技術, 32-37, 2013.
    • 「経営者のためのゲーム理論入門」(第1回-第18回)、戦略経営者(TKC全国会)、2011年4月号から2012年9月号まで連載。
    • 「ゲーム理論のキーワード」, 現代思想, vol.36, 44-57, 2008.
  • なお、研究論文(査読付き論文)リストはこちらを。学会発表はこちらを。

講演や研修などの履歴

社会人向けのゲーム理論の講義や研修を引き受けています。
大学生や大学院生向けと少し異なるプログラムで、ゲーム理論とは何かを知ってみたい社会人向けのプログラムを用意しています。以下は過去に引き受けた社会人向けの講義経歴と講義資料です。

  • 首都大学東京ビジネススクール(2004-
    • これは本務です(^^;)、15回の社会人向けの講義です。
  • 東京都管理職候補生 研修 (2007年-
    • 本学の経営学専攻が引き受けている東京都職員向けの研修です。「ゲーム理論と制度設計」というタイトルで1日8時間のプログラムで、毎年講義させて頂いています。
  • 自治体・公的団体等での講義:
    • 東京都の職員以外では、東京都特別区職員研修所研修 (2009年)などで講義させて頂きました。
  • 市民向け一般講座
    • 麹町アカデミア(2014年):4回の講義をさせて頂きました。
    • シブヤ大学(2008年)、八王子学園都市大学「いちょう塾」(2005年10月)、東京都立大学公開講座(2003年2月)
  • 日本生産性本部(2014年-2016年)
    • 「ユニオンリーダー養成講座」で、2014年から講義させて頂いています。
  • 以下の企業に呼んで頂き2-3時間講義させて頂きました
    • ティージー情報ネットワーク株式会社(2014年)、株式会社ブレインパッド(2011年)、関西電力チャレンジ研修 (2007年-2011年)、住友経営テクノロジーフォーラム(2007年1月)、Link and Motivation 社(2005年7月)
  • 日本数学検定協会(2015年)
    • 数学コーチャー研究発表会・研修会で講演させて頂きました。
  • 中小企業大学校(2004年度-2006年度)
  • 政策研究大学院大学(2004年度-2006年度)
  • 筑波大学ビジネススクール企業科学専攻:(2009年3月)
  • 他に社会人向けではなく大学生向けに、東京工業大学、防衛大学校などで講義をさせて頂きました。

講義の依頼などありましたら、こちらまでご連絡ください。

図解雑学ゲーム理論

ナツメ社の図解雑学シリーズから、私の著書「図解雑学ゲーム理論」が2004年8月14日に出版されました。皆さんに愛され18刷まで出ました。残念ながら2018年を持って紙での媒体は絶版となりました。

現在はkindle版として販売されています。 
韓国語にも翻訳されました。


現在、この本は日経BP社「ビジュアル ゲーム理論」として書き直され、新しく生まれ変わっています。

講義と講演の資料(学生、一般向け)

  • 首都大のゲーム理論1、2の資料はこちら
  • 初歩から学ぶゲーム理論-web講義(BASIC)はこちら
  • クールノー競争とベルトラン競争には関連する資料をこちらにまとめておきました。
  • 都庁管理職候補者研修「ゲーム理論と制度設計」
  • 首都大学東京「ゲーム理論1」「ゲーム理論2」の講義資料2016年度版(28回分、30時間くらい)
  • 首都大学東京 経営学系講義「入門ミクロ経済学」講義資料のページ
  • 首都大学東京 経営学系講義「ミクロ経済学1」(2015年度)講義スライド

東京都立大学講義「ゲーム理論」 講義情報

東京都立大学経済経営学部「ゲーム理論1」「ゲーム理論2」の講義情報です。

参考となるページ

以下のページも参考にして下さい。

オンライン講義(2020:コロナ対応、youtube)

youtubeで公開されているオンライン講義です。