支配戦略

戦略形ゲームにおいては,各プレイヤーがどの戦略(選択,行動,代替案)を選ぶかを決めることが分析の主たる目的となります.

このとき,各プレイヤーに対して,他のプレイヤーが何を選んでも,自分の他の戦略よりも良い戦略(利得を高くする戦略)があれば,その戦略を支配戦略と呼びます.プレイヤーに支配戦略があれば,そのプレイヤーはその支配戦略を選ぶと考えます.

例を挙げましょう.

支配戦略の例(コンビニ戦争2):2つのコンビニ,セレブ(セレブイレブン)とファミモ(ファミリーモール)が,まだコンビニがないA駅とB駅のどちらか一方に出店しようと考えている.コンビニを1日に利用する客はA駅が1200人,B駅が300人である.セレブとファミモがもし違う駅を選べば,利用客を独占できる.しかし同じ駅に出店すると,ファミモが人気で,ファミモはセレブの2倍の客数を獲得できる.すなわち両方がA駅に出店すると,セレブ400人,ファミモ800人.B駅に出店すると,セレブ100人,ファミモ200人である.ここで客数を利得と考える.セレブとファミモはどちらの駅に出店するだろうか?

ゲーム理論を持ち出すまでもなく,ちょっと考えるとセレブもファミモもA駅を選ぶことが分かるでしょう.B駅を独占しても高々300人ですからね.でも最初はこの例から始めましょう.

このゲームを利得行列で書くと下のようになります.

コンビニ戦争2

このときセレブの視点に立ってみましょう.セレブは

  • ファミモがA駅を選ぶならB駅(300)よりA駅(400)を選ぶほうが良い.
  • セレブは,ファミモがB駅を選んでも B駅(100)よりA駅(1200)を選ぶほうが良い.

と言うことが分かります.セレブは,ファミモが何を選んでも,B駅よりはA駅の方が良い戦略です.したがってA駅はセレブの支配戦略です(以下の図).

セレブの支配戦略

同様に ファミモの視点に立って考えてみます.

ファミモの支配戦略

セレブは,ファミモが何を選んでも,B駅よりはA駅の方が良い戦略です.したがってA駅はセレブの支配戦略です.

もしすべてのプレイヤーに支配戦略があれば,すべてのプレイヤーが支配戦略を選ぶことがゲームの答となり,そのゲームは解けたことになると言えるでしょう.今回の例では,セレブもファミモも支配戦略はA駅でしたから,両方ともA駅を選ぶと予測でき,ゲームは解けたことになります.

支配戦略は,相手の選択に関わらず,自分にとって他の選択より良いような選択がある場合です.このときプレイヤーは,相手や自分にとっての知識が完全でなくても行動を確定することができます.例えば,

(禅が好きなアリス)アリスと文太は,それぞれ禅寺に行くか,ショッピングセンターに行くか悩んでいる.アリスはとにかく禅寺に行きたいので,文太が禅寺に行っても行かなくても,ショッピングセンターよりは禅寺がいい.

この場合,アリスにとって禅寺に行くことが支配戦略になり,アリスは禅寺に行くことが確定します(だから「悩んでいる」って問題設定はおかしいんだけど).しかも

  • 文太の利得は全く分かっていない.つまりプレイヤーに支配戦略があれば,相手の行動どころか,利得さえ分からなくても,そのプレイヤーの行動は確定する.
  • アリスも結果に対する好みがすべて確定しているわけではない.例えば「文太と一緒に禅寺に行くこと」と「アリスだけが禅寺に行き,文太はショッピングセンターに行くこと」のどちらが良いかは問題には定められていない(文太が好きなのか,嫌いなのか?).つまりプレイヤーは,相手の選択それぞれに対する自分の好みだけが分かっていれば行動は確定する.

ということになります.つまり支配戦略があれば,細かい情報はなくてもプレイヤーはそれを選ぶことになります.このことは,支配戦略によるプレイヤーの行動の予測は,かなり確かなものになっているということで,支配戦略がないゲーム(その解はナッシュ均衡)よりも,より確からしい予測を与えているということになります.

このように支配戦略があればゲームの解は自明なように思えますが,必ずしもそうではないように見えるゲームがあります.それが囚人のジレンマであり,共有地の悲劇です.

じゃんけんで出やすい手

じゃんけんで出やすい手について.じゃんけんでは統計的にグーが出やすく,チョキが出にくいことが知られている.

もはや古典とも言える有名な結果が,桜美林大学の芹沢光雄教授のデータで「学生725人に,のべ11567回ジャンケンさせたところ グーが4054回(35.0%)、パーが3849回(33.3%)、最も少ないのはチョキで3664回(31.7%)」というものである.(例えば日本じゃんけん協会「勝利の法則」.なおこの記事は「2009年6月20日の日本経済新聞土曜版「日経プラスワン」に掲載された」とされているものが多いが,私が見たのはそれより前の読売オンラインだった.その記事では,卒論でそれを調べた学生がいた,というものだったと記憶している.)

世界じゃんけん協会(The world rock paper scissors society) のホームページでも,出典は不明ながら「グーが35.4%,パーが35.0%,チョキが29.6%」となっており(じゃんけんの戦略(rock-paper-scissors strategies)) やはりグーが一番出やすい手だと言われている.

このことから,何も条件がなく初めての人とじゃんけんをするときは,「パーを出すと勝つ確率が上がるので,パーを出せ」とされている.

ちなみに私のゲーム理論の講義では,この話をした後に学生とじゃんけんをしてみる.それで私はチョキを出すのだが,学生もこの必勝法を鵜呑みにして,パーを出すことはほとんどない.相手も自分もその情報を知っていると,その必勝法は使えない.ゲーム理論における2人じゃんけんの解(ナッシュ均衡)は「グー,チョキ,パーを1/3の確率で出す」である.ゲーム理論では,相手が自分の行動を読んでも,自分の利得がそれ以上高くならない手を選び合う. 「グー,チョキ,パーを1/3の確率で出す」 以外の解は,それに従うことを相手が知れば,もう解にはならないのである.

自分が興味があるのはこのような統計が人々に知られるようになると,人間の行動が変わり,統計が変わるのかどうかである.10年後に調べてみると,じゃんけんではチョキを出す人が多くなっていると面白い.

他に有名な必勝法としては 「じゃんけんを続けてするときは「相手は異なる手を出しやすいので,いま相手が出している手に負けるような手を出せ」」と言うのがある.例えばパーであいこになったとき,次は相手はパーと異なる手(グーかチョキ)を出しやすいので,グーを出せば勝つ確率は高くなる,と言ったものである.特に2回同じ手であいこになったときは,相手が手を変える確率はずっと高くなる.例えばパーで2回あいこになったときは,3回目にグーを出せば勝つ確率はずっと高いと言われている.

戦略形ゲームと利得行列

戦略形ゲームは,展開形ゲームと並ぶ非協力ゲームの表現形式です(参照:戦略形ゲームと展開形ゲーム).戦略形ゲームは,プレイヤー,戦略,利得の3つの要素から構成されます.すべてのプレイヤーは同時に戦略を選び,その結果,各プレイヤーの利得が決まります.戦略形ゲームの例として,次のような問題を考えてみましょう.

戦略形ゲームの例(コンビニ戦争1):2つのコンビニ,セレブ(セレブイレブン)とファミモ(ファミリーモール)が,まだコンビニがないA駅とB駅のどちらか一方に出店しようと考えている.コンビニを1日に利用する客はA駅が600人,B駅が300人である.セレブとファミモがもし違う駅を選べば,利用客を独占できる.しかし同じ駅に出店すると,ファミモが人気で,ファミモはセレブの2倍の客数を獲得できる.すなわち両方がA駅に出店すると,セレブ200人,ファミモ400人.B駅に出店すると,セレブ100人,ファミモ200人である.ここで客数を利得と考える.セレブとファミモはどちらの駅に出店するだろうか?

本題に入る前に言っておきたいのですが,別にこのページはコンビニの戦略の話をしたいのではなくて,ゲーム理論とは何かを話すための「例」ですからね.「両方に出店するというのはないのでしょうか」とか聞く人がいるけど(本当にたくさんいる),そうしたければ,そういう例を勝手に考えてください.むかし,あるビジネス系の雑誌に,こういう例を出したら,雑誌の編集部の人がコンビニの会社の人に聞きに行って,そしたら「うちには『客を取り合う』という発想はない.2つのコンビニに同じ駅に出店すると集積効果があって,利用客は増える」とか言われてしまったのですが,そうならば,そういう例を作ればいいですよ.でも増えたりしたら,例として分かりにくいじゃないですか.ここはリアリティを求めてるんじゃなくて,わかりやすい例にしてるんです.

で,本題です.上記の例の場合,戦略形ゲームの3要素(プレイヤー,戦略,利得)は

  • プレイヤー:セレブとファミモ
  • セレブの戦略:A駅に出店する,B駅に出店する
  • ファミモの戦略:A駅に出店する,B駅に出店する
  • 利得:上記に書かれている客数

のようになります.このようにプレイヤーが2人のゲームを2人ゲームと呼び,その中でも両プレイヤーの戦略の数が2つの場合は2✕2ゲーム(ツーバイツーゲーム,と呼ぶ)と呼ばれます.2✕2ゲームは,戦略形ゲームの中で最も簡単なゲームであると言えます.

「利得は上記に書かれている」と言われても見にくいので,このような2人戦略形ゲームを表すには,以下のような利得行列という表を使います.

利得行列

この表では,セレブが行(水平方向)を選択し,ファミモが列(垂直方向)を選択し,交わったセルの左側の数値がセレブの利得,右側の数値がファミモの利得を表します.例えば,セレブがA駅,ファミモがB駅を選ぶと…

セレブがA駅,ファミモがB駅を選択

このようになり,セレブの利得が600,ファミモの利得が300になることが分かります.

利得行列にはいろいろな書き方があり,下の図のようにセルを左下と右上に区切り,左下に第1プレイヤー(行を選ぶプレイヤー,今回はセレブ)の利得,右上に第2プレイヤーの利得を書く場合もあります.

利得行列の別の書き方

戦略形ゲームと展開形ゲーム

ゲーム理論(非協力ゲーム)には,戦略形ゲームと展開形ゲームと言う2つの「表現」があります.「表現」と言われてもは分かりにくいので,ざっくりと「ゲーム理論は,戦略形ゲームと展開形ゲームの2つの理論がある」と考えて良いでしょう.

これら2つのゲームについて,初めて学ぶときは

  • 戦略形ゲームは,プレイヤーが同時に行動を選ぶ「同時ゲーム」.代表的なゲームはじゃんけんなど.
  • 展開形ゲームは,プレイヤーが順番で行動を選ぶ「交互ゲーム」を含む「すべてのゲームを表現する」ゲーム.代表的なゲームはチェスや将棋など.

くらいに考えると良いです.

ゲーム理論では「同時か,逐次か」と言った「時間」が重要なのではなく,相手の行動が観察できるかどうかが重要です.例えば,2人でじゃんけんをするとき,まず1人(先手)が相手に分からないように「ぐー,ちょき,ぱー」のどれかを選んで紙に書き,もう1人(後手)はそれを見ずに 後から「ぐー,ちょき,ぱー」を選ぶ.そして先手の書いた紙が公表されて勝負をする,としましょう.この場合は,時間としては交互に行動していますが,同時にじゃんけんをしているのと変わりありません(同時にじゃんけんすると,後出しっぽくなる人がいるのを考えると,こっちのほうがずっと「同時」かも知れない) .先手は後手の行動を知らず,後手も先手の行動を知りません.この場合は戦略形ゲームになっていると言えます.

このように(すべてのプレイヤーが)他のプレイヤーの行動が観察できずに行動を選ぶ場合は戦略形ゲームです.オークションや競りを例に挙げれば,封印された紙に価格を書いて,最後に競り人がそれを開いて一番高額の人に出品された物を売る,と言った「封印入札」なども戦略形ゲームの典型的な例と言えます.

これに対して,チェスや将棋や囲碁では,自分より前に行動した人がどのような行動をしたかがすべて分かります.このようなゲームは完全情報ゲームと呼ばれますが,展開形ゲームで分析されるゲームの代表例です.オークションや競りでは,オークションハウスでの絵画の取引やマグロの競りなど,誰かが値段をつけたのを見て,それより高く買いたい人は更に高い価格をつける...などの「イングリッシュオークション」は展開形ゲームの典型例と言えます.同じ競りやオークションでも,ルールや形式によって違うゲームと考えられる点に注意です.

戦略形ゲームは「利得行列」と呼ばれる道具を用いて表現し,展開形ゲームは「ゲームの木」と言う道具を用いて表現します.戦略形ゲームと展開形ゲームについては,別の投稿で詳しく説明します.

非協力ゲームと協力ゲーム

ゲーム理論は非協力ゲーム(non-cooperative game)と協力ゲーム(cooperative game)に分けられます.

ゲーム理論は経済学で大きく発展しました.近年,経済学で主に扱われているのは非協力ゲームです.このため「ゲーム理論」と言う言葉は,非協力ゲームのことを指すことも多いです.実際に,ゲーム理論の代表的なテキストTadelis(2012),Fudenberug and Tirole(1991) などでも協力ゲームは扱われていません.

これに対し,近年ゲーム理論の研究が盛んな計算機科学の分野では,協力ゲームもそれなりに扱われ,研究されているように見えます.

非協力ゲームは,プレイヤーが行動を選び,その結果が各プレイヤーにどのように好まれるか(利得)がモデルに与えられます.「プレイヤーがどのように行動するか」を明らかにすることが非協力ゲームの目的であると言えます.例えば非協力ゲームの代表的な例である「囚人のジレンマ」では:

  • プレイヤーは2人,各プレイヤーは「協力する」か「協力しない」かの2つの行動から1つを選ぶ
  • 各プレイヤーは次の順番に結果を好む
    • 自分が協力せず,相手が協力してくれること
    • 自分も相手も協力すること
    • 自分も相手も協力しないこと
    • 自分は協力して,相手が協力しないこと

というモデルです.ここではプレイヤーの行動と,その行動の帰結に対して,自分が何を好むかが与えられています.このような設定で,各プレイヤーがどのような行動を選ぶのかを明らかにすることが非協力ゲームであると言えます.

これに対し協力ゲームは,プレイヤーの提携(集合,結託,グループなどと呼ばれる)に対する利益が与えられます.例えば,

  • プレイヤーはA君,B君,C君の3人.大道芸をして稼ごうとしている.
  • A君,B君,C君は1人ずつだと1日の利益は0円.
  • A君とB君が一緒に組むと(これが「提携」)利益は1万円になる,B君とC君だと1万5千円,A君とC君だと2万円.
  • A君,B君,C君が3人で組むと,利益は3万円

と言ったモデルです.非協力ゲームと違い,プレイヤーには選ぶ「行動」がなく,提携に対する利益だけが与えられています.このような設定で「どのような提携が最終的に組まれるのか(全体提携が組まれるのか)」「そのとき利益はどのように分配されるのか」を明らかにすることが協力ゲームであると言えます.

協力ゲームでは,いかに提携の利益が発生するかが明確ではないため,その利益が本当に実現するのか,という問題が残ります.提携の利益が確実に得られる「拘束的合意」と呼ばれる合意が存在することが,前提になっているとも言われます.もともとは協力ゲームは,非協力ゲームの設定が与えられ,そこから各提携の利益が導かれるという形が出発点でした.それならば,元の非協力ゲームを分析すれば良いだろう(分析するべきだ)というのが,現在,経済学等で非協力ゲームだけが扱われる理由です.根底には「社会の状態は,個人が合理的に選択する行動の帰結として描写されるべきだ」という経済学の理論に対する考え方が現れてるとも言えましょう.

しかし目的によっては,協力ゲームのようなモデル化が便利な場合もあります.特に「どのような行動が選ばれて,どのような利益が得られるか」という「どうなるか(記述的理論)」ではなく,「提携ごとの利益から,どのように利益が各プレイヤーに配分されるべきか」という「どうあるべきか(規範的理論)」として活用できることが,協力ゲームの利点でもあります.

協力ゲームも非協力ゲームも,共にゲーム理論として発展してゆくべきだと私は考えています.

一般の方に向けた原稿など

  • ゲーム理論に関する一般向けの文章など(査読なし論文)はこちら
  •  特に最近のリスト
    • 「初歩から学ぶゲーム理論 ―ORにおけるゲーム理論入門―」,オペレーションズリサーチ,2015年6月号.
    • 「企業経営に活かすゲーム理論(前・後編)」,渡辺隆裕,調査月報,10月号,38-43, 11月号,38-43, 2014.
    • 「ゲーム理論入門/「ゲーム理論」は数学か?」,渡辺隆裕,数学セミナー,2014年10月号, 636号,ゲーム理論の数理.
    • 「経済学では公共工事をどうみるか」(もし経済学で日本の公共工事を論じたら第1回) 建設マネジメント技術, 3-6, 2013.
    • 「囚人のジレンマから見る価格競争」(もし経済学で日本の公共工事を論じたら第2回), 建設マネジメント技術, 32-37, 2013.
    • 「経営者のためのゲーム理論入門」(第1回-第18回),戦略経営者(TKC全国会),2011年4月号から2012年9月号まで連載.
    • 「ゲーム理論のキーワード」, 現代思想, vol.36, 44-57, 2008.
  • なお,研究論文(査読付き論文)リストはこちらを.学会発表はこちらを.

講演や研修などの履歴

社会人向けのゲーム理論の講義や研修を引き受けています.
大学生や大学院生向けと少し異なるプログラムで,ゲーム理論とは何かを知ってみたい社会人向けのプログラムを用意しています.以下は過去に引き受けた社会人向けの講義経歴と講義資料です.

  • 首都大学東京ビジネススクール(2004-
    • これは本務です(^^;),15回の社会人向けの講義です.
  • 東京都管理職候補生 研修 (2007年-
    • 本学の経営学専攻が引き受けている東京都職員向けの研修です.「ゲーム理論と制度設計」というタイトルで1日8時間のプログラムで,毎年講義させて頂いています.
  • 自治体・公的団体等での講義:
    • 東京都の職員以外では,東京都特別区職員研修所研修 (2009年)などで講義させて頂きました.
  • 市民向け一般講座
    • 麹町アカデミア(2014年):4回の講義をさせて頂きました.
    • シブヤ大学(2008年),八王子学園都市大学「いちょう塾」(2005年10月),東京都立大学公開講座(2003年2月)
  • 日本生産性本部(2014年-2016年)
    • 「ユニオンリーダー養成講座」で,2014年から講義させて頂いています.
  • 以下の企業に呼んで頂き2-3時間講義させて頂きました
    • ティージー情報ネットワーク株式会社(2014年),株式会社ブレインパッド(2011年),関西電力チャレンジ研修 (2007年-2011年),住友経営テクノロジーフォーラム(2007年1月),Link and Motivation 社(2005年7月)
  • 日本数学検定協会(2015年)
    • 数学コーチャー研究発表会・研修会で講演させて頂きました.
  • 中小企業大学校(2004年度-2006年度)
  • 政策研究大学院大学(2004年度-2006年度)
  • 筑波大学ビジネススクール企業科学専攻:(2009年3月)
  • 他に社会人向けではなく大学生向けに,東京工業大学,防衛大学校などで講義をさせて頂きました.

講義の依頼などありましたら,こちらまでご連絡ください.

図解雑学ゲーム理論

ナツメ社の図解雑学シリーズから,私の著書「図解雑学ゲーム理論」が2004年8月14日に出版されました.皆さんに愛されて,18刷まで出ました.残念ながら2018年を持って紙での媒体は絶版となりました.

現在はkindle版として販売されています. 
韓国語にも翻訳されました.