ナッシュ均衡の求め方:2人ゲームの利得行列の場合

ここではゲーム理論におけるナッシュ均衡を求める方法について。「プレイヤーが2人で混合戦略(確率を用いる戦略)を考えない場合」について説明します。ゲーム理論の基本中の基本と言えます。

  • 混合戦略(確率を用いる戦略)のナッシュ均衡の求め方こちら
  • クールノー均衡の求め方はこちら
  • ナッシュ均衡とは何かはこちら
  • ナッシュ均衡の概念を理解するおけいこはこちら

ナッシュ均衡の求め方

ナッシュ均衡は「すべてのプレイヤーが最適反応戦略(利得が最も高くなる戦略)を選び合う戦略の組み合わせ」ですから、以下の方法で求めることができます。

  • STEP1 プレイヤー1の立場で考える。
    • 相手(プレイヤー2)のすべての戦略に対して、プレイヤー1がもっとも利得が高くなる戦略をチェックする(プレイヤー1の最適反応戦略)。ここでは利得に下線を引く。
  • STEP2 プレイヤー1の立場でチェックが終わったら、プレイヤー2の立場で考える。
    • 相手(プレイヤー1)のすべての戦略に対して、プレイヤー2がもっとも利得が高くなる戦略をチェックする(プレイヤー2の最適反応戦略)。ここでは利得に下線を引く。
  • STEP3 すべてのチェックが終わったら、両プレイヤーの利得に下線が引かれているのがナッシュ均衡。(利得ではなく、戦略の組であることに注意!)

例題

以下の利得行列でナッシュ均衡を求めてみましょう。

ナッシュ均衡を求めてみよう

今回は、ナッシュ均衡を求める手順を習得することが目的なので、ストーリーは特につけずに、単なる記号で利得行列を考えます。利得行列の読み方が不安、分からないって方は、こちらをご覧ください。

STEP1 まず、プレイヤー1の立場で考えます。相手(プレイヤー2)のすべての戦略に対して、プレイヤー1がもっとも利得が高くなる戦略(最適反応戦略)をチェックし、利得の下に下線を引いて行きます。

1.1 プレイヤー2がLという戦略を選んだ場合を考えます。プレイヤー1はTを選べば利得3、Bを選べば利得2です。したがってプレイヤー1はTを選びます(TがLに対する最適反応戦略)。そこでTを選んだ時の利得3に下線を引きます。

プレイヤー2のLに対するプレイヤー1の最適反応戦略はT

1.2 プレイヤー2がMという戦略を選んだら?プレイヤー1はTを選べば利得0、Bを選べば利得1です。したがってプレイヤー1はBを選びます(BがMに対する最適反応戦略)。そこでBの利得1に下線を引きます。

プレイヤー2のMに対するプレイヤー1の最適反応戦略はB

1.3 最後にプレイヤー2がRという戦略を選んだ場合を考えます。プレイヤー1はTを選んでも、Bを選んでも利得は2で同じです。この場合はTとBの利得2の両方に下線を引きます( TもBもRに対する最適反応戦略)。

プレイヤー2のRに対するプレイヤー1の最適反応戦略はTとB

STEP2 プレイヤー1に対する検討が終わったので、次にプレイヤー2の立場で考えます。相手(プレイヤー1)のすべての戦略に対して、プレイヤー2の利得がもっとも高くなる戦略(最適反応戦略)をチェックし、利得に下線を引いて行きます。

2.1 プレイヤー1がTという戦略を選んだ場合を考えます。プレイヤー2はLを選べば利得4、Mを選べば利得2、Rを選べば利得0です。したがってプレイヤー2はLを選びます(LがTに対する最適反応戦略)。そこでLの利得4に下線を引きます。

プレイヤー1のTに対するプレイヤー2の最適反応戦略はL

2.2 最後にプレイヤー1がBという戦略を選んだ場合を考えます。プレイヤー2はLを選べば利得2、Mを選べば利得3、Rを選べば利得9です。したがってプレイヤー2はRを選びます(RがBに対する最適反応戦略)。そこでRの利得9の下に線を引きます。

プレイヤー1のBに対するプレイヤー2の最適反応戦略はR

STEP3これでプレイヤー1とプレイヤー2のすべてのチェックが終わりました。プレイヤーの両方の利得に下線が引かれている戦略の組がナッシュ均衡です!「

ナッシュ均衡は(T,L)と(B,R)

ナッシュ均衡は「プレイヤー1はTを選び、プレイヤー2はLを選ぶ」「プレイヤー1はBを選び、プレイヤー2はRを選ぶ」の2つです。このようにナッシュ均衡は複数出てくる場合があります(これが悩みの種)。これを(T,L)と(B,R)のように、ベクトルのように書く場合もあります。

ナッシュ均衡は「戦略の組 (profile of strategies)」なので、戦略の組として答えます。「ナッシュ均衡は(3,4)と(2,9)です」などと答えては間違いです。それは利得の組ですから。「Tがナッシュ均衡」などと答えても間違いです。Tはプレイヤー1の戦略(a strategy of player 1)です。戦略の組み合わせではありません。

東京都立大学 2020ゲーム理論1 オンライン講義(2020:コロナ対応)