ゼミナールゲーム理論入門 読者からの質問と回答

読者からの質問のうち,誤植に関してはゼミナールゲーム理論入門正誤表-第9刷まで(pdfファイル)に,演習問題に関する質問は演習問題の解説に載せています.

ここではそれ以外のものに対して載せています.

第6章 6.4.2について

6.4.2マキシミニ戦略とミニマックス値を求める というところでわからなくなってしまいました. マキシミニ戦略の求め方の1つ目2つ目は何とかわかるのですが3つ目がわかりません.

  • 質問1:「図6.24のグラフより最悪の利得を与えるプレイヤー2の(純粋)戦略は,X2とY2の両方である(p211)」→最悪の利得とはなん ですか?
  • 質問2:グラフの交点の場所だとしたらそこがなぜ最悪なのですか?「プレイヤー2の期待利得は,プレイヤー1がX1を選んでもY1を選んでも等しいはずである.(p211~212)」→なぜですか?

質問1の回答:

  • 最悪の利得とは,最小の利得のことです.図6.23と図6.24には,プレイヤー2がx2を選んだときとy2を選んだときの プレイヤー1の期待利得が分かります.これを見ると…
    • 0≦x<3/4では,プレイヤー2がx2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる.
    • 3/4<x≦1では,プレイヤー2がy2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる.
    • そして, x=3/4では,プレイヤー2がx2を選ぶときとy2を選ぶときの両方が,プレイヤー1 にとって利得は最小(最悪)となる.
    • したがって「プレイヤー1のマキシミニ戦略x=3/4」に対して,利得を最小に する戦略はx2とy2の両方である

    ということになります.

  • このようにプレイヤー2の戦略が2つだと,プレイヤー1 のマキシミニ戦略x=3/4に対して最小(最悪)の利得を与える戦略が「すべての」 戦略であり,言っている意味が分かりにくいのですが,プレイヤー2の戦略が3つ あると意味が分かってきます.P212のプレイヤー2の戦略が3つの場合を見 てみましょう.
    • 0≦x<1/3では,プレイヤー2がy2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる.
    • x=1/3では,プレイヤー2がx2を選ぶときとy2を選ぶときの両方が,プレイヤー1 にとって利得は最小(最悪)となる.(z2では最悪にはならない)
    • 1/3<x<2/3では,プレイヤー2がx2を選ぶときがプレイヤー1にとって利得は最小 (最悪)となる.
    • x=2/3では,プレイヤー2がx2を選ぶときとz2を選ぶときの両方が,プレイヤー1 にとって利得は最小(最悪)となる.(y2では最悪にはならない)
    • 2/3<x≦1では,プレイヤー2がz2を選ぶときがプレイヤー1にとって利得は最小
      (最悪)となる.
  • したがって「プレイヤー1のマキシミニ戦略x=2/3」に対して,利得を最小にする戦略はx2とz2の両方です.(y2ではない),とな ります.このように マキシミニ戦略に対して,相手のどの戦略が利得を最悪にするかは相手の戦略 が3つ以上あるときに重要になります.
  • なお「最小」ではなく「最悪」と言っている理由は,ゼロ和ゲームでプレイヤー 1の利得表だけを使った場合,プレイヤー1では利得を最小にすることが最悪です が,プレイヤー2は(プレイヤー1の利得を)最大にすることが最悪で,「最小」 と言ってしまうと,同じ原理をプレイヤー2にとって当てはめたときに分からなく なってしまうからです.

質問2の回答:

  • .ミニマックス定理では「プレイヤー2のマキニミニ戦略に対して最悪の利得を 与える戦略は,プレイヤー1のマキシミニ戦略」だということが分かります. またプレイヤー1のマキシミニ戦略はp=3/4であることが既に求められています.
  • .もしプレイヤー2のマキニミニ戦略における期待利得が,x1よりy1の方が大き いと,プレイヤー2のマキシミニ戦略に対して最悪の利得を与える戦略はx1に なります.したがってミニマックス定理より,プレイヤー1のマキシミニ戦略
    はx1(p=1)となり,p=3/4であることに矛盾します.
  • 同様にプレイヤー2のマキニミニ戦略における期待利得が,y1よりx1の方が大 きいと,プレイヤー2のマキシミニ戦略に対して最悪の利得を与える戦略はy1に なります.したがってプレイヤー1のマキシミニ戦略はy1(p=0)となり,p=3/4
    であることに矛盾します.
  • したがってプレイヤー2のマキニミニ戦略における期待利得は,x1とy1で
    等しくなければなりません.
  • だいたいは上記の通りですが,実は2についてはもう少し詳しい説明が必要 カも知れません.プレイヤー1の混合戦略をx1をp,y1を1-pで選ぶようなもの として考えると,このような戦略に対するプレイヤー2の期待利得は
    p×(x1での期待利得)+(1-p)×(y1での期待利得)
    になります.もしプレイヤー2のマキニミニ戦略における期待利得が,x1より y1の方が大きいと,プレイヤー2のマキシミニ戦略に対して最悪の利得を与え る戦略はp=1になります.p=3/4での期待利得は,p=1よりも大きくなります.
    これは,p=3/4がプレイヤー1のマキシミニ戦略であることに矛盾します.