クールノー競争とベルトラン競争入門(1):不完全競争市場

クールノー競争とベルトラン競争って何なのか?って、話から始めます。計算から行きたい人は独占市場の価格決定へ行くと良いでしょう。

完全競争市場と不完全競争市場

経済学では、最初に完全競争市場(perfectly competitive market)という市場を学びます。そこでは

  • 消費者や企業は多数いて、価格受容者(その行動によって価格が変化しない)
  • 企業は価格を所与とし、生産量を決めて、利益を最大化する
  • 企業は限界費用と価格が等しくなるように生産量を決める
  • 分析道具は、需要曲線と供給曲線 (部分均衡)で、需要曲線と供給曲線が交わったとこで価格と取引量が決まる

とされています。これは「古典的な」市場理論と言えるもので、経済学の考え方の基礎となります。農業なんかだとこの考えは当てはまるし(キャベツの生産者は、自分の生産によって、市場のキャベツの価格が変化するとは思わないでしょう)、経済学が作られた頃は企業とか今のようではなかったし、このように単純化すると経済の問題をシンプルに扱うことができるのでうれしいっす。しかし、

企業は価格を所与として、生産量を決めて、利益を最大化する

という部分は、現在の経済ではとても問題となります。実際に、現在の多くの市場では、企業は価格を所与だと考えているとは思わないでしょう。自分自身が価格を決めたり、もしくは自身の生産が価格に影響を及ぼすことを考慮したりして、意思決定をする場合が多いと思われます。

そこで近年の経済学の研究では、不完全競争市場(imperfectly competitive market)を考えることが多いです。これは企業の数が1つ(独占市場)だったり、2つ(複占市場)だったり、少数(寡占市場)だったりする市場です。ここでは企業を価格決定者であると考え、企業の行動によって価格が決まります。

企業が1つの独占市場の問題は簡単でしたが、2つ以上のときは企業の相互作用がどのように価格や生産量に影響を及ぼすかを考えなければなりません。このとき中心となるのはゲーム理論であり、これによって不完全競争市場は大きく発展し、産業組織論(政策が企業の行動にどのように影響を及ぼす考えたりする)国際経済学などの分野に大きく応用され、近年は経営戦略にも応用されるようになったのでした。

クールノー競争とベルトラン競争

ざっくりいうと、2社以上の企業の不完全競争市場を扱うモデルのうち、クールノー競争は企業が生産量を決定するモデル(生産量競争)で、ベルトラン競争は企業が価格を決定するモデル(価格競争)です。

クールノー競争:各企業は生産量を決定する(生産量競争)
ベルトラン競争:各企業は価格を決定する(価格競争)

このとき各企業が生産する財が同質財か、異質財か、でモデルが大きく分かれます。

同質財の市場と言うのは、すべての企業が生産する財が全く同じで、消費者は企業ごとの財の区別をしません。生産量競争では、全企業が生産した財の合計(=市場全体の生産量)によって財の価格が決まり、その価格はすべての企業の財の価格になると考えます。価格競争では、一番安い価格をつけた企業からすべての消費者は財を買うと考えます。各企業の財は1つの市場、1つの需要曲線で表現されます。

異質財の市場は製品が差別化された市場です。各企業ごとに別の市場があり、相手企業の価格や生産量は、自企業の製品の需要量に影響を及ぼしますが、その需要関数は各企業ごとに与えられます。

通常、クールノー競争と言うと同質財のクールノー競争を指します。これに対し、ベルトラン競争は同質財と異質財の両方を指すことが多いようです。

クールノー競争 vs ベルトラン競争

ゲーム理論では、各プレイヤーが行動するタイミングは、ゲームを決める重要な要素です。上記のモデルは、企業は、相手企業の価格や生産量を知らずに、自社の価格や生産量を決定すると考えています。言わば「同時に」決定すると考えています。

これに対して、各企業が逐次的に価格や生産量を決定するモデルもあります。2社の生産量競争で、1社が先に生産量を決定し(先手)、それを見てもう1社が生産量を決定するモデルはシュタッケルベルグ(Stackelberg)競争と呼ばれます。

クールノー競争:2社が同時に生産量を決める
シュタッケルベルグ競争:2社が先手と後手で逐次的に生産量を決める

2社が先手と後手で価格を決めるモデルもありますが、特に名前はついていません。
※経済学では特に名前はついていませんが、情報学やORなどでは最近、2人ゲームの先手と後手のあるゲームをすべて「シュタッケルベルグゲーム」と呼ぶことが多いです。

次は独占市場の価格・生産量と社会的総余剰へ。

ナッシュ均衡を理解する演習

利得行列や数式を用いずにナッシュ均衡を理解する

ゲーム理論の解はナッシュ均衡こちらで説明)です。「ゲーム理論が少し分かった!」と思えるためには、ナッシュ均衡が理解できていなければなりません。しかし、よくあるゲーム理論の教え方では、ナッシュ均衡は利得行列を使って説明され、プレイヤーの利得が数式や数値や表で与えられて、それを機械的に計算しナッシュ均衡を求める人が多い気がしています。

利得行列からナッシュ均衡を求める方法はこちら(ナッシュ均衡の求め方:2人ゲームの利得行列の場合)。

しかし、それで正しくナッシュ均衡の概念が理解できたと考えられるでしょうか?(いやない、反語)。ここでは、数式や表を用いない例題でナッシュ均衡を理解していきましょう。

まずナッシュ均衡の定義をおさらいしましょう。ナッシュ均衡とは、

どのプレイヤーも、他のプレイヤーがそのナッシュ均衡の戦略を選んでいるならば、自分はそのナッシュ均衡の戦略を選ぶことが利得がもっとも高くなる。

です。つまり、

どのプレイヤーも、他のプレイヤーがそのナッシュ均衡の戦略を選んでいるならば、自分はそのナッシュ均衡の戦略以外を選ぶと、利得が同じか低くなる(高くなることはない)

ということです。この「同じか低くなる」と言うのは1つのポイントです。相手の戦略に対し、利得が最大になる戦略が1つならば「低くなる」で良いのですが、最大となる戦略が<同点>で2つ以上あるときは、「低くなるか同じ」 です。

なお「利得が高くなる」とは、プレイヤーにとって「良い」とか「好ましい」ということです。

2人ゲームの例

2人ゲームで練習してみましょう。なお以下では確率で戦略を選ぶ「混合戦略」は考えません。

練習1:アリスと文太は、禅寺かショッピングモールへ行く。アリスは禅が好きで、文太の行動に関わらず禅寺のほうがショッピングモールより良いと考えている。その中でどちらに行っても、文太に会えないよりは会える方が良いと考えている。一方、文太はどちらに行くかより、アリスに会えることが大切である。そして、アリスに会えたなら、ショッピングモールのほうが禅寺よりもいい。アリスに会えないときも同じである。以下から、ナッシュ均衡を選べ。複数あるときはすべて選び、ないときは「なし」と答えよ。
(A)2人とも禅寺へ行く
(B)アリスは禅寺へ、文太はショッピングモールへ行く
(C)アリスはショピングモールへ、文太は禅寺へ行く
(D)2人ともショッピングモールへ行く

正解は(A)。(A)では、どちらのプレイヤーも、自分だけが行動を変えると利得が小さくなるのでナッシュ均衡です。(B)では文太は禅寺へ行ったほうが利得が高くなりますし、(C)と(D)では、アリスは禅寺へ行ったほうが利得が高くなります。したがってナッシュ均衡ではありません。

なお(C)で「文太はショッピングモールに行ったほうが利得が高くなるのでナッシュ均衡ではない」としても良いです。「ナッシュ均衡ではない」ことを示すには、選択を変えると利得が高くなるプレイヤーが1人でもいることを示せば良いので、アリスと文太の両方について言わなくても、どちらか1人で良いわけです。なお上記の場合、アリスにとって禅寺に行くことは支配戦略です。支配戦略がある場合は、ナッシュ均衡では必ずその戦略が選ばれます。

次はどうでしょうか?

練習2:アリスと文太は、禅寺かショッピングモールへ行く。アリスも文太も、お互いのことが大好きで、どちらに行くかよりも、相手に会えるほうが大切である。ただし、アリスは、会えたときも会えないときも、禅寺のほうがショピングモールよりも良く、文太はショッピングモールのほうが禅寺よりも良い。以下から、ナッシュ均衡を選べ。複数あるときはすべて選び、ないときは「なし」と答えよ。
(A)2人とも禅寺へ行く
(B)アリスは禅寺へ、文太はショッピングモールへ行く
(C)アリスはショピングモールへ、文太は禅寺へ行く
(D)2人ともショッピングモールへ行く

正解は(A)か(D)。2人が会えている(A)と(D)では、どちらか一方だけが行動を変えると、そのプレイヤーの利得が小さくなるのでナッシュ均衡です。(B)と(C)で、どちらか一方だけが行動を変えると、そのプレイヤーの利得が高くなるのでナッシュ均衡ではありません

さてさて、次はどうでしょうか?

練習3:アリスと文太は、禅寺かショッピングモールへ行く。アリスは文太が大好きで、どこに行くかよりも文太に会えることが大切。そして、その中で会えても会えなくても、禅寺のほうがショピングモールよりも良いと考えている。文太は残念ながらアリスが嫌いで、どこに行くかよりもアリスに会わないほうが会えるより絶対良いと考えている。その中で、会えたときも会えないときも、禅寺よりショピングモールのほうが良い。以下から、ナッシュ均衡を選べ。複数あるときはすべて選び、ないときは「なし」と答えよ。
(A)2人とも禅寺へ行く
(B)アリスは禅寺へ、文太はショッピングモールへ行く
(C)アリスはショピングモールへ、文太は禅寺へ行く
(D)2人ともショッピングモールへ行く

この場合はナッシュ均衡は「なし」です。2人が会えている(A)と(D)では、文太が行動を変えると会えなくなって利得が高くなり、2人が会えていない(B)と(C)では、アリスが行動を変えると高くなるので、どれもナッシュ均衡ではありません。(なおこのような場合も確率で戦略を選ぶ混合戦略を用いると、ナッシュ均衡がありますが、その場合は利得を数値で表さなければ確率が計算できません)。

3人以上のゲームの例

ナッシュ均衡についての理解が深まってきたでしょうか?それでは3人以上の例を考えて、練習してみましょう。まず簡単な「多数決」を考えてみましょう。

練習4:(奇数人での多数決) 5人で「海」か「山」を選ぶ。 多い人数が選んだ方を選ぶと勝ち、少ない人数が選んだ言葉を選ぶと負け。当然、勝つほうが負けるより良いとします。以下から、ナッシュ均衡を選べ。複数あるときはすべて選び、ないときは「なし」を選べ。
(A) なし
(B) 全員が「海」を選ぶ
(C) 4人が「海」、1人が「山」を選ぶ
(D) 3人が「海」、2人が「山」を選ぶ
(E) 2人が「海」、3人が「山」を選ぶ
(F) 1人が「海」、4人が「山」を選ぶ
(G) 全員が「山」を選ぶ

正解は(B)と(G)です。 全員が同じ言葉を選ぶ(B)と(G)では、どの人も他者の選択はそのままで自分の選択を変えると利得が低くなるので、ナッシュ均衡です。それ以外では、少数派になっているプレイヤーは、他者の選択がそのままのときに自分の選択だけを変えると多数派となり、利得が高くなるので、ナッシュ均衡ではありません。

では、次はどうでしょう。ライアーゲームの最初に出てくる「少数決」です。少数派になったほうが勝ちです。

練習5:(奇数人の少数決) 5人で「海」か「山」を選ぶ。少ない人数が選んだ方を選ぶと勝ちで、 多い人数が選んだ方を選ぶと負け。以下から、ナッシュ均衡を選べ。複数あるときはすべて選び、ないときは「なし」を選べ。
(A) なし
(B) 全員が「海」を選ぶ
(C) 4人が「海」、1人が「山」を選ぶ
(D) 3人が「海」、2人が「山」を選ぶ
(E) 2人が「海」、3人が「山」を選ぶ
(F) 1人が「海」、4人が「山」を選ぶ
(G) 全員が「山」を選ぶ

正解は(D)と(E)です。それ以外では、多数派になっている人は、自分だけの選択を変えると少数派となり利得が高くなりますので、ナッシュ均衡ではありません。

これに対し(D)と(E)では、すべてのプレイヤーが自分だけ選択を変えても利得が高くならない(同じか低くなる)のでナッシュ均衡です。なぜかと言うと、少数派となったプレイヤーは自分の選択を変えると多数派になり利得が下がりますし、多数派のプレイヤーは自分だけが選択を変えても、やはり多数派になってしまい(多数派が変わってしまいます)利得は同じになります。

もうお腹いっぱいでしょうかね?それでは、最後の問題です。

練習6:(7人じゃんけん)7人でじゃんけんをします。もちろんすべてのプレイヤーは、勝ち、あいこ、負けの順に良い(利得が高い)とします。
(A) なし
(B) 7人ともにグーを出す
(C) 3人がグー、4人がパーを出す
(D) 1人がグー、2人がパー、4人がチョキを出す
(E) 2人がグー、2人がパー、3人がチョキを出す
(F) 3人がグー、2人がパー、2人がチョキを出す

答えは(E)と(F)です!(B)「7人ともにグーを出す」や (C)「3人がグー、4人がパーを出す」では、グーの人がパーに変えることで負けから勝ちに転じて利得が高くなります。また(D)「1人がグー、2人がパー、4人がチョキ」では、グーの人がチョキに手を変えると、アイコから勝ちに転じて利得が高くなります。したがってナッシュ均衡ではありません。しかし(E)と(F)の場合は、どの人も自分だけが手を変えても、あいこからあいこになるだけで利得は高くなりません。したがって、(E)と(F)はナッシュ均衡です。

ナッシュ均衡(ざっくりした説明)

ここではまずナッシュ均衡について、ざっくり説明します。

  • ナッシュ均衡の求め方(2人ゲームの利得行列)はこちらのページで。
  • クールノー均衡はこっち。
  • 定義などは、また後ほど。

ナッシュ均衡とは

ゲーム理論におけるナッシュ均衡とは、ざっくりいうと

どのプレイヤーも、自分だけでは、それ以上利得が大きくできない状態

です。「状態」って言い方は不正確過ぎるか。もう少し正確に言うと、ナッシュ均衡とは

どのプレイヤーも、他のプレイヤーがそのナッシュ均衡の戦略を選んでいるもとでは、その戦略が一番利得が高くなる(他の戦略では利得が同じか低くなる)

ような戦略の組です。あんまり変わんないか。

ナッシュ均衡の例

例を挙げましょう(これは支配戦略を説明するときに用いた例の「客数」を変えたものです)。

2つのコンビニ、セレブ(セレブイレブン)とファミモ(ファミリーモール)が、まだコンビニがないA駅とB駅のどちらか一方に出店しようと考えている。コンビニを1日に利用する客はA駅が600人、B駅が750人である。セレブとファミモがもし違う駅を選べば、利用客を独占できる。しかし同じ駅に出店すると、ファミモが人気で、ファミモはセレブの2倍の客数を獲得できる。すなわち両方がA駅に出店すると、セレブ200人、ファミモ400人。B駅に出店すると、セレブ250人、ファミモ500人である。ここで客数を利得と考える。セレブとファミモはどちらの駅に出店するだろうか?

このゲームを利得行列で書くと下のようになります

ナッシュ均衡の例

例えば「セレブとファミモが共にA駅を選ぶこと」はナッシュ均衡ではありません。なぜならセレブは、ファミモがA駅を選んでいるなら、B駅に変えたほうが利得が高くなるからです。このように、他のプレイヤーの戦略が変わらないもとで、あるプレイヤーが選択を変えると利得が高くなるならば、その戦略の組はナッシュ均衡ではありません。

ナッシュ均衡ではない

これに対し、例えば「セレブがA駅、ファミモがB駅を選ぶこと」はナッシュ均衡です。なぜならセレブもファミモも、相手がそれを選んでいる限り、自分の利得をもっとも高くしているからです。つまりナッシュ均衡では、

どのプレイヤーも(相手がその戦略を選んでいるならば)、それ以上利得を高くできない (他の戦略では利得が同じか低くなる)

と言うことになります。

ナッシュ均衡である

ナッシュ均衡は2つ以上あるときもある

しかしこの例では「セレブがA駅、ファミモがB駅を選ぶこと」だけではなく、「セレブがB駅、ファミモがA駅を選ぶこと」 もナッシュ均衡になることが分かります。つまりナッシュ均衡は1つとは限らず、2つ以上ある場合もあります。このときどちらをゲーム理論の解とすべきかは難しい問題で、これは「均衡選択」と呼ばれる理論と「均衡精緻化」と呼ばれる理論で考えられています(2つの違いを説明するのはちょっと難しい)これはまた別の機会に。

ナッシュ均衡が複数あるゲームの代表例は、調整ゲームチキンゲームです。調整ゲームの記事では、どういうときにナッシュ均衡が実現しやすいかについても述べています。

ナッシュ均衡がなぜ解なのか

ナッシュ均衡以外が結果として予測されたとします。このとき、もしすべてのプレイヤーがその予測を知ったならば、少なくとも1人はその予測から違う行動を取ることで利得を高くすることができるはずです。そのプレイヤーは、ナッシュ均衡と違う行動を取るでしょうから、もはやその予測は当たりません。このことから、ゲームの結果の予測をプレイヤーが知っても結果が成り立つためには、その予測はナッシュ均衡でなければならないはずです。(「じゃんけんの必勝法と行動ファイナンス・行動経済学」も参考にしてください)

注意点と補足

  • すべてのプレイヤーが支配戦略を選んでいるときはナッシュ均衡になります。これはナッシュ均衡の特殊ケースと考えられます。したがって囚人のジレンマの結果もナッシュ均衡であると言えます。
  • 上記の点から考えると、じゃんけんにはナッシュ均衡がありませんが、確率を用いる「混合戦略」を考えるとナッシュ均衡が存在します。このような混合戦略まで考えると、すべてのn人有限ゲームにナッシュ均衡が存在します。この素晴らしい定理を誰が証明したかは、よく考えれば分かるはずである。これによって、その人はノーベル経済学賞を受賞しています。私ではありません。
  • ナッシュ均衡が分かったような気がしない?もう少し理解を深めたい?ではナッシュ均衡のおけいこ(1)で練習しましょう
  • 2人ゲームの利得行列でのナッシュ均衡の求め方はこちら
  • 混合戦略のナッシュ均衡の求め方
  • クールノー均衡はこっち

東京都立大学 2020ゲーム理論1 オンライン講義(2020:コロナ対応)

じゃんけんの必勝法と行動ファイナンス・行動経済学

じゃんけん必勝法とナッシュ均衡の理解

じゃんけんの必勝法はゲーム理論の答である「ナッシュ均衡」を理解するために良い教材になります。
2人でジャンケンをするとき、ゲーム理論の解であるナッシュ均衡は「2人ともグー・チョキ・パーをすべて1/3で出すこと」となり、それ以外はありません。

「グー・チョキ・パーをすべて1/3で出す」以外に、ジャンケンの必勝法があったならば、どうなるのでしょうか?
例えば、1つの必勝法として「グーを多く出し、チョキをあまり出さない」という調査結果が知られており、したがって「パーを出すと勝つ確率があがる」とされています(こちら)。また、2回続けて同じ手を出すと、次は異なる手を出すことが多く、したがって「2回続けてアイコになったら、それに負ける手を出せ」というのも必勝法の1つとされています。

( じゃんけんで出やすい手 のページも参考にしてください)

しかし「初心者にはパーを出せ」という必勝法を知っている人には、チョキを出すと勝つことができます。また「2回続けてアイコになったら、それに負ける手を出せ」という人には2回続けてアイコになったら、3回目も同じ手を出すと勝つことができます。このように「グー・チョキ・パーをすべて1/3で出す」以外のあらゆる「ジャンケンの必勝法」は、それを使うことが知られてしまうと、もう必勝法にはなりません。

ゲーム理論の解であるナッシュ均衡は「(自分がナッシュ均衡の戦略を選んでいる状態では)、自分はナッシュ均衡以外の戦略を選んでも利得が高くならない」という状態です。「ナッシュ均衡が答だ」と知っているプレイヤー達は、相手がそれに従っていると知っていても、自分もその答に従うことが最適であり、ナッシュ均衡以外の戦略に変えたいと思う動機を持たないのです(これはナッシュ均衡の自己拘束性と呼ばれる)。

逆に<ナッシュ均衡以外の予測が答だ>とされると、誰かはそこから選択や行動を変えることで利得が高くなります。したがって、その予測や予言をゲームをするプレイヤーが知ったときには、多くの人が知ったときには当たらなくなります。

このような理由から、ナッシュ均衡である 「2人ともグー・チョキ・パーをすべて1/3で出すこと」が唯一のゲームの解とされています。

(2020/05/18追記:混合戦略のナッシュ均衡について説明したこちらの記事も参照して下さい)。

行動ファイナンス・行動経済学とじゃんけんに対する考察

行動経済学や行動ファイナンスと呼ばれる分野は、人間が必ずしもゲーム理論や経済学の理論通りに行動しないということを研究する分野です。「人間は経済学で考えるほど合理的には行動しないんだ!」という事実を、たくさん教えてくれるこの分野は、多くの人にとって魅力的に映ります。

ジャンケンの必勝法について考察することは、行動経済学や行動ファイナンスに対して私達がどのように接するべきかを考える手がかりになります。行動ファイナンスや行動経済学では、理論から乖離した人間の行動や現象が観察されることがあります。行動ファイナンスや行動経済学と言っても、その立場には以下のようにいくつかのものがあるように思えます。


(1)人間の行動が、自己の獲得する金銭を最大にするのではなく、別に目的があることを明らかにする。この立場では個人は効用を最大にする合理的な人間と解釈している。例えばファイナンスでは「ファンドマネージャーは、運用益を最大にしようとするのではなく、他者の運用益の平均を下回らないように行動する」「最後通牒ゲームでは自己の獲得利益を最大にするだけではなく、他者と公平であることも望み、それとのバランスで効用が決まる」など。


(2)人間の思考や認知には限界があったり、感情が理性的な判断を邪魔することで本人が目的としていることと異なる選択をすることがある。この立場では、個人は効用を最大にできない非合理的な人間と解釈される。

上記の立場から、じゃんけんの必勝法を考察してみると、以下のようになるのではないでしょうか。

(1)の立場で発見された必勝法は、それが皆に知られても必勝法として残る可能性があると考えられます。ジャンケンに当てはめると、例えば「私はチョキを愛してやまない」という人がいたとすれば(そんな人はいないけど…)、彼に対して「グーで勝つ」という必勝法は、たとえ彼がそれを知っても残る可能性があります。つまりこの場合は、彼は「勝つこと」より、「チョキを出して負けたこと」に喜んでいれば、それで勝った方も負けた方も自分の目的に従って合理的な選択をしたことになります。

余談ですが、私は競馬が好きなんですけど、毎年の回収率はマイナスです。非合理的だという人がいるんですが、私が競馬をするのはお金をプラスにするという目的よりは、自分の予想が当たるかどうかを楽しんだり、自分お好きな馬を応援したりするようなレジャーとしての目的が強く、ディズニーランドに行くのにお金を払ったりするのと同じように、競馬にお金を支払ってレジャーを楽しんでいることになります。もし競馬の目的を「お金を儲けることである」と規定されたら、私は非合理的な人間となりますが、「自らの予想が当たるかどうかを試す行為や、自分が好きな馬に賭けてそれを応援するという行為」が目的であるなら、これは合理的な行為だということになります。

しかし、じゃんけんにおいて「私はチョキを愛してやまない」という行為は考えにくいですよね?

これに対して(2)の立場で発見された必勝法-「初心者にはパーを出せ」「2回続けてアイコになったら、それに負ける手を出せ」と言った類のもの-は、それが皆に知られてしまったときに、なくなってしまうように思えます。ただし、人間の思考や認知に限界があるので「分かっていてもできない、だからこのような必勝法は使える」というのは1つの考え方かもしれません。これは「人間は、自分で乱数を作ることが難しい」などの認知科学の研究成果と合致する考え方でもあります。

行動ファイナンスや行動経済学の研究に興味を持つ人には、このような人間の非合理的な行動パターンを利用して、超過利益を得ようとすることが目的である人も多くいるようです。果たして彼らは上記のことについて、どのように、どのくらい考えているのでしょうか。非合理的な人間行動の判断ミスやアノマリは「何らかの理由でなくならない」と考えるのでしょうか、それとも「それはやがてはなくなるけど、全員にそれが知られてなくなるまでの時間に、それを利用して利益をあげよう」と考えるのでしょうか。

私は、行動ファイナンスや行動経済学で明らかになった「事実そのもの」よりは、「その事実が将来になくなるものなのかなくならないものなのか。その判断基準が何なのか。なくならないとしたら、その理由は何であるか」について知りたいです。今後、これについてはたくさん勉強しなければならないなと思っています。