じゃんけんの必勝法と行動ファイナンス・行動経済学

じゃんけん必勝法とナッシュ均衡の理解

じゃんけんの必勝法はゲーム理論の答である「ナッシュ均衡」を理解するために良い教材になります。
2人でジャンケンをするとき、ゲーム理論の解であるナッシュ均衡は「2人ともグー・チョキ・パーをすべて1/3で出すこと」となり、それ以外はありません。

「グー・チョキ・パーをすべて1/3で出す」以外に、ジャンケンの必勝法があったならば、どうなるのでしょうか？
例えば、１つの必勝法として「グーを多く出し、チョキをあまり出さない」という調査結果が知られており、したがって「パーを出すと勝つ確率があがる」とされています（こちら）。また、２回続けて同じ手を出すと、次は異なる手を出すことが多く、したがって「２回続けてアイコになったら、それに負ける手を出せ」というのも必勝法の１つとされています。

（　じゃんけんで出やすい手　のページも参考にしてください）

しかし「初心者にはパーを出せ」という必勝法を知っている人には、チョキを出すと勝つことができます。また「２回続けてアイコになったら、それに負ける手を出せ」という人には２回続けてアイコになったら、３回目も同じ手を出すと勝つことができます。このように「グー・チョキ・パーをすべて1/3で出す」以外のあらゆる「ジャンケンの必勝法」は、それを使うことが知られてしまうと、もう必勝法にはなりません。

ゲーム理論の解であるナッシュ均衡は「（自分がナッシュ均衡の戦略を選んでいる状態では）、自分はナッシュ均衡以外の戦略を選んでも利得が高くならない」という状態です。「ナッシュ均衡が答だ」と知っているプレイヤー達は、相手がそれに従っていると知っていても、自分もその答に従うことが最適であり、ナッシュ均衡以外の戦略に変えたいと思う動機を持たないのです（これはナッシュ均衡の自己拘束性と呼ばれる）。

逆に＜ナッシュ均衡以外の予測が答だ＞とされると、誰かはそこから選択や行動を変えることで利得が高くなります。したがって、その予測や予言をゲームをするプレイヤーが知ったときには、多くの人が知ったときには当たらなくなります。

このような理由から、ナッシュ均衡である「2人ともグー・チョキ・パーをすべて1/3で出すこと」が唯一のゲームの解とされています。

（2020/05/18追記：混合戦略のナッシュ均衡について説明したこちらの記事も参照して下さい）。

行動ファイナンス・行動経済学とじゃんけんに対する考察

行動経済学や行動ファイナンスと呼ばれる分野は、人間が必ずしもゲーム理論や経済学の理論通りに行動しないということを研究する分野です。「人間は経済学で考えるほど合理的には行動しないんだ！」という事実を、たくさん教えてくれるこの分野は、多くの人にとって魅力的に映ります。

ジャンケンの必勝法について考察することは、行動経済学や行動ファイナンスに対して私達がどのように接するべきかを考える手がかりになります。行動ファイナンスや行動経済学では、理論から乖離した人間の行動や現象が観察されることがあります。行動ファイナンスや行動経済学と言っても、その立場には以下のようにいくつかのものがあるように思えます。

(1)人間の行動が、自己の獲得する金銭を最大にするのではなく、別に目的があることを明らかにする。この立場では個人は効用を最大にする合理的な人間と解釈している。例えばファイナンスでは「ファンドマネージャーは、運用益を最大にしようとするのではなく、他者の運用益の平均を下回らないように行動する」「最後通牒ゲームでは自己の獲得利益を最大にするだけではなく、他者と公平であることも望み、それとのバランスで効用が決まる」など。

(2)人間の思考や認知には限界があったり、感情が理性的な判断を邪魔することで本人が目的としていることと異なる選択をすることがある。この立場では、個人は効用を最大にできない非合理的な人間と解釈される。

上記の立場から、じゃんけんの必勝法を考察してみると、以下のようになるのではないでしょうか。

(1)の立場で発見された必勝法は、それが皆に知られても必勝法として残る可能性があると考えられます。ジャンケンに当てはめると、例えば「私はチョキを愛してやまない」という人がいたとすれば（そんな人はいないけど…）、彼に対して「グーで勝つ」という必勝法は、たとえ彼がそれを知っても残る可能性があります。つまりこの場合は、彼は「勝つこと」より、「チョキを出して負けたこと」に喜んでいれば、それで勝った方も負けた方も自分の目的に従って合理的な選択をしたことになります。

余談ですが、私は競馬が好きなんですけど、毎年の回収率はマイナスです。非合理的だという人がいるんですが、私が競馬をするのはお金をプラスにするという目的よりは、自分の予想が当たるかどうかを楽しんだり、自分お好きな馬を応援したりするようなレジャーとしての目的が強く、ディズニーランドに行くのにお金を払ったりするのと同じように、競馬にお金を支払ってレジャーを楽しんでいることになります。もし競馬の目的を「お金を儲けることである」と規定されたら、私は非合理的な人間となりますが、「自らの予想が当たるかどうかを試す行為や、自分が好きな馬に賭けてそれを応援するという行為」が目的であるなら、これは合理的な行為だということになります。

しかし、じゃんけんにおいて「私はチョキを愛してやまない」という行為は考えにくいですよね？

これに対して(2)の立場で発見された必勝法－「初心者にはパーを出せ」「２回続けてアイコになったら、それに負ける手を出せ」と言った類のもの－は、それが皆に知られてしまったときに、なくなってしまうように思えます。ただし、人間の思考や認知に限界があるので「分かっていてもできない、だからこのような必勝法は使える」というのは1つの考え方かもしれません。これは「人間は、自分で乱数を作ることが難しい」などの認知科学の研究成果と合致する考え方でもあります。

行動ファイナンスや行動経済学の研究に興味を持つ人には、このような人間の非合理的な行動パターンを利用して、超過利益を得ようとすることが目的である人も多くいるようです。果たして彼らは上記のことについて、どのように、どのくらい考えているのでしょうか。非合理的な人間行動の判断ミスやアノマリは「何らかの理由でなくならない」と考えるのでしょうか、それとも「それはやがてはなくなるけど、全員にそれが知られてなくなるまでの時間に、それを利用して利益をあげよう」と考えるのでしょうか。

私は、行動ファイナンスや行動経済学で明らかになった「事実そのもの」よりは、「その事実が将来になくなるものなのかなくならないものなのか。その判断基準が何なのか。なくならないとしたら、その理由は何であるか」について知りたいです。今後、これについてはたくさん勉強しなければならないなと思っています。