モンティ・ホール問題の直感的説明は間違ってることが多い

※本記事に対してメールを頂き、それを受けて少し書き直しました。ありがとうございました。(2024/03/16)

モンティホール問題とは?

まずモンティ・ホール問題について説明しておきます。

司会者(モンティ・ホールさん)と回答者がいて、回答者の前にはA、B、Cの3つのドアがあります。1つのドアは当たりで豪華な商品があり、回答者はそのドアを当てます。2つのドアはハズレです。回答者が「当たり」のドアを当てる、というものです。

まず、回答者がが当たりと思うドアを1つ選びます。ここではAを選んだとしましょう。司会者は、当たりのドアを知っていて、回答者が選ばなかったドアのうち、1つのドアがハズレであることを示します。ここではBのドアがハズレだと示されたとしましょう。

ここで司会者が回答者に言います。「あなたには、もう一度ドアを選び直すチャンスがあります。そのままにしますか?それとも変えますか?(stick or switch?)」
今回の場合、Aのまま留まるか?Cに変えるか?ということになります。

さて、回答者はドアを変更すべきでしょうか?それとも留まるべき?

この問題、AとCの2枚のドアのうち1つが当たりなので、変えても留まっても当たる確率は半々(1/2)のように思えます。しかしこの問題の答は「変えたほうが良い」です。留まる(Aのまま)だと当たる確率は1/3、変えると(Cに変更)当たる確率は2/3になります。

なぜ、そうなるかについては、ベイズの定理を使って、数々のネットの情報や本で説明されています。拙著「ゼミナールゲーム理論入門」でも「一歩ずつ学ぶ ゲーム理論」でも、もちろん解説されています。

「直観的説明」には注意が必要

「お、じゃあネットで検索してみようか!」と思ったあなた!ちょっと待ってください。この問題に対して「直感的に説明すると...」とした説明には、間違っていることが結構あります。本稿の意図は「直感的な説明は間違っていることが多いので、ベイズの定理で理解しましょう」ということなんです。

特に「確率は変わらない」的な説明は、間違いです。例えば「最初に選んだドアが当たる確率は1/3、それ以外が当たる確率は2/3だから、ハズレのドアを開けた後も、最初に選んだドアの当たる確率は1/3で、それ以外が当たる確率は2/3」と言う説明は誤りです。正しい説明は「情報によって確率は変わる」です。

最初に各ドアの当たる確率が等しいと、この「確率は変わらない」という説明も(たまたま)正しいように見えるのですが、最初に当たりやすいドアと、当たりにくいドアがあると考えれば、この説明が正しくないことが分かります。

A,B,Cのドアがあり、どれか1つが当たりだとします。ただし、Aのドアは当たりやすく当たる確率は0.5、Bは当たりにくく当たる確率は0.2、Cは0.3であるとします。

回答者は最初に(当たりやすそうな)Aのドアを選んだとしましょう。

ここで司会者(解答を知っている)は、選んでないドアからハズレのドアを1つ開けます。Bのドアが当たりならCが開き、Cのドアが当たりならBが開きますね。さて、Aのドアが当たりの場合はBとCのどちらを開けても良いのですが、ここで司会者がBとCのドアを開ける確率は同じ1/2であるとします(ここを変えると答も変わります)。

さて、司会者がBのドアを開けて、ハズレであることを示したとします。回答者はドアを変えたほうが良いんでしょうか?

「最初にAのドアが当たる確率は0.5、それ以外は当たる確率は0.5、この確率は変わらない」という説明だとフィフティ・フィフティで、変えても変えなくとも確率は1/2のような気がします。

しかし、この場合はAのドアのままだと当たる確率は5/11、Bに変えると当たる確率は6/11です。この場合は、やはりドアを変えたほうが良いです。

ちなみに司会者がCのドアを開けてハズレであることを示すと、 Aのドアのままだと当たる確率は5/9、Bに変えると当たる確率は4/9です。この場合は、ドアを変えない方が良いのです。つまり、この場合は「司会者がBのドアを開けたときはCに変えたほうが良く、Cのドアを開けたときはAのドアのままが良い」です。

モンティ・ホール問題の本質は、ドアを開けたことが情報になっていて、開ける前の事前確率と開けた後の事後確率が変化している、ということにあります。なので「元の確率と変わらないから」 的な説明は間違っていることが多いのです。

A,B,Cのドアが当たる確率が、それぞれ0.54、0.13、0.33として同じ状況だとしましょう。司会者がドアを開ける前は「Aのドアが当たる確率は0.54、それ以外は当たる確率は0.46」です。司会者がBのドアを開けたとき、回答者はドアを変えたほうが良いのでしょうか?確率は変わらない」のならば「Aのドアが当たる確率は0.54」なので、変えないほうが良いですね。

しかしこの場合も「Aのドアのままだと当たる確率は0.45、Cに変えると当たる確率は0.55」になります。司会者がドアを開ける前は、Aを選んだ方が、それ以外のドアが当たる確率より高いにも関わらずです!

計算方法は、ベイズの定理を勉強してください。このように、この問題は「直感的な」理解はなかなか難しいのです。ネットの説明でも「情報によって確率は変わる」という回答を読むと良いでしょう。

なぜ間違いを犯すのかという研究がある

認知科学や認知心理学では、なぜ人間はこの問題に対して正しい答が出せないのか、どのような点が間違いを引き起こすのかについて研究されています(いました)。興味にある方は、以下の本を参考にしてください。

市川 伸一 (著)、日本認知科学会 (編集)、確率の理解を探る―3囚人問題とその周辺 (認知科学モノグラフ 10) (1998)/5/1

ちなみに、若い頃、先輩の金融工学の大家KJ先生(川喜田二郎氏ではないよ)に「認知科学にこんな研究があります」と話したことがあります。そのときKJ先生曰く:

渡辺君。こんな研究は意味ないよ。
皆んながベイズの定理を正しく理解すれば良いだけだ!

…でした。直感的な理解ではなく、ベイズの定理で理解しましょう。

ゲーム理論で考えると?

さて、この問題では「回答者が差したドアが当たりの場合は、司会者は残りの2つのドアを等しい確率で開ける」とされていました。これによって、回答者は、指さしたカーテンの中で、まだ開いていないドアに変えたほうが当たる確率が高い、となっています。

でも「司会者ができるだけ回答者に賞品を当てて欲しくない」と考えると、ドアをどのように開けると良いのでしょうか?これはゲーム理論になりますね。ゲーム理論のテキストの演習問題なんかでは、見かけるものです(私の記憶だと、たとえば「Scott Bierman and Luis Fernandez, “Game Theory with Economic Applications,” Addison Wesley, (1997)」などに載っていた気がします。)。

答はどうなるでしょうか?ベイズの定理とゲーム理論を勉強した皆さんなら簡単ですね!

サッカーのPK戦をゲーム理論で考える

フットボール批評という雑誌に、私のインタビュー記事が掲載されました。サッカーのPK戦をゲーム理論から見ると言うものです。

フットボール批評issue39(アマゾンへのリンク)

私の本などで紹介しているPK戦の混合戦略の話(例えばこちら)と、Ignacio palacious-Huerta (2003)のヨーロッパリーグでの実証研究 “Professionals Play Minmax”などを紹介しました。

フットボール批評という雑誌は、その前身のサッカー批評という雑誌から数えると20年近く続いている雑誌だそうですが、今号をもって休刊となるそうです。複雑な気持ちです。

篠原じゃんけんとその解

篠原さんというゲームデザイナーの方が発案した「よくばりじゃんけん(または、篠原じゃんけん)という面白いじゃんけんがあるそうです。

知らなきゃ損する? ボードゲームに欠かせない「ゲーマーじゃんけん」と「よくばりじゃんけん」のルール

そのナッシュ均衡を一橋大学の宇井先生が求めています。以下に、宇井先生の原稿があります(篠原じゃんけんの説明も、その中にあります)

「よくばりじゃんけん」の分析

宇井先生の求め方は秀逸です。このじゃんけんは、グーを出すと、それによって脱落する人が出て人数が変わるため、普通は再帰的にしか求められないのですが、宇井先生は混合戦略均衡の性質と対称性をうまく利用して、きれいに解かれています。

多人数で勝者を決定するじゃんけんには「わたなべじゃんけん」がありますが、「生き残るかどうか!」というゲーム性と面白さは、さすがゲームデザイナー!ですね。

朝日新聞「グリコじゃんけん」にコメント

朝日新聞の記事「グリコじゃんけん、いつからあった?」で、グリコじゃんけんの必勝法について、コメントしました。

本サイトのグリコ・チョコレート・パイナップルゲームのゲーム理論による解をもとに、記者さんから取材を受けたものです。

記事には、以下のデジタル版(2022年9月1日版)もありますが、有料会員しか読めないようです(^^;)
グリコじゃんけん、いつからあった?(朝日新聞)

「高校生のためのゲーム理論入門」の動画公開です

昨年(2021年)の10月に東京都立大学のオープンユニバーシティで講義した「高校生のためのゲーム理論入門」(高校生のための大学授業体験シリーズ)の動画が、東京都立大学のホームページ内でOCWとして公開されることになりました!

2021年度東京都立大学オープンユニバーシティ・高校生のための大学授業体験シリーズ 高校生のためのゲーム理論入門

他のゲーム理論講義動画とともにどうぞ

高校生のゲーム理論研究:八王子東高校「探究学習」の成果発表会に行ってきました!

2021年度は筑波大附属高校の他に、八王子東高校でも「探究学習」のゲーム理論プロジェクトのお手伝いをしました。3月12日(2022年)には、その成果発表会があり、参加させて頂きました。

当日はゲーム理論だけではなく、物理化学、生物、哲学、心理学、スポーツ、ジェンダーなど、さまざまなプロジェクトのすべての成果が発表されていました。多くの会場で同時並行的に発表会が行われ、さながら学園祭のようでした。

成果発表会のプログラム

生徒たちの間に実行委員があり、発表会が行われるようです。すごい!(委員長と副委員長の開会と閉会の挨拶も素晴らしかったです)。

教室での発表の様子

ゲーム理論プロジェクト発表は、主に体育館のポスターセッションでした。発表数も多く、ゲーム理論プロジェクトだけでも、全部を聞けなくて残念でした。

体育館での発表

以下は研究テーマの例です。

  • 親子のお手伝いから考える努力に対する報酬のインセンティブ
  • ブラフはどのような場面で成功するのか
  • Eカードにおける最良の選択は何か
  • チキンゲームで考える恋愛必勝法
ポスターセッション!
ブラフの有効性

今回のゲーム理論プロジェクトは高校1年生の発表でした。ゲーム理論は高校1年生には少し難しいかなとも思たのですが、皆さん、私の「ビジュアルゲーム理論」を参考書にし、よく勉強して、素晴らしい成果を発表していました。⇒アマゾン

ビジュアルゲーム理論

今回の探究学習のお手伝いを通じて、混合戦略などを、どのように高校生に教えればよいか、考えさせられました。高校生を主にターゲットにしながら、ゲーム理論を面白く教えるような教材を作っていきたいと思うようになりました。

筑波大附属高校で「総合的な探究の時間」のお手伝い

筑波大学附属高校で「総合的な探究の時間」のお手伝いをしてきました。高校1年生の「数学的モデリング」をテーマにしたグループで、ゲーム理論の講演をしたり、彼らの研究に助言を与えたりしました。

講演の様子

生徒たちは、ゲーム理論を中心に、自分の興味がある研究テーマに取り組みます。微分も確率もほとんど習っていない高校1年生とは思えないほどの高度な研究に取り組んでいました。テーマの例を挙げると

  • 特殊ルール(手札のシャッフル)がある3人ババ抜きの戦略
  • 3人人狼の戦略とシミュレーション
  • ゲーム理論の観点からの交通渋滞の回避
  • LINEによる異性とのやり取りの戦略

です。また、特に高校生にとってはゲーム理論によるスポーツの戦略に興味があるようで

  • バスケットボールの戦略(3Pシュートと2Pシュートのどちらを打つべきか)
  • 野球の戦略(高校野球における初級ストライクを打つべきかどうか)
  • バレーボールの戦略(アタックはストレートかクロスか)
  • サッカーの戦略(ドリブルか、パスか)

などのテーマが多く見受けられました。

野球の戦略

スポーツの戦略と混合戦略については、いくつかの研究はあるものの、それを詳しく解説したものはありません。改めて、そのような解説を書いてみようかと思いました。

多くの学生のテーマに向き合い、短い時間でアドバイスを与える担当の山田先生は、本当に凄いなと思いました。学生たちの探求は、まだまだ続くようです。

東京都立大学 ゲーム理論 過去の試験問題

東京都立大学「ゲーム理論1」「ゲーム理論2」の過去の試験問題と解答です。一部欠落しているものもあります。2019年度以降の問題は公開していません。講義資料(スライド)や宿題などはこちらにあります。

ゲーム理論1

ゲーム理論2

ゲーム理論 オンライン講義 一覧

東京都立大学 ゲーム理論 オンライン講義

2020年コロナ対応でオンデマンドにした大学の講義動画をyoutubeに公開しています。以下は、そのタイトルの一覧です。

それ「協力ゲーム」じゃないから

ゲーム理論において、間違いられやすい用語は「協力ゲーム」だ。

多くの場合、世の中の状況は「競争」と「協力」に分けられる。
そこで、一般の人(?)は、競争を非協力ゲーム、協力や協調を協力ゲームと呼びがちだ。

呼びがちな人にとって競争とは、「一方が勝ち、一方が負ける」ような状況、例えば、将棋とか囲碁などの遊戯の<ゲーム>、スポーツなどを意味している。
一方、協力とは、交渉とかコーディネーションや囚人のジレンマなどなど、両者の行動によっては、良くなるウィンウィンの状態が存在する状況を意味しているように思える。

ゲーム理論では、上記の状況は両方とも非協力ゲームとして分析される。
あえて上記の状況を呼ぶのならば、競争はゼロサムゲームで、協力はノンゼロサムゲームである。

非協力ゲームと協力ゲームとは何かについては、別の記事に書いてあるが、ここでは使われている用語から見分ける方法を書いておこう。

利得行列、戦略、行動、ゲームの木、ナッシュ均衡、進化などの用語が使われているならば、それは非協力ゲーム。
特性関数、コア、シャープレイ値、仁などの用語が使われていれば、それは協力ゲームである。