パスワードを忘れた? アカウント作成
12989644 journal
日記

taggaの日記: 2つの封筒問題 14

日記 by tagga

Two envelopes problemというものがある。 基本の問題は次のようなもの:

区別のできない封筒が2つある。 片方にはもう片方の2倍の金額が入っている。 どちらか片方をもらえるが、 受けとったあと開封する前に一度だけ交換ができる。 交換した方が得か否か。

これ、交換してもしなくても確率的には同じ。 だけれども、 例えば10_000円入っているとしたら、 もう片方は5_000円か20_000円なので、 期待値が12_500円となり交換したら得なのかも と考えてしまうことがあるようだ。

とりあえず単純に片付けとく。 胴元がx円合計で入れる確率関数をp(x)とする。 このときΣp(x)=1. x円を入れたときに、x/3円の方をもらう確率も、2x/3円の方をもらう確率も 1/2なので、胴元がx円を入れカツ交換した方が得な確率は、p(x)/2. これを全部足したものが得な確率で、Σp(x)/2=(Σp(x))/2=1/2.

引っ掛けポイントは、仮に10_000円が入っていても、 もう片方が5_000円の確率、20_000円の確率は不明なので、 期待値が分からないというところ。

念のためだが、封筒内の金額らでも、もちろん同じ答えにいきつく。 受けとった封筒に y円入っていたときに得する確率は、 p(3y)/(p(3/2y)+p(3y))だけど、これはとりあえず無関係。 y円入っていてカツ得する確率は、 胴元が3y円つぎこんで、y円の方をもらったときなので、p(3y)/2. これも全部足せばいいので、やっぱり、Σp(3y)/2=(Σp(3y))/2=1/2.

ちょっと問題をかえる:

区別のできない封筒が2つある。 片方にはもう片方の2倍の金額が入っている。 とりあえずもらった方に10_000円入っていた。 このあと、一度だけ交換ができる。 交換した方が得か否か。

こっちは条件が増えているので、決めやすくなった気がするけど、 逆に不定になる。 胴元が15_000円つっこんだことを知っていればキープ、 30_000円つっこんだことを知っていればチェンジ。 とはいえ、確率関数が分からない、 つまり、どっちか推測する情報がないので決められない。

;; 追記: 念のためだけど、確率関数が不明なところがポイント。 胴元がサイコロを投げて、入れる金額を決めようなばあいもありうることに注意。

事前に確率が分からないときに仮に等配分して、 繰り返して推定値を改善していくことはできるけど、 1回だけなら、それも無理。 ということで、心理学や経済学の問題になって、 数学はあくまでも参考。

;; 単なる逃避。とくに意味はない。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by minet (45149) on 2016年11月24日 8時09分 (#3119151) 日記

    最初の例、すなわち1回目に受け取った時点ではまだ封筒の中身を確認できない事にしておくと、胴元は両方に同じ額を入れておくだけでも客に期待値を1.25倍に錯覚させることができるのか。

    #もし後で両方の額が同じだとバレたら、「1万円と5千円にするはずが間違って両方1万円にしてしまった。あなたにはきちんと1万円でサービスしておく」とでも言い逃れておこう。

  • by Anonymous Coward on 2016年11月24日 0時16分 (#3119122)

    交換回数を最大2回とか無限に許す場合を考えると、1回の交換で得する確率は1/2だよなあとか思ったりするのですが、そんな考えも穴がありそうで不安。

    リンク先のWikipediaの関連項目「モンティ・ホール問題」を読み直して「あれ? 1/2じゃなかったっけ?」となるぐらいマヌケです、はい。

    • by tagga (31268) on 2016年11月24日 14時05分 (#3119255) 日記

      あれこれごまかして説明しているからね。

      勝利条件についても、もうけの確率が高いのか、期待値が高いのかも、 明確に言ってないし。

      基本タイプだと、確率で考えても、期待値で考えても結果は同じ。

      もらえる期待値が確率関数によるけど、計算できないのが普通だけど、 増減の期待値は確率関数によらずに計算できて0円になる。 だから、交換してもしなくても同じ。 人間基本、自己中心なので、 1万入っていたとき2万に増える分と5千円に減る分に着目しちゃうけど、 増える分は2万入っていたとき1万に減る分で、 減る分は5千円入っていたとき1万に増える分で相殺するってのに 気づきにくい。

      応用タイプは、 1万入っていたとき2万に増えるか5千円に減るかだけになるので、 相殺が効かず、逆に難しくなる。 もうけられる確率が p(30_000)/(p(30_000)+p(15_000))[=q]で、 増減の期待値が ((20_000 - 10_000)p(30_000) + (5_000 - 10_000)p(15_000))/(p(30_000)+p(15_000) [=15_000q - 5_000] となり、 勝利条件どうしようから始まるので、 とてもやっかい。 とはいえ、数学的には単なる不定の問題。

      ;; しかし、知識がダダもれした結果、 変な解説している人が多いのは、なんでなんだろう。

      ベイズの人は文句言うかもしれないけど

      1. 根源事象に割り当てあてられた 確率(初級の教科書だと等確率だけど、そうとは限らない)は、 どういう情報が与えられても変わらない、
      2. 他の確率は、与えられた情報のもとでの、 (可能な当りの根源事象の確率の合計)/(可能な根源事象の確率の合計)

      という基本の考え方だけで、問題ないはずなんだけど。 つまり、 「情報は運命を変えないけど、どういう運命なのかの推測は変える」 のさ。

      親コメント
  • by Anonymous Coward on 2016年11月25日 13時25分 (#3119862)

    答えはここに書いてありますね。
    http://8044.teacup.com/miurat/bbs [teacup.com]

    • そういう答えになっているのは、 本来は問題にない「半額になる確率と倍額になる確率が同じ」という前提を加えてしまっているからです。 問題のどこにも「とりえず片方に入れてから、コイントスでもう片方を倍か半額に決める」の類の説明はないので、 これらは未知です。

      この手の一見パラドクスの問題は、 式やことばで説明しても信じない人がいるので、 Google Spreadでのシミュレーション [google.com]を置いておきます。 ただし、繰り返し回数が200回だけなので、誤差はそれなりにあります。

      1枚目がオリジナルの問題のもの(元金は300円未満を一様分布)、 2枚目からのシートが開けてみて100円だったときに交換するとどうなるかのもので、 C2がもうかる確率、D2が平均しての利得です。 それぞれのシートは:

      • q_0.5は、M先生やT先生が暗黙の了解としてしまった、増額と減額が等確率のもの(利得の期待値 25円)
      • q_0.4は、1回だけなら損する可能性が高いが、繰り返すならもうかるもの(期待値10円)
      • q_0.2は、繰り返してももうからないもの(期待値 -20円)

      分からないからとりあえず等確率にするのは、 繰り返して改善していくときの初期値としてはありえても、 それを前提にするのは問題です。

      もうかる確率 q 自体が一様分布しているはずだと、 交換すればもうかる派の人は言い出すかもしれません。 おそらくM先生はそういう気分なのでしょう。 そのとき、期待値の期待値はやはり 25円になります。 とはいえ、気分と論理を混同されては困ります。 一様分布も問題にはない勝手に入れた前提です。 オリジナル問題のように確率の公理から期待値が確定するものと区別する 必要があります。

      親コメント
      • 開封して10000円を見た人全員を全可能世界に特定して、母集団Aとしましょう。
        その母集団Aの全員を、交換した人々の母集団Bと交換しない人々の母集団Cに分けてみます。
        母集団Bの人々の方が、母集団Cの人々よりも、平均して2500円多く得ていることは taggaさんも否定しないでしょう。
        もし私が封筒内に10000円を見たら、私は母集団Aの中のランダムな一人だということがわかったわけです。
        ならば、母集団Cより母集団Bに入った方が得ということになります。

        • 母集団Bの人々の方が、母集団Cの人々よりも、平均して2500円多く得ていることは taggaさんも否定しないでしょう。

          そこを否定する根拠は、すでに数式でもシミュレーションでも出しています。 平均していくら多く得るかは、分布によります。 ここが分布によらずに平均できると思ってしまうのは、 《分からないものは一様分布だ》と思う、 多くの確率論のパラドクスのもとになっているバイアスのせいです。

          数式もシミュレーションの計算式も 読めないのであれば、次のように考えてください。

          開封して金額を確認したら平均25%多く得ると考える人は、 どのような行動を取りますか。 金額を確認したあとで、交換するはずです。

          さて、この金額はいくらでもいいのですよね。 ということは、金額がいくらであっても交換します。 つまりは、受け取ったものは全部、交換します。

          結局のところ、 未開封型で得をすると信じている人と同じように交換してしまいます。

          したがって、未開封型と同じ得しかしないはずです。 ところで、未開封型は平均すると得をしないはずです。 同じだけ交換をしているのに、 開封型だけ得をするの考えるのは変ではありませんか。

          同じ結果の原因は、 《分からないものは一様分布だ》という同じバイアス を気付かずに入れてしまったからです。

          親コメント
          • by Anonymous Coward

            taggaさんは、2封筒問題を根本的に誤解しています。
            未開封バージョンと開封バージョンは全く別のゲームです。

            また、開封バージョンの場合、新たな条件が記載されなければ、「このゲーム」とは「一度見た金額だけを交換する」ゲームです。
            それが「開封して金額がわかった」という情報が意味を持つ最低限の条件なので。
            それ以上を読み込むのは恣意的ということです。

            ですので、開封して10,000円を見たら、相手の封筒には5000円か20,000円のいずれかしかなく、いずれである確率も1/2です。
            ですので、交換による期待値は12,500円です。

            仮に、ゲームのルールを変え、何度でもゲームを繰り返すとした場合でも
            (もはや2封筒問題ではなくなりますが)、
            必勝法はいくつかあると思います。
            例えば「一度見た金額の2倍の金額を見た場合は交換しない」という方法があります。

            • ですので、開封して10,000円を見たら、相手の封筒には5000円か20,000円のいずれかしかなく、いずれである確率も1/2です。 ですので、交換による期待値は12,500円です。

              繰り返しますが、 そこの部分が《わからないから一様分布だ》というバイアスにもとづく誤解です。

              10_000円入っていたとき、 胴元が15_000円しか使っていないことを知っていれば、 期待値は -5_000円です。 30_000円を入れてくれていることを知っていれば、期待値は +10_000円です。

              たぶん、上の文を読んで、 勝手な仮定を入れていると逆に思っているでしょうが、 そうではないことを理解してください。

              胴元が15_000円しか入れないばあい(期待値 -5_000円)、 30_000円しか入れないばあい(期待値 +10_000円)、 15_000円と30_000円をコイントスで入れるのを決めるばあい(期待値 +2_500円)、 いずれも 問題文と両立することを確認してください。 しかし、期待値はどのばあいかによって、変化します。

              つまり、ふだん慣れているタイプの答えが決まる数学の問題とは異なり、 答えを決定するのに必要な情報、 つまり、胴元が元金を入れる確率分布が欠けている、不定の問題です。

              いくつかの誤った説明を読んでみての推測ですが、 開封問題で期待値が増えると思っている人には、 胴元がケチ、お大尽、あれこれ全部のばあいを均すことができると 思っている人がいるようです。 しかし、それは経験的にしか決めることができず、 先験的である数学には決めることができません。

              未開封問題についても、 胴元が15_000円しか入れないばあい、 30_000円しか入れないばあい、 15_000円と30_000円をコイントスで入れるのを決めるばあい、 いずれも問題文と両立することを確認してください。 こちらでは、 いずれのばあいでも、封筒の中身が不明なときの期待値は0円です。 実際には、 任意の確率分布において、期待値が0円であることを示すことができます。

              念のためですが、 未開封問題の期待値が0円であることが意味するのは、 胴元がケチでもお大尽でも関係なく損得なしということです。 ケチ、お大尽、みんな均すと損得なしということではないことを理解して おいてください。

              親コメント
              • by Anonymous Coward

                未開封バージョンではなく、あくまで開封バージョンの話ですね。

                そして、問題文は、「封筒を開けて10,000円を見た。」ということですね。
                それが問題文の全てです。他の金額を見た場合のことは何も言ってません。
                それだけは理解してください。

                封筒を開けて10,000円を見たゲーム参加者にわかるのは、
                胴元は、<5,000円、10,000円>のペアか<10,000円、20,000円>のペアで
                お金を入れたということ、この2通りしかないという事実です。
                そして、問題文を読む限りこの2通りに優劣はありません。

                であれば、交換による期

              • by Anonymous Coward

                > であれば、交換による期待値は12500円と計算する以外にありません。

                そこは情報が足りないから
                期待値が計算できない
                と考えるべきでは?

              • by Anonymous Coward

                情報が足りない????

                >封筒を開けて10,000円を見たゲーム参加者にわかるのは、
                >胴元は、<5,000円、10,000円>のペアか<10,000円、20,000円>のペアで
                >お金を入れたということ、この2通りしかないという事実です。
                >そして、問題文を読む限りこの2通りに優劣はありません。

                交換による期待値を計算するには十分ですよ。

              • by Anonymous Coward

                > そして、問題文を読む限りこの2通りに優劣はありません。

                ここが間違いです

                「優劣がありません」なんてことは書いてません
                貴方が勝手に思い込んでいるだけです

                そしてそのような思い込みの問題を取り上げたエントリで
                わざわざ同じ誤りを犯すような貴方は
                このエントリの主旨が全く理解できていないと思われます

              • by Anonymous Coward

                >「優劣がありません」なんてことは書いてません

                だからこそ優劣がないのです。

                >貴方が勝手に思い込んでいるだけです

                勝手に思い込んでいるのは貴方です。

                >そしてそのような思い込みの問題を取り上げたエントリで
                >わざわざ同じ誤りを犯すような貴方は
                >このエントリの主旨が全く理解できていないと思われます

                激しく同意
                (15年ぶりに使ってしまった。)

typodupeerror

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

読み込み中...