ベイズ更新を使う

今回の話は、以下の話の続きだ。
https://slot-hal9000.muragon.com/entry/24.html
戻って来る為のリンクを用意するほど吾廃(わがはい)は親切ではない
続けて読みたい人は、自力で戻ってきて頂きたい。



いきなり、続きの話から始める。
確率比が 1 : 2 : 3 だったとしよう。
正解を引き当てたいなら、当然右の3のボタンを選ぶのが利口だ。
しかし、ここはあえて中の2のボタンを選択してみる。
すると、の良いことに当選を引き当てた。


さてz\次に、もう一度ボタンを選択してみよう。
次はどのボタンを選ぶべきか。
今度は、無難に一番可能性の高いボタンを選ぶ事としよう。
左ボタンを選ぶべきだろうか。
しかし、中ボタンで一回当選を引き当てた実績があることを考慮すると、中ボタンが正解ボタンである可能性も考えられる。
もちろん、中ボタンが不正解ボタンだったが、運良く25%を引き当て当選した可能性もある。
どのように判断すべきだろうか。



こんな場合、有用なのがベイズ更新だ。
三つのボタンの正解確率を以下の様に定義する。
 左ボタンが正解 : P
 中ボタンが正解 : P
 右ボタンが正解 : P


前回は、中ボタンを選択して当選した。
各条件を仮定しての当選確率を計算する。
 左ボタンが正解で、中ボタン当選 : 0.25P
 中ボタンが正解で、中ボタン当選 : 0.5P
 右ボタンが正解で、中ボタン当選 : 0.25P


以上の結果から条件確率、すなわち中ボタン当選の確率を求める。


 0.25P + 0.5P + 0.25P


これで、前回の中ボタン当選があった事を考慮した、次回のボタン選択時の正解確率が計算できる。


 左ボタンが正解 : P' = 0.25P / (0.25P + 0.5P + 0.25P)
 中ボタンが正解 : P' = 0.5P / (0.25P + 0.5P + 0.25P)
 右ボタンが正解 : P' = 0.25P / (0.25P + 0.5P + 0.25P)


さて、ここまでは確率の話である。
しかし、ここでは確率比を使う。
これを確率比で考えると、式が簡単になる。


しかし、話が長くなった。
続きの話は、またいつか気が向いた時にする事にしよう。


                 

・・・本日も、生存!!

×

非ログインユーザーとして返信する