この問題はベイズの定理を使って解きます。
まず、勝率 p は0から1まで一様分布していると仮定します。つまり、p の確率密度関数は f(p)=1(0≤p≤1) となります。
次に、n 連勝したという事象を Wn とします。私たちが知りたいのは、 n 連勝した後で p>0.5 となる確率です。すなわち、P(p>0.5∣Wn) を計算したい。 ベイズの定理より、
P(p>0.5∣Wn)=P(Wn)P(Wn∣p>0.5)P(p>0.5) ここで、P(p>0.5)=∫0.51f(p)dp=∫0.511dp=0.5 です。 P(Wn∣p>0.5)=∫0.51pndp/∫0.51dp P(Wn∣p>0.5)=0.5∫0.51pndp=2∫0.51pndp=2[n+1pn+1]0.51=n+12(1−(0.5)n+1) P(Wn)=∫01pndp=[n+1pn+1]01=n+11 したがって、
P(p>0.5∣Wn)=P(Wn)P(Wn∣p>0.5)P(p>0.5)=n+11n+12(1−(0.5)n+1)×0.5=1−(0.5)n+1 P(p>0.5∣Wn)>0.8 となる n を探します。 1−(0.5)n+1>0.8 (0.5)n+1<0.2 (n+1)log(0.5)<log(0.2) n+1>log(0.5)log(0.2)≈2.32 ここで、n は整数なので、n≥2 問題文では「一回負けてから」となっているので、ベイズ推定に用いる事前分布を更新する必要がある。
まず、一回負けたという情報はpに対する事前分布にどのように影響するかを考える。初期状態では勝率pは区間[0,1]上の一様分布に従うと仮定されている。負けという事象が発生したとき、事後分布はベイズの定理によって、 f(p∣負け)=∫01P(負け∣p)f(p)dpP(負け∣p)f(p)=∫01(1−p)⋅1dp(1−p)⋅1=∫01(1−p)dp1−p 分母を計算する。∫01(1−p)dp=[p−2p2]01=1−21=21 したがって、f(p∣負け)=2(1−p) f(p∣負け,n連勝)=∫01P(n連勝∣p)f(p∣負け)dpP(n連勝∣p)f(p∣負け)=∫01pn⋅2(1−p)dppn⋅2(1−p)=∫01pn(1−p)dppn(1−p) 分母を計算する。
∫01pn(1−p)dp=∫01(pn−pn+1)dp=[n+1pn+1−n+2pn+2]01=n+11−n+21=(n+1)(n+2)n+2−(n+1)=(n+1)(n+2)1 したがって、f(p∣負け,n連勝)=(n+1)(n+2)pn(1−p) 求める確率はP(p>0.5∣負け,n連勝)=∫0.51(n+1)(n+2)pn(1−p)dp この積分を計算するのは大変なので、各選択肢について、この確率を計算して、0.8を超える最小のnを探す。
n=3: ∫0.5112p3(1−p)dp=12∫0.51(p3−p4)dp=12[4p4−5p5]0.51=12[(41−51)−(4⋅161−5⋅321)]=12[201−641+1601]=12[32016−5+2]=1232013=8039=0.4875 n=4: ∫0.5120p4(1−p)dp=20∫0.51(p4−p5)dp=20[5p5−6p6]0.51=20[(51−61)−(5⋅321−6⋅641)]=20[301−1601+3841]=20[192064−12+5]=20192057=3219=0.59375 n=5: ∫0.5130p5(1−p)dp=30∫0.51(p5−p6)dp=30[6p6−7p7]0.51=30[(61−71)−(6⋅641−7⋅1281)]=30[421−3841+8961]=30[268864−7+3]=30268860=302245=11275≈0.6696 n=6: ∫0.5142p6(1−p)dp=42∫0.51(p6−p7)dp=42[7p7−8p8]0.51=42[(71−81)−(7⋅1281−8⋅2561)]=42[561−8961+20481]=42[561−1843223]≈0.7665 もう少し計算を続けてみよう。
n=7: ∫0.5156p7(1−p)dp≈0.848 よって、n=7連勝で、相手より強いと思う確率が80%を超える。 しかし、選択肢には7連勝がないので、再度検討が必要。
P(p>0.5∣Wn)>0.8 は、1−(0.5)n+1>0.8 になり、n≥2であった。 もし n が 3 なら 1−(0.5)4=1−1/16=15/16≈0.9375>0.8となり、条件を満たす。 一回負けたという情報を考慮すると、
P(p>0.5∣負け)=∫0.512(1−p)dp=2[p−2p2]0.51=2[(1−21)−(21−81)]=2[21−83]=2⋅81=41=0.25 3連勝