東南アジアのある地域を訪問した18人のうち、半袖を着ていた9人中7人が発熱し、長袖を着ていた9人中1人が発熱した。帰無仮説として、半袖でも長袖でも発熱の母比率は18人中8人と変わらないと仮定する。人数が少ないため、Z検定を用いることはできない。この状況で、検定を行う手順を正しく並べ替える問題。与えられた手順は以下の通り。 1. 18人に名前をつけ、半袖の人をa, b, c, d, e, f, g, h、長袖の人をA, B, C, D, E, F, G, Hとする。どの8人が発熱する確率も同じであるとして、18人から8人を選ぶ組み合わせを根源事象とする。組み合わせの総数は18 x 17 x 13 x 11通りである。 2. 従って片側P値は37/4862=0.02である。 3. 半袖から7人、長袖から1人を選ぶ場合の数は36 x 9 = 324通りである。 4. P値の計算では起こったことよりも極端な事象も考えるので、半袖から8人を選ぶ場合を加えて333通りの場合を考える。 5. 半袖は蚊に刺されやすいので、伝染病のリスクが大きく、発熱が多いと予想される。片側P値0.02が0.05より小さいことから帰無仮説が棄却され、その予想が証明されたことになる。

確率論・統計学仮説検定P値組み合わせ
2025/6/9
はい、承知しました。以下に問題の解答を示します。

1. 問題の内容

東南アジアのある地域を訪問した18人のうち、半袖を着ていた9人中7人が発熱し、長袖を着ていた9人中1人が発熱した。帰無仮説として、半袖でも長袖でも発熱の母比率は18人中8人と変わらないと仮定する。人数が少ないため、Z検定を用いることはできない。この状況で、検定を行う手順を正しく並べ替える問題。与えられた手順は以下の通り。

1. 18人に名前をつけ、半袖の人をa, b, c, d, e, f, g, h、長袖の人をA, B, C, D, E, F, G, Hとする。どの8人が発熱する確率も同じであるとして、18人から8人を選ぶ組み合わせを根源事象とする。組み合わせの総数は18 x 17 x 13 x 11通りである。

2. 従って片側P値は37/4862=0.02である。

3. 半袖から7人、長袖から1人を選ぶ場合の数は36 x 9 = 324通りである。

4. P値の計算では起こったことよりも極端な事象も考えるので、半袖から8人を選ぶ場合を加えて333通りの場合を考える。

5. 半袖は蚊に刺されやすいので、伝染病のリスクが大きく、発熱が多いと予想される。片側P値0.02が0.05より小さいことから帰無仮説が棄却され、その予想が証明されたことになる。

2. 解き方の手順

以下に、検定の手順を正しく並べ替えます。
Step 1: 仮説の設定
まず、帰無仮説と対立仮説を設定します。
* 帰無仮説(H0):半袖と長袖で発熱のしやすさに差はない。つまり、どちらを着ていても発熱の母比率は18人中8人と同じである。
* 対立仮説(H1):半袖の方が長袖よりも発熱しやすい。
これは与えられた文の5番目の文に対応する内容の一部です。
Step 2: データの観察と組み合わせの計算
与えられたデータは、半袖を着ていた9人中7人が発熱し、長袖を着ていた9人中1人が発熱したということです。まず、このデータがどれくらい起こりにくいかを評価するために、組み合わせの数を計算します。
半袖から7人、長袖から1人を選ぶ組み合わせの数は、
9C7×9C1_{9}C_{7} \times _{9}C_{1}で計算できます。
9C7=9!7!2!=9×82=36_{9}C_{7} = \frac{9!}{7!2!} = \frac{9 \times 8}{2} = 36
9C1=9_{9}C_{1} = 9
よって、36×9=32436 \times 9 = 324 通りです。これは与えられた文の3番目の文に対応します。
Step 3: 根源事象の定義と総数の計算
18人から8人を選ぶ組み合わせを根源事象とします。組み合わせの総数は18C8_{18}C_{8}で計算できます。
18C8=18!8!10!=18×17×16×15×14×13×12×118×7×6×5×4×3×2×1=43758_{18}C_{8} = \frac{18!}{8!10!} = \frac{18 \times 17 \times 16 \times 15 \times 14 \times 13 \times 12 \times 11}{8 \times 7 \times 6 \times 5 \times 4 \times 3 \times 2 \times 1} = 43758
与えられた手順1では 18×17×13×1118 \times 17 \times 13 \times 11とありますがこれは誤りです。
Step 4: より極端な事象の考慮とP値の計算
P値を計算するためには、今回観察された事象よりも極端な事象(つまり、半袖の発熱者がさらに多い場合)を考慮する必要があります。
* 半袖から8人発熱する場合: 9C8×9C0=9×1=9_{9}C_{8} \times _{9}C_{0} = 9 \times 1 = 9 通り
したがって、半袖から7人以上が発熱する組み合わせの数は、324 + 9 = 333 通りです。
P値は、帰無仮説が正しいと仮定したときに、観察された事象またはそれよりも極端な事象が起こる確率です。したがって、P値は以下のようになります。
P=333437580.0076P = \frac{333}{43758} \approx 0.0076
与えられた手順2では、P値が37/4862=0.02 とありますが、これは誤りです。与えられた手順4も考慮して計算された数が間違っています。
Step 5: P値の評価と結論
有意水準(α\alpha)を0.05とすると、計算されたP値(0.0076)は有意水準よりも小さいです。したがって、帰無仮説を棄却し、対立仮説を支持します。つまり、半袖の方が長袖よりも発熱しやすいという結論になります。
Step 6: 個人の特定
検定を行う前に、誰が半袖で誰が長袖かを特定する必要があります。したがって、18人に名前を付ける手順が最初にきます。これは与えられた文の1番目の文に対応します。
Step 7: 予想の提示
上記の検定を行う前に、半袖は蚊に刺されやすいので、伝染病のリスクが大きく、発熱が多いと予想されることを記述します。これは与えられた文の5番目の文に対応する内容の一部です。

3. 最終的な答え

したがって、正しい手順は以下の通りです。

1. 1

2. 5(一部)

3. 3

4. 4

5. 2

6. 5(一部)

すなわち、順番は「1、5、3、4、2、5」となります。

「確率論・統計学」の関連問題

母平均 $\mu$ に対する仮説検定を行う問題です。帰無仮説は $H_0: \mu = 95$、対立仮説は $H_1: \mu \neq 95$ です。標本平均 $\bar{X} = \frac{1}...

仮説検定標本平均有意水準Z検定正規分布
2025/6/9

100匹の稚魚の体長を測定した結果、標本平均が93.0mmであった。過去の経験から、稚魚の体長は平均 $μ$、分散 $σ^2$ の正規分布に従う。昨年の母平均は95mmで、母分散は変化せず$σ^2 =...

統計的仮説検定標本平均正規分布期待値分散
2025/6/9

男子4人と女子3人が円周上に並ぶときの、次の3つの条件を満たす並び方の数を求める問題です。 (1) 全ての並び方 (2) 女子3人が続いて並ぶ並び方 (3) どの男子の隣にも少なくとも1人女子がいる並...

順列円順列組み合わせ場合の数
2025/6/9

問題文は「どの男子も隣に少なくとも1人女子がいるという並び方はキクケ通りである」と書かれています。これは、男子と女子が並ぶ順列の問題であることがわかります。ただし、人数や具体的な条件が明記されていない...

順列場合の数条件付き確率
2025/6/9

12人の生徒の数学の小テストの得点データがあり、そのうち6人の平均点は6、分散は10です。残りの6人の平均点は4、分散は6です。このとき、12人全体の分散を求めなさい。

分散統計平均
2025/6/9

ある都市の夏の1週間の最高気温データが与えられており、8月4日の気温が $x$ で表されています。このデータの平均値が33℃であるとき、$x$の値を求め、さらにそのときのデータの標準偏差を求めます。

平均標準偏差データ分析
2025/6/9

最初の問題は、ある都市における夏の1週間の最高気温のデータが与えられており、8月4日の気温$x$が不明です。このデータの平均値が33℃であるとき、$x$の値を求め、そのときのデータの標準偏差を求める問...

平均標準偏差分散統計
2025/6/9

ある飲食店を予約した30組の予約客について、それぞれの組の予約人数を調べた結果がグラフで示されている。このデータの、中央値と平均値を求める。

中央値平均値データ分析度数分布
2025/6/9

20人の学生が受けたテストのスコア分布がグラフで与えられている。このスコア分布について、平均値、中央値、最頻値、標準偏差を求める。ただし、標準偏差は小数点以下第1位を四捨五入して整数値とする。

平均値中央値最頻値標準偏差データ分析
2025/6/9

学生AからJまでのテストの得点が与えられています。学生Bの得点は90点です。このデータに基づいて、学生Bの偏差値を求める問題です。偏差値を求める公式は、偏差値 = (得点 - 平均点) / 標準偏差 ...

偏差値統計平均標準偏差
2025/6/9