A組 $m$ 人とB組 $n$ 人の生徒に対して行ったテストの得点について、A組の平均点を $\bar{x}$、分散を $S_A^2$、B組の平均点を $\bar{y}$、分散を $S_B^2$、A組とB組を合わせた $(m+n)$ 人の平均点を $w$、分散を $S^2$ とする。このとき、A組の得点と $w$ の差の2乗の和 $\sum_{i=1}^m (x_i - w)^2$ を $\bar{x}, S_A^2, w$ を用いて表し、また $S^2$ を $m, n, S_A^2, S_B^2, \bar{x}, \bar{y}, w$ を用いて表す問題。

確率論・統計学統計分散平均データの解析
2025/5/18

1. 問題の内容

A組 mm 人とB組 nn 人の生徒に対して行ったテストの得点について、A組の平均点を xˉ\bar{x}、分散を SA2S_A^2、B組の平均点を yˉ\bar{y}、分散を SB2S_B^2、A組とB組を合わせた (m+n)(m+n) 人の平均点を ww、分散を S2S^2 とする。このとき、A組の得点と ww の差の2乗の和 i=1m(xiw)2\sum_{i=1}^m (x_i - w)^2xˉ,SA2,w\bar{x}, S_A^2, w を用いて表し、また S2S^2m,n,SA2,SB2,xˉ,yˉ,wm, n, S_A^2, S_B^2, \bar{x}, \bar{y}, w を用いて表す問題。

2. 解き方の手順

(1) A組の得点と ww の差の2乗の和 i=1m(xiw)2\sum_{i=1}^m (x_i - w)^2xˉ,SA2,w\bar{x}, S_A^2, w を用いて表す。
分散の定義より、SA2=1mi=1m(xixˉ)2S_A^2 = \frac{1}{m} \sum_{i=1}^m (x_i - \bar{x})^2 なので、
i=1m(xixˉ)2=mSA2\sum_{i=1}^m (x_i - \bar{x})^2 = mS_A^2 となる。
i=1m(xiw)2=i=1m(xixˉ+xˉw)2=i=1m((xixˉ)2+2(xixˉ)(xˉw)+(xˉw)2)\sum_{i=1}^m (x_i - w)^2 = \sum_{i=1}^m (x_i - \bar{x} + \bar{x} - w)^2 = \sum_{i=1}^m ((x_i - \bar{x})^2 + 2(x_i - \bar{x})(\bar{x} - w) + (\bar{x} - w)^2)
=i=1m(xixˉ)2+2(xˉw)i=1m(xixˉ)+i=1m(xˉw)2= \sum_{i=1}^m (x_i - \bar{x})^2 + 2(\bar{x} - w) \sum_{i=1}^m (x_i - \bar{x}) + \sum_{i=1}^m (\bar{x} - w)^2
ここで i=1m(xixˉ)=0\sum_{i=1}^m (x_i - \bar{x}) = 0 であり、
i=1m(xiw)2=i=1m(xixˉ)2+m(xˉw)2=mSA2+m(xˉw)2\sum_{i=1}^m (x_i - w)^2 = \sum_{i=1}^m (x_i - \bar{x})^2 + m(\bar{x} - w)^2 = mS_A^2 + m(\bar{x} - w)^2
(2) S2S^2m,n,SA2,SB2,xˉ,yˉ,wm, n, S_A^2, S_B^2, \bar{x}, \bar{y}, w を用いて表す。
(m+n)w=i=1mxi+i=1nyi=mxˉ+nyˉ(m+n)w = \sum_{i=1}^m x_i + \sum_{i=1}^n y_i = m\bar{x} + n\bar{y} より、w=mxˉ+nyˉm+nw = \frac{m\bar{x} + n\bar{y}}{m+n} となる。
S2=1m+n[i=1m(xiw)2+i=1n(yiw)2]S^2 = \frac{1}{m+n} [\sum_{i=1}^m (x_i - w)^2 + \sum_{i=1}^n (y_i - w)^2]
=1m+n[mSA2+m(xˉw)2+nSB2+n(yˉw)2]= \frac{1}{m+n} [mS_A^2 + m(\bar{x}-w)^2 + nS_B^2 + n(\bar{y}-w)^2]
=mSA2+nSB2+m(xˉw)2+n(yˉw)2m+n= \frac{mS_A^2 + nS_B^2 + m(\bar{x}-w)^2 + n(\bar{y}-w)^2}{m+n}

3. 最終的な答え

ア:2
イ:0

「確率論・統計学」の関連問題

4, 3, 7, 6という4つのデータに2つの値を追加した。追加後のデータの平均値は変わらなかったが、分散は4.5だけ増加した。追加された2つの値(小さい順にア、イ)を求める。

平均分散統計データ分析
2025/6/8

帰無仮説 $H_0: p = p_0$、対立仮説 $H_1: p \neq p_0$ に対して、検定に利用する統計量 $Z = \frac{\bar{p} - p_0}{\sqrt{p_0(1-p_0...

統計的仮説検定両側検定有意水準Z検定標準正規分布
2025/6/8

母平均の検定において、帰無仮説 $H_0: \mu = 100$ とするとき、両側検定における対立仮説として適切なものを選ぶ。

統計的検定仮説検定母平均両側検定
2025/6/8

N国における主要国からの観光客数とその割合の推移を示したグラフから、2018年から2019年にかけて観光客数の変動がカナダのみによって起こったと仮定した場合、2018年のメキシコからの観光客の割合を$...

割合グラフ変動観光客
2025/6/8

グラフは日本企業の海外への研究費支出額(単位:10億円)の推移を示しています。1988年度の研究費支出額が、1987年度よりも120億円増加しているとき、1987年度に対する1988年度の増加率を求め...

統計グラフ割合増加率
2025/6/8

グラフから、2005年における甲地域の60歳以上の人口を推定し、最も近い選択肢を選ぶ。グラフの総数(単位:千人)と、60歳以上の割合(75歳以上と60歳から74歳の合計割合)を使用する。

統計人口推計グラフ解析割合
2025/6/8

母平均 $170$ 、母標準偏差 $8$ の母集団から、大きさ $196$ の標本を無作為抽出する。標本平均を $\bar{X}$ とするとき、$\bar{X}$ が $169$ 以上 $171$ 以...

統計的推測標本平均正規分布確率
2025/6/8

家から学校までの交通手段として、電車とバスの2つの選択肢がある。電車を利用すると30分かかる。バスは遅延しなければ20分、遅延した場合は35分かかる。バスが遅延する確率は $1/3$ である。どちらの...

期待値確率意思決定
2025/6/8

1個のサイコロを3回繰り返し投げるとき、5以上の目が出る回数の期待値を求める問題です。

期待値確率サイコロ確率分布
2025/6/8

1点のカードが30枚、2点のカードが20枚、3点のカードが10枚ある。この60枚のカードを母集団とし、カードの点数を$X$とするとき、母平均$m$、母分散$\sigma^2$、母標準偏差$\sigma...

確率分布母平均母分散母標準偏差確率変数
2025/6/8