(1) 2つの変量 $x$ と $y$ のデータが5組与えられているとき、$x$ と $y$ の相関係数を求める。 (2) 20個の値からなるデータがあり、そのうち15個の値の平均値は10で分散は5であり、残りの5個の値の平均値は14で分散は13である。このデータの平均値と分散を求める。

確率論・統計学相関係数平均分散データ分析
2025/5/28

1. 問題の内容

(1) 2つの変量 xxyy のデータが5組与えられているとき、xxyy の相関係数を求める。
(2) 20個の値からなるデータがあり、そのうち15個の値の平均値は10で分散は5であり、残りの5個の値の平均値は14で分散は13である。このデータの平均値と分散を求める。

2. 解き方の手順

(1)
まず、xxyy それぞれの平均値 xˉ\bar{x}yˉ\bar{y} を求める。
xˉ=12+14+11+8+105=555=11\bar{x} = \frac{12 + 14 + 11 + 8 + 10}{5} = \frac{55}{5} = 11
yˉ=11+12+14+10+85=555=11\bar{y} = \frac{11 + 12 + 14 + 10 + 8}{5} = \frac{55}{5} = 11
次に、xxyy の標準偏差 sxs_xsys_y を求める。
sx2=(1211)2+(1411)2+(1111)2+(811)2+(1011)25=1+9+0+9+15=205=4s_x^2 = \frac{(12-11)^2 + (14-11)^2 + (11-11)^2 + (8-11)^2 + (10-11)^2}{5} = \frac{1 + 9 + 0 + 9 + 1}{5} = \frac{20}{5} = 4
sx=4=2s_x = \sqrt{4} = 2
sy2=(1111)2+(1211)2+(1411)2+(1011)2+(811)25=0+1+9+1+95=205=4s_y^2 = \frac{(11-11)^2 + (12-11)^2 + (14-11)^2 + (10-11)^2 + (8-11)^2}{5} = \frac{0 + 1 + 9 + 1 + 9}{5} = \frac{20}{5} = 4
sy=4=2s_y = \sqrt{4} = 2
次に、xxyy の共分散 sxys_{xy} を求める。
sxy=(1211)(1111)+(1411)(1211)+(1111)(1411)+(811)(1011)+(1011)(811)5=0+3+0+3+35=95=1.8s_{xy} = \frac{(12-11)(11-11) + (14-11)(12-11) + (11-11)(14-11) + (8-11)(10-11) + (10-11)(8-11)}{5} = \frac{0 + 3 + 0 + 3 + 3}{5} = \frac{9}{5} = 1.8
相関係数 rr は、
r=sxysxsy=1.82×2=1.84=0.45r = \frac{s_{xy}}{s_x s_y} = \frac{1.8}{2 \times 2} = \frac{1.8}{4} = 0.45
(2)
20個の値の平均値 xˉ\bar{x} は、
xˉ=15×10+5×1420=150+7020=22020=11\bar{x} = \frac{15 \times 10 + 5 \times 14}{20} = \frac{150 + 70}{20} = \frac{220}{20} = 11
15個のデータの分散は5なので、
115i=115(xi10)2=5\frac{1}{15}\sum_{i=1}^{15}(x_i - 10)^2 = 5
i=115(xi10)2=15×5=75\sum_{i=1}^{15}(x_i - 10)^2 = 15 \times 5 = 75
5個のデータの分散は13なので、
15i=1620(xi14)2=13\frac{1}{5}\sum_{i=16}^{20}(x_i - 14)^2 = 13
i=1620(xi14)2=5×13=65\sum_{i=16}^{20}(x_i - 14)^2 = 5 \times 13 = 65
20個のデータの分散 s2s^2 は、
s2=120i=120(xi11)2=120[i=115(xi11)2+i=1620(xi11)2]s^2 = \frac{1}{20}\sum_{i=1}^{20}(x_i - 11)^2 = \frac{1}{20}\left[ \sum_{i=1}^{15}(x_i - 11)^2 + \sum_{i=16}^{20}(x_i - 11)^2 \right]
ここで、
i=115(xi11)2=i=115((xi10)1)2=i=115(xi10)22i=115(xi10)+i=1151\sum_{i=1}^{15}(x_i - 11)^2 = \sum_{i=1}^{15}((x_i - 10) - 1)^2 = \sum_{i=1}^{15}(x_i - 10)^2 - 2\sum_{i=1}^{15}(x_i - 10) + \sum_{i=1}^{15}1
=75+152(i=115xi150)=902(150150)=90= 75 + 15 - 2(\sum_{i=1}^{15}x_i - 150) = 90 - 2(150 - 150) = 90
i=1620(xi11)2=i=1620((xi14)+3)2=i=1620(xi14)2+6i=1620(xi14)+i=16209\sum_{i=16}^{20}(x_i - 11)^2 = \sum_{i=16}^{20}((x_i - 14) + 3)^2 = \sum_{i=16}^{20}(x_i - 14)^2 + 6\sum_{i=16}^{20}(x_i - 14) + \sum_{i=16}^{20}9
=65+6(i=1620xi70)+45=110+6(7070)=110= 65 + 6(\sum_{i=16}^{20}x_i - 70) + 45 = 110 + 6(70 - 70) = 110
したがって、
s2=120(90+110)=20020=10s^2 = \frac{1}{20}(90 + 110) = \frac{200}{20} = 10

3. 最終的な答え

(1) 相関係数:0.45
(2) 平均値:11, 分散:10

「確率論・統計学」の関連問題

大小2個のサイコロを投げるとき、出た目の和が2または8になる場合の数を求める問題です。

確率サイコロ場合の数
2025/5/28

AからDまでの4種類のカードがそれぞれ1枚ずつあるとき、この中から2枚を選ぶ組み合わせの総数を求める問題です。

組み合わせ確率場合の数順列
2025/5/28

与えられた標本データ ${70, 35, 63, 48, 80}$ について、以下の値を計算します。 (1) $\sum_{i=1}^{5} x_i$ (2) (a) $\sum_{i=1}^...

統計標本合計分散
2025/5/28

9人の生徒の中から5人を選ぶ組み合わせの総数を求める問題です。

組み合わせ組み合わせの公式場合の数
2025/5/28

原点にある点Pが、サイコロを投げるごとに以下の規則で移動する。 - 1または2の目が出たとき、x軸方向に+1移動 - 3または4の目が出たとき、y軸方向に+1移動 - 5の目が出たとき、x軸方向に+1...

確率サイコロ確率分布組み合わせ
2025/5/28

ある企業が販売する4つの商品(P, Q, R, S)の売り上げ構成比が月ごとに示されている表がある。この表から、9月のQの売り上げの比率を読み取る問題である。

比率データ分析割合
2025/5/28

袋の中に赤玉4個、青玉3個、白玉2個が入っている。この袋から4つの玉を同時に取り出すとき、以下の確率を求める。 (1) 取り出した4つの玉の中に白玉が入っていない確率 (2) 取り出した4つの玉の中に...

確率組み合わせ余事象
2025/5/28

男子5人(A, B, C, D, E)と女子3人(F, G, H)の計8人が円形のテーブルに着席する。 (1) 女子の両隣には必ず男子が座るような座り方は何通りあるか。 (2) FとGの間に男子1人が...

順列円順列組み合わせ
2025/5/28

野球チームA, Bの過去15年間の対戦結果から、AとBの間に力の差があるかを、有意水準5%で検定する問題です。 (1)では、2009年から2018年までの100試合の結果を用いて、二項分布に従う確率変...

仮説検定二項分布期待値標準偏差統計
2025/5/28

AとBの間に力の差があるかを、有意水準5%で検定する問題です。標準正規分布 $N(0, 1)$ に従う確率変数Zに対して、$P(-1.96 \le Z \le 1.96) = 0.95$ であることが...

仮説検定有意水準標準正規分布統計的推論
2025/5/28