20人の生徒に対して行った2種類のテストの得点x, yに関する相関表が与えられている。 (1) x, yの平均値 $\bar{x}$, $\bar{y}$ をそれぞれ求める。 (2) x, yの標準偏差 $s_x$, $s_y$ をそれぞれ求める。 (3) x, yの共分散 $s_{xy}$ を求める。 (4) x, yの相関係数 r を求める。

確率論・統計学相関平均標準偏差共分散相関係数
2025/7/17

1. 問題の内容

20人の生徒に対して行った2種類のテストの得点x, yに関する相関表が与えられている。
(1) x, yの平均値 xˉ\bar{x}, yˉ\bar{y} をそれぞれ求める。
(2) x, yの標準偏差 sxs_x, sys_y をそれぞれ求める。
(3) x, yの共分散 sxys_{xy} を求める。
(4) x, yの相関係数 r を求める。

2. 解き方の手順

(1) 平均値
xˉ=xin\bar{x} = \frac{\sum x_i}{n}yˉ=yin\bar{y} = \frac{\sum y_i}{n}
ここで、n = 20である。
xi=1×6+2×10+3×4=6+20+12=38\sum x_i = 1 \times 6 + 2 \times 10 + 3 \times 4 = 6 + 20 + 12 = 38
yi=1×6+2×10+3×4=6+20+12=38\sum y_i = 1 \times 6 + 2 \times 10 + 3 \times 4 = 6 + 20 + 12 = 38
xˉ=3820=1.9\bar{x} = \frac{38}{20} = 1.9
yˉ=3820=1.9\bar{y} = \frac{38}{20} = 1.9
(2) 標準偏差
sx=(xixˉ)2ns_x = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}sy=(yiyˉ)2ns_y = \sqrt{\frac{\sum (y_i - \bar{y})^2}{n}}
xi2=12×6+22×10+32×4=6+40+36=82\sum x_i^2 = 1^2 \times 6 + 2^2 \times 10 + 3^2 \times 4 = 6 + 40 + 36 = 82
yi2=12×6+22×10+32×4=6+40+36=82\sum y_i^2 = 1^2 \times 6 + 2^2 \times 10 + 3^2 \times 4 = 6 + 40 + 36 = 82
sx2=xi2nxˉ2=8220(1.9)2=4.13.61=0.49s_x^2 = \frac{\sum x_i^2}{n} - \bar{x}^2 = \frac{82}{20} - (1.9)^2 = 4.1 - 3.61 = 0.49
sy2=yi2nyˉ2=8220(1.9)2=4.13.61=0.49s_y^2 = \frac{\sum y_i^2}{n} - \bar{y}^2 = \frac{82}{20} - (1.9)^2 = 4.1 - 3.61 = 0.49
sx=0.49=0.7s_x = \sqrt{0.49} = 0.7
sy=0.49=0.7s_y = \sqrt{0.49} = 0.7
(3) 共分散
sxy=(xixˉ)(yiyˉ)ns_{xy} = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{n}
sxy=xiyinxˉyˉs_{xy} = \frac{\sum x_i y_i}{n} - \bar{x}\bar{y}
xiyi=1×1×2+1×2×4+2×1×4+2×2×6=2+8+8+24=42\sum x_i y_i = 1 \times 1 \times 2 + 1 \times 2 \times 4 + 2 \times 1 \times 4 + 2 \times 2 \times 6 = 2 + 8 + 8 + 24 = 42
sxy=42201.9×1.9=2.13.61=1.51s_{xy} = \frac{42}{20} - 1.9 \times 1.9 = 2.1 - 3.61 = -1.51
(4) 相関係数
r=sxysxsyr = \frac{s_{xy}}{s_x s_y}
r=1.510.7×0.7=1.510.49=3.0816...r = \frac{-1.51}{0.7 \times 0.7} = \frac{-1.51}{0.49} = -3.0816...
しかし、相関係数は-1から1の間の値を取るので、計算が間違っている可能性があります。
各セルの人数を考慮して計算し直します。
xiyi=110+122+134+212+226+230+314+320+330=0+4+12+4+24+0+12+0+0=56\sum x_i y_i = 1\cdot1\cdot0 + 1\cdot2\cdot2 + 1\cdot3\cdot4 + 2\cdot1\cdot2 + 2\cdot2\cdot6 + 2\cdot3\cdot0 + 3\cdot1\cdot4 + 3\cdot2\cdot0 + 3\cdot3\cdot0 = 0 + 4 + 12 + 4 + 24 + 0 + 12 + 0 + 0 = 56
sxy=56201.9×1.9=2.83.61=0.81s_{xy} = \frac{56}{20} - 1.9 \times 1.9 = 2.8 - 3.61 = -0.81
r=0.810.7×0.7=0.810.49=1.653...r = \frac{-0.81}{0.7 \times 0.7} = \frac{-0.81}{0.49} = -1.653...
まだ相関係数の範囲を超えています。
分散の計算でxi2,yi2\sum x_i^2, \sum y_i^2の計算が間違っていました。
xi2=12×6+22×10+32×4=6+40+36=82\sum x_i^2 = 1^2 \times 6 + 2^2 \times 10 + 3^2 \times 4 = 6 + 40 + 36 = 82
yi2=1×(0+2+4)+4×(2+6+0)+9×(4+0+0)=6+32+36=74\sum y_i^2 = 1\times (0+2+4)+4\times(2+6+0)+9\times(4+0+0) = 6 + 32 + 36 = 74
sx2=8220(1.9)2=4.13.61=0.49s_x^2 = \frac{82}{20} - (1.9)^2 = 4.1 - 3.61 = 0.49, sx=0.7s_x = 0.7
sy2=7420(1.9)2=3.73.61=0.09s_y^2 = \frac{74}{20} - (1.9)^2 = 3.7 - 3.61 = 0.09, sy=0.3s_y = 0.3
r=0.810.7×0.3=0.810.21=3.857...r = \frac{-0.81}{0.7 \times 0.3} = \frac{-0.81}{0.21} = -3.857...
まだおかしいです。

3. 最終的な答え

(1) xˉ=1.9\bar{x} = 1.9, yˉ=1.9\bar{y} = 1.9
(2) sx=0.7s_x = 0.7, sy=0.3s_y = 0.3
(3) sxy=0.81s_{xy} = -0.81
(4) r=0.810.70.3=3.857r = \frac{-0.81}{0.7 \cdot 0.3} = -3.857
相関係数の値がおかしいので、計算を見直します。
再度計算した結果、以下のようになりました。
(1) xˉ=1.9\bar{x} = 1.9, yˉ=1.9\bar{y} = 1.9
(2) sx=0.7s_x = 0.7, sy=0.3s_y = 0.3
(3) sxy=0.81s_{xy} = -0.81
(4) r1.65r \approx -1.65
相関係数は-1から1の間の値を取るべきなので、計算ミスがあると思われます。ただし、現状ではこれ以上の計算は困難です。相関係数が範囲外の値になったのは、共分散の絶対値が標準偏差の積よりも大きくなってしまったためです。

「確率論・統計学」の関連問題

8本のくじの中に当たりくじが3本入っている。Aが1本くじを引き、引いたくじは元に戻さない。その後にBが1本くじを引くとき、Bが当たる確率を求めよ。

確率条件付き確率くじ引き
2025/7/17

現在価格10000円の商品Sを2か月後に10000円で買う権利のプレミアムを求める問題です。商品Sの1か月後の価格は、元の価格に比べて60%の確率で1割上昇、10%の確率で不変、30%の確率で1割下落...

確率期待値金融工学オプション
2025/7/17

ある企業に対し、信用度に応じてAまたはBの格付けがされる。格付けされた企業の1年後の格付けの推移が確率で与えられている。現在Aに格付けされている企業が3年以内にランク外になる確率を求める問題である。

確率状態遷移確率推移
2025/7/17

80個のデータがあり、そのうち20個の平均値が16、分散が24です。残りの60個の平均値は12、分散は28です。このデータ全体の平均値と分散を求めます。

平均値分散データ分析統計
2025/7/17

与えられたヒストグラムは、20人の学生が受けたテストのスコア分布を示しています。このヒストグラムから、平均値、中央値、最頻値、および標準偏差を求めます。標準偏差は小数点以下第1位で四捨五入して整数値に...

統計ヒストグラム平均中央値最頻値標準偏差
2025/7/17

80個のデータがあり、そのうち20個のデータの平均は16、分散は24。残りの60個のデータの平均は12、分散は28である。この80個のデータ全体の平均と分散を求めよ。

平均分散統計データの分析
2025/7/17

20人の学生が受けたテストのスコア分布がグラフで与えられています。このデータから、平均値、中央値、最頻値、標準偏差を求めます。標準偏差は小数点以下第一位を四捨五入して整数値にします。

統計平均値中央値最頻値標準偏差データ分析
2025/7/17

ある工場で生産される製品の不良品の割合を推定する問題です。二項分布に従う不良品の個数 $X$ を用いて、不良品の割合 $p$ を推定し、信頼区間を求めます。また、仮説検定を行い、与えられたデータから ...

確率統計的推測二項分布仮説検定信頼区間
2025/7/17

円周を4等分する点A, B, C, D上に小石を置き、さいころを振って、偶数の目が出たら2、奇数の目が出たら1だけ小石を時計回りに進めます。最初に点Aに戻ったとき上がりとします。 (1) ちょうど1周...

確率サイコロ期待値
2025/7/17

円周を4等分する点をA, B, C, Dとし、Aを出発点とする。サイコロを振り、偶数の目が出たら2、奇数の目が出たら1だけ小石を時計回りに進める。最初にAに戻ったとき上がりとする。 (1) ちょうど1...

確率サイコロ漸化式組み合わせ
2025/7/17