高校2年生40人のクラスで、ハンドボール投げの飛距離を一人2回ずつ測定した。39人分のデータが散布図と表で与えられている。 (1) 1回目と2回目のデータの相関係数を求める。 (2) 欠席者の記録(1回目: 24.7m, 2回目: 26.9m)を含めたときの新しい共分散をA、元の共分散をB、新しい相関係数をC、元の相関係数をDとする。AとBの大小関係、CとDの大小関係を比較する。

確率論・統計学相関係数共分散標準偏差散布図データの分析
2025/7/12

1. 問題の内容

高校2年生40人のクラスで、ハンドボール投げの飛距離を一人2回ずつ測定した。39人分のデータが散布図と表で与えられている。
(1) 1回目と2回目のデータの相関係数を求める。
(2) 欠席者の記録(1回目: 24.7m, 2回目: 26.9m)を含めたときの新しい共分散をA、元の共分散をB、新しい相関係数をC、元の相関係数をDとする。AとBの大小関係、CとDの大小関係を比較する。

2. 解き方の手順

(1) 相関係数 rr は、共分散 sxys_{xy} をそれぞれの標準偏差 sxs_xsys_y で割ることで求められる。
r=sxysxsyr = \frac{s_{xy}}{s_x s_y}
問題文より、
1回目のデータの標準偏差 sx=8.21s_x = 8.21
2回目のデータの標準偏差 sy=6.98s_y = 6.98
共分散 sxy=54.30s_{xy} = 54.30
したがって、相関係数 DDは、
D=54.308.21×6.98=54.3057.30580.9475D = \frac{54.30}{8.21 \times 6.98} = \frac{54.30}{57.3058} \fallingdotseq 0.9475
四捨五入して小数第2位まで求めると、相関係数は0.95である。
(2)
欠席者のデータ(24.7, 26.9)を加える前後で共分散がどう変化するかを考える。
元の39人のデータによる共分散をBとする。欠席者のデータは1回目の平均と等しく、2回目の平均ともほぼ等しい。共分散は偏差積の平均なので、新たなデータが平均付近の値である場合、共分散への影響は小さい。
新しい共分散をAとする。欠席者のデータは、1回目の平均値24.70と完全に一致し、2回目の平均値26.90と完全に一致する。共分散の式から、sxy=1ni=1n(xixˉ)(yiyˉ)s_{xy}=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})であり、欠席者のデータを含めた場合は、n=40n=40、欠席者のデータを加えることで分子i=1n(xixˉ)(yiyˉ)\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})は少し変化するが、40で割ることになるので、共分散はほとんど変わらないと考えられる。つまり、AとBはほぼ等しい。
ただし、欠席者のデータのx座標が平均と等しいから、xixˉ=0x_i - \bar{x}=0となり、データの追加は、i=1n(xixˉ)(yiyˉ)\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})に0を加えることになるので、共分散の分子は変化しない。しかし、nnが39から40に変化するので、新しい共分散Aは元の共分散Bよりも小さくなる。つまり、A<BA < B
相関係数は共分散を標準偏差の積で割ったものなので、共分散が小さくなれば、相関係数も小さくなる傾向にある。ただし、標準偏差も変化するので、一概には言えないが、共分散の影響が大きければ、C<DC < D

3. 最終的な答え

(1) 0.95
(2) A < B, C < D

「確率論・統計学」の関連問題

M中学校のテニス部の部員21人の身長データが与えられています。このデータを用いて、以下の問いに答えます。 (1) 最小値、最大値、四分位数を求め、表にまとめます。 (2) 範囲を求めます。 (3) 四...

データの分析四分位数範囲箱ひげ図中央値最大値最小値
2025/7/15

この問題は、確率に関する3つの小問から構成されています。 (1) ウミガメ遭遇ツアーの過去のデータから、遭遇確率を求める。 (2) 1から18の数字が書かれたカードから1枚選ぶとき、偶数または5の倍数...

確率組み合わせ事象期待値
2025/7/15

Cさんがボウリングを30ゲーム行ったところ、1ゲームにおけるストライクの回数が4回未満だったゲームが合計12ゲームあった。AさんとCさんのどちらが、ストライクの回数が4回未満の累積相対度数が大きいかを...

相対度数累積相対度数確率統計
2025/7/15

AさんとBさんの2人が20ゲームずつボウリングをしたときの、1ゲームごとのストライクの回数を記録した度数分布表が与えられています。 Aさんのストライク回数の中央値または最頻値を考え、次のゲームでより多...

度数分布中央値最頻値統計分析
2025/7/15

K中学校のサッカー部員43人の20mシャトルランの記録をヒストグラムで表した図を見て、以下の2つの問題に答えます。 (1) 中央値がふくまれる階級を答える。 (2) 記録が120回以上の部員の割合が2...

ヒストグラム中央値割合データ分析
2025/7/15

男子8人、女子7人の中から、男子3人、女子2人の委員を選ぶ方法は何通りあるか。

組み合わせ場合の数組み合わせの公式
2025/7/15

以下の確率問題を解きます。 (1) 大小2つのサイコロを投げて、少なくとも1つは4以下の目が出る確率 (2) 1枚のコインを繰り返し投げ、2回連続で表が出たら終了となるゲームが、3回以内で終了する確率...

確率サイコロコイン条件付き確率
2025/7/15

1から6の番号が振られた円卓にA, B, C, Dの4人が座る時、座り方は何通りあるかを求める問題です。

順列円順列場合の数組み合わせ
2025/7/15

問題は2つあります。 (1) ストライクの回数の中央値または最頻値を比べて、次にゲームをする際にAさんとBさんのどちらがより多くストライクを取りそうかを答える問題です。中央値がふくまれる階級または最頻...

中央値最頻値度数分布累積相対度数統計的推測
2025/7/15

問題は2つのパートに分かれています。 パート1は10人のゲーム参加者の得点に関するもので、範囲、平均値、中央値、最頻値を求める問題です。 パート2は度数分布表に関するもので、相対度数、累積度数、累積相...

データの分析範囲平均値中央値最頻値度数分布表相対度数累積度数ヒストグラム度数分布多角形
2025/7/15