高校2年生40人のクラスで、ハンドボール投げの飛距離データを一人2回ずつ測定した。39人のデータに基づき、 (1) 1回目のデータと2回目のデータの相関係数を求める。 (2) 欠席していた1人の生徒の記録を加えた場合、共分散と相関係数がどう変化するかを判断する。

確率論・統計学相関係数共分散標準偏差データの分析
2025/7/12

1. 問題の内容

高校2年生40人のクラスで、ハンドボール投げの飛距離データを一人2回ずつ測定した。39人のデータに基づき、
(1) 1回目のデータと2回目のデータの相関係数を求める。
(2) 欠席していた1人の生徒の記録を加えた場合、共分散と相関係数がどう変化するかを判断する。

2. 解き方の手順

(1) 相関係数の計算
相関係数 rr は、共分散をそれぞれの標準偏差の積で割ることで求められます。
r=共分散1回目の標準偏差×2回目の標準偏差r = \frac{\text{共分散}}{\text{1回目の標準偏差} \times \text{2回目の標準偏差}}
問題文より、
共分散 = 54.30
1回目の標準偏差 = 8.21
2回目の標準偏差 = 6.98
したがって、
r=54.308.21×6.98=54.3057.30580.9475r = \frac{54.30}{8.21 \times 6.98} = \frac{54.30}{57.3058} \approx 0.9475
四捨五入して小数第2位まで求めます。
(2) 共分散と相関係数の変化
元のデータ(39人)の平均値と共分散を考えます。欠席した生徒の記録(24.7m, 26.9m)は、1回目のデータと2回目のデータのそれぞれの平均値(24.7m, 26.9m)と一致します。
共分散は、各データの偏差の積の平均です。欠席した生徒のデータはそれぞれの平均値と一致するので、この生徒の偏差は0となります。
ここで、すべてのデータの数をnとすると、共分散は
i=1n(xixˉ)(yiyˉ)n\frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{n}
と表せます。
元の39人のデータに基づいて計算した共分散をBとすると、B = 54.30。新たに加わる生徒の記録は、1回目の記録が24.7m、2回目の記録は26.9mです。これらはそれぞれ1回目のデータの平均と2回目のデータの平均と一致しています。したがって、新しいデータによる偏差の積は0になります。また、データのサンプルサイズは39から40に変化します。元の39人のデータの偏差と、新しく追加されたデータの偏差に基づいて計算した共分散Aは、
A=3940B+1400=3940B<BA = \frac{39}{40} B + \frac{1}{40} \cdot 0 = \frac{39}{40} B < B
となります。
次に、相関係数の変化について考えます。
相関係数は、共分散をそれぞれの標準偏差の積で割ったものです。欠席した生徒のデータを加えることで、共分散は小さくなります。
また、分散はそれぞれのデータのばらつき具合を表しています。追加された生徒のデータは平均値と同じであるため、データのばらつき具合は小さくなります。したがって、標準偏差も小さくなります。
相関係数は、共分散標準偏差の積\frac{\text{共分散}}{\text{標準偏差の積}} で計算されるので、
共分散が小さくなり、標準偏差の積も小さくなる場合、相関係数がどう変化するかは一概には言えません。ただし、ばらつき具合は小さくなると考えられるので、相関係数は元の値より少し大きくなると予想されます。
相関係数の大小関係は、詳しい計算をしないと正確にはわかりませんが、元の相関係数Dと新しい相関係数Cの間には、C > Dの関係があると予想されます。
ここでは問題文の意図に従い、データの追加によって共分散が小さくなる影響を優先的に考えます。すると相関係数も小さくなる可能性が高いと判断できます。この場合C<Dとなります。

3. 最終的な答え

(1) 0.95
(2) A < B, C < D

「確率論・統計学」の関連問題

M中学校のテニス部の部員21人の身長データが与えられています。このデータを用いて、以下の問いに答えます。 (1) 最小値、最大値、四分位数を求め、表にまとめます。 (2) 範囲を求めます。 (3) 四...

データの分析四分位数範囲箱ひげ図中央値最大値最小値
2025/7/15

この問題は、確率に関する3つの小問から構成されています。 (1) ウミガメ遭遇ツアーの過去のデータから、遭遇確率を求める。 (2) 1から18の数字が書かれたカードから1枚選ぶとき、偶数または5の倍数...

確率組み合わせ事象期待値
2025/7/15

Cさんがボウリングを30ゲーム行ったところ、1ゲームにおけるストライクの回数が4回未満だったゲームが合計12ゲームあった。AさんとCさんのどちらが、ストライクの回数が4回未満の累積相対度数が大きいかを...

相対度数累積相対度数確率統計
2025/7/15

AさんとBさんの2人が20ゲームずつボウリングをしたときの、1ゲームごとのストライクの回数を記録した度数分布表が与えられています。 Aさんのストライク回数の中央値または最頻値を考え、次のゲームでより多...

度数分布中央値最頻値統計分析
2025/7/15

K中学校のサッカー部員43人の20mシャトルランの記録をヒストグラムで表した図を見て、以下の2つの問題に答えます。 (1) 中央値がふくまれる階級を答える。 (2) 記録が120回以上の部員の割合が2...

ヒストグラム中央値割合データ分析
2025/7/15

男子8人、女子7人の中から、男子3人、女子2人の委員を選ぶ方法は何通りあるか。

組み合わせ場合の数組み合わせの公式
2025/7/15

以下の確率問題を解きます。 (1) 大小2つのサイコロを投げて、少なくとも1つは4以下の目が出る確率 (2) 1枚のコインを繰り返し投げ、2回連続で表が出たら終了となるゲームが、3回以内で終了する確率...

確率サイコロコイン条件付き確率
2025/7/15

1から6の番号が振られた円卓にA, B, C, Dの4人が座る時、座り方は何通りあるかを求める問題です。

順列円順列場合の数組み合わせ
2025/7/15

問題は2つあります。 (1) ストライクの回数の中央値または最頻値を比べて、次にゲームをする際にAさんとBさんのどちらがより多くストライクを取りそうかを答える問題です。中央値がふくまれる階級または最頻...

中央値最頻値度数分布累積相対度数統計的推測
2025/7/15

問題は2つのパートに分かれています。 パート1は10人のゲーム参加者の得点に関するもので、範囲、平均値、中央値、最頻値を求める問題です。 パート2は度数分布表に関するもので、相対度数、累積度数、累積相...

データの分析範囲平均値中央値最頻値度数分布表相対度数累積度数ヒストグラム度数分布多角形
2025/7/15