ある高校2年生40人のクラスで、一人2回ずつハンドボール投げの飛距離のデータを取った。欠席者がいたため、データは39人分である。1回目のデータと2回目のデータの散布図と、平均値、中央値、分散、標準偏差、共分散が与えられている。 (1) 1回目のデータと2回目のデータの相関係数を小数第2位まで求めよ。 (2) 欠席していた生徒の記録(1回目: 24.7m, 2回目: 26.9m)を含めて計算し直したときの新しい共分散をA、もとの共分散をB、新しい相関係数をC、もとの相関係数をDとする。AとBの大小関係、CとDの大小関係を求めよ。
2025/7/12
1. 問題の内容
ある高校2年生40人のクラスで、一人2回ずつハンドボール投げの飛距離のデータを取った。欠席者がいたため、データは39人分である。1回目のデータと2回目のデータの散布図と、平均値、中央値、分散、標準偏差、共分散が与えられている。
(1) 1回目のデータと2回目のデータの相関係数を小数第2位まで求めよ。
(2) 欠席していた生徒の記録(1回目: 24.7m, 2回目: 26.9m)を含めて計算し直したときの新しい共分散をA、もとの共分散をB、新しい相関係数をC、もとの相関係数をDとする。AとBの大小関係、CとDの大小関係を求めよ。
2. 解き方の手順
(1) 相関係数は、共分散をそれぞれの標準偏差の積で割ることで求められる。
相関係数 は以下の式で計算できる。
与えられた値から、相関係数を計算する。
(2)
共分散の定義式を考える。
共分散は、で表される。
新しい共分散Aと元の共分散Bの大小関係を比較するために、新しいデータの追加が共分散にどのような影響を与えるかを考える。
相関係数は、で表される。
新しい相関係数Cと元の相関係数Dの大小関係を比較するために、平均、標準偏差、共分散がどのように変化するかを考える。
具体的に、欠席していた生徒のデータが平均値に近い場合、分散は小さくなる傾向がある。相関係数は共分散を標準偏差で割ったものなので、標準偏差の変化も考慮する必要がある。
欠席していた生徒の記録が平均値に近いため、データ全体のばらつきは小さくなる。つまり、1回目と2回目のデータの標準偏差が小さくなる。
また、新しいデータは元のデータの平均値に近い場所にプロットされるため、共分散はあまり変化しないか、もしくは平均値に近いため小さくなる可能性がある。
AとBの比較:
欠席していた生徒のデータは、1回目の平均値(24.7)と2回目の平均値(26.9)に一致する。このため、共分散を計算する際に、この生徒の偏差の積は0になる。つまり、共分散への寄与は0である。したがって、新しい共分散Aは、元の共分散Bと比べて、わずかに小さくなる可能性がある。
CとDの比較:
新しいデータによって標準偏差が小さくなると考えられる。
相関係数は、であるから、共分散がわずかに小さくなる、もしくは変化しないとしても、が小さくなる影響の方が大きければ、は大きくなる。
ただし、欠席していた生徒の1回目のデータと2回目のデータがそれぞれの平均値と一致しているため、標準偏差は小さくなるが、共分散も小さくなる。
どちらの影響が大きいか不明なため、正確な判断は難しい。
しかし、与えられたデータから、1回目の標準偏差(8.21)と2回目の標準偏差(6.98)の積に対する共分散(54.30)の割合は比較的小さい。
新しいデータは平均値に近いので、標準偏差の減少は共分散の減少よりも大きいと考えられる。
したがって、相関係数は大きくなる可能性がある。
3. 最終的な答え
(1) 相関係数:
四捨五入して小数第2位まで求めると、0.95
(2)