ある高校2年生40人のクラスで、一人2回ずつハンドボール投げの飛距離のデータを取った。欠席者がいたため、データは39人分である。1回目のデータと2回目のデータの散布図と、平均値、中央値、分散、標準偏差、共分散が与えられている。 (1) 1回目のデータと2回目のデータの相関係数を小数第2位まで求めよ。 (2) 欠席していた生徒の記録(1回目: 24.7m, 2回目: 26.9m)を含めて計算し直したときの新しい共分散をA、もとの共分散をB、新しい相関係数をC、もとの相関係数をDとする。AとBの大小関係、CとDの大小関係を求めよ。

確率論・統計学相関係数共分散散布図標準偏差データの分析
2025/7/12

1. 問題の内容

ある高校2年生40人のクラスで、一人2回ずつハンドボール投げの飛距離のデータを取った。欠席者がいたため、データは39人分である。1回目のデータと2回目のデータの散布図と、平均値、中央値、分散、標準偏差、共分散が与えられている。
(1) 1回目のデータと2回目のデータの相関係数を小数第2位まで求めよ。
(2) 欠席していた生徒の記録(1回目: 24.7m, 2回目: 26.9m)を含めて計算し直したときの新しい共分散をA、もとの共分散をB、新しい相関係数をC、もとの相関係数をDとする。AとBの大小関係、CとDの大小関係を求めよ。

2. 解き方の手順

(1) 相関係数は、共分散をそれぞれの標準偏差の積で割ることで求められる。
相関係数 rr は以下の式で計算できる。
r=共分散1回目の標準偏差×2回目の標準偏差r = \frac{共分散}{1回目の標準偏差 \times 2回目の標準偏差}
与えられた値から、相関係数を計算する。
(2)
共分散の定義式を考える。
共分散は、Cov(X,Y)=1ni=1n(xixˉ)(yiyˉ)Cov(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})で表される。
新しい共分散Aと元の共分散Bの大小関係を比較するために、新しいデータの追加が共分散にどのような影響を与えるかを考える。
相関係数は、ρ=Cov(X,Y)σXσY\rho = \frac{Cov(X, Y)}{\sigma_X \sigma_Y}で表される。
新しい相関係数Cと元の相関係数Dの大小関係を比較するために、平均、標準偏差、共分散がどのように変化するかを考える。
具体的に、欠席していた生徒のデータが平均値に近い場合、分散は小さくなる傾向がある。相関係数は共分散を標準偏差で割ったものなので、標準偏差の変化も考慮する必要がある。
欠席していた生徒の記録が平均値に近いため、データ全体のばらつきは小さくなる。つまり、1回目と2回目のデータの標準偏差が小さくなる。
また、新しいデータは元のデータの平均値に近い場所にプロットされるため、共分散はあまり変化しないか、もしくは平均値に近いため小さくなる可能性がある。
AとBの比較:
欠席していた生徒のデータは、1回目の平均値(24.7)と2回目の平均値(26.9)に一致する。このため、共分散を計算する際に、この生徒の偏差の積は0になる。つまり、共分散への寄与は0である。したがって、新しい共分散Aは、元の共分散Bと比べて、わずかに小さくなる可能性がある。
A<BA < B
CとDの比較:
新しいデータによって標準偏差が小さくなると考えられる。
相関係数は、r=共分散σxσyr = \frac{共分散}{\sigma_x \sigma_y}であるから、共分散がわずかに小さくなる、もしくは変化しないとしても、σxσy\sigma_x \sigma_yが小さくなる影響の方が大きければ、rrは大きくなる。
ただし、欠席していた生徒の1回目のデータと2回目のデータがそれぞれの平均値と一致しているため、標準偏差は小さくなるが、共分散も小さくなる。
どちらの影響が大きいか不明なため、正確な判断は難しい。
しかし、与えられたデータから、1回目の標準偏差(8.21)と2回目の標準偏差(6.98)の積に対する共分散(54.30)の割合は比較的小さい。
新しいデータは平均値に近いので、標準偏差の減少は共分散の減少よりも大きいと考えられる。
したがって、相関係数は大きくなる可能性がある。
C>DC > D

3. 最終的な答え

(1) 相関係数: r=54.308.21×6.98=54.3057.30580.9475r = \frac{54.30}{8.21 \times 6.98} = \frac{54.30}{57.3058} \approx 0.9475
四捨五入して小数第2位まで求めると、0.95
(2) A<BA < B
C>DC > D

「確率論・統計学」の関連問題

M中学校のテニス部の部員21人の身長データが与えられています。このデータを用いて、以下の問いに答えます。 (1) 最小値、最大値、四分位数を求め、表にまとめます。 (2) 範囲を求めます。 (3) 四...

データの分析四分位数範囲箱ひげ図中央値最大値最小値
2025/7/15

この問題は、確率に関する3つの小問から構成されています。 (1) ウミガメ遭遇ツアーの過去のデータから、遭遇確率を求める。 (2) 1から18の数字が書かれたカードから1枚選ぶとき、偶数または5の倍数...

確率組み合わせ事象期待値
2025/7/15

Cさんがボウリングを30ゲーム行ったところ、1ゲームにおけるストライクの回数が4回未満だったゲームが合計12ゲームあった。AさんとCさんのどちらが、ストライクの回数が4回未満の累積相対度数が大きいかを...

相対度数累積相対度数確率統計
2025/7/15

AさんとBさんの2人が20ゲームずつボウリングをしたときの、1ゲームごとのストライクの回数を記録した度数分布表が与えられています。 Aさんのストライク回数の中央値または最頻値を考え、次のゲームでより多...

度数分布中央値最頻値統計分析
2025/7/15

K中学校のサッカー部員43人の20mシャトルランの記録をヒストグラムで表した図を見て、以下の2つの問題に答えます。 (1) 中央値がふくまれる階級を答える。 (2) 記録が120回以上の部員の割合が2...

ヒストグラム中央値割合データ分析
2025/7/15

男子8人、女子7人の中から、男子3人、女子2人の委員を選ぶ方法は何通りあるか。

組み合わせ場合の数組み合わせの公式
2025/7/15

以下の確率問題を解きます。 (1) 大小2つのサイコロを投げて、少なくとも1つは4以下の目が出る確率 (2) 1枚のコインを繰り返し投げ、2回連続で表が出たら終了となるゲームが、3回以内で終了する確率...

確率サイコロコイン条件付き確率
2025/7/15

1から6の番号が振られた円卓にA, B, C, Dの4人が座る時、座り方は何通りあるかを求める問題です。

順列円順列場合の数組み合わせ
2025/7/15

問題は2つあります。 (1) ストライクの回数の中央値または最頻値を比べて、次にゲームをする際にAさんとBさんのどちらがより多くストライクを取りそうかを答える問題です。中央値がふくまれる階級または最頻...

中央値最頻値度数分布累積相対度数統計的推測
2025/7/15

問題は2つのパートに分かれています。 パート1は10人のゲーム参加者の得点に関するもので、範囲、平均値、中央値、最頻値を求める問題です。 パート2は度数分布表に関するもので、相対度数、累積度数、累積相...

データの分析範囲平均値中央値最頻値度数分布表相対度数累積度数ヒストグラム度数分布多角形
2025/7/15