n個のデータ$(x_1, y_1), (x_2, y_2), \dots, (x_n, y_n)$があり、$x$と$y$の間には$y = 7x + 8$という関係がある。 (1) $x$と$y$の標準偏差をそれぞれ$s_x$, $s_y$とするとき、$s_y$を$s_x$を用いて表す。 (2) $x$と$y$の相関係数$r$を求める。

確率論・統計学統計標準偏差相関係数共分散データ分析
2025/7/27

1. 問題の内容

n個のデータ(x1,y1),(x2,y2),,(xn,yn)(x_1, y_1), (x_2, y_2), \dots, (x_n, y_n)があり、xxyyの間にはy=7x+8y = 7x + 8という関係がある。
(1) xxyyの標準偏差をそれぞれsxs_x, sys_yとするとき、sys_ysxs_xを用いて表す。
(2) xxyyの相関係数rrを求める。

2. 解き方の手順

(1) 標準偏差の関係を求める。
y=7x+8y = 7x + 8より、
yi=7xi+8y_i = 7x_i + 8が成り立つ。
yyの分散sy2s_y^2は、
sy2=1ni=1n(yiyˉ)2s_y^2 = \frac{1}{n}\sum_{i=1}^{n} (y_i - \bar{y})^2
ここで、yˉ=1ni=1nyi=1ni=1n(7xi+8)=7xˉ+8\bar{y} = \frac{1}{n}\sum_{i=1}^{n} y_i = \frac{1}{n}\sum_{i=1}^{n} (7x_i + 8) = 7\bar{x} + 8
したがって、
sy2=1ni=1n(7xi+8(7xˉ+8))2=1ni=1n(7xi7xˉ)2=1ni=1n49(xixˉ)2=491ni=1n(xixˉ)2=49sx2s_y^2 = \frac{1}{n}\sum_{i=1}^{n} (7x_i + 8 - (7\bar{x} + 8))^2 = \frac{1}{n}\sum_{i=1}^{n} (7x_i - 7\bar{x})^2 = \frac{1}{n}\sum_{i=1}^{n} 49(x_i - \bar{x})^2 = 49 \cdot \frac{1}{n}\sum_{i=1}^{n} (x_i - \bar{x})^2 = 49 s_x^2
sy=sy2=49sx2=7sxs_y = \sqrt{s_y^2} = \sqrt{49s_x^2} = 7s_x
(2) 相関係数を求める。
xxyyの共分散sxys_{xy}は、
sxy=1ni=1n(xixˉ)(yiyˉ)=1ni=1n(xixˉ)(7xi+8(7xˉ+8))=1ni=1n(xixˉ)(7xi7xˉ)=1ni=1n7(xixˉ)2=7sx2s_{xy} = \frac{1}{n}\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y}) = \frac{1}{n}\sum_{i=1}^{n} (x_i - \bar{x})(7x_i + 8 - (7\bar{x} + 8)) = \frac{1}{n}\sum_{i=1}^{n} (x_i - \bar{x})(7x_i - 7\bar{x}) = \frac{1}{n}\sum_{i=1}^{n} 7(x_i - \bar{x})^2 = 7s_x^2
相関係数rrは、
r=sxysxsy=7sx2sx7sx=7sx27sx2=1r = \frac{s_{xy}}{s_x s_y} = \frac{7s_x^2}{s_x \cdot 7s_x} = \frac{7s_x^2}{7s_x^2} = 1

3. 最終的な答え

(1) sy=7sxs_y = 7s_x
(2) r=1r = 1

「確率論・統計学」の関連問題

すごろくゲームに関する以下の3つの問題に答えます。 (1) さいころを3回投げたときの出目がそれぞれ6, 5, 2の場合、コマが最終的にどこにあるかを求めます。 (2) さいころを2回投げてゲームが終...

確率すごろくサイコロ組み合わせ
2025/7/27

大小2つのサイコロを同時に投げるとき、事象A: 出る目の数の和が5以下である、と事象B: 2つとも奇数の目が出る、のどちらが起こりやすいか判断し、より起こりやすい方の確率を求める問題です。

確率サイコロ事象確率の比較
2025/7/27

この問題は、男子3人、女子2人の中からくじ引きで2人を選ぶときの確率を求める問題です。具体的には、 (1) 男子が2人選ばれる確率 (2) 男女それぞれ1人ずつ選ばれる確率 (3) 少なくとも1人は女...

確率組み合わせ場合の数順列
2025/7/27

クラス全体の通学にかかる時間の平均を求める問題です。通学時間は0分~10分、10分~20分、20分~30分、30分~40分、40分~50分、50分~60分の範囲に分かれており、それぞれの範囲に該当する...

平均統計度数分布データの分析
2025/7/27

太郎さんの中学校の1年生、2年生、3年生の生徒が1ヶ月に図書室から借りた本の冊数を度数分布表にまとめたものが与えられている。(1) では1年生の平均 $x$ を求める。(2) では3つの学年を合わせた...

平均度数分布表データの分析
2025/7/27

この問題は、資料の活用に関する問題です。具体的には、ヒストグラムの読み取り、相対度数の計算、平均値・中央値・最頻値の計算、有効数字を用いた近似値の表現について問われています。

ヒストグラム相対度数平均値中央値最頻値有効数字
2025/7/27

1枚のコインを繰り返し投げ、表が3回出るか、裏が3回出たところで終了する。コインの表と裏の出方は何通りあるか。

確率組み合わせ期待値
2025/7/27

大中小3つのサイコロを同時に投げたとき、目の和が12になる場合は何通りあるかを求める問題です。

確率サイコロ場合の数組み合わせ
2025/7/27

a, a, a, b, b, c の6個の文字から3個を選んで1列に並べる方法は何通りあるか。

順列組み合わせ場合の数数え上げ
2025/7/27

与えられた標本平均、母標準偏差、標本サイズから、母平均の95%信頼区間と99%信頼区間を求める。 標本平均は88点、母標準偏差は4.0点、標本サイズは16である。

信頼区間標本平均母平均母標準偏差統計的推測
2025/7/27