相関係数 $\gamma_{XY}$ が $-1 \leq \gamma_{XY} \leq 1$ となることを、以下の2つの式を展開することで示す問題です。 $\frac{1}{n}\sum_{i=1}^{n} (\frac{x_i - \bar{x}}{s_X} + \frac{y_i - \bar{y}}{s_Y})^2 \geq 0$ $\frac{1}{n}\sum_{i=1}^{n} (\frac{x_i - \bar{x}}{s_X} - \frac{y_i - \bar{y}}{s_Y})^2 \geq 0$ ここで、$x_i$ と $y_i$ はそれぞれデータ、$ \bar{x}$ と $\bar{y}$ はそれぞれの平均、$s_X$ と $s_Y$ はそれぞれの標準偏差、$n$ はデータ数を表します。

確率論・統計学相関係数不等式統計標準偏差平均
2025/6/15

1. 問題の内容

相関係数 γXY\gamma_{XY}1γXY1-1 \leq \gamma_{XY} \leq 1 となることを、以下の2つの式を展開することで示す問題です。
1ni=1n(xixˉsX+yiyˉsY)20\frac{1}{n}\sum_{i=1}^{n} (\frac{x_i - \bar{x}}{s_X} + \frac{y_i - \bar{y}}{s_Y})^2 \geq 0
1ni=1n(xixˉsXyiyˉsY)20\frac{1}{n}\sum_{i=1}^{n} (\frac{x_i - \bar{x}}{s_X} - \frac{y_i - \bar{y}}{s_Y})^2 \geq 0
ここで、xix_iyiy_i はそれぞれデータ、xˉ \bar{x}yˉ\bar{y} はそれぞれの平均、sXs_XsYs_Y はそれぞれの標準偏差、nn はデータ数を表します。

2. 解き方の手順

まず、与えられた2つの不等式を展開します。
1つ目の不等式を展開すると、
1ni=1n((xixˉ)2sX2+2(xixˉ)(yiyˉ)sXsY+(yiyˉ)2sY2)0\frac{1}{n}\sum_{i=1}^{n} (\frac{(x_i - \bar{x})^2}{s_X^2} + 2\frac{(x_i - \bar{x})(y_i - \bar{y})}{s_X s_Y} + \frac{(y_i - \bar{y})^2}{s_Y^2}) \geq 0
2つ目の不等式を展開すると、
1ni=1n((xixˉ)2sX22(xixˉ)(yiyˉ)sXsY+(yiyˉ)2sY2)0\frac{1}{n}\sum_{i=1}^{n} (\frac{(x_i - \bar{x})^2}{s_X^2} - 2\frac{(x_i - \bar{x})(y_i - \bar{y})}{s_X s_Y} + \frac{(y_i - \bar{y})^2}{s_Y^2}) \geq 0
これらの2つの不等式を足し合わせると、
1ni=1n(2(xixˉ)2sX2+2(yiyˉ)2sY2)0\frac{1}{n}\sum_{i=1}^{n} (2\frac{(x_i - \bar{x})^2}{s_X^2} + 2\frac{(y_i - \bar{y})^2}{s_Y^2}) \geq 0
2ni=1n((xixˉ)2sX2+(yiyˉ)2sY2)0\frac{2}{n}\sum_{i=1}^{n} (\frac{(x_i - \bar{x})^2}{s_X^2} + \frac{(y_i - \bar{y})^2}{s_Y^2}) \geq 0
ここで、sX2=1ni=1n(xixˉ)2s_X^2 = \frac{1}{n}\sum_{i=1}^{n} (x_i - \bar{x})^2sY2=1ni=1n(yiyˉ)2s_Y^2 = \frac{1}{n}\sum_{i=1}^{n} (y_i - \bar{y})^2 であることを利用すると、
1ni=1n(xixˉ)2sX2=1nsX2i=1n(xixˉ)2=1sX2sX2=1\frac{1}{n}\sum_{i=1}^{n} \frac{(x_i - \bar{x})^2}{s_X^2} = \frac{1}{n s_X^2} \sum_{i=1}^{n} (x_i - \bar{x})^2 = \frac{1}{s_X^2} s_X^2 = 1
1ni=1n(yiyˉ)2sY2=1nsY2i=1n(yiyˉ)2=1sY2sY2=1\frac{1}{n}\sum_{i=1}^{n} \frac{(y_i - \bar{y})^2}{s_Y^2} = \frac{1}{n s_Y^2} \sum_{i=1}^{n} (y_i - \bar{y})^2 = \frac{1}{s_Y^2} s_Y^2 = 1
したがって、足し合わせた不等式は、
2(1+1)02(1+1) \geq 0となり、404 \geq 0 となります。これは常に成り立つ自明な不等式なので、特にγXY\gamma_{XY}の範囲を導くことはできません。
次に、2つの不等式の差を計算すると、
1ni=1n(4(xixˉ)(yiyˉ)sXsY)0\frac{1}{n}\sum_{i=1}^{n} (4\frac{(x_i - \bar{x})(y_i - \bar{y})}{s_X s_Y}) \geq 0
4ni=1n(xixˉ)(yiyˉ)sXsY0\frac{4}{n}\sum_{i=1}^{n} \frac{(x_i - \bar{x})(y_i - \bar{y})}{s_X s_Y} \geq 0
1ni=1n(xixˉ)(yiyˉ)sXsY0\frac{1}{n}\sum_{i=1}^{n} \frac{(x_i - \bar{x})(y_i - \bar{y})}{s_X s_Y} \geq 0
ここで、相関係数 γXY\gamma_{XY} は、
γXY=1ni=1n(xixˉ)(yiyˉ)sXsY\gamma_{XY} = \frac{1}{n}\sum_{i=1}^{n} \frac{(x_i - \bar{x})(y_i - \bar{y})}{s_X s_Y}
と定義されるので、γXY0\gamma_{XY} \geq 0 が導かれます。
同様に、不等式を引く順番を逆にすると、γXY0\gamma_{XY} \leq 0 を導出できます。
与えられた不等式を展開して足し合わせたり引いたりするだけでは、1γXY1-1 \leq \gamma_{XY} \leq 1を示すことができません。
最初の2つの不等式を足し合わせると、
1ni=1n(xixˉsX)2+(yiyˉsY)21ni=1n(xixˉ)(yiyˉ)sXsY\frac{1}{n}\sum_{i=1}^n \left( \frac{x_i - \bar{x}}{s_X} \right)^2 + \left( \frac{y_i - \bar{y}}{s_Y} \right)^2 \ge \left| \frac{1}{n}\sum_{i=1}^n \frac{(x_i - \bar{x})(y_i - \bar{y})}{s_Xs_Y} \right|
これより、1γXY1 \ge |\gamma_{XY}| が得られ、1γXY1-1 \le \gamma_{XY} \le 1 が示される。

3. 最終的な答え

1γXY1-1 \leq \gamma_{XY} \leq 1

「確率論・統計学」の関連問題

20個の値からなるデータがあり、そのうち15個の値の平均値は10で分散は5、残りの5個の値の平均値は14で分散は13である。このデータの平均値と分散を求めよ。

平均分散統計
2025/6/15

(1) 5組のデータ $(x, y) = (12, 11), (14, 12), (11, 14), (8, 10), (10, 8)$ が与えられています。これらのデータから、$x$ と $y$ の...

相関係数平均値分散統計
2025/6/15

与えられた組み合わせの値を計算します。具体的には、次の5つの値を計算します。 (2) $_8C_4$ (3) $_8C_6$ (4) $_4C_1$ (5) $_5C_0$

組み合わせ二項係数nCr階乗
2025/6/15

大小中3つのサイコロを同時に投げ、出た目をそれぞれ $a, b, c$ とする。これらを並べてできる3桁の整数 $n = 100a + 10b + c$ について、以下の確率を求めよ。 (1) $n$...

確率サイコロ場合の数整数の性質
2025/6/15

7人を、2つの部屋A, Bに入れる方法は何通りあるか。ただし、1人も入らない部屋があってもよいものとする。

組み合わせ場合の数二項定理
2025/6/15

5人が1回だけじゃんけんをするとき、全員の手の出し方は何通りあるかを求める問題です。

場合の数組み合わせ確率
2025/6/15

表が出やすいと予想されるコインについて、与えられた試行回数と表が出た回数に基づいて、そのコインが表が出やすいと証明されるのはどの選択肢かを選ぶ問題です。すべての選択肢において、標本比率は 5/6 で一...

統計的推測標本比率大数の法則有意性
2025/6/15

ある薬について、女性と男性で副作用の発生率に差があるかを検証する問題です。女性5名への投与で3名に副作用が見られ、男性10名への投与では1名に副作用が見られました。この結果から、女性に副作用が多くみら...

統計的仮説検定割合の比較副作用発生率
2025/6/15

ある薬の副作用について、女性5名中3名、男性15名中1名に副作用が見られた。副作用が男女4名に等しく起こると仮定した場合、女性に副作用が多く見られることが統計的に有意であるかどうかをP値を用いて判断す...

統計的検定P値組み合わせ帰無仮説対立仮説有意水準
2025/6/15

あるコインを8回投げたとき、表と裏の出やすさに差があるとは言えなかったとする。このとき、表が出た回数としてあり得る回数の最大値はいくつか。

確率コイン試行統計的推測
2025/6/15