## 問題の要約

確率論・統計学回帰分析散布図相関係数記述統計推測統計
2025/6/5
## 問題の要約
TさんはM駅の近くに家を建てたいと考え、8箇所の住宅地についてM駅からの距離X(単位:m)と地価Y(単位:万円/m²)を調査しました。そのデータを用いて、散布図の作成、偏差平方和・偏差積和・相関係数の計算、回帰分析、地価の推定などを行い、回帰モデルの妥当性について考察します。
## 解き方の手順
2.(1) 横軸をX(M駅からの距離)、縦軸をY(地価)として、与えられたデータをプロットして散布図を作成します。
2.(2) 偏差平方和 SxS_x, SyS_y と偏差積和 SxyS_{xy} は以下の式で計算できます。
まず、XとYの平均 Xˉ\bar{X}, Yˉ\bar{Y}を計算します。
Xˉ=200+440+140+350+320+170+400+2408=22608=282.5\bar{X} = \frac{200+440+140+350+320+170+400+240}{8} = \frac{2260}{8} = 282.5
Yˉ=30+12+36+18+24+32+16+328=2008=25\bar{Y} = \frac{30+12+36+18+24+32+16+32}{8} = \frac{200}{8} = 25
次に、SxS_x, SyS_y, SxyS_{xy}を計算します。
Sx=i=18(XiXˉ)2=(200282.5)2+(440282.5)2+(140282.5)2+(350282.5)2+(320282.5)2+(170282.5)2+(400282.5)2+(240282.5)2=68062.5S_x = \sum_{i=1}^8 (X_i - \bar{X})^2 = (200-282.5)^2 + (440-282.5)^2 + (140-282.5)^2 + (350-282.5)^2 + (320-282.5)^2 + (170-282.5)^2 + (400-282.5)^2 + (240-282.5)^2 = 68062.5
Sy=i=18(YiYˉ)2=(3025)2+(1225)2+(3625)2+(1825)2+(2425)2+(3225)2+(1625)2+(3225)2=426S_y = \sum_{i=1}^8 (Y_i - \bar{Y})^2 = (30-25)^2 + (12-25)^2 + (36-25)^2 + (18-25)^2 + (24-25)^2 + (32-25)^2 + (16-25)^2 + (32-25)^2 = 426
Sxy=i=18(XiXˉ)(YiYˉ)=(200282.5)(3025)+(440282.5)(1225)+(140282.5)(3625)+(350282.5)(1825)+(320282.5)(2425)+(170282.5)(3225)+(400282.5)(1625)+(240282.5)(3225)=14335S_{xy} = \sum_{i=1}^8 (X_i - \bar{X})(Y_i - \bar{Y}) = (200-282.5)(30-25) + (440-282.5)(12-25) + (140-282.5)(36-25) + (350-282.5)(18-25) + (320-282.5)(24-25) + (170-282.5)(32-25) + (400-282.5)(16-25) + (240-282.5)(32-25) = -14335
2.(3) 相関係数 rxyr_{xy} は以下の式で計算できます。
rxy=SxySxSy=1433568062.5×426=1433529003612.5=143355385.50.266r_{xy} = \frac{S_{xy}}{\sqrt{S_x S_y}} = \frac{-14335}{\sqrt{68062.5 \times 426}} = \frac{-14335}{\sqrt{29003612.5}} = \frac{-14335}{5385.5} \approx -0.266
2.(4) 回帰式 y=a+bxy = a + bx を仮定し、パラメータaa, bbを求めます。
b=SxySx=1433568062.50.2106b = \frac{S_{xy}}{S_x} = \frac{-14335}{68062.5} \approx -0.2106
a=YˉbXˉ=25(0.2106)×282.5=25+59.49=84.49a = \bar{Y} - b\bar{X} = 25 - (-0.2106) \times 282.5 = 25 + 59.49 = 84.49
したがって、回帰式は y=84.490.2106xy = 84.49 - 0.2106x となります。
2.(5) (1)で作成した散布図に、直線 y=84.490.2106xy = 84.49 - 0.2106x を描きます。
2.(6) M駅からの距離が300mのときの地価の推定値は、回帰式にx=300x=300を代入して求めます。
y=84.490.2106×300=84.4963.18=21.31y = 84.49 - 0.2106 \times 300 = 84.49 - 63.18 = 21.31 (万円/m²)
2.(7) M駅からの距離が500mのときの地価の推定値は、回帰式にx=500x=500を代入して求めます。
y=84.490.2106×500=84.49105.3=20.81y = 84.49 - 0.2106 \times 500 = 84.49 - 105.3 = -20.81 (万円/m²)
2.(8) M駅からの距離が1000mのときの地価の推定値は、回帰式にx=1000x=1000を代入して求めます。
y=84.490.2106×1000=84.49210.6=126.11y = 84.49 - 0.2106 \times 1000 = 84.49 - 210.6 = -126.11 (万円/m²)
2.(9) M駅からの距離が2000mのときの地価の推定値は、回帰式にx=2000x=2000を代入して求めます。
y=84.490.2106×2000=84.49421.2=336.71y = 84.49 - 0.2106 \times 2000 = 84.49 - 421.2 = -336.71 (万円/m²)
2.(10) (6), (7), (8), (9)で求めた地価の推定値について、考察します。
(7), (8), (9)では地価が負の値になっているため、妥当ではありません。これは、回帰モデルがデータの範囲外で適用されているためです。
回帰モデルを改善するためには、より多くのデータを用いて、より複雑なモデル(例えば、二次関数や指数関数)を検討する必要があります。また、M駅からの距離以外の要因(例えば、周辺環境、土地の形状など)も考慮に入れる必要があります。
3.(1) 記述統計学は、データの要約や特徴を記述することに焦点を当てます(平均、標準偏差など)。一方、推測統計学は、標本データから母集団に関する推論を行うことに焦点を当てます。
3.(2) 数学的確率は、理論的なモデルに基づいて計算される確率です(コインを投げるなど)。統計的確率・経験的確率は、過去のデータや経験に基づいて推定される確率です。
3.(3) 平均値は、データの総和をデータの個数で割った値です。中央値は、データを大きさ順に並べたときの中央に位置する値です。
3.(4) 相関関係は、2つの変数の間に何らかの関係があることを示しますが、一方が他方の原因であるとは限りません。因果関係は、一方が他方の原因であることを示します。
3.(5) 説明変数は、他の変数を説明するために用いられる変数です。目的変数(被説明変数)は、説明変数によって説明される変数です。
## 最終的な答え
2.(2) Sx=68062.5S_x = 68062.5, Sy=426S_y = 426, Sxy=14335S_{xy} = -14335
2.(3) rxy0.266r_{xy} \approx -0.266
2.(4) y=84.490.2106xy = 84.49 - 0.2106x
2.(6) 21.31万円/m²
2.(7) -20.81万円/m²
2.(8) -126.11万円/m²
2.(9) -336.71万円/m²

「確率論・統計学」の関連問題

7枚のカード(1から7までの数字が書かれている)から5枚を選び、横一列に並べる問題を考える。 (1) 1, 2, 3, 4, 5 のカードを使って並べる場合、並べ方は全部で何通りあるか。 (2) 7枚...

順列組み合わせ場合の数
2025/6/6

平均 $\mu$、分散 $\sigma^2$ の母集団から無作為に抽出した $n$ 個の標本 $X_1, \dots, X_n$ があるとき、標本平均 $\overline{X}$ を $\overl...

標本平均期待値分散中心極限定理確率分布
2025/6/6

確率変数 $X$ は、確率 $p$ で $1$ をとり、確率 $1-p$ で $0$ をとる。ただし、$0 \le p \le 1$ である。このとき、以下の問いに答える。 (1) $X$ の期待値 ...

確率変数期待値分散確率関数ベルヌーイ分布
2025/6/6

確率変数 $X$ が、確率 $p$ で 1 をとり、確率 $1-p$ で 0 をとるとします。ただし、$0 \le p \le 1$ です。 (1) $X$ の期待値 $E[X]$ と分散 $V[X]...

確率変数期待値分散確率関数ベルヌーイ分布
2025/6/6

白玉2つと赤玉5つが入っている袋から1個の玉を取り出し、色を調べてから袋に戻す操作を40回繰り返す。白玉を取り出す回数 $X$ は二項分布 $B(n, p)$ に従う。 (1) $n$ と $p$ を...

確率二項分布期待値分散標準偏差
2025/6/6

1から4までの数字が書かれたカードが合計10枚あります。1が4枚、2が3枚、3が2枚、4が1枚です。この中からランダムに1枚を選び、そのカードに書かれた数をXとします。Xの期待値E(X)、X^2の期待...

期待値分散確率分布
2025/6/6

8人を指定された人数でいくつかのグループに分ける場合の数を計算する問題です。 (1) 8人をA, B, C, Dの4つの組に、2人ずつ分ける場合の数を求める。 (2) 8人を2人ずつの4つの組に分ける...

組み合わせ場合の数順列二項係数
2025/6/6

確率変数 $X$ の期待値が $E[X] = \frac{5}{2}$、分散が $V[X] = \frac{5}{4}$ であるとき、確率変数 $-2X+3$ の期待値、分散、標準偏差を求める。

期待値分散標準偏差確率変数線形性
2025/6/6

1と書かれたカードが4枚、2と書かれたカードが3枚、3と書かれたカードが2枚、4と書かれたカードが1枚、合計10枚のカードがある。この中から無作為に1枚カードを取り出し、取り出したカードに書かれた数を...

期待値分散確率変数確率分布
2025/6/6

大小中3個のサイコロを投げるとき、以下の条件を満たす場合はそれぞれ何通りあるか。 (1) 目がすべて異なる (2) 少なくとも2個が同じ目 (3) 目の積が3の倍数 (4) 目の和が奇数

確率組み合わせサイコロ場合の数
2025/6/6