M駅の近くにマイホームを建てようとしているTさんが、8箇所の住宅地について地価を調査した。M駅からの距離Xと地価Yの関係が与えられている。 (1) 散布図の作成 (2) 偏差平方和Sx, Syと、偏差積和Sxyの計算 (3) 相関係数rxyの計算 (4) 回帰直線y=a+bxのパラメータa, bの推定 (5) 回帰直線の散布図への描画 (6) M駅からの距離が300mの住宅地Iの地価の推定 (7) M駅からの距離が500mの住宅地Jの地価の推定 (8) M駅からの距離が1000mの住宅地Kの地価の推定 (9) M駅からの距離が2000mの住宅地Lの地価の推定 (10) (6)~(9)の地価推定の妥当性の検討と、より適切な回帰モデルの提案

確率論・統計学回帰分析相関係数散布図データの分析統計
2025/6/3

1. 問題の内容

M駅の近くにマイホームを建てようとしているTさんが、8箇所の住宅地について地価を調査した。M駅からの距離Xと地価Yの関係が与えられている。
(1) 散布図の作成
(2) 偏差平方和Sx, Syと、偏差積和Sxyの計算
(3) 相関係数rxyの計算
(4) 回帰直線y=a+bxのパラメータa, bの推定
(5) 回帰直線の散布図への描画
(6) M駅からの距離が300mの住宅地Iの地価の推定
(7) M駅からの距離が500mの住宅地Jの地価の推定
(8) M駅からの距離が1000mの住宅地Kの地価の推定
(9) M駅からの距離が2000mの住宅地Lの地価の推定
(10) (6)~(9)の地価推定の妥当性の検討と、より適切な回帰モデルの提案

2. 解き方の手順

(1) 散布図の作成:
横軸にM駅からの距離X、縦軸に地価Yを取ったグラフを作成する。与えられたデータ(A~H)をプロットする。
(2) 偏差平方和と偏差積和の計算:
まず、XとYの平均値を計算する。
Xの平均値:
xˉ=(200+440+140+350+320+170+400+240)/8=282.5\bar{x} = (200 + 440 + 140 + 350 + 320 + 170 + 400 + 240) / 8 = 282.5
Yの平均値:
yˉ=(30+12+36+18+24+32+16+32)/8=25\bar{y} = (30 + 12 + 36 + 18 + 24 + 32 + 16 + 32) / 8 = 25
次に、偏差平方和Sx, Syと偏差積和Sxyを計算する。
Sx=i=18(xixˉ)2=(200282.5)2+(440282.5)2+(140282.5)2+(350282.5)2+(320282.5)2+(170282.5)2+(400282.5)2+(240282.5)2=108550S_x = \sum_{i=1}^{8} (x_i - \bar{x})^2 = (200-282.5)^2 + (440-282.5)^2 + (140-282.5)^2 + (350-282.5)^2 + (320-282.5)^2 + (170-282.5)^2 + (400-282.5)^2 + (240-282.5)^2 = 108550
Sy=i=18(yiyˉ)2=(3025)2+(1225)2+(3625)2+(1825)2+(2425)2+(3225)2+(1625)2+(3225)2=458S_y = \sum_{i=1}^{8} (y_i - \bar{y})^2 = (30-25)^2 + (12-25)^2 + (36-25)^2 + (18-25)^2 + (24-25)^2 + (32-25)^2 + (16-25)^2 + (32-25)^2 = 458
Sxy=i=18(xixˉ)(yiyˉ)=(200282.5)(3025)+(440282.5)(1225)+(140282.5)(3625)+(350282.5)(1825)+(320282.5)(2425)+(170282.5)(3225)+(400282.5)(1625)+(240282.5)(3225)=19465S_{xy} = \sum_{i=1}^{8} (x_i - \bar{x})(y_i - \bar{y}) = (200-282.5)(30-25) + (440-282.5)(12-25) + (140-282.5)(36-25) + (350-282.5)(18-25) + (320-282.5)(24-25) + (170-282.5)(32-25) + (400-282.5)(16-25) + (240-282.5)(32-25) = -19465
(3) 相関係数の計算:
相関係数rxyr_{xy}は以下の式で計算できる。
rxy=SxySxSy=19465108550×458=19465497159000.873r_{xy} = \frac{S_{xy}}{\sqrt{S_x S_y}} = \frac{-19465}{\sqrt{108550 \times 458}} = \frac{-19465}{\sqrt{49715900}} \approx -0.873
(4) 回帰直線の推定:
回帰直線y=a+bxy = a + bxの傾きbbは以下の式で計算できる。
b=SxySx=194651085500.179b = \frac{S_{xy}}{S_x} = \frac{-19465}{108550} \approx -0.179
切片aaは以下の式で計算できる。
a=yˉbxˉ=25(0.179)×282.5=25+50.567575.57a = \bar{y} - b\bar{x} = 25 - (-0.179) \times 282.5 = 25 + 50.5675 \approx 75.57
(5) 回帰直線の散布図への描画:
(1)で作成した散布図に、求めた回帰直線y=75.570.179xy = 75.57 - 0.179xを描画する。
(6) 地価の推定(I):
M駅からの距離が300mの場合、
y=75.570.179×300=75.5753.7=21.87y = 75.57 - 0.179 \times 300 = 75.57 - 53.7 = 21.87万円/m²
(7) 地価の推定(J):
M駅からの距離が500mの場合、
y=75.570.179×500=75.5789.5=13.93y = 75.57 - 0.179 \times 500 = 75.57 - 89.5 = -13.93万円/m²
(8) 地価の推定(K):
M駅からの距離が1000mの場合、
y=75.570.179×1000=75.57179=103.43y = 75.57 - 0.179 \times 1000 = 75.57 - 179 = -103.43万円/m²
(9) 地価の推定(L):
M駅からの距離が2000mの場合、
y=75.570.179×2000=75.57358=282.43y = 75.57 - 0.179 \times 2000 = 75.57 - 358 = -282.43万円/m²
(10) 地価推定の妥当性:
M駅からの距離が500m, 1000m, 2000mの地点の地価推定値が負の値になっているため、この回帰モデルをそのまま用いて地価を推定するのは妥当ではない。これは、回帰モデルがデータ範囲外の値を予測する際に不適切な結果を出す可能性があるためである。
より適切なモデルを作成するためには、
- データ範囲を広げる:M駅からの距離が500m以上の地点の地価データも収集し、回帰分析を行う。
- 非線形モデルを検討する:地価が距離に対して線形に減少するとは限らないため、2次関数や指数関数などの非線形モデルを試す。
- 他の要因を考慮する:地価はM駅からの距離だけでなく、周辺環境や施設の有無など、他の要因にも影響される可能性がある。これらの要因も考慮したモデルを作成する。

3. 最終的な答え

(2) Sx = 108550, Sy = 458, Sxy = -19465
(3) rxy = -0.873
(4) a = 75.57, b = -0.179
(6) 21.87万円/m²
(7) -13.93万円/m²
(8) -103.43万円/m²
(9) -282.43万円/m²
(10) 妥当ではない。回帰モデルがデータ範囲外で不適切な値を出すため。データ範囲を広げる、非線形モデルを検討する、他の要因を考慮する。

「確率論・統計学」の関連問題

与えられた不等式 $-1.96 \le \frac{x - \mu}{\sigma} \le 1.96$ または $x - 1.96 \sigma \le \mu \le x + 1.96 \sigm...

不等式統計的推測信頼区間
2025/6/6

標準偏差 $\sigma$ が既知の正規母集団において、標本1個の値 $x$ が得られたとき、母平均 $\mu$ に関する仮説が棄却されないための条件を求める。具体的には、以下の不等式を満たす $\m...

統計的仮説検定母平均信頼区間正規分布標準偏差
2025/6/6

大人6人、子ども4人の合計10人の中から、抽選で5人を選ぶとき、以下の確率を求める。 (1) 大人が3人、子どもが2人となる確率 (2) 子どもが1人だけとなる確率

組み合わせ確率場合の数
2025/6/6

10本のくじがあり、そのうち3本が当たりくじである。 (1) 2本を同時に引くとき、2本とも当たる確率を求める。 (2) 3本を同時に引くとき、3本ともはずれの確率を求める。

確率組み合わせくじ
2025/6/6

AとBを含む4人が、くじ引きで順番を決めて横1列に並ぶとき、以下の確率を求めます。 (1) Aが左端に並ぶ確率 (2) Bが左端、Aが右端に並ぶ確率

確率順列場合の数
2025/6/6

2つのサイコロを同時に投げたとき、以下のそれぞれの確率を求めます。 (1) 目の和が7になる確率。 (2) 2つとも偶数の目が出る確率。

確率サイコロ確率の計算
2025/6/6

3枚の硬貨を同時に投げるとき、以下の確率を求めます。 (1) すべて表が出る確率。 (2) 1枚だけ裏が出る確率。

確率硬貨組み合わせ
2025/6/6

袋の中に白玉が5個、赤玉が4個入っている。P, Qの順に1個ずつ玉を取り出す。 (1) Pが取り出した玉を袋に戻してからQが取り出す時、2人とも赤玉を取り出す確率を求める。 (2) Pが取り出した玉を...

確率事象条件付き確率玉の取り出し
2025/6/6

$a$ は定数である。7つの値 $7, 9, 12, 22, 34, a-15, a+1$ からなるデータにおいて、中央値が16であるとき、$a$ の値を求め、さらにこのデータの四分位範囲を求める。

中央値四分位範囲データの分析
2025/6/6

度数分布表から、10人の成人男性の身長の平均値が取りうる値を四つの選択肢から選びます。

度数分布平均値統計
2025/6/5