M駅周辺の8箇所の住宅地について、M駅からの距離と地価の関係が与えられています。 (1) 散布図の作成、(2) 偏差平方和と偏差積和の計算、(3) 相関係数の計算、(4) 回帰直線のパラメータ推定、(5) 回帰直線の散布図への描画、(6)-(9) 回帰モデルを用いた地価の推定、(10) 回帰モデルの妥当性の検討と改善策の提案を行います。

確率論・統計学回帰分析相関係数散布図偏差線形回帰
2025/6/3

1. 問題の内容

M駅周辺の8箇所の住宅地について、M駅からの距離と地価の関係が与えられています。
(1) 散布図の作成、(2) 偏差平方和と偏差積和の計算、(3) 相関係数の計算、(4) 回帰直線のパラメータ推定、(5) 回帰直線の散布図への描画、(6)-(9) 回帰モデルを用いた地価の推定、(10) 回帰モデルの妥当性の検討と改善策の提案を行います。

2. 解き方の手順

(1) 散布図:横軸をM駅からの距離X、縦軸を地価Yとして、与えられたデータをプロットします。
(2) 偏差平方和、偏差積和の計算:
まず、XとYの平均値を計算します。
Xˉ=(200+440+140+350+320+170+400+240)/8=282.5 \bar{X} = (200 + 440 + 140 + 350 + 320 + 170 + 400 + 240) / 8 = 282.5
Yˉ=(30+12+36+18+24+32+16+32)/8=25 \bar{Y} = (30 + 12 + 36 + 18 + 24 + 32 + 16 + 32) / 8 = 25
次に、偏差平方和 SxS_x, SyS_y と偏差積和 SxyS_{xy} を計算します。
Sx=i=18(XiXˉ)2 S_x = \sum_{i=1}^{8} (X_i - \bar{X})^2
Sy=i=18(YiYˉ)2 S_y = \sum_{i=1}^{8} (Y_i - \bar{Y})^2
Sxy=i=18(XiXˉ)(YiYˉ) S_{xy} = \sum_{i=1}^{8} (X_i - \bar{X})(Y_i - \bar{Y})
具体的な計算は以下の通りです。
Sx=(200282.5)2+(440282.5)2+(140282.5)2+(350282.5)2+(320282.5)2+(170282.5)2+(400282.5)2+(240282.5)2S_x = (200-282.5)^2 + (440-282.5)^2 + (140-282.5)^2 + (350-282.5)^2 + (320-282.5)^2 + (170-282.5)^2 + (400-282.5)^2 + (240-282.5)^2
Sx=6806.25+24806.25+20306.25+4556.25+1406.25+12656.25+13806.25+1806.25=85550S_x = 6806.25 + 24806.25 + 20306.25 + 4556.25 + 1406.25 + 12656.25 + 13806.25 + 1806.25 = 85550
Sy=(3025)2+(1225)2+(3625)2+(1825)2+(2425)2+(3225)2+(1625)2+(3225)2S_y = (30-25)^2 + (12-25)^2 + (36-25)^2 + (18-25)^2 + (24-25)^2 + (32-25)^2 + (16-25)^2 + (32-25)^2
Sy=25+169+121+49+1+49+81+49=544S_y = 25 + 169 + 121 + 49 + 1 + 49 + 81 + 49 = 544
Sxy=(200282.5)(3025)+(440282.5)(1225)+(140282.5)(3625)+(350282.5)(1825)+(320282.5)(2425)+(170282.5)(3225)+(400282.5)(1625)+(240282.5)(3225)S_{xy} = (200-282.5)(30-25) + (440-282.5)(12-25) + (140-282.5)(36-25) + (350-282.5)(18-25) + (320-282.5)(24-25) + (170-282.5)(32-25) + (400-282.5)(16-25) + (240-282.5)(32-25)
Sxy=(82.5)(5)+(157.5)(13)+(142.5)(11)+(67.5)(7)+(37.5)(1)+(112.5)(7)+(117.5)(9)+(42.5)(7)S_{xy} = (-82.5)(5) + (157.5)(-13) + (-142.5)(11) + (67.5)(-7) + (37.5)(-1) + (-112.5)(7) + (117.5)(-9) + (-42.5)(7)
Sxy=412.52047.51567.5472.537.5787.51057.5297.5=6680S_{xy} = -412.5 - 2047.5 - 1567.5 - 472.5 - 37.5 - 787.5 - 1057.5 - 297.5 = -6680
(3) 相関係数 rxyr_{xy} の計算:
rxy=SxySxSy=668085550×544=668046547200=66806822.550.979 r_{xy} = \frac{S_{xy}}{\sqrt{S_x S_y}} = \frac{-6680}{\sqrt{85550 \times 544}} = \frac{-6680}{\sqrt{46547200}} = \frac{-6680}{6822.55} \approx -0.979
(4) 回帰直線のパラメータ推定:
y=a+bxy = a + bx
b=SxySx=6680855500.078 b = \frac{S_{xy}}{S_x} = \frac{-6680}{85550} \approx -0.078
a=YˉbXˉ=25(0.078)×282.5=25+22.03547.035 a = \bar{Y} - b\bar{X} = 25 - (-0.078) \times 282.5 = 25 + 22.035 \approx 47.035
よって、回帰直線は y=47.0350.078xy = 47.035 - 0.078x
(5) 回帰直線の散布図への描画:
(1)で作成した散布図上に、上記で求めた回帰直線を描画します。
(6) M駅からの距離が300mの住宅地Iの地価:
y=47.0350.078×300=47.03523.4=23.635 y = 47.035 - 0.078 \times 300 = 47.035 - 23.4 = 23.635
約23.635万円/m²
(7) M駅からの距離が500mの住宅地Jの地価:
y=47.0350.078×500=47.03539=8.035 y = 47.035 - 0.078 \times 500 = 47.035 - 39 = 8.035
約8.035万円/m²
(8) M駅からの距離が1000mの住宅地Kの地価:
y=47.0350.078×1000=47.03578=30.965 y = 47.035 - 0.078 \times 1000 = 47.035 - 78 = -30.965
約-30.965万円/m²。地価が負の値になるのは不自然です。
(9) M駅からの距離が2000mの住宅地Lの地価:
y=47.0350.078×2000=47.035156=108.965 y = 47.035 - 0.078 \times 2000 = 47.035 - 156 = -108.965
約-108.965万円/m²。地価が負の値になるのは不自然です。
(10) 回帰モデルの妥当性:
(6)と(7)は妥当ですが、(8)と(9)は妥当ではありません。なぜなら、地価が負の値になるという現実にはあり得ない結果が出ているからです。
これは、回帰モデルが与えられたデータ範囲外の値を予測する際に、モデルの限界を超えていることを示しています。
改善策:
より広い範囲のデータ(M駅から遠い場所の地価データ)を追加して、回帰モデルを作り直すことが考えられます。
あるいは、直線回帰ではなく、より複雑な関数(例えば、二次関数や指数関数)を用いた回帰モデルを検討する必要があります。
距離と地価の関係が、ある距離を超えると単純な線形関係から外れる可能性があるため、非線形モデルの検討が有効です。

3. 最終的な答え

(2) Sx=85550S_x = 85550, Sy=544S_y = 544, Sxy=6680S_{xy} = -6680
(3) rxy0.979r_{xy} \approx -0.979
(4) a47.035a \approx 47.035, b0.078b \approx -0.078
(6) 約23.635万円/m²
(7) 約8.035万円/m²
(8) 約-30.965万円/m²
(9) 約-108.965万円/m²
(10) (6)と(7)は妥当、(8)と(9)は妥当ではない。データ範囲外の予測にモデルの限界があるため。より広い範囲のデータを追加するか、非線形モデルを検討する。

「確率論・統計学」の関連問題

大人6人、子ども4人の合計10人の中から、抽選で5人を選ぶとき、以下の確率を求める。 (1) 大人が3人、子どもが2人となる確率 (2) 子どもが1人だけとなる確率

組み合わせ確率場合の数
2025/6/6

10本のくじがあり、そのうち3本が当たりくじである。 (1) 2本を同時に引くとき、2本とも当たる確率を求める。 (2) 3本を同時に引くとき、3本ともはずれの確率を求める。

確率組み合わせくじ
2025/6/6

AとBを含む4人が、くじ引きで順番を決めて横1列に並ぶとき、以下の確率を求めます。 (1) Aが左端に並ぶ確率 (2) Bが左端、Aが右端に並ぶ確率

確率順列場合の数
2025/6/6

2つのサイコロを同時に投げたとき、以下のそれぞれの確率を求めます。 (1) 目の和が7になる確率。 (2) 2つとも偶数の目が出る確率。

確率サイコロ確率の計算
2025/6/6

3枚の硬貨を同時に投げるとき、以下の確率を求めます。 (1) すべて表が出る確率。 (2) 1枚だけ裏が出る確率。

確率硬貨組み合わせ
2025/6/6

袋の中に白玉が5個、赤玉が4個入っている。P, Qの順に1個ずつ玉を取り出す。 (1) Pが取り出した玉を袋に戻してからQが取り出す時、2人とも赤玉を取り出す確率を求める。 (2) Pが取り出した玉を...

確率事象条件付き確率玉の取り出し
2025/6/6

$a$ は定数である。7つの値 $7, 9, 12, 22, 34, a-15, a+1$ からなるデータにおいて、中央値が16であるとき、$a$ の値を求め、さらにこのデータの四分位範囲を求める。

中央値四分位範囲データの分析
2025/6/6

度数分布表から、10人の成人男性の身長の平均値が取りうる値を四つの選択肢から選びます。

度数分布平均値統計
2025/6/5

白玉1個、赤玉2個、青玉4個の合計7個の玉がある。 (1) これらを机の上に円形に並べる方法は何通りあるか。 (2) これらで何通りの首飾りが作れるか。

順列組み合わせ円順列首飾り
2025/6/5

10本のくじの中に3本の当たりくじが入っている箱がある。引いたくじは元に戻す。 (8) この試行を3回繰り返したとき、3回とも当たりくじを引く確率を求める。 (9) この試行を4回繰り返したとき、2回...

確率反復試行組み合わせ確率の計算
2025/6/5