M駅からの距離Xと地価Yのデータが与えられている。 (1) 散布図の作成、(2) 偏差平方和と偏差積和の計算、(3) 相関係数の計算、(4) 回帰分析によるパラメータ推定、(5) 回帰直線の図示、(6)-(9) 回帰モデルを用いた地価の推定、(10) 推定の妥当性の評価とより適切な回帰モデルの提案を行う。

確率論・統計学回帰分析相関係数散布図偏差平方和偏差積和線形回帰
2025/6/3

1. 問題の内容

M駅からの距離Xと地価Yのデータが与えられている。
(1) 散布図の作成、(2) 偏差平方和と偏差積和の計算、(3) 相関係数の計算、(4) 回帰分析によるパラメータ推定、(5) 回帰直線の図示、(6)-(9) 回帰モデルを用いた地価の推定、(10) 推定の妥当性の評価とより適切な回帰モデルの提案を行う。

2. 解き方の手順

データ:
住宅地 | A | B | C | D | E | F | G | H |
------- | --- | --- | --- | --- | --- | --- | --- | --- |
X [m] | 200 | 440 | 140 | 350 | 320 | 170 | 400 | 240 |
Y [万円/m^2] | 30 | 12 | 36 | 18 | 24 | 32 | 16 | 32 |
(1) 散布図:
X軸をM駅からの距離、Y軸を地価として、上記データ点をプロットする。 (省略)
(2) 偏差平方和と偏差積和:
まず、XとYの平均値を計算する。
Xˉ=(200+440+140+350+320+170+400+240)/8=282.5\bar{X} = (200 + 440 + 140 + 350 + 320 + 170 + 400 + 240) / 8 = 282.5
Yˉ=(30+12+36+18+24+32+16+32)/8=25\bar{Y} = (30 + 12 + 36 + 18 + 24 + 32 + 16 + 32) / 8 = 25
次に、偏差平方和 Sx,SyS_x, S_y と偏差積和 SxyS_{xy} を計算する。
Sx=i=18(XiXˉ)2S_x = \sum_{i=1}^{8} (X_i - \bar{X})^2
Sx=(200282.5)2+(440282.5)2+(140282.5)2+(350282.5)2+(320282.5)2+(170282.5)2+(400282.5)2+(240282.5)2S_x = (200-282.5)^2 + (440-282.5)^2 + (140-282.5)^2 + (350-282.5)^2 + (320-282.5)^2 + (170-282.5)^2 + (400-282.5)^2 + (240-282.5)^2
Sx=6806.25+24806.25+20306.25+4556.25+1406.25+12656.25+13806.25+1806.25=85150S_x = 6806.25 + 24806.25 + 20306.25 + 4556.25 + 1406.25 + 12656.25 + 13806.25 + 1806.25 = 85150
Sy=i=18(YiYˉ)2S_y = \sum_{i=1}^{8} (Y_i - \bar{Y})^2
Sy=(3025)2+(1225)2+(3625)2+(1825)2+(2425)2+(3225)2+(1625)2+(3225)2S_y = (30-25)^2 + (12-25)^2 + (36-25)^2 + (18-25)^2 + (24-25)^2 + (32-25)^2 + (16-25)^2 + (32-25)^2
Sy=25+169+121+49+1+49+81+49=544S_y = 25 + 169 + 121 + 49 + 1 + 49 + 81 + 49 = 544
Sxy=i=18(XiXˉ)(YiYˉ)S_{xy} = \sum_{i=1}^{8} (X_i - \bar{X})(Y_i - \bar{Y})
Sxy=(200282.5)(3025)+(440282.5)(1225)+(140282.5)(3625)+(350282.5)(1825)+(320282.5)(2425)+(170282.5)(3225)+(400282.5)(1625)+(240282.5)(3225)S_{xy} = (200-282.5)(30-25) + (440-282.5)(12-25) + (140-282.5)(36-25) + (350-282.5)(18-25) + (320-282.5)(24-25) + (170-282.5)(32-25) + (400-282.5)(16-25) + (240-282.5)(32-25)
Sxy=412.52047.51567.5472.537.5857.51057.5297.5=6750S_{xy} = -412.5 - 2047.5 - 1567.5 - 472.5 - 37.5 - 857.5 - 1057.5 - 297.5 = -6750
(3) 相関係数:
rxy=SxySxSyr_{xy} = \frac{S_{xy}}{\sqrt{S_x S_y}}
rxy=675085150×544=675046317600=67506805.703=0.9918r_{xy} = \frac{-6750}{\sqrt{85150 \times 544}} = \frac{-6750}{\sqrt{46317600}} = \frac{-6750}{6805.703} = -0.9918
(4) 回帰分析:
y=a+bxy = a + bx の回帰直線を求める。
b=SxySx=675085150=0.07927b = \frac{S_{xy}}{S_x} = \frac{-6750}{85150} = -0.07927
a=YˉbXˉ=25(0.07927)×282.5=25+22.394=47.394a = \bar{Y} - b\bar{X} = 25 - (-0.07927) \times 282.5 = 25 + 22.394 = 47.394
したがって、y=47.3940.07927xy = 47.394 - 0.07927x
(5) 回帰直線の図示:(省略) 散布図に上記の回帰直線を描画する。
(6) M駅からの距離が300mの住宅地Iの地価:
x=300x = 300 のとき
y=47.3940.07927×300=47.39423.781=23.613y = 47.394 - 0.07927 \times 300 = 47.394 - 23.781 = 23.613
(7) M駅からの距離が500mの住宅地Jの地価:
x=500x = 500 のとき
y=47.3940.07927×500=47.39439.635=7.759y = 47.394 - 0.07927 \times 500 = 47.394 - 39.635 = 7.759
(8) M駅からの距離が1000mの住宅地Kの地価:
x=1000x = 1000 のとき
y=47.3940.07927×1000=47.39479.27=31.876y = 47.394 - 0.07927 \times 1000 = 47.394 - 79.27 = -31.876
(9) M駅からの距離が2000mの住宅地Lの地価:
x=2000x = 2000 のとき
y=47.3940.07927×2000=47.394158.54=111.146y = 47.394 - 0.07927 \times 2000 = 47.394 - 158.54 = -111.146
(10) 推定の妥当性:
(6)と(7)は妥当な値と考えられる。しかし、(8)と(9)は地価が負の値になっており、妥当ではない。これは回帰モデルがデータの範囲外で適用されているためである。
特にM駅から遠い場所の地価を推定する場合、回帰モデルは単純な線形ではなく、より複雑なモデル(例えば、二次関数や指数関数など)を用いるべきである。また、データとして存在する距離範囲でモデルを構築し、その範囲外の予測は慎重に行うべきである。

3. 最終的な答え

(2) Sx=85150,Sy=544,Sxy=6750S_x = 85150, S_y = 544, S_{xy} = -6750
(3) rxy=0.9918r_{xy} = -0.9918
(4) y=47.3940.07927xy = 47.394 - 0.07927x
(6) 23.613万円/m^2
(7) 7.759万円/m^2
(8) -31.876万円/m^2
(9) -111.146万円/m^2
(10) (8)と(9)は妥当ではない。非線形モデルやデータ範囲内での推定を検討する。

「確率論・統計学」の関連問題

袋の中に白玉が5個、赤玉が4個入っている。P, Qの順に1個ずつ玉を取り出す。 (1) Pが取り出した玉を袋に戻してからQが取り出す時、2人とも赤玉を取り出す確率を求める。 (2) Pが取り出した玉を...

確率事象条件付き確率玉の取り出し
2025/6/6

$a$ は定数である。7つの値 $7, 9, 12, 22, 34, a-15, a+1$ からなるデータにおいて、中央値が16であるとき、$a$ の値を求め、さらにこのデータの四分位範囲を求める。

中央値四分位範囲データの分析
2025/6/6

度数分布表から、10人の成人男性の身長の平均値が取りうる値を四つの選択肢から選びます。

度数分布平均値統計
2025/6/5

白玉1個、赤玉2個、青玉4個の合計7個の玉がある。 (1) これらを机の上に円形に並べる方法は何通りあるか。 (2) これらで何通りの首飾りが作れるか。

順列組み合わせ円順列首飾り
2025/6/5

10本のくじの中に3本の当たりくじが入っている箱がある。引いたくじは元に戻す。 (8) この試行を3回繰り返したとき、3回とも当たりくじを引く確率を求める。 (9) この試行を4回繰り返したとき、2回...

確率反復試行組み合わせ確率の計算
2025/6/5

男子3人、女子5人の中から4人を選ぶとき、次の選び方は何通りあるか。 (2) 男子が少なくとも1人は含まれるように選ぶ。 (3) 特定のA、Bについて、Aは選ばれるが、Bは選ばれない。

組み合わせ場合の数組合せ
2025/6/5

ある農園で、かかしの数(X)、畑に来る動物の数(Y)、収穫できた果物の数(Z)のデータが与えられています。Xの標本分散は2、Yの標本分散は16、Zの標本分散は82、XとYの共分散は-5.6、YとZの共...

統計回帰分析共分散標本分散因果関係
2025/6/5

U教授の講義では以前は受講者の80%が単位を取得できていたが、最近は単位認定が厳しくなったという噂がある。今年度の単位取得者は100人中73人だった。帰無仮説「U教授は受講者の80%の単位を認定する」...

仮説検定二項分布正規分布左側検定有意水準
2025/6/5

与えられた統計量 $Z = \frac{\bar{p} - p_0}{\sqrt{p_0(1-p_0)/n}}$ を用いた仮説検定において、帰無仮説 $H_0: p = p_0$、対立仮説 $H_1:...

仮説検定統計量有意水準z検定両側検定標準正規分布
2025/6/5

母平均の検定において、帰無仮説 $H_0: \mu = 100$ が与えられたとき、両側検定における適切な対立仮説 $H_1$ を選択する問題です。

仮説検定母平均両側検定帰無仮説対立仮説
2025/6/5