データ:
住宅地 | A | B | C | D | E | F | G | H |
------- | --- | --- | --- | --- | --- | --- | --- | --- |
X [m] | 200 | 440 | 140 | 350 | 320 | 170 | 400 | 240 |
Y [万円/m^2] | 30 | 12 | 36 | 18 | 24 | 32 | 16 | 32 |
(1) 散布図:
X軸をM駅からの距離、Y軸を地価として、上記データ点をプロットする。 (省略)
(2) 偏差平方和と偏差積和:
まず、XとYの平均値を計算する。
Xˉ=(200+440+140+350+320+170+400+240)/8=282.5 Yˉ=(30+12+36+18+24+32+16+32)/8=25 次に、偏差平方和 Sx,Sy と偏差積和 Sxy を計算する。 Sx=∑i=18(Xi−Xˉ)2 Sx=(200−282.5)2+(440−282.5)2+(140−282.5)2+(350−282.5)2+(320−282.5)2+(170−282.5)2+(400−282.5)2+(240−282.5)2 Sx=6806.25+24806.25+20306.25+4556.25+1406.25+12656.25+13806.25+1806.25=85150 Sy=∑i=18(Yi−Yˉ)2 Sy=(30−25)2+(12−25)2+(36−25)2+(18−25)2+(24−25)2+(32−25)2+(16−25)2+(32−25)2 Sy=25+169+121+49+1+49+81+49=544 Sxy=∑i=18(Xi−Xˉ)(Yi−Yˉ) Sxy=(200−282.5)(30−25)+(440−282.5)(12−25)+(140−282.5)(36−25)+(350−282.5)(18−25)+(320−282.5)(24−25)+(170−282.5)(32−25)+(400−282.5)(16−25)+(240−282.5)(32−25) Sxy=−412.5−2047.5−1567.5−472.5−37.5−857.5−1057.5−297.5=−6750 (3) 相関係数:
rxy=SxSySxy rxy=85150×544−6750=46317600−6750=6805.703−6750=−0.9918 (4) 回帰分析:
y=a+bx の回帰直線を求める。 b=SxSxy=85150−6750=−0.07927 a=Yˉ−bXˉ=25−(−0.07927)×282.5=25+22.394=47.394 したがって、y=47.394−0.07927x (5) 回帰直線の図示:(省略) 散布図に上記の回帰直線を描画する。
(6) M駅からの距離が300mの住宅地Iの地価:
y=47.394−0.07927×300=47.394−23.781=23.613 (7) M駅からの距離が500mの住宅地Jの地価:
y=47.394−0.07927×500=47.394−39.635=7.759 (8) M駅からの距離が1000mの住宅地Kの地価:
y=47.394−0.07927×1000=47.394−79.27=−31.876 (9) M駅からの距離が2000mの住宅地Lの地価:
y=47.394−0.07927×2000=47.394−158.54=−111.146 (10) 推定の妥当性:
(6)と(7)は妥当な値と考えられる。しかし、(8)と(9)は地価が負の値になっており、妥当ではない。これは回帰モデルがデータの範囲外で適用されているためである。
特にM駅から遠い場所の地価を推定する場合、回帰モデルは単純な線形ではなく、より複雑なモデル(例えば、二次関数や指数関数など)を用いるべきである。また、データとして存在する距離範囲でモデルを構築し、その範囲外の予測は慎重に行うべきである。