(1) 散布図:横軸をM駅からの距離X、縦軸を地価Yとして、与えられたデータをプロットします。
(2) 偏差平方和、偏差積和の計算:
まず、XとYの平均値を計算します。
Xˉ=(200+440+140+350+320+170+400+240)/8=282.5 Yˉ=(30+12+36+18+24+32+16+32)/8=25 次に、偏差平方和 Sx, Sy と偏差積和 Sxy を計算します。 Sx=∑i=18(Xi−Xˉ)2 Sy=∑i=18(Yi−Yˉ)2 Sxy=∑i=18(Xi−Xˉ)(Yi−Yˉ) 具体的な計算は以下の通りです。
Sx=(200−282.5)2+(440−282.5)2+(140−282.5)2+(350−282.5)2+(320−282.5)2+(170−282.5)2+(400−282.5)2+(240−282.5)2 Sx=6806.25+24806.25+20306.25+4556.25+1406.25+12656.25+13806.25+1806.25=85550 Sy=(30−25)2+(12−25)2+(36−25)2+(18−25)2+(24−25)2+(32−25)2+(16−25)2+(32−25)2 Sy=25+169+121+49+1+49+81+49=544 Sxy=(200−282.5)(30−25)+(440−282.5)(12−25)+(140−282.5)(36−25)+(350−282.5)(18−25)+(320−282.5)(24−25)+(170−282.5)(32−25)+(400−282.5)(16−25)+(240−282.5)(32−25) Sxy=(−82.5)(5)+(157.5)(−13)+(−142.5)(11)+(67.5)(−7)+(37.5)(−1)+(−112.5)(7)+(117.5)(−9)+(−42.5)(7) Sxy=−412.5−2047.5−1567.5−472.5−37.5−787.5−1057.5−297.5=−6680 (3) 相関係数 rxy の計算: rxy=SxSySxy=85550×544−6680=46547200−6680=6822.55−6680≈−0.979 (4) 回帰直線のパラメータ推定:
b=SxSxy=85550−6680≈−0.078 a=Yˉ−bXˉ=25−(−0.078)×282.5=25+22.035≈47.035 よって、回帰直線は y=47.035−0.078x (5) 回帰直線の散布図への描画:
(1)で作成した散布図上に、上記で求めた回帰直線を描画します。
(6) M駅からの距離が300mの住宅地Iの地価:
y=47.035−0.078×300=47.035−23.4=23.635 約23.635万円/m²
(7) M駅からの距離が500mの住宅地Jの地価:
y=47.035−0.078×500=47.035−39=8.035 約8.035万円/m²
(8) M駅からの距離が1000mの住宅地Kの地価:
y=47.035−0.078×1000=47.035−78=−30.965 約-30.965万円/m²。地価が負の値になるのは不自然です。
(9) M駅からの距離が2000mの住宅地Lの地価:
y=47.035−0.078×2000=47.035−156=−108.965 約-108.965万円/m²。地価が負の値になるのは不自然です。
(10) 回帰モデルの妥当性:
(6)と(7)は妥当ですが、(8)と(9)は妥当ではありません。なぜなら、地価が負の値になるという現実にはあり得ない結果が出ているからです。
これは、回帰モデルが与えられたデータ範囲外の値を予測する際に、モデルの限界を超えていることを示しています。
改善策:
より広い範囲のデータ(M駅から遠い場所の地価データ)を追加して、回帰モデルを作り直すことが考えられます。
あるいは、直線回帰ではなく、より複雑な関数(例えば、二次関数や指数関数)を用いた回帰モデルを検討する必要があります。
距離と地価の関係が、ある距離を超えると単純な線形関係から外れる可能性があるため、非線形モデルの検討が有効です。