(1) 散布図の作成: 横軸をM駅からの距離X、縦軸を地価Yとして、与えられたデータをプロットします。
(2) 偏差平方和と偏差積和の計算:
まず、XとYの平均値を計算します。
Xˉ=8200+440+140+350+320+170+400+240=82260=282.5 Yˉ=830+12+36+18+24+32+16+32=8200=25 次に、各データ点について偏差を計算し、偏差平方和と偏差積和を求めます。
Sx=∑i=18(Xi−Xˉ)2=(200−282.5)2+(440−282.5)2+...+(240−282.5)2=79075 Sy=∑i=18(Yi−Yˉ)2=(30−25)2+(12−25)2+...+(32−25)2=758 Sxy=∑i=18(Xi−Xˉ)(Yi−Yˉ)=(200−282.5)(30−25)+(440−282.5)(12−25)+...+(240−282.5)(32−25)=−6365 (3) 相関係数の計算:
rxy=SxSySxy=79075×758−6365≈−0.821 (4) 回帰直線のパラメータ推定:
回帰直線の式を y=a+bx とします。 b=SxSxy=79075−6365≈−0.0805 a=Yˉ−bXˉ=25−(−0.0805)×282.5≈47.7 (5) 回帰直線の描画:
(1)で作成した散布図に、求めた回帰直線 y=47.7−0.0805x を描きます。 (6)~(9) 回帰モデルを用いた地価の推定:
求めた回帰直線に、それぞれの距離を代入して地価を推定します。
住宅地I (300m): y=47.7−0.0805×300≈23.55 (万円/m^2) 住宅地J (500m): y=47.7−0.0805×500≈7.45 (万円/m^2) 住宅地K (1000m): y=47.7−0.0805×1000≈−32.8 (万円/m^2) 住宅地L (2000m): y=47.7−0.0805×2000≈−113.3 (万円/m^2) (10) モデルの妥当性の評価とその改善策の提案:
住宅地K, Lの地価が負の値になっているため、この回帰モデルを遠方まで外挿するのは妥当ではありません。
このモデルは、M駅近辺の地価傾向を反映していると考えられますが、距離が大きくなるにつれて、他の要因(例えば、公共施設の有無、自然環境など)が地価に影響を与えるようになるため、単純な線形回帰では予測精度が低下します。
改善策としては、以下のような方法が考えられます。
* 非線形回帰モデルの利用(例えば、二次関数や指数関数など)。
* 他の説明変数の追加(例えば、最寄りのバス停からの距離、公園の面積など)。
* M駅からの距離がある程度以上離れたデータを除外して、モデルを再構築する。