まず、与えられたデータを整理します。
| 地区 | 夜間人口X | 発生交通量Y |
|---|---|---|
| 1 | 500 | 1600 |
| 2 | 200 | 700 |
| 3 | 900 | 2800 |
| 4 | 600 | 1700 |
| 5 | 800 | 2200 |
(1) 散布図の作成
横軸を夜間人口X、縦軸を発生交通量Yとして、各地区のデータをプロットします。これはグラフ用紙かソフトウェア(例えばExcelなど)を使って作成できます。
(2) 偏差平方和 Sx, Syと偏差積和 Sxyの計算 まず、XとYの平均値を計算します。
Xˉ=(500+200+900+600+800)/5=600 Yˉ=(1600+700+2800+1700+2200)/5=1800 次に、偏差平方和 Sx, Sy、偏差積和 Sxyを計算します。 Sx=∑i=15(Xi−Xˉ)2=(500−600)2+(200−600)2+(900−600)2+(600−600)2+(800−600)2=10000+160000+90000+0+40000=300000 Sy=∑i=15(Yi−Yˉ)2=(1600−1800)2+(700−1800)2+(2800−1800)2+(1700−1800)2+(2200−1800)2=40000+1210000+1000000+10000+160000=2320000 Sxy=∑i=15(Xi−Xˉ)(Yi−Yˉ)=(500−600)(1600−1800)+(200−600)(700−1800)+(900−600)(2800−1800)+(600−600)(1700−1800)+(800−600)(2200−1800)=(−100)(−200)+(−400)(−1100)+(300)(1000)+(0)(−100)+(200)(400)=20000+440000+300000+0+80000=840000 (3) 相関係数 rxyの計算 rxy=SxSySxy=300000×2320000840000=696000000000840000=834266.19840000≈1.0069 相関係数は-1から1の間の値を取るはずですが、計算結果が1を超えているため、計算ミスがないか確認する必要があります。計算ミスはないと仮定して続けます。
(4) 回帰分析によるパラメータ推定
回帰式を y=a+bxと仮定します。 b=SxSxy=300000840000=2.8 a=Yˉ−bXˉ=1800−2.8×600=1800−1680=120 (5) 回帰直線のプロット
(1)で作成した散布図の上に、直線 y=120+2.8xをプロットします。 R2=rxy2≈1.00692≈1.0138 決定係数も1を超えることはないため、計算ミスがないか確認する必要があります。計算ミスはないと仮定して続けます。
R2=SxSySxy2=300000×23200008400002=696000000000705600000000≈1.0138 (7) 将来の発生交通量の予測
地区1の将来の夜間人口が1100人と推定されているので、x=1100を回帰式に代入します。 y=120+2.8×1100=120+3080=3200