## 問題の要約
TさんはM駅の近くに家を建てたいと考え、8箇所の住宅地についてM駅からの距離X(単位:m)と地価Y(単位:万円/m²)を調査しました。そのデータを用いて、散布図の作成、偏差平方和・偏差積和・相関係数の計算、回帰分析、地価の推定などを行い、回帰モデルの妥当性について考察します。
## 解き方の手順
2.(1) 横軸をX(M駅からの距離)、縦軸をY(地価)として、与えられたデータをプロットして散布図を作成します。
2.(2) 偏差平方和 Sx, Sy と偏差積和 Sxy は以下の式で計算できます。 まず、XとYの平均 Xˉ, Yˉを計算します。 Xˉ=8200+440+140+350+320+170+400+240=82260=282.5 Yˉ=830+12+36+18+24+32+16+32=8200=25 次に、Sx, Sy, Sxyを計算します。 Sx=∑i=18(Xi−Xˉ)2=(200−282.5)2+(440−282.5)2+(140−282.5)2+(350−282.5)2+(320−282.5)2+(170−282.5)2+(400−282.5)2+(240−282.5)2=68062.5 Sy=∑i=18(Yi−Yˉ)2=(30−25)2+(12−25)2+(36−25)2+(18−25)2+(24−25)2+(32−25)2+(16−25)2+(32−25)2=426 Sxy=∑i=18(Xi−Xˉ)(Yi−Yˉ)=(200−282.5)(30−25)+(440−282.5)(12−25)+(140−282.5)(36−25)+(350−282.5)(18−25)+(320−282.5)(24−25)+(170−282.5)(32−25)+(400−282.5)(16−25)+(240−282.5)(32−25)=−14335 2.(3) 相関係数 rxy は以下の式で計算できます。 rxy=SxSySxy=68062.5×426−14335=29003612.5−14335=5385.5−14335≈−0.266 2.(4) 回帰式 y=a+bx を仮定し、パラメータa, bを求めます。 b=SxSxy=68062.5−14335≈−0.2106 a=Yˉ−bXˉ=25−(−0.2106)×282.5=25+59.49=84.49 したがって、回帰式は y=84.49−0.2106x となります。 2.(5) (1)で作成した散布図に、直線 y=84.49−0.2106x を描きます。 2.(6) M駅からの距離が300mのときの地価の推定値は、回帰式にx=300を代入して求めます。 y=84.49−0.2106×300=84.49−63.18=21.31 (万円/m²) 2.(7) M駅からの距離が500mのときの地価の推定値は、回帰式にx=500を代入して求めます。 y=84.49−0.2106×500=84.49−105.3=−20.81 (万円/m²) 2.(8) M駅からの距離が1000mのときの地価の推定値は、回帰式にx=1000を代入して求めます。 y=84.49−0.2106×1000=84.49−210.6=−126.11 (万円/m²) 2.(9) M駅からの距離が2000mのときの地価の推定値は、回帰式にx=2000を代入して求めます。 y=84.49−0.2106×2000=84.49−421.2=−336.71 (万円/m²) 2.(10) (6), (7), (8), (9)で求めた地価の推定値について、考察します。
(7), (8), (9)では地価が負の値になっているため、妥当ではありません。これは、回帰モデルがデータの範囲外で適用されているためです。
回帰モデルを改善するためには、より多くのデータを用いて、より複雑なモデル(例えば、二次関数や指数関数)を検討する必要があります。また、M駅からの距離以外の要因(例えば、周辺環境、土地の形状など)も考慮に入れる必要があります。
3.(1) 記述統計学は、データの要約や特徴を記述することに焦点を当てます(平均、標準偏差など)。一方、推測統計学は、標本データから母集団に関する推論を行うことに焦点を当てます。
3.(2) 数学的確率は、理論的なモデルに基づいて計算される確率です(コインを投げるなど)。統計的確率・経験的確率は、過去のデータや経験に基づいて推定される確率です。
3.(3) 平均値は、データの総和をデータの個数で割った値です。中央値は、データを大きさ順に並べたときの中央に位置する値です。
3.(4) 相関関係は、2つの変数の間に何らかの関係があることを示しますが、一方が他方の原因であるとは限りません。因果関係は、一方が他方の原因であることを示します。
3.(5) 説明変数は、他の変数を説明するために用いられる変数です。目的変数(被説明変数)は、説明変数によって説明される変数です。
## 最終的な答え
2.(2) Sx=68062.5, Sy=426, Sxy=−14335 2.(3) rxy≈−0.266 2.(4) y=84.49−0.2106x 2.(6) 21.31万円/m²
2.(7) -20.81万円/m²
2.(8) -126.11万円/m²
2.(9) -336.71万円/m²