以下の統計学に関する用語の違いを簡潔に説明する。 (1) 記述統計学と推測統計学 (2) 数学的確率と統計的確率・経験的確率 (3) 平均値と中央値 (4) 相関関係と因果関係 (5) 説明変数と目的変数(被説明変数)
2025/6/5
1. 問題の内容
以下の統計学に関する用語の違いを簡潔に説明する。
(1) 記述統計学と推測統計学
(2) 数学的確率と統計的確率・経験的確率
(3) 平均値と中央値
(4) 相関関係と因果関係
(5) 説明変数と目的変数(被説明変数)
2. 解き方の手順
各用語について、定義や目的、利用場面の違いを説明する。
(1) 記述統計学と推測統計学
* **記述統計学:** 収集したデータの特徴を、平均、分散、グラフなどを用いて要約し、記述する。データの全体像を把握することが目的。
* **推測統計学:** 標本データに基づいて、母集団の性質を推定する。例えば、世論調査の結果から、国民全体の意見を推測するなど。仮説検定や区間推定などが含まれる。
(2) 数学的確率と統計的確率・経験的確率
* **数学的確率:** 理論的に計算される確率。例えば、コインを投げたときに表が出る確率がであるなど、前提条件が明確で、演繹的に導き出される。
* **統計的確率(経験的確率):** 過去のデータや実験結果から推定される確率。例えば、ある工場で製造された製品の不良率を、過去の製造実績から推定するなど。試行回数を増やすことで精度が向上する。
(3) 平均値と中央値
* **平均値:** データの総和をデータ数で割った値。
外れ値の影響を受けやすい。
* **中央値:** データを大きさの順に並べたとき、中央に位置する値。データ数が偶数の場合は、中央の2つの値の平均を取る。外れ値の影響を受けにくい。
(4) 相関関係と因果関係
* **相関関係:** 2つの変数の間に見られる関係。一方が増加すると他方も増加(正の相関)、または減少(負の相関)する傾向がある場合、相関関係があるという。相関関係があるからといって、必ずしも因果関係があるとは限らない。
* **因果関係:** 一方の変数が他方の変数の原因となっている関係。例えば、喫煙が肺がんの原因となるなど。因果関係を証明するには、相関関係があるだけでなく、他の要因の影響を排除する必要がある。
(5) 説明変数と目的変数(被説明変数)
* **説明変数:** ある結果(目的変数)を説明するために用いられる変数。独立変数とも呼ばれる。
* **目的変数(被説明変数):** 説明変数によって説明される変数。従属変数とも呼ばれる。
例えば、広告費(説明変数)と売上(目的変数)の関係を分析する場合、広告費が増加すると売上が増加する、といった関係を調べることができる。
3. 最終的な答え
(1) 記述統計学はデータの特徴を要約し、推測統計学は標本データから母集団の性質を推定する。
(2) 数学的確率は理論的に計算される確率、統計的確率・経験的確率は過去のデータや実験結果から推定される確率。
(3) 平均値はデータの総和をデータ数で割った値、中央値はデータを大きさの順に並べたときの中央に位置する値。
(4) 相関関係は2つの変数の間に見られる関係、因果関係は一方の変数が他方の変数の原因となっている関係。
(5) 説明変数はある結果を説明するために用いられる変数、目的変数は説明変数によって説明される変数。