あるデータの中に1つ誤ったデータが含まれており、正しい数値に基づいた平均値と中央値がともに29であることがわかっている。誤ったデータを特定し、正しい数値に修正した後のデータの分散が修正前のデータの分散と比べてどうなるかを答える問題です。
2025/4/4
1. 問題の内容
あるデータの中に1つ誤ったデータが含まれており、正しい数値に基づいた平均値と中央値がともに29であることがわかっている。誤ったデータを特定し、正しい数値に修正した後のデータの分散が修正前のデータの分散と比べてどうなるかを答える問題です。
2. 解き方の手順
この問題では、元のデータの具体的な値が与えられていないため、具体的な数値を使って考えることはできません。しかし、平均値と中央値が等しいという条件から、誤ったデータが平均値(および中央値)から大きくずれていると推測できます。
まず、データ数が不明なので、データ数をとします。正しいデータの合計を、誤ったデータを、正しいデータをとすると、正しいデータの平均は となります。
これは、 を意味します。また、誤ったデータを含んだ元のデータの平均をとすると、なので、 ということになります。 .
中央値も29であることから、データの分布は29を中心に比較的対称であることが予想されます。誤ったデータを正しいデータに修正することで、全体のデータのばらつきがどのように変化するかを考えます。
もしが29から大きく離れた値である場合、を(29に近い値)に修正すると、データのばらつきは小さくなる傾向にあります。つまり、分散は小さくなります。
一方、が元のデータの中で最大値または最小値であり、その値を修正することで、データの最大値と最小値の差が小さくなる場合、分散は小さくなります。
もし修正後のデータが平均値付近に集まる場合、分散は修正前より小さくなります。分散はデータのばらつきを表す指標なので、29から大きく離れたデータを29に近い値に修正すると、ばらつきは小さくなる、つまり分散は小さくなる、と予想できます。
3. 最終的な答え
誤っているデータは、平均値(および中央値)から大きくずれた値であると推測されます。また、このとき、正しい数値に修正した後のデータの分散は、修正する前のデータの分散より小さい。
ただし、最後の□には、「小さい」を入れなさい。