2人の従業員が目視で製品の異常を検知した結果が表にまとめられています。この表をもとに、(1) カイ二乗統計量、(2) 単純一致係数、(3) Jaccard係数をそれぞれ計算します。

確率論・統計学カイ二乗検定統計的検定相関単純一致係数Jaccard係数
2025/6/14

1. 問題の内容

2人の従業員が目視で製品の異常を検知した結果が表にまとめられています。この表をもとに、(1) カイ二乗統計量、(2) 単純一致係数、(3) Jaccard係数をそれぞれ計算します。

2. 解き方の手順

(1) カイ二乗統計量
カイ二乗統計量は、観測度数と期待度数のずれを表す指標です。期待度数は、各行と各列の合計から計算します。
まず、観測度数と期待度数を以下の表のように整理します。
| | 従業員B:異常あり | 従業員B:異常なし | 合計 |
|----------|-----------------|-----------------|------|
| 従業員A:異常あり | 85 | 15 | 100 |
| 従業員A:異常なし | 20 | 80 | 100 |
| 合計 | 105 | 95 | 200 |
期待度数は、
- (従業員A:異常あり, 従業員B:異常あり) : 100105/200=52.5100 * 105 / 200 = 52.5
- (従業員A:異常あり, 従業員B:異常なし) : 10095/200=47.5100 * 95 / 200 = 47.5
- (従業員A:異常なし, 従業員B:異常あり) : 100105/200=52.5100 * 105 / 200 = 52.5
- (従業員A:異常なし, 従業員B:異常なし) : 10095/200=47.5100 * 95 / 200 = 47.5
カイ二乗統計量 χ2\chi^2 は以下の式で計算されます。
χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}
ここで、OiO_i は観測度数、EiE_i は期待度数です。
χ2=(8552.5)252.5+(1547.5)247.5+(2052.5)252.5+(8047.5)247.5\chi^2 = \frac{(85-52.5)^2}{52.5} + \frac{(15-47.5)^2}{47.5} + \frac{(20-52.5)^2}{52.5} + \frac{(80-47.5)^2}{47.5}
χ2=32.5252.5+(32.5)247.5+(32.5)252.5+32.5247.5\chi^2 = \frac{32.5^2}{52.5} + \frac{(-32.5)^2}{47.5} + \frac{(-32.5)^2}{52.5} + \frac{32.5^2}{47.5}
χ2=1056.2552.5+1056.2547.5+1056.2552.5+1056.2547.5\chi^2 = \frac{1056.25}{52.5} + \frac{1056.25}{47.5} + \frac{1056.25}{52.5} + \frac{1056.25}{47.5}
χ2=20.12+22.24+20.12+22.24=84.72\chi^2 = 20.12 + 22.24 + 20.12 + 22.24 = 84.72
(2) 単純一致係数
単純一致係数は、2人の評価が一致した割合を示す指標です。
単純一致係数 = (一致した数) / (全体の数)
一致した数 = (従業員A:異常あり, 従業員B:異常あり) + (従業員A:異常なし, 従業員B:異常なし) = 85 + 80 = 165
全体の数 = 200
単純一致係数 = 165 / 200 = 0.825
(3) Jaccard係数
Jaccard係数は、2つの集合の共通部分の要素数を、和集合の要素数で割ったものです。この問題では、両方の従業員が異常ありと判断した場合の割合を、少なくともどちらかの従業員が異常ありと判断した場合の割合で割ったものと解釈できます。
Jaccard係数 = (両方異常あり) / (少なくともどちらか異常あり)
両方異常あり = 85
少なくともどちらか異常あり = (従業員A:異常あり) + (従業員A:異常なし, 従業員B:異常あり) = 100 + 20 = 120
あるいは、(従業員B:異常あり) + (従業員B:異常なし、従業員A:異常あり) = 105 + 15 = 120
または、全部 - (従業員A:異常なし, 従業員B:異常なし) = 200 - 80 = 120
Jaccard係数 = 85 / 120 = 0.708333... ≒ 0.708

3. 最終的な答え

(1) カイ二乗統計量: 84.72
(2) 単純一致係数: 0.825
(3) Jaccard係数: 0.708

「確率論・統計学」の関連問題

検定において、調べたい確率変数の出現確率が、基準の確率よりもどのような場合に、最初に立てた仮説を棄却するかという問題です。選択肢の中から適切なものを選びます。

統計的仮説検定p値有意水準帰無仮説
2025/6/14

問題文は「検定で最初に立てる仮説を棄却するか、採用するかの基準を何といいますか?」です。選択肢として、棄却水準、検定水準、有意水準、帰無水準があります。

仮説検定有意水準帰無仮説棄却
2025/6/14

「得られる結果の方向性を仮定しないで実施される検定を何といいますか?」という問題で、選択肢の中から正しい答えを選ぶ問題です。選択肢は、両側検定、片側検定、予測検定、有意検定です。

統計的検定仮説検定両側検定片側検定
2025/6/14

検定の手順において、最初に母集団について何を定めるか、そして、その定めたもののもとで確率変数を調べ、それらの何を作成するかを問う問題です。空欄(1)と(2)に当てはまる語の組み合わせを選択肢から選びま...

統計的仮説検定帰無仮説確率分布検定統計量
2025/6/14

ある定食で、ご飯2種類から1つ、大皿料理5種類から2つ、小皿料理4種類から2つをそれぞれ選ぶときの組み合わせの総数を求める問題です。

組み合わせ順列と組み合わせ
2025/6/14

白玉1個、赤玉4個、青玉6個で環状の首飾りを作るとき、作り方は全部で何通りあるかを求める問題です。

順列組合せ円順列対称性首飾り
2025/6/14

8人(男性5人、女性3人)の班の中から、くじ引きで班長と副班長をそれぞれ1名ずつ選ぶとき、班長も副班長も男性である確率を求める問題です。

確率組み合わせ条件付き確率
2025/6/14

マンションXとマンションYの世帯人数に関する表が与えられています。 問1:マンションXの平均世帯人数を小数点以下第3位を四捨五入して求めます。 問2:マンションYの平均世帯人数、マンションXで3人以上...

平均割合統計
2025/6/14

ある野球チームの8試合の得点数 $x$ と三振数 $y$ のデータが与えられている。$x$ と $y$ の平均値 $\bar{x}$, $\bar{y}$ を求め、表中の空欄を埋め、 $x$ の標準偏...

統計相関関係平均標準偏差共分散相関係数
2025/6/14

ある飲食店が新商品X, Yを販売するにあたり、それぞれ5人のモニターに10点満点で採点してもらった。Xの採点$x$とYの採点$y$が表で与えられている。$x, y$のデータの平均値、分散、標準偏差をそ...

平均値分散標準偏差データ解析統計
2025/6/14