分散の違いの検定 |
作成日:2004-08-24 最終更新日: |
2つのデータ群があるとき、分散に違いがあるかどうかを調べる。 AIC を用いる方法が簡便だが、F分布を利用した手法をここで述べる。
例:群1はあるWebページの1日あたりのアクセス数(10日間)のデータである。 このWebページを変更した後で、同様に1日あたりのアクセス数を9日間調べた。このときの 1日あたりのアクセス数のデータを群2とした。 そのときの結果は次の通りである。分散(バラツキ)に違いがあるといえるか
| No. | 群1 | 群2 |
|---|---|---|
| 日数ni | 10 | 9 |
| 平均μi | 745.0 | 753.9 |
| 平方和Si | 508 | 509 |
| 不偏分散ui | 56.4 | 63.6 |
ここで群iに関する平方和 `S_i` は下記の式で表される
`S_i = sum_k (x_i[k] - mu_i)^2`
ただし、`x_i[k] ( k = 1, ..., n_i )`は、 群 `i` に属する `k` 番めのデータを表す。
答:次の手順で求められる。
分散の違いに関する帰無仮説H0および対立仮説H1は次のとおりである。
`H_0 : sigma_1^2 = sigma_2^2`
`H_0 : sigma_1^2 != sigma_2^2`
次のように記法を定義する。
| 群1 | 群2 | |
|---|---|---|
| 標本数 | n1 | n2 |
| 平均 | μ1 | μ2 |
| 平方和 | S1 | S2 |
| 不偏分散 | u1 | u2 |
以下は、JavaScript で計算を行なう場合のフォームである。
初期状態では上記の値が入っている。「計算」のボタンを押すと、
F分布によりパーセント点を計算する。
本例の場合、
F0 = 1.13
この場合の確率は0.438、すなわち43%であり、5%検定では棄却できない。
よって、2群のアクセス数で分散(バラツキ)に差があるとはいえない。
その結果、平均値の差の検定ができる。これから先の話は、
平均値の差の検定参照。
注意
文献