分散の違いの検定

作成日:2004-08-24
最終更新日:

2つのデータ群があるとき、分散に違いがあるかどうかを調べる。 AIC を用いる方法が簡便だが、F分布を利用した手法をここで述べる。

例:群1はあるWebページの1日あたりのアクセス数(10日間)のデータである。 このWebページを変更した後で、同様に1日あたりのアクセス数を9日間調べた。このときの 1日あたりのアクセス数のデータを群2とした。 そのときの結果は次の通りである。分散(バラツキ)に違いがあるといえるか

No.群1群2
日数ni109
平均μi745.0753.9
平方和Si508509
不偏分散ui56.463.6

ここで群iに関する平方和 `S_i` は下記の式で表される

`S_i = sum_k (x_i[k] - mu_i)^2`

ただし、`x_i[k] ( k = 1, ..., n_i )`は、 群 `i` に属する `k` 番めのデータを表す。

答:次の手順で求められる。

分散の違いに関する帰無仮説H0および対立仮説H1は次のとおりである。

`H_0 : sigma_1^2 = sigma_2^2`
`H_0 : sigma_1^2 != sigma_2^2`

次のように記法を定義する。

群1群2
標本数n1n2
平均μ1μ2
平方和S1S2
不偏分散u1u2

以下は、JavaScript で計算を行なう場合のフォームである。 初期状態では上記の値が入っている。「計算」のボタンを押すと、 F分布によりパーセント点を計算する。 本例の場合、
F0 = 1.13
この場合の確率は0.438、すなわち43%であり、5%検定では棄却できない。 よって、2群のアクセス数で分散(バラツキ)に差があるとはいえない。 その結果、平均値の差の検定ができる。これから先の話は、 平均値の差の検定参照。

注意

  1. 自由度φ1とφ2に対するF分布の1%点と5%点は、 表から求めるのが一般的だ。 しかし、本稿では表は用いず、直接確率を計算するようにした。 F分布では自由度がφ1とφ2の2次元であるため、 表の転記が面倒になるためである。
  2. 上記に関連して、F分布の1%点と5%点を近似式で求める方法も文献4により考案されている。 しかし、文献4の近似式では正しい値が得られなかったため、この方法の採用は断念した。

群1 群2
標本数 n1 n2
平均 μ1 μ2
平方和 S1 S2
不偏分散 V1 V2
分散比F0
確率p

文献

  1. 日科技連QCリサーチ・グループ編 初等品質管理テキスト 日科技連
  2. 小針晛宏 確率統計入門 岩波書店
  3. 奥村ほか Javaによるアルゴリズム入門 技術評論社(F分布の計算、JavaScriptに移植)
  4. 鈴木義一郎 現代統計学小辞典 講談社ブルーバックス()

まりんきょ学問所統計活用術 ≫ 分散の違いの検定

MARUYAMA Satosi