平均値の差の検定

作成日:2004-08-24
最終更新日:

2つのデータ群があるとき、平均値に差があるかどうかを調べる。 AIC を用いる方法が簡便だが、t分布およびF分布を利用した手法をここで述べる。

例:群1はあるWebページの1日あたりのアクセス数(10日間)のデータである。 このWebページを変更した後で、同様に1日あたりのアクセス数を9日間調べた。このときの 1日あたりのアクセス数のデータを群2とした。 そのときの結果は次の通りである。アクセスは変わったと言えるか。 5%水準で検定せよ。

No.群1群2
日数ni109
平均μi745.0753.9
平方和Si508509
不偏分散ui56.463.6

ここで群iに関する平方和Si とは、群iに属するk番めのデータをxi[k](k = 1 .. ni)とすれば次の式で表される

`S_i = sum_k (x_i[k] - mu_i)^2 `

答:次の手順で求められる。

  1. これまでの経験があれば、2群の間で分散に大きな差がないことを確かめる。 経験がない場合は、分散の差の検定を行ない、2群の間で分散に大きな差がないことを確かめる。
  2. 分散で大きな差がなければ、これから述べる方法による平均値の差の検定を行なう。

平均値の差に関する帰無仮説H0および対立仮説H1は次のとおりである。

H0:μ1 =μ2
H1:μ1 ≠ μ2

この場合は、既に2群の間で分散に大きな差はないことがわかっている 分散の違いの検定で計算すればよい。 ここでは既に上記の検定は終わっているものして、 これから述べる方法で平均値の差の検定を行なう。次のように記法を定義する。

群1群2
標本数n1n2
平均μ1μ2
平方和S1S2
不偏分散u1u2

プールした不偏分散uは次で定義される。

u = (S1 + S2) / (n1 + n2 + 2)

この S を用いて、次のt0を計算する。

t0 = |x~1 - x~2|/ C
ただし、
`C = S sqrt(1/n_1 + 1/n_2)`

このt0がt分布の5%点を上回っていれば、有意水準5%で有意差があると判定する。 t0がt分布の1%点を上回っていれば、有意水準1%で有意差があると判定する。

以下は、JavaScript で計算を行なう場合のフォームである。 初期状態では上記の値が入っている。「計算」のボタンを押すと、 t分布の1%点と5%点を計算する。 本例の場合、t0 = 2.504 は5%点 の値 2.110 より大きい。従って、有意水準5%で平均値の差は有意である。

注意

  1. 自由度φに対するt分布の1%点と5%点は次のように計算している。 まず1〜30までは直接表から検索する。 31〜100までは、30から10おき、100までのt分布の1%点と5%点を線形補間している。 101以上は、100,120,∞におけるt分布の1%点と5%点を分数式で補間している。

群1 群2
標本数 n1 n2
平均 μ1 μ2
平方和 S1 S2
不偏分散V
推定偏差σe
自由度φ
t0
1%点
5%点

表記

ASCIIMath を使っている。

文献

  1. 日科技連QCリサーチ・グループ編 初等品質管理テキスト 日科技連
  2. 小針晛宏 確率統計入門 岩波書店

まりんきょ学問所統計活用術 ≫ 平均値の差の検定

MARUYAMA Satosi