平均値の差の検定 |
作成日:2004-08-24 最終更新日: |
2つのデータ群があるとき、平均値に差があるかどうかを調べる。 AIC を用いる方法が簡便だが、t分布およびF分布を利用した手法をここで述べる。
例:群1はあるWebページの1日あたりのアクセス数(10日間)のデータである。 このWebページを変更した後で、同様に1日あたりのアクセス数を9日間調べた。このときの 1日あたりのアクセス数のデータを群2とした。 そのときの結果は次の通りである。アクセスは変わったと言えるか。 5%水準で検定せよ。
| No. | 群1 | 群2 |
|---|---|---|
| 日数ni | 10 | 9 |
| 平均μi | 745.0 | 753.9 |
| 平方和Si | 508 | 509 |
| 不偏分散ui | 56.4 | 63.6 |
ここで群iに関する平方和Si とは、群iに属するk番めのデータをxi[k](k = 1 .. ni)とすれば次の式で表される
`S_i = sum_k (x_i[k] - mu_i)^2 `
答:次の手順で求められる。
平均値の差に関する帰無仮説H0および対立仮説H1は次のとおりである。
H0:μ1 =μ2
H1:μ1 ≠ μ2
この場合は、既に2群の間で分散に大きな差はないことがわかっている 分散の違いの検定で計算すればよい。 ここでは既に上記の検定は終わっているものして、 これから述べる方法で平均値の差の検定を行なう。次のように記法を定義する。
| 群1 | 群2 | |
|---|---|---|
| 標本数 | n1 | n2 |
| 平均 | μ1 | μ2 |
| 平方和 | S1 | S2 |
| 不偏分散 | u1 | u2 |
プールした不偏分散uは次で定義される。
u = (S1 + S2) / (n1 + n2 + 2)
この S を用いて、次のt0を計算する。
t0 = |x~1 - x~2|/ C
ただし、
`C = S sqrt(1/n_1 + 1/n_2)`
このt0がt分布の5%点を上回っていれば、有意水準5%で有意差があると判定する。 t0がt分布の1%点を上回っていれば、有意水準1%で有意差があると判定する。
以下は、JavaScript で計算を行なう場合のフォームである。 初期状態では上記の値が入っている。「計算」のボタンを押すと、 t分布の1%点と5%点を計算する。 本例の場合、t0 = 2.504 は5%点 の値 2.110 より大きい。従って、有意水準5%で平均値の差は有意である。
注意
ASCIIMath を使っている。