2つのデータ群があるとき、平均値に差があるかどうかを調べる。 AIC を用いる方法が簡便だが、 これは、2 つのデータ群が等分散である仮定を要しないという意味で、 従来型の平均値の差の検定より優れている。
例 : 群 1 はある WEB ページの 1 日あたりのアクセス数を 7 日間にわたって調べたデータである。 この WEB ページを更新した後で、同様に 1 日あたりのアクセス数を 5 日間調べた。このときの 1 日あたりのアクセス数のデータを群2とした。 そのときの結果は次の通りである。アクセス数は変わったと言えるか。 5 % 水準で検定せよ。
No. | 日数 | データ |
---|---|---|
群 1 | 7 | 45, 30, 75, 45, 60, 70, 60 |
群 2 | 5 | 60, 90, 45, 70, 80 |
答 : 平均値の差に関する帰無仮説 H0 および対立仮説 H1 は次のとおりである。 ここで群iに関する平均を `mu_i` とする。
H0:μ1 =μ2
H1:μ1 ≠ μ2
これから述べる方法で Welch の t 検定を行なう。次のように記法を定義する。
群1 | 群2 | |
---|---|---|
標本サイズ | n1 | n2 |
平均 | μ1 | μ2 |
不偏分散 | s1 | s2 |
統計量 `t` を次で定義する。
`t = (mu_1 - mu_2)/sqrt(s_1^2/n_1 + s_2^2/n_2)`
また、この検定において自由度 `nu` を次で定義する。
`nu = (s_1^2/n_1 + s_2^2/n_2)^2 / (s_1^4/(n_1^2(n_1-1)) + s_2^4/(n_2^2(n_2-1)) `
この `t` と `nu` から `p` 値を求める。この `p` 値から 5 % 水準あるいは 1 % 水準で棄却できるかできないかを判断することができる。
以下は、JavaScript で計算を行なう場合のフォームである。 初期状態では上記の値が入っている。「計算」のボタンを押すと、 各種データを計算する。この例では `p=0.0957cdots` となり、両側 5 % の点 `p = 0.025` より小さい値である。 すなわち、95 % 信頼区間外の値である。よって、帰無仮説は棄却される。したがって、アクセス数は変わったと判断される。
Welch の t 検定では、自由度は一般に非整数である。このときの `t` 分布を求めるには、適当な整数自由度に丸めて数表を使うか、 非整数の自由度のまま計算するか、いずれかで対応する。 このページでは、非整数の自由度で t 分布を計算する方法を使っている。
ASCIIMath を使っている。