Welch の t 検定

作成日 : 2022-07-22
最終更新日 :

2つのデータ群があるとき、平均値に差があるかどうかを調べる。 AIC を用いる方法が簡便だが、 これは、2 つのデータ群が等分散である仮定を要しないという意味で、 従来型の平均値の差の検定より優れている。

例 : 群 1 はある WEB ページの 1 日あたりのアクセス数を 7 日間にわたって調べたデータである。 この WEB ページを更新した後で、同様に 1 日あたりのアクセス数を 5 日間調べた。このときの 1 日あたりのアクセス数のデータを群2とした。 そのときの結果は次の通りである。アクセス数は変わったと言えるか。 5 % 水準で検定せよ。

No.日数データ
群 1745, 30, 75, 45, 60, 70, 60
群 2560, 90, 45, 70, 80

答 : 平均値の差に関する帰無仮説 H0 および対立仮説 H1 は次のとおりである。 ここで群iに関する平均を `mu_i` とする。

H0:μ1 =μ2
H1:μ1 ≠ μ2

これから述べる方法で Welch の t 検定を行なう。次のように記法を定義する。

群1群2
標本サイズn1n2
平均μ1μ2
不偏分散s1s2

統計量 `t` を次で定義する。

`t = (mu_1 - mu_2)/sqrt(s_1^2/n_1 + s_2^2/n_2)`

また、この検定において自由度 `nu` を次で定義する。

`nu = (s_1^2/n_1 + s_2^2/n_2)^2 / (s_1^4/(n_1^2(n_1-1)) + s_2^4/(n_2^2(n_2-1)) `

この `t` と `nu` から `p` 値を求める。この `p` 値から 5 % 水準あるいは 1 % 水準で棄却できるかできないかを判断することができる。

以下は、JavaScript で計算を行なう場合のフォームである。 初期状態では上記の値が入っている。「計算」のボタンを押すと、 各種データを計算する。この例では `p=0.0957cdots` となり、両側 5 % の点 `p = 0.025` より小さい値である。 すなわち、95 % 信頼区間外の値である。よって、帰無仮説は棄却される。したがって、アクセス数は変わったと判断される。


群番号 データ
1
2

各群に関する統計量

群1 群2
標本サイズ n1 n2
平均 μ1 μ2
分散 s1 s2

全体に関する統計量

標本平均の差 d
統計量 t
自由度 `nu`
P 値

付記

Welch の t 検定では、自由度は一般に非整数である。このときの `t` 分布を求めるには、適当な整数自由度に丸めて数表を使うか、 非整数の自由度のまま計算するか、いずれかで対応する。 このページでは、非整数の自由度で t 分布を計算する方法を使っている。

表記

ASCIIMath を使っている。

文献

  1. 日科技連QCリサーチ・グループ編 初等品質管理テキスト 日科技連

まりんきょ学問所統計活用術 ≫ Welch の t 検定

MARUYAMA Satosi