Welch の t 検定

作成日 : 2022-07-22

最終更新日 :

２つのデータ群があるとき、平均値に差があるかどうかを調べる。 AIC を用いる方法が簡便だが、これは、2 つのデータ群が等分散である仮定を要しないという意味で、従来型の平均値の差の検定より優れている。

例 : 群 1 はある WEB ページの 1 日あたりのアクセス数を 7 日間にわたって調べたデータである。この WEB ページを更新した後で、同様に 1 日あたりのアクセス数を 5 日間調べた。このときの 1 日あたりのアクセス数のデータを群2とした。そのときの結果は次の通りである。アクセス数は変わったと言えるか。 5 % 水準で検定せよ。

No.	日数	データ
群 1	7	45, 30, 75, 45, 60, 70, 60
群 2	5	60, 90, 45, 70, 80

答 : 平均値の差に関する帰無仮説 H₀ および対立仮説 H₁ は次のとおりである。ここで群iに関する平均を `mu_i` とする。

H₀：μ₁ ＝μ₂
H₁：μ₁ ≠ μ₂

これから述べる方法で Welch の t 検定を行なう。次のように記法を定義する。

	群1	群2
標本サイズ	n₁	n₂
平均	μ₁	μ₂
不偏分散	s₁	s₂

統計量 `t` を次で定義する。

`t = (mu_1 - mu_2)/sqrt(s_1^2/n_1 + s_2^2/n_2)`

また、この検定において自由度 `nu` を次で定義する。

`nu = (s_1^2/n_1 + s_2^2/n_2)^2 / (s_1^4/(n_1^2(n_1-1)) + s_2^4/(n_2^2(n_2-1)) `

この `t` と `nu` から `p` 値を求める。この `p` 値から 5 % 水準あるいは 1 % 水準で棄却できるかできないかを判断することができる。

以下は、JavaScript で計算を行なう場合のフォームである。初期状態では上記の値が入っている。「計算」のボタンを押すと、各種データを計算する。この例では `p=0.0957cdots` となり、両側 5 % の点 `p = 0.025` より小さい値である。すなわち、95 % 信頼区間外の値である。よって、帰無仮説は棄却される。したがって、アクセス数は変わったと判断される。

群番号	データ
1
2

各群に関する統計量

	群1	群2
標本サイズ	n₁	n₂
平均	μ₁	μ₂
分散	s₁	s₂

全体に関する統計量

標本平均の差 d
統計量 t
自由度 `nu`
P 値

付記

Welch の t 検定では、自由度は一般に非整数である。このときの `t` 分布を求めるには、適当な整数自由度に丸めて数表を使うか、非整数の自由度のまま計算するか、いずれかで対応する。このページでは、非整数の自由度で t 分布を計算する方法を使っている。

表記

ASCIIMath を使っている。

文献

日科技連QCリサーチ・グループ編初等品質管理テキスト日科技連

まりんきょ学問所 ≫ 統計活用術 ≫ Welch の t 検定

MARUYAMA Satosi