条件付正規分布モデル

作成日 : 2004-02-13
最終更新日 :

2組のデータが、同じ正規分布に従うとみなしてよいかどうか、判定する。

例題:次の2組のデータがある。2組のデータは同じ正規分布に従うとみなせるか?

データ1:0.73 -0.06 1.04 2.29 0.51 -0.45 1.03 0.44 0.02 0.11 -2.42
データ2:0.10 0.56 -1.11 -0.48 3.46 -2.39 0.36 4.56

同じ正規分布とはどういうことか。これは、 データ1の平均μ1とデータ2の平均μ2がともに同じ平均μであり、 かつデータ1の分散σ12と データ2の分散σ22がともに同じ分散σ2であることをいう。 このときのモデルを(μ,μ,σ22)と略記する。 ここでモデルの自由パラメータ数は2である。 一方で、データ1とデータ2が異なる正規分布に従うと仮定すると、 このときモデルは、(μ121222) と書ける。モデルの自由パラメータ数は4である。

また、「分散は等しいが平均が異なる」モデルを考えることもできる。このときの表記は、 (μ1222)となり、 自由パラメータ数は3となる。 さらに、「平均は等しいが分散が異なる」モデルを考えることもできる。このときの表記は、 (μ,μ,σ1222)となり、 自由パラメータ数はやはり3である。

まとめると、データが異なるモデルに属するかどうかを判定するためには、4つのモデルを立て、 それぞれのモデルの良さを比較すればよい。モデルの良さを判定するためには、 AIC が利用できる。すなわち、AIC の小さいモデルがもっともよいモデルとなる。

答:「コピー」ボタンをクリックすると、上記例が左下の欄に入力される。 「計算」ボタンをクリックすると、右の欄にAICが表示される。 最もAICの低いモデル、すなわち最もよいモデルは、 (μ,μ,σ1222)であることがわかる。

モデル制約#AIC μ1 μ2 σ12 σ22
(μ,μ,σ22) μ12
σ12 = σ22
2
(μ,μ,σ1222) μ12 3
1222) σ1222 3
121222) 4
データ1データ2

まりんきょ学問所統計活用術 ≫ 条件付正規分布モデル

MARUYAMA Satosi