同じ観測値でも、区分を変えることで異なる度数分布表(ヒストグラム)が得られる。 どちらの区分がよりよいヒストグラムデータかを判定する。 ただし、ここで比較するのは、細かく区分したモデル1と、モデル1で隣りどうしの区分を合算した粗くしたモデル2に限る。
例題:表1と表2はある 100 個の観測値から得た度数分布表である。 どちらがよい度数分布表か。
階級 | 度数 |
---|---|
-0.45 | 1 |
0.45-0.85 | 2 |
0.85-1.25 | 7 |
1.25-1.65 | 10 |
1.65-2.05 | 16 |
2.05-2.45 | 12 |
2.45-2.85 | 15 |
2.85-3.25 | 16 |
3.25-3.65 | 7 |
3.65-4.05 | 9 |
4.05-4.45 | 4 |
4.45- | 1 |
階級 | 度数 |
---|---|
-0.85 | 3 |
0.85-1.65 | 17 |
1.65-2.45 | 28 |
2.45-3.25 | 31 |
3.25-4.05 | 16 |
4.05- | 5 |
表1のヒストグラムをモデル1、表2のヒストグラムをモデル2とする。 モデル1、モデル2の AIC をそれぞれ `AIC(1), AIC(2)` で表す。 階級数の多いほう、すなわちモデル1の階級数を `c` 、 各階級の観測度数を `n(i) (i = 1, ..., c)` とする。 また、モデル 2 の階級数を `c' = c/2` 、各階級の観測度数を `n'(i) (i = 1, ..., c') ` とする。 導出は省略するが、それぞれの AIC は次の式で表される。
`AIC(1)=(-2)sum_(i=1)^c n(i) log {:(n(i))/n:} + 2(c - 1)`
`AIC(2)=(-2)sum_(j=1)^(c') n'(j) log {:(n'(j))/(2n):} + 2(c' - 1)`
下の[コピー]ボタンをクリックすると、上記の例の数値が入力される。[計算]ボタンをクリックすると、 それぞれのモデルの AIC が表示される。