同じ観測値でも、区分を変えることで異なる度数分布表(ヒストグラム)が得られる。 どちらの区分がよりよいヒストグラムデータかを判定する。 ただし、ここで比較するのは、細かく区分したモデル1と、モデル1で隣りどうしの区分を合算した粗くしたモデル2に限る。
例題:表1と表2はある 100 個の観測値から得た度数分布表である。 どちらがよい度数分布表か。
|
|
表1のヒストグラムをモデル1、表2のヒストグラムをモデル2とする。 モデル1、モデル2の AIC をそれぞれ `AIC(1), AIC(2)` で表す。 階級数の多いほう、すなわちモデル1の階級数を `c` 、 各階級の観測度数を `n(i) (i = 1, ..., c)` とする。 また、モデル 2 の階級数を `c' = c/2` 、各階級の観測度数を `n'(i) (i = 1, ..., c') ` とする。 導出は省略するが、それぞれの AIC は次の式で表される。
`AIC(1)=(-2)sum_(i=1)^c n(i) log {:(n(i))/n:} + 2(c - 1)`
`AIC(2)=(-2)sum_(j=1)^(c') n'(j) log {:(n'(j))/(2n):} + 2(c' - 1)`
下の[コピー]ボタンをクリックすると、上記の例の数値が入力される。[計算]ボタンをクリックすると、 それぞれのモデルの AIC が表示される。