ヒストグラムの比較

作成日 : 2004-02-28

最終更新日 :

同じ観測値でも、区分を変えることで異なる度数分布表（ヒストグラム）が得られる。どちらの区分がよりよいヒストグラムデータかを判定する。ただし、ここで比較するのは、細かく区分したモデル１と、モデル１で隣りどうしの区分を合算した粗くしたモデル２に限る。

例題：表1と表2はある 100 個の観測値から得た度数分布表である。どちらがよい度数分布表か。

表1
階級	度数
-0.45	1
0.45-0.85	2
0.85-1.25	7
1.25-1.65	10
1.65-2.05	16
2.05-2.45	12
2.45-2.85	15
2.85-3.25	16
3.25-3.65	7
3.65-4.05	9
4.05-4.45	4
4.45-	1

表2
階級	度数
-0.85	3
0.85-1.65	17
1.65-2.45	28
2.45-3.25	31
3.25-4.05	16
4.05-	5

それぞれの AIC

表1のヒストグラムをモデル1、表2のヒストグラムをモデル2とする。モデル1、モデル2の AIC をそれぞれ `AIC(1), AIC(2)` で表す。階級数の多いほう、すなわちモデル1の階級数を `c` 、各階級の観測度数を `n(i) (i = 1, ..., c)` とする。また、モデル 2 の階級数を `c' = c/2` 、各階級の観測度数を `n'(i) (i = 1, ..., c') ` とする。導出は省略するが、それぞれの AIC は次の式で表される。

`AIC(1)=(-2)sum_(i=1)^c n(i) log {:(n(i))/n:} + 2(c - 1)`
`AIC(2)=(-2)sum_(j=1)^(c') n'(j) log {:(n'(j))/(2n):} + 2(c' - 1)`

下の[コピー]ボタンをクリックすると、上記の例の数値が入力される。[計算]ボタンをクリックすると、それぞれのモデルの AIC が表示される。

モデル	AIC
AIC(1)
AIC(2)

まりんきょ学問所 ≫ 統計活用術 ≫ ヒストグラムの比較

MARUYAMA Satosi