ヒストグラムの自動描画

作成日 : 2004-02-28
最終更新日 :

前項のヒストグラムの比較の考え方を一般化する。 ある細かなヒストグラムデータをもとにして、 分布を最もよく表す区分となるヒストグラムを作る。

例題:細かなヒストグラムが次のように与えられている。
16 22 11 6 7 9 11 4 3 2 3 2 1 1 0 0 0 0 2
細かなヒストグラムの区分から隣接する区分を足し合わせて新しいヒストグラムを作り直すことができる。 どのように作り直せば最適なヒストグラムとなるか。

回答:前節の考え方の一般化である。カテゴリーの区分の仕方をいろいろと変え、 パラメータ数の減少を図れば最適なヒストグラムが得られる。 この場合の最適というのは、分布の型を再現できる、という意味である。

まず `c` 個の細かな区分に分かれているヒストグラムから、 一番左の大きな区分に `c_1` 個を入れる。中央は大きな一つの区分に細かな `r` 個の区分を入れる。そして一番右の大きな区分に `c_2` 個を入れる。 例題では、全部で `c=19` である。 `c_1=2, c_2=7, r=5` としてみよう。区切りを*で表示すれば、次のように区切ることができる。

16 22 * 11 6 7 9 11 * 4 3 2 3 2 * 1 1 0 0 0 0 2

中央は等間隔になることに注意。

「コピー」ボタンを押すと、 モデルの欄に`c_1, r, c_2` の順序でカンマ区切りで複数のモデルを入力することができる。「計算」ボタンを押すと、 それぞれのモデルに対応する AIC を表示する。この例の場合は `(c_1, r, c_2) = (2, 5, 7)` のモデルが一番 AIC の値が小さい。 したがってこのモデルがもっとも分布の形をよく表していると考えられる。


初期区分:

モデルAIC

まりんきょ学問所統計活用術 ≫ ヒストグラムの自動描画

MARUYAMA Satosi