分布の適合度

作成日 : 1999-03-09
最終更新日 :

赤池情報量規準(AIC)を統計の検定論に応用するシリーズから、 今回は分布の適合度をAICでどのように扱えるかを示す。

あるサイトの 1 時間あたりのアクセス数を調べたところ、次の結果を得た。 1時間あたりのアクセス数は、ポアソン分布に従っているとみなしてよいか。

アクセス数標本数
012
128
228
318
49
54
61
7〜0

モデル1:分布が無制約の多項分布から得られたと考えるモデル

モデル0:別のパラメータで規定されるモデルから得られたと考えるモデル

このどちらがよいかを判定する。 前者のAICをAIC(1)、後者のAICをAIC(0)とする。 両者のモデルから計算されるAICを比べて、 小さいほうをより真に近いモデルと判断するものである。 ここで、モデル0の、別のパラメータで規定されるモデルとして、 ポアソン分布を想定する。導出は文献に任せ、結果のみを掲げる。

観測値が `c` 個のクラスに分割されたとする。観測値がそれらのクラスに入る確率を `p(i), i = 1, ..., c`、 観測度数を `n(i), i=1, ..., c` とする。

`AIC(1) = (-2) sum_(i=1)^c n(i) log {:(n(i))/n:} + 2 (c - 1)`
`AIC(0) = (-2) {sum_(i=1)^(c-1) n(i) log {:(bar x^(i-1))/((i-1)!):} exp(- bar x) + n(c) log(1 - sum_(i=1)^(c-1) (bar x^(i-1))/((i-1)!)) exp(- bar x)} + 2 `

計算結果は次のようになる。

`AIC(1)=(-2){12log(12/100)+ 28log(28/100) + 28log(28/100) + 18log(18/100)+ 9log(9/100) + 4log(4/100) + log(1/100)} + 2*6 = 345.50`
`AIC(0)=(-2){12log(2.0^0/(0!))exp(-2.0)+...+ log(1-0.9834)}+2 = 336.08`

AIC(0) < AIC(1) であるので、 データがポアソン分布に従っているとみなしてもよい、 という判定結果を得る。

次のフォームでJavaScriptによる計算ができる。 分布表に、12,28,28,18,9,4,1 を一行ずつ入力すること。 カンマは入力しない。 「計算」ボタンをクリックすると、各タイプのAICが計算される。


AIC(0)
AIC(1)

まりんきょ学問所統計活用術 > 分布の適合度


MARUYAMA Satosi