赤池情報量規準(AIC)を統計の検定論に応用する。 今回はAIC による分布の一様性の扱い方を示す。
例題3:あるWebサイトで、時間帯によってアクセスされる回数に差があるかどうかをみるために、 朝、昼、夕方、夜、深夜にわけて、各1時間あたりのアクセス回数を調べたところ、下記の結果が得られた。 時間帯にアクセス数に差があるといえるか。
朝 | 昼 | 夕方 | 夜 | 深夜 | 13 | 17 | 13 | 6 | 9 |
---|---|---|---|---|
アクセス数に差がないと考えられるモデルがよいか、 それともアクセス数が時間帯によって独自であると考えるモデルがよいかの選択である。 前者のAICをAIC(0)、後者のAICをAIC(1)とする。 両者のモデルから計算されるAICを比べて、小さいほうをより真に近いモデルと判断するものである。 計算結果は次のようになる。
`AIC(0)=(-2)*(13+17+13+6+9)*log(1/5)=186.69`
`AIC(1)=(-2)*(13log(13/58)+...+9log(9/58))+2*(5-1)=188.25`
AIC(0) < AIC(1) であるので、アクセス数に差がない、と考えられる。
次のフォームでJavaScriptによる計算ができる。 分布表に、13, 17, 13, 6, 9 を一行ずつ入力してほしい(カンマは入力しないこと)。 「計算」ボタンをクリックすると、各タイプのAICが計算される。