赤池情報量規準(AIC)を統計の検定論に応用するシリーズとして、 今回は分布の同一性をAICでどのように扱えるかを示す。
例題4:あるWebサイトについて、大学 A, B, C の学生にアンケートをとった。 1.おもしろい、2.ふつう、3.つまらない、4.その他・わからない(DK) の4段階で評価してもらったところ、 次の表の結果を得た。 これらの関心の結果はWebサイトごとに差があるといえるか。
A | B | C | 計 | |
---|---|---|---|---|
1. | 14 | 11 | 18 | 43 |
2. | 17 | 19 | 23 | 59 |
3. | 18 | 14 | 20 | 52 |
4. | 11 | 18 | 10 | 39 |
計 | 60 | 62 | 71 | 193 |
大学ごとに差がないと考えられるモデルがよいか、 それとも大学ごとに差がある、 すなわち結果が大学固有の値をもつと考えるモデルがよいかの選択である。 前者のAICをAIC(0)、後者のAICをAIC(1)とする。 両者のモデルから計算されるAICを比べて、 小さいほうをより真に近いモデルと判断するものである。 計算結果は次のようになる。
AIC(0)=(-2)[43*log(43/193) + ... + 39*log(39/193)]+2* (4-1)=536.1
AIC(1)=(-2)[14*log(14/60) + ... + 10*log(10/71)]+2*3*(4-1)=542.6
AIC(0) < AIC(1) であるので、 大学ごとに差があると考えられる。
次のフォームでJavaScriptによる計算ができる。 分布表に、一行ずつ入力する。カンマや合計は入力しないこと。 「例」ボタンをクリックすると、上記の数値例が分布表に入力される。 「計算」ボタンをクリックすると、各タイプのAICが計算される。
まりんきょ学問所 >> 統計活用術 >> 分布の同一性の判定