母比率の判定

作成日 : 1999-11-15
最終更新日:

赤池情報量規準(AIC)の応用の中に、従来の複雑で煩雑な統計的検定の各種手法の簡便化がある。 このページでは、従来「母比率の検定」と呼ばれていた統計的検定の問題を、母比率の判定という名前に改めて紹介する。 名前を変更したのは、従来の煩雑な検定手法とは一線を画していて、 AIC による統一した扱いができるからだ。そして、実際の簡単な計算もできることを示す。 具体的な計算にはJavaScriptを用いる。 この結果、手軽に計算をしてみることができる。

さてこのページに限らず、AIC を用いた簡便化とは次のようになる。

  1. 統計モデルを複数作り、
  2. それらのモデルについて、一種の「あてはまり度」をAICと呼ばれる値として計算する
  3. 複数のモデルがもつAICを比較して、
  4. もっとも小さなAICをもつモデルを採用する。

本ページでは、AICの導出の仕方はばっさり省略して、使える形になったものだけを見ていく。

例題1:あるWebサイトでは、サイトを見た読者にアンケートをお願いしている。 アンケートの回答率は通常20%であった。 最近行なったアンケートでは、サイトを見た読者80人のうち、 アンケートを回答したのは10人だった。 回答率は12.5%に落ちたと判定すべきか。

n 回の試行が独立で(ある試行が他の試行に影響を与えない)、 かつそれぞれの試行の結果が2つの背反な事象に分けられる(結果がOK/NGのように2通りしかなく、必ずどちらか一方しかとらない) とき、着目した事象が `n` 回中 `n_1`回起こる確率は2項分布で与えられる。

一般化してみると、次のようになる。 着目した事象が `n` 回のうち`n_1` 回起こったとする。 いっぽう、母集団で、着目した事象が起こる確率は `p` であることがわかっているとする。 問題は、`n` 回のうち `n_1` 回起こったことが確率 `p` に照らして正しいといえるのか、 それとも正しいとはいえないのかを調べることである。 モデルの式のことばで言い換えると、2項分布の結果起こった率が、所与の率pとみなすモデル MODEL(0)が正しいのか、 それとも、他の値とみなすモデルMODEL(1)が正しいのかを所与のデータから判定することだ。 一般式は次の通り。

`AIC(1)=(-2){n_1 * log(n_1 /n) + (n - n_1)log(1 - n_1/n)}+ 2`
`AIC(0)=(-2){n_1 * log(p) + (n - n_1) * log(1-p)}`

AIC(1)が、独自の確率をもつモデルのAIC、AIC(0)が所与の確率をもつモデルのAICであり、値の小さい方がよりよいモデルとなる。 これをプログラムにしてみた。上の例題では、サンプル数に80、起こった数に10、着目事象の確率に0.2を入力する。 入力後、「計算」ボタンをクリックする。

結果は、AIC(1)が62.28,AIC(0)が63.43で、AIC(1)が低くなる。これは、独自の確率をもつモデルがより確からしい、 すなわち、回答率は12.5%に落ちた、と判定すべきということだ。

サンプル数
起こった数
確率
AIC(1)
AIC(0)

まりんきょ学問所統計活用術 > 母比率の判定


MARUYAMA Satosi