「はじめに」から引用する。
(前略)本書は,(中略)高等学校の数学のみを前提にして統計学の概念と方法が理解できるように心がけている.(後略)
要再読である。
p.87 の例題 4.6 をやってみた。
自由度が 10 のカイ2乗分布に従う確率変数 `X` がある値を越える確率が 5 % であるようにするためには, その値をいくらにすればよいか.(すなわち`chi_10^2(0.05)` を表から求めよ.)
JavaScript の simple-statistics パッケージを使ってやってみた。
解 カイ2乗分布表から `chi_10^2(0.05) = `
本書の解では 18.307 である。本書の付表3を見ると、確かに 18.307 である。ということは、本書の付表では小数点以下3桁まで書かれているのに、 私が使った simple-statistics にある表は小数点以下2桁までしかないのか。ちょっと残念だが、simple-statistics だから仕方がないだろう。
p.119 の例題 6.1 をやってみた。
ある中学校で1年生 44 名に集団式知能検査を実施したところ,偏差値の平均は 55.4 だった.この学校の1年生は平均的な生徒といえるか. ただし,知能の偏差値は `N(50, 10^2)` に従うといわれている.
帰無仮説と対立仮説を立てる。
帰無仮説 `"H"_0: mu = mu_0 = 50`
対立仮説 `"H"_1: mu != mu_0`
正規母集団 `N(mu, sigma^2)` から `n` 個のランダムサンプルを抽出したとき、標本平均 `barX` は平均 = `mu`、分散 = `sigma^2/n` の正規分布に従う。 したがって、`"H"_0` のもとで次の `Z`
の分布が標準正規分布に従うことを利用して検定する。有意水準は `alpha = 0.05` とする。棄却域 `R` は両側検定であるから
`R = {z | abs(z) gt z_(0.05) = 1.957}`
となる。ここで `z_(0.05)` の値は、`int_-oo^t N(0, 1)dx = ` となるような `t` が
であることから定めた。
`Z` の実現値を求めると、
となる。これは棄却域に含まれるので、帰無仮説は棄却となる。すなわち平均的な生徒とはいえない(優秀な生徒といえる)。
以上の方法は`z_(0.05) = 1.957` から 1.957 と 3.582 の大小を比較している。
別の方法として、`int_-oo^3.582 N(0, 1)dx = ` であり、0.999 > 0.975 であることから、 棄却域が 5 % の場合帰無仮説棄却となる、としてもよい。 この方法であれば、0.999 > 0.995 であるから棄却域が 1 % の場合でも帰無仮説棄却となることがすぐにわかる。
なお、`int_-oo^t N(0, 1)dx = P` の式で、 `t` を与えて `P` を求める計算や、`P` を与えて `t` を求める計算には、JavaScript の simple-statistics パッケージを使った。
普通、検定を扱う書籍では、`t` 分布や `F` 分布と記すが、本書ではそれぞれティー分布(p.88)、エフ分布(p.90)と表現している。まるで星新一のショートショートのようだ。
さて、simple-statistics を頼りに `t` 分布や `F` 分布に関する本書の問題を解こうとしたが、 simple-statistics では `t` 分布や `F` 分布に関する関数や数表が不足している。 数表は統計計算のページにあるので、自分で数表を作った。
準備をして、p.89 の例題 4.7 をやってみた。
ティー分布表で,自由度 `nu = 20`,確率 0.05 に対応する値を見出し,それらの関係を式表現せよ.
解答:`t_20(0.05)` = ,`P(abs(T) ge `)= 0.05
私が作った `t` 分布表は片側 `alpha` だから、表の値を得るときは tDistributionTable[20][0.025] として呼び出している。
次に `F` 分布表も自分で作ってみることにした。といっても先人の作った表をそのまま使っている。 本書 p.91 の例題 4.8 を見てみる。
p.91 の例題 4.8 をやってみた。
自由度が (10, 8) のエフ分布表で,`F` 値が確率 0.05 で `F_0` を超えるという.`F_0` の値を表から求めよ. また,この確率が 0.95 となるのはいくらか.
`F_8^(10) (0.05) = 3.35`,
`F_8^(10) (0.95) = 1 / (F_(10)^8 (0.05) = 0.326)`
私が作った`F` 分布表は、以前群馬大学にいらっしゃった青木先生の表に基づいている。 この表では`F_8^(10) (0.05) = 3.35` であるが、本書 p.91 では `F_8^(10) (0.05) = 3.34` であり、本書付表でもそうなっている。 WEB を見ても、`F` 分布で小数点以下2桁の数表は `F_8^(10) (0.05) = 3.34` となっている。どちらが正しいのかわからなくなった。 小数点以下 3 桁まで表示されている表では 3.347 であり、小数点以下 4 桁まで表示されている表では 3.3472 となっている。 F 分布(パーセント点)・高精度計算サイト(keisan.casio.jp) で計算させた (累積モード:上側累積 Q、累積確率 = 0.05、分子の自由度 ν1 = 10、分母の自由度 ν2 = 8)。その結果は、 パーセント点 x = 3.347163120233979693965 となった。四捨五入すれば 3.35 が正しいと思われる。
数式はASCIIMathMLを使って表示している。
書名 | 統計学入門 |
著者 | 稲垣宣生・山根芳知・吉田光雄 |
発行日 | 1992 年 11 月 25 日 第 1 版発行 |
発行元 | 裳華房 |
定価 | 2000 円(本体) |
サイズ | A5 判 ページ |
ISBN | 4-7853-1075-8 |
備考 | 草加市立図書館で借りて読む |
まりんきょ学問所 > 統計活用術 > 統計・時系列の本 > 稲垣宣生・山根芳知・吉田光雄: 統計学入門