「序」から引用する。
我々はデータに基づいて次の行動決定の基準を作ろうと試みる.この解析には電子計算が大きな役割を果たすが, 今後有効に利用できる手続きを集積してゆくことが電子計算導入の大きな目的の一つでなければならず, そのプログラム作成用のメモとしてもアルゴリズム記法は有効に利用できるものと考えている. 電子計算と統計解析の双方への良い導入となることを念じつつ本書を世に送り出したい.
章末には参考文献が掲げられている。
「序」で書かれている「アルゴリズム記法」とは、今でいう「疑似プログラム」のようなものだ。本書 2 章で詳細が述べられている。 この記法は命令型言語のプログラムにはしやすいと思う。「10 章 アルゴリズム記法よりプログラムへ」では、アルゴリズム記法から、 ALGOL, PL/I, FORTRAN への変換方法について解説されている。
5 章を見てみる。p.98 から始まる「5.10 直交多項式」では、高次の多項式回帰において、`{1, x, x^2, x^3, cdots}` の系列を使わない方法が述べられている。 そのかわり、系列として直交多項式を用いるのだが、いわゆる名のある直交多項式ではない。また、この直交多項式は水準(ここではデータの数)にも依存して係数が変わる。 現代では使いづらいと思われる。本書 p.99 にある例題を見てみよう。
直交多項式により次のデータを回帰分析せよ.
年 1961 1962 1963 1964 1965 1966 1967 `y` 37.50 42.63 49.92 59.34 71.22 86.70 102.09
グラフは書かれていない。SVGGraph を使ってグラフを書いてみた。
このグラフを見る限り、2次式で回帰するのがよさそうだ。本書では、2次式で回帰する根拠として、F 表の値を調べているが、やはりこれは AIC を使うのがいいと思う。 多項式回帰モデルを使って、AIC が最小となる次数を調べてみた。ただし、計算で、`x` には `1961, 1962, cdots` ではなく、 `1, 2, cdots` を使った。`1961, 1962, cdots` を使うと誤差が大きくなってしまい、正しい値が得られないからだ。結果は次のとおりである。
次数 | AIC |
0 | 65.16 |
1 | 43.36 |
2 | 12.46 |
3 | 13.73 |
次数は 2 とするのがよさそうだ。
6 章を見てみる。6.2 節は「多くの平均値の差の検定(q 検定)」である。この、多くの平均値の推定は難しい。本節の方法は、現在では一般に「テューキーの範囲検定」として知られている。 6.3 節は「対比の検定(S 検定)」である。これは、現在では「シェッフェの方法」と呼ばれている。この方法も難しい。 6.4 節は「Duncanの範囲検定」である。これと「ダンカンの新多重範囲検定」とは関係があると思うが、よくわからない。6.5 節は「分散の一様性検定」である。 本書では Hartley (ハートレー)の方法や Cochran (コクラン)の方法が紹介されている。ほかにも Bartlett (バートレット)の方法がある。
書名 | コンピュータによる統計解析 |
著者 | 中村慶一 |
発行日 | 1990 年 10 月 25 日 第 1 版 第 5 刷 |
発行元 | 森北出版 |
定価 | 2900 円(税別) |
サイズ | A5 版 |
ISBN | 4-627-00450-8 |
NDC | |
備考 | 草加市立図書館で借りて読む |
まりんきょ学問所 > 統計活用術 > 統計の本 > 中村慶一:コンピュータによる統計解析