久米均:統計解析への出発

作成日 : 2022-04-04
最終更新日:

概要

「まえがき」から引用する。

本書は(中略),品質管理に統計的方法を活用するための考え方, 基本的な手法について平易に述べた.

要再読

要再読である。

異常値の検定

pp.157-159 の §7.1 は「異常値の検定」である。本書ではグラブス(Grubbs) の検定とシャピロ・ウィルク(Shapiro-Wilk)の検定について述べられている。 どちらも表の数値を参照する必要がある。グラブスの検定を行うための表は本書付表8 に、 またシャピロ・ウィルクの検定を行うための表は本書付表 9-1 と付表 9-2 に掲載されている。 私が気になるのは、この付表 8 と付表 9-1 , 9-2 の引用元が不明であることだ。 本書の付表は 1 から 10 まであり、付表 1~6, 10 は引用元が書かれている。また、付表 7 はキャプションで、この表は論文これこれを用いて作成した、と書かれている。 しかし、付表 8 と 付表 9-1,9-2 についてはこのような説明が見当たらない。 どうしたものだろう。今の人なら統計パッケージ R を使ってあっという間に分析できるのだろうな。 なお、本シリーズの「多次元データの解析」には、 本書のグラブスの検定が「スミルノフ-グラブスの検定」として取り上げられていたのでこちらを読むことにしよう。

インターネット上では、スミルノフ-グラブス検定の方法が下記にある。
http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs.html
下記ページから、スミルノフ-グラブス検定の有意点の表を見ることができる。 この表と、本書の付表8を比べると、わずかに違っている欄がある。どうしてだろう。

解答の理解

次の問題が p.155 にある。

6.8 粉塊混合物の原料の品位の推定にあたってサンプリング誤差を推定する目的で, 各ロット4個ずつのサンプルを5ロットについてとり,サンプルごとに分析した結果, 次のデータが得られた.各ロットごとに観測データの分散を計算しサンプリング誤差およびその 90% 信頼区間を求めよ.ただし分析誤差は無視できるものとする.

No.データ
120182220
223262323
323242523
421181919
522232522

pp.263-264 の解答は次のようになっている。

`i` ロットの `j` サンプルのデータを `x_(ij)` とする.
`barx_1 = 20.0, barx_2 = 23.75, barx_3 = 23.75, bar x_4 = 19.25, barx_5 = 23.0`
`V_1 = 2.67, V_2 = 2.25, V_3 = 0.92, V_4 = 1.58, V_5 = 2.0`
`hatsigma_S^2 = S_s/phi_S = V_S = 1/5 sum_i^5V_i = 1.884`
`S_S/(chi^2(phi_S, 0.05)) lt sigma_S^2 lt S_S/(chi^2(phi_S, 0.95))` より
`28.26/25.0 lt sigma_S^2 lt 28.26/7.26`
`1.130 lt sigma_S^2 lt 3.893`

まず最初の 1 行は不要だ。この後に `x_(ij)` という記法が出てこないからだ。 代わりに、「添字 `i ( i = 1, 2, 3, 4, 5)` はロットを表わす」とすればいいだろう。 それはともかく、ロットあたりの平均 `hatx_i` と偏差平方和 `V_i` はいい。次の式はどうだろう。 添字の `{::}_S` はサンプリングについてのものだろう。そして、サンプリングの分散 `V_S` は各ロット `V_i` の平均であることはわかる。 では、`hatsigma^2_S, S_S, phi_S` は何だろう。わからないので次へ行く。 次の行は `sigma^2_S` についての不等式で、次の行と見比べると、`S_S` は 28.26 という値だ。 また、`chi^2(phi_S, 0.05) = 25.0` かつ `chi^2(phi_S, 0.95) = 7.26` だから、 これを表と見比べると `phi = 15` だとわかる。なぜ `phi=15` なのか。ええと、 ロットあたりの自由度は 4-1 = 3 だから、全部で 5 ロットの自由度が 5*3 = 15 という計算でいいのかな。 それで `S_S = 28.26` というのは、`S_S = 1.884 * 15` という計算で得られたからだろう。 ふむ、サンプリングはややこしい。ちなみに、誤差を求めよというのに分散のまま計算を終わらせていいのだろうか。 それから、`hatsigma_S^2 = ... ` の式はシグマにハットがあるのに、以降の式にはないのは、 意味があるのだろうか。

`barx - R` 管理図

p.211 から始まる「§ 8.4 `barx -R` 管理図」について、気になることがある。手順が細かく解説されていて、手順 7 a) で x 管理図の、 また b) で R 管理図のそれぞれ管理線を引くときの係数が p.284「付表 5 `barx - R` 管理図係数表」に列挙されている。この数値の根拠がどういうところにあるか、 本書に書かれていることを理解したい。 また、本シリーズの「実験の計画と解析」で、等分散性の確認で似たようなことをやっていたような覚えがあるが、 それが実質的に同一のことなのかも知りたい。

シリーズ 入門 統計的方法

  1. 統計解析への出発
  2. 回帰分析
  3. 多次元データの解析
  4. 実験の計画と解析
  5. 信頼性データの解析

書誌情報

書名統計解析への出発
著者久米均
発行日1989 年 3 月 28 日 第1刷
発行元岩波書店
定価2,600 円(税別)
サイズB6 版
ISBN4-00-007761-9
NDC
備考越谷市立図書館で借りて読む

まりんきょ学問所統計活用術統計の本 > 久米均:統計解析への出発


MARUYAMA Satosi