「まえがき」から引用する。
本書は(中略),品質管理に統計的方法を活用するための考え方, 基本的な手法について平易に述べた.
この「マスク効果」という文字だけを見ると、 顔につけるマスクをしていると新型コロナウイルスにかかる確率を減らす効果がある、ということなのだろうかと思う。 しかし本書は統計学の本だから、そういう意味ではない。あるデータに外れ値があるかどうかを検定する方法について、 pp.131-132 から引用する。
次に,検定法としてみてみると,スミルノフ・グラブス検定は, 平均値がずれた「異常な」値が1 個だけデータに含まれた場合に感度が高い方法であり, 平均値がずれたりバラツキが大きな「異常な」値が複数含まれた場合,標準偏差が過大評価され, `T` は有意となりにくいことである.このように, 複数の外れ値がお互いに庇いあう効果のことをマスク効果と呼ぶ.(後略)
なお、`T` とは、スミルノフ・グラブス検定で外れ値に対して計算する値である。
本書 p.131 では、異常値の棄却検定方法として「スミルノフ-グラブスの検定」が述べられている。 本書では、この検定を行うにあたり、他の文献に出ている数値表を参照している。 そのため、本書の例について、この検定を検証することができない。 一方、同じシリーズの「統計解析への出発」では、 「グラブスの検定」として取り上げられていて、この書籍では別表として数値表を載せている。 ということは、本書の例について、「統計解析への出発」の表を使えば検証できるのではないか、 と思ったが、本書の例で使われている数値は、「統計解析への出発」の表には当てはまらないのだった。 「統計解析への出発」の表は片側検定であるのに対し、本書は両側検定を前提に話を進めているからだ。
異常値が 2 つ以上ある場合について、本書では次の記述がある。
マスク効果を避け,複数の外れ値の有意性をまとめて検定する方法も考案されているが, 予備的解析の道具箱に入れるまでもないと筆者は考える.
本シリーズの「統計解析への出発」では、複数の外れ値がある場合に、データ全体が正規分布に従うかどうか、
の方法を述べている。これは複数の外れ値の有意性をまとめて検定する方法
ではない、
ということだから、シリーズ全体で矛盾はしていない、と思い納得した。
書名 | 多次元データの解析 |
著者 | 鷲尾泰俊、大橋靖雄 |
発行日 | 1989 年 2 月 21 日 第1刷 |
発行元 | 岩波書店 |
定価 | 2,500 円(税別) |
サイズ | B6 版 |
ISBN | 4-00-007763-5 |
NDC | |
備考 | 越谷市立図書館で借りて読む |
まりんきょ学問所 > 統計活用術 > 統計の本 > 鷲尾泰俊、大橋靖雄:多次元データの解析