「はじめに」から引用する。
本書では,比較的最近までの発展を含めた多変量解析に関するできるだけ多数の技法の理論的基礎,計算法,
適用の仕方をなるべく平易に解説することを試みた.
p.407 にある「無意味相関 nonsense correlation」の項目を見てみると、
スグリの木,ラム酒消費量も参照
と書かれている。ところが本書には、
ラム酒消費量という項目はあったが、スグリの木という項目はない。
スグリは gooseberry というらしいので、
索引で調べると p.105 に「グーズベリーの木 gooseberry bushes」という項目があった。
以下引用する。意味のない相関をたとえたもの.20 世紀の数十年にわたり,
ロンドンにおける出生数に対して,ロンドンの庭園にあるグーズベリーの木の数をプロットすれば,
その両方とも人口の増加量を反映しているため,
そのグラフは無意味であるが強い正の相関があるようにみえる.(後略)
なぜスグリの木なのかはわからないが、まあいいことにしよう。
p.198 にあるこの項目を引用する。
(前略) `n` 個のベクトル観測値 `{bbx_j}` が未知の平均 `bbmu` をもつ `p(gt3)` 次元多変量正規分布から得られたとする. このとき `bbmu` の最良の推定量は標本平均 `barbbx` ではなく
`(1-(p-2)/(sum_(j=1)^n bbx'_j bbx_j))barbbx`である.(後略)
この推定量はジェームス=スタイン推定量もしくは縮小推定量と呼ばれている。これには驚いた。
p.202 にあるこの項目を引用する。
(前略) 時系列に移動平均を適用する際の望ましくない効果. 時系列が同じ分布からランダムに取られた観測値からなっていると仮定すると, どんな移動平均もほぼ一定となって欲しいであろう.しかし,偶然に, 他の値より大きな値が出る事があり,`x_k` を特別大きな値とする. 移動平均をとると,`x_k` を含む移動平均はより大き目の値を取り,ほとんどの移動平均で, このインフレ現象は `k` 番目の観測値を中心にした移動平均で最も大きくなり, それ以外では小さくなる.図を参照.どの極端な値でも同じような効果を持ち, 移動平均列に振幅をもたらすがこれは偶然である.
なお、図は略した。スラツキーと表記されているが、 これは Евгений Слуцкий のことだろう。スルツキーと発音するほうがいいだろう。
序文にあるリンクは、現在下記に変わっている。
https://www.oxfordreference.com/page/stat
書名 | 統計学辞典 |
著者 | Graham Upton, Ian Cook |
監訳者 | 白旗慎吾 |
発行日 | 2011 年 9 月 15 日 初版 2 刷 |
発行元 | 共立出版 |
定価 | 3800 円(本体) |
サイズ | B6 判 512ページ |
ISBN | 978-4-320-01939-3 |
備考 | 越谷市立図書館で借りて読む |
まりんきょ学問所 > コンピュータの部屋 > 統計活用術 > 統計の本 Graham Upton, Ian Cook : 統計学辞典