「まえがき」から引用する。
(前略)いずれにしても、統計を知っているのと、そうでないのでは大きな違いがある。
問題と解答はすべて本文にある。
本書のまえがきには、次のような指摘がある。
最近では新聞やテレビ局が内閣支持率を独自に計算しているが、 その標本数はたかだか 1000 程度である。たったこれだけのデータから点推定して求めた値は、 とても信頼のおける数値とは言えないのである。
ここでの「標本数」は正しくは「標本サイズ」というべきだろうが、それにしても現在でも標本サイズは 1000 程度なのだろうか。 今調べたら、A 社ではおよそ 3700 人を対象として、そのうちのおよそ 2000 人からの回答があったという。 また B 社では回答を得たのはおよそ 1000 人だった。C 社では 1000 人を目標にしているという。 なるほど、と思いながら別の WEB を見ていると、 母集団が 1 億人であっても 1000 人の標本サイズであれば 95 % の確率で誤差 3% 以内に収まるのだという主張があった。 たぶんこれは数学的に正しいのかもしれない。本書でそれがわかるのだろうか。
本書の pp.255-256 では、内閣支持率の信頼区間の推定を、2 項分布と正規分布を使って求める例がある。
ここでは現在、発表されている内閣支持率の有効回答数が 500 前後である
と書かれている。
あれ、まえがきにある標本数がたかだか 1000 程度
という数字と異なっているようだ。
まあいいか、たかだか
と書いてあるからな。
まえがきにはこんなことも書かれている。
また、選挙報道では、各政党の当選者数を、 ライブで放映している。(中略)同じ選挙を対象としているのに、テレビ局によって予想結果が異なるという事実は興味深いが、 それが統計の宿命であるとも言える。これは、それぞれのテレビ局が、互いに異なったデータと統計手法を使っているからに他ならない。
私が思うに、テレビ局によって予想結果が異なる
理由は、
互いに異なったデータと統計手法を使っているから
というのはその通りと思う。ただ、さらに考えるとテレビ局ごとに異なった予想を生むのは、
各々のテレビ局の方針が支持する政治の主義があり、
その支持を正当化すべくデータと統計手法が陽に陰に採用されるということではないかと思う。
書名 | なるほど統計学 |
著者 | 村上雅人 |
発行日 | 2002 年 10 月 18 日 第 1 刷 |
発行元 | 海鳴社 |
定価 | 2800 円(税別) |
サイズ | A5 版 |
ISBN | 4-87525-210-2 |
NDC | |
備考 | 草加市立図書館で借りて読む |
まりんきょ学問所 > 統計活用術 > 統計の本 > 村上雅人:なるほど統計学