副題は「偶然を生かす」。原題は en:"statistics and Truth" 。
ラオという名前はどこかで聞いたことがあった。統計学でいう、Cramér - Rao の下界だ。 どうやら、その人らしい。
この本で、重み付き分布とか、切断、ということばを初めて知った。ここでは、切断について説明する。
試行数 `n`、成功の確率 `p` をもつ二項分布からの標本で、変数の値がゼロとなる事象が観測されないとする。 このときの確率分布を切断二項分布と呼ぶ。 また、このときの確率変数を切断二項確率変数とよび、`R^T` で表す(肩の `T` は Truncated 切断 の意味)。 このとき、`R^T` が値 `r` をとる確率を `P(R^T = r)` とすると、
`P(R^T = r) = (((n),(r)) p^r(1-p)^(n-r))/(1-(1-p)^n), quad r = 1, 2, cdots, n`
となる。また期待値に関して、次が成り立つ。
`E(R^T) = (np)/(1-(1-p)^n), quad E(R^T/n) = p/(1-(1-p)^n)`
この本では、ある教授の電話帳にあった女子学生の姉妹・兄弟の数の一覧がデータとして掲げられている。 本人を含めているので、姉妹についてはかならず1 以上であり、兄弟については 0 以上となる。 したがって、姉妹に関しては切断二項分布を適用することとなる。
なお上に記した式は、同書の P.149 を少し変えている。といっても成功確率が `pi` と書かれていたのを `p` に変えた程度である。 `pi` はどうも円周率を連想してしまい気持ちが落ち着かなかったからだ。
確認しておくと、普通の二項分布は次のとおりである。
`P(R = r) = ((n),(r)) p^r(1-p)^(n-r), quad r = 0, 1, 2, cdots, n`
`E(R) = np, quad E(R/n) = p`
pp.048-049 の「2.9 デリケートな質問に対する回答を引き出す方法」には感動した。以下引用する。
もう1つの乱数の興味ある応用は,デリケートな質問に対する回答を引き出す際に考えられる. もし,「あなたは麻薬をすっていますか?」というような質問をしたとすれば,正確な回答は得られそうにない. これに対して,まずつぎのような2つの質問(そのうちの1つは無害なものである)を並べておく.
S:あなたは麻薬をすっていますか?
T:あなたの電話番号の末尾の数字は偶数ですか?
そして回答者にコイン投げをしてもらい,表が出れば質問Sに正しく答えてもらい,裏が出れば質問Tに正しく答えてもらうよう依頼する. この場合,回答者がどちらの質問に答えたかは調査者にはわからないようにしておき,情報についての秘密は守られるものとする. このようにして得られた回答結果から,麻薬をすっている人の割合を,次に示すようにして推定することができる.
`pi` = 麻薬をすっている人の割合で,未知(推定されるべきパラメータ)
`lambda` = 電話番号の末尾が偶数である割合で,既知
`p` = 「イエス」と回答された観測値の割合
このとき `pi + lambda = 2p` が成立する.したがって `pi` に対する推定値は
`pi = 2p - lambda`によって与えられる.
これに対して[訳注7]があるのでこれもp.297 から引用する。
「調査対象(個人)に,いくつかの質問のうちの1つを確率的に,しかも調査員にはどれが選ばれたかがわからないように選択させ,それに対する回答から,“デリケートな特性”の割合を推定する方法」 をランダム回答法という.本文の問題の場合,「イエス」と回答する場合とそれが起こる確率は,つぎのようになる.
(ⅰ)麻薬喫煙者が質問Sを選択した場合:確率 = `pi//2`
(ⅱ)電話番号の末尾が偶数である人が質問Tを選択した場合:確率 = `lambda // 2`
したがって,`p = pi // 2 + lambda // 2` すなわち `2p = pi + lambda` が成立する.
p.306 下から 4 行目、「同様に `p(5) = 7, p(6)=10` となる」とあるが、正しくは、「同様に `p(5) = 7, p(6)=11` となる」である。 ちなみに、`p(n)` の定義は、自然数 `n` を1以上の自然数の和で表すことを考えるとき、その表し方の総数である。
4 = 1 + 1 + 1 + 1 = 2 + 1 + 1 = 2 + 2 = 3 + 1
よって p(4) = 5
5 = 1 + 1 + 1 + 1 + 1 = 2 + 1 + 1 + 1 = 3 + 1 + 1 = 2 + 2 + 1 = 4 + 1 = 3 + 2
よって p(5) = 7
6 = 1 + 1 + 1 + 1 + 1 + 1 = 2 + 1 + 1 + 1 + 1 = 3 + 1 + 1 + 1= 2 + 2 + 1 + 1 = 4 + 1 + 1 = 3 + 2 + 1 = 2 + 2 + 2 = 5 + 1 = 4 + 2 = 3 + 3
よって p(6) = 11
書名 | 統計学とは何か |
著者 | C. R. ラオ: |
訳者 | 藤越 康祝, 柳井 晴夫, 田栗 正章 |
発行日 | 年 月 日 |
発行元 | 筑摩書房 |
定価 | 円 |
サイズ | |
ISBN | 9784480092717 |
NDC | 417 |
その他 | ちくま学芸文庫 |
まりんきょ学問所 > 数学の部屋 > 数学の本 > C. R. ラオ:統計学とは何か