________________

「所沢で赤ちゃん死亡率急増データ」の解析 09.03.99






週刊新潮の櫻井よしこ氏の「環境汚染告発」記事に引用された、「ダイオキシンのため所沢で赤ちゃんの死亡率が急増」の根拠となっている棚橋氏の図が手に入った。棚橋氏のデータを完全に再現するには、まだまだ相当の努力と時間を要するので、ここでは中間報告として、現時点における疑問点のみを指摘するにとどめたい。


C先生:さて、某氏のご好意によって、棚橋氏が赤ちゃんがダイオキシンで死んでいると主張した図が手に入った。これがそれだ。

A君:えっ。これですか。

B君:本当にこれなのか。統計で嘘をついている可能性が大だ。

C先生:図のように、1971年から新生児死亡率(生後4週間未満の死亡)は、日本全体で順調に低下している。埼玉県全体の死亡率が見事に低下しているのが見て取れる。所沢、三芳、大井地区の新生児死亡率も、ざっと見た限りでは順調に低下しているように見える。しかし、棚橋氏は、1981年を境として、この3つの地域の値が急増し、埼玉県全体の死亡率を大幅に上回っていると主張されている。確かに低下速度が多少遅いようだ。さらに、丁度この時点を第2期開始時点と位置付けて、焼却量の増加と正の相関があるとの主張である。

A君:統計的に意味があるかどうか。すなわち、統計的なばらつきを考慮にいれて、エラーバーの形で表現してみるとどうなるか、ですね。
 やってみましょう。
 必要なデータは、実際に起きた死亡数です。厚生省データを調べればもっと確実ですが、中間報告ですから、まあ、ざっとした考え方だけを示すという方針で行きます。まず、出生数の推定が必要ですね。いくつにしましょうか。
 
B君:今日のところは、余り細かいことろを言ってもどうしようもないから、1000人に10という仮定で良いのでは。最近出生数は落ちているから、10という値なら、平成5、6年の値かもしれないが。

A君:それでは、出生率1.0%で行きます。次に必要なのは、それぞれの地域の人口なのですが、どうしましょうか。

B君:少々調べておいた。95年データだが、大体こんなものだ。
    所沢市   320,406人
    三芳町    35,607人
    大井町    39,604人

A君:それではそれを使います。出生数の予測ですが、1.0%とすれば、有効数値2桁としますが、
    所沢市     3,200件
    三芳町       360件
    大井町       400件
    合計      3,960件
 さて、棚橋氏のデータによって、1980年、81年の死亡率を4.0/1000、5.2/1000とします。新生児死亡の概略件数は、
            1980年      1981年
    所沢市      12.8件     16.6件
    三芳町       1.4件      1.9件
    大井町       1.6件      2.1件
    合計        15.8件     20.6件
 この計算ですが、人口データが1995年で、その他のデータが80、81年ですから、大変にいい加減です。やはりそのうちデータを揃えましょう。
 
B君:さて、統計的なバラツキはどのように評価すべきだろうか。

A君:このような場合は、もっとも簡単に、Nの平方根としますか。とすると、
               1980年      1981年
             平均値 標準偏差     平均値  標準偏差
    所沢市      12.8± 3.6       16.6±  4.1
    三芳町       1.4± 1.2        1.9±  1.4
    大井町       1.6± 1.3         2.1± 1.4
    合計        15.8± 4.0       20.6± 4.5

 所沢市の1980年の死亡率が4.0/1000ですが、これに標準偏差を考慮すると、 4.0 ± 1.1。  1981年ですと、5.2/10000ですが、同様に、 5.2±1.3。
 このデータ一つだけですと、有意とは言いにくいですが、それから数年間連続して同様の傾向を示しています。難しいところですが、なんらかの傾向を示していると理解すべきかも知れません。
 
B君:そのデータだが、おかしいよ。なぜならば、死亡数は整数だろ。1.4件の死亡というのは何だ。1.6件というのは何だ。

A君:今回の場合、あくまでも39万人を一まとめにした議論ですから、小数が出るのは気にしません。棚橋氏がその後地域別の議論をやっているのですが、そのときには、その点が疑問点になります。三芳、大井の80年、81年の人口は95年よりも少ないと思われますので、実際に発生した新生児死亡は恐らく、80年には1件だったのが81年には2件になった、といったのが現実だったのではないでしょうか。
 
B君:統計的に意味の無い議論だな。ゆらぎの範囲内だ。このような危ういデータであることを意図的に隠しているのなら、信用できない。棚橋氏は物理探査のエンジニアということだから、統計学には必ずや精通しているだろう。統計学で嘘をつく方法も当然ご存知だろう。

C先生:中間報告ということで、そろそろ終わりにしたいが、家庭用簡易型焼却炉の購入補助実施市町村における自家焼却によって新生児死亡率が県平均の4.65倍も高いとされている吉田町、2倍以上高い荒川村、川里村のデータがどのようなものか、これも厳密にチェックする必要があるだろう。どうも89〜94年6年間のデータの平均のようだが、人口の母数が10万以下だとしたら、ほとんど意味をなさないだろう。1件の死亡のたまたまの増加・減少によって、データが大きくばらつくであろうことが予想されるからだ。
 そこで、吉田町の人口を調べてみたところ、平成7年の国勢調査結果が、6275名であった。出生数の予測値は、毎年63名程度、6年間で388件程度となる。棚橋レポートのように、新生児死亡率を11.5/1000とすると、実際の死亡数は4件か5件が候補。小数点以下は有り得ないからだ。4件と仮定すると、6年間の出生数は348件だったことになり、5件と仮定すると435件だったことになる。ここでは、推定値に近い348件から出る4件を採用する。となると結論はこのようになる。6年間で1件の新生児死亡が出れば埼玉県全体としての平均値程度だが、この吉田町では、6年間で4件の新生児死亡が出たことになる。新生児死亡率が4.65倍という実態がこれだ。新生児死亡がたまたまこの6年間では4件になったということをもって統計的に有意とするのは相当難しい。なにせ、データ数が1では、統計的揺らぎが余りにも大きいからだ。対象となる人口の母数がやはり30万人ぐらいはないと。ということで、吉田町以外の荒川村、川里村のデータの状況も統計的に意味が無いものだろう。

A君:その方法なら、荒川村、川里村の検証も簡単ですね。えーと、荒川村の人口を8000人、川里村の人口は6300人としましょうか。荒川村の6年間の出生予想数が、480名、川里村は380名。新生児死亡率が、棚橋氏のデータで、それぞれ6.41/1000、5.75/1000ですので、新生児死亡数は荒川村で3件、川里村は2件でしょう。荒川村を3件とすると、出生数が468件だったことになりますので、多分これが正解。川里村の場合には、予想出生数は348件なのですが、これが偶然ながら、吉田町とほぼ一致。余りにも偶然? いえ、ある観点からみれば納得なのです。なぜならば、吉田町と川里村は人口がほぼ同じ。そこで死亡率が、吉田町が11.49で、川里村は5.75なんと丁度半分なのですよ。そこで、新生児死亡4件と2件というわけ。一見複雑そうな数字ですが、実は、単純な仕組みだったようです。
 繰り返しですが、荒川村では、6年間で新生児死亡が1件なら平均、2件ならやや高い。それがこの6年間ではたまたま3件出た。川里村についていえば、6年間での新生児死亡が1件だと平均、それがたまたまこの6年間については2件になったという状況です。これが有意というなら、統計学は死んだ。

C先生:分かった。これ以上の解析は、後日またということにしたい。
 しかし、いずれにしても、櫻井よしこ氏は本当にこのデータを見たのだろうか。データを見たとたんに、統計的な問題がありそうなデータであることがすぐ分かるのだが。