分散分析の中で、繰り返しのある二元配置モデルを取り上げる。AIC による判定と従来型の検定による方法の 2 種類がある。 以下の例題に関する解説は、従来型の検定による方法である。
例題 1 : 次は 3 人の生徒に対して難度の同じ試験を 2 回 受けさせたときの成績である。教科間および生徒間で違いがあるか。また、教科によって得意・不得意があるか。 (白旗慎吾『統計解析入門』 例題11.2 および例題 11.3 を改変)。
国語 | 数学 | 理科 | 社会 | 英語 | |
---|---|---|---|---|---|
生徒1 | |||||
生徒2 | |||||
生徒3 |
解答 1 : 伝統的な分散分析手法で考える。まず、処理を見やすくするために仮平均を差し引いておく。仮の平均は文献 [1] に従って 62 とする。
国語 | 数学 | 理科 | 社会 | 英語 | |
---|---|---|---|---|---|
生徒1 | |||||
生徒2 | |||||
生徒3 |
次に分散分析表をもとめるために計算し予備表にまとめる。要因 1 を生徒とし、要因 2 を教科とする。要因 1 の水準を `i` 、水準数を `r`、要因 2 の水準を `j` 、水準数を `s`、 繰り返しを `k` 、回数を `t` 、総実験数を `n` とする。この例題 1 では、`r = 3, s = 5, t = 2、n = rst = 30` である。
まず生徒と教科の欄は、それぞれの仮平均を差し引いた値の和と二乗和である。 `T_(*j)` の行は仮平均を差し引いた和の列方向の総計、`T_(*j)^2 = (T_(*j))^2`、`sum_(i=1)^3T_(ij)^2` は仮平均を差し引いた値の二乗和の総計である。 また、`T_(i*)` の列は仮平均を差し引いた和の行方向の総計、`T_(i*)^2 = (T_(i*))^2`、`sum_(j=1)^5sum_(k=1)^2T_(ijk)^2` は仮平均を差し引いた値の二乗和の行方向の総計である。
国語 | 数学 | 理科 | 社会 | 英語 | `T_(i*)` | `T_(i*)^2` | `Sigma_(j=1)^s Sigma_(k=1)^tT_(ijk)^2` | |
---|---|---|---|---|---|---|---|---|
生徒1 | ||||||||
生徒2 | ||||||||
生徒3 | ||||||||
`T_(*j)` | ||||||||
`T_(*j)^2` | ||||||||
`Sigma_(i=1)^rT_(ij)^2` |
分散分析表は次のようになる。求める `F` 値は行と列、交互作用の 3 つとなり、その結果として限界水準 (`P` 値)も対応する 3 つがある。これらを求めて、有意か否かを判断する。 下記の例では生徒の `P` 値は 0.239... と 0.05 より大きいので有意水準 5 % の検定では帰無仮説は棄却されない。しかし、教科の `P` 値はほとんど 0 であるので帰無仮説は棄却されるので、 教科の間には違いがある。また、交互作用も 0.0001 以下であり(実際は 0.0000013... )非常に小さいので、交互作用がある。つまり、生徒によって教科の得意・不得意があるということがわかる。なお、下の分散分析表では、 二乗和と平均は小数点第2位を、`F` 値は小数点第3位を、`P` 値は小数点第2位をそれぞれ四捨五入している。
要因 | 二乗和 | 自由度 | 平均 | `F` 比 | `P` 値 |
---|---|---|---|---|---|
生徒 | |||||
教科 | |||||
交互作用 | |||||
誤差 | |||||
合計 |
例題 2 : ある金属材料の強度を,製造の温度3水準 `A_1, A_2, A_3`,触媒の種類4種類 `B_1, B_2, B_3, B_4` について2回の繰り返し実験により測定したところ, 次のデータを得た.
(白旗慎吾『統計解析入門』 演習問題 11.8 を改変)。
`B_1` | `B_2` | `B_3` | `B_4` | |
---|---|---|---|---|
`A_1` | ||||
`A_2` | ||||
`A_3` |
解答 2
例題 1 と同様に計算する。仮の平均は目の子で 100 にした。表 2.1 から分散分析表を作ると次のようになる。
要因 | 二乗和 | 自由度 | 平均 | `F` 比 | `P` 値 |
---|---|---|---|---|---|
要因`A` | |||||
要因`B` | |||||
交互作用 | |||||
誤差 | |||||
合計 |
この結果、要因`A` の `P` 値は 0.1352 で 0.05 より大きい。したがって、帰無仮説は棄却できず、温度による差があるかどうかはわからない。 要因 `B` の `P` 値は 0.0005 であり、0.05 より小さい。したがって、帰無仮説は棄却され、触媒によって差があると有意水準5%でいえる。 `A` と `B` の交互作用の `P` 値は 0.4459 であり、0.05 より大きい。したがって、帰無仮説は棄却できず、交互作用があるかどうかはわからない。
例題 3 : 3つのメーカー A, B, C の自動車用タイヤの寿命を3種類の環境の中で測定して,下のデータを得た.
(白旗慎吾『統計解析入門』 演習問題 11.9 を改変)。
環境1 | 環境2 | 環境3 | |
---|---|---|---|
A | |||
B | |||
C |
解答 3
例題 1 や例題 2 と同様に計算する。仮の平均は目の子で 700 にした。表 3.1 から分散分析表を作ると次のようになる。
要因 | 二乗和 | 自由度 | 平均 | `F` 比 | `P` 値 |
---|---|---|---|---|---|
メーカー | |||||
環境 | |||||
交互作用 | |||||
誤差 | |||||
合計 |
この結果、要因「メーカー」の `P` 値は 0.0004 で 0.01 より小さい。したがって、帰無仮説は棄却され、メーカーによる差があるといえる。 要因「環境」の `P` 値は 0.0001 未満 であり、0.01 より小さい。したがって、帰無仮説は棄却され、環境によって差があるといえる。 `A` と `B` の交互作用の `P` 値は 0.0110 であり、0.01 より大きい。したがって、帰無仮説は棄却できず、交互作用があるかどうかはわからない。
例題 4 : 発泡剤の伸び率を大きくする条件を検討するために,活性剤の添加率 A を 3 水準とし, 主要原料の納入メーカ B を 2 水準として,繰り返し 2 回の実験を行い,伸び率(単位:倍率)を測定した結果次の表のようになった.ただし, 総計 12 回の実験の順序はランダムとした.
(谷津進『すぐに役立つ実験の計画と解析 基礎編』 例 6.1 p.72 を改変)。
`B_1` | `B_2` | |
---|---|---|
`A_1` | ||
`A_2` | ||
`A_3` |
解答 4 : 今までの解答と同様に計算する。仮の平均は目の子で 3.60 にした。表 4.1 から分散分析表を作ると次のようになる。
要因 | 二乗和 | 自由度 | 平均 | `F` 比 | `P` 値 |
---|---|---|---|---|---|
添加率 | |||||
メーカ | |||||
交互作用 | |||||
誤差 | |||||
合計 |
この結果、要因A「添加率」の `P` 値は 0.0260 であり 0.05 より小さい。したがって、帰無仮説は棄却され、添加率による差があるといえる。 要因B「メーカ」の `P` 値は 0.0039 であり、0.05 より小さい。したがって、帰無仮説は棄却され、メーカによって差があるといえる。 `A` と `B` の交互作用の `P` 値は 0.7902 であり、0.05 より大きい。したがって、帰無仮説は棄却できず、交互作用があるかどうかはわからない。
例題 5 : 電子管の電子放射電流がエージング条件 A とカソード B によってどのように影響されるかを実験した結果, 次のようなデータが得られた.ただし, 総計 24 回の実験の順序はランダムとした.
(谷津進『すぐに役立つ実験の計画と解析 基礎編』 第6 章演習問題 1 p.79 を改変)。
`B_1` | `B_2` | `B_3` | `B_4` | |
---|---|---|---|---|
`A_1` | ||||
`A_2` | ||||
`A_3` |
解答 5 : 今までの解答と同様に計算する。仮の平均は目の子で 9.0 にした。表 5.1 から分散分析表を作ると次のようになる。
要因 | 二乗和 | 自由度 | 平均 | `F` 比 | `P` 値 |
---|---|---|---|---|---|
エージング条件 | |||||
カソード | |||||
交互作用 | |||||
誤差 | |||||
合計 |
この結果、要因A「エージング条件」の `P` 値は 0.0015 であり 0.05 より小さい。したがって、帰無仮説は棄却され、エージング条件による差があるといえる。 要因B「カソード」の `P` 値は 0.0167 であり、0.05 より小さい。したがって、帰無仮説は棄却され、カソードによって差があるといえる。 `A` と `B` の交互作用の `P` 値は 0.5265 であり、0.05 より大きい。したがって、帰無仮説は棄却できず、交互作用があるかどうかはわからない。
左列、中央列、右列のそれぞれについて説明する。
左列では、データ入力欄に適切な形式でデータを入れる。形式は1行1データ形式であり、 1データには、目的変数の値、要因Aの水準(1, 2, ..., r)、要因 Bの水準(1, ..., s)の順に、空白を間に入れて並べる。 例題 1 から 例題 5 のいずれかのボタンをクリックすると、この形式に従った 例題 1 から 例題 5 までのデータがデータ入力欄に挿入される。 [計算]ボタンをクリックすると、繰り返しのある二元配置モデルのための AIC 表と分散分析表が作成される。
中央列は AIC 表である。AIC の値が最も小さなモデルが最も適したモデルであるという結論である。たとえば、`MODEL(A, B)` の値が最も小さいのであれば、 要因 `A` と要因 `B` の双方を考慮するモデルがもっとも適している、という結論が得られる。なお、AIC では要因 `A` と 要因 `B` の交互作用は考慮していない。考慮したモデルは現在検討中である。
右列は分散分析表である。ただし、プーリングは行なっていない。`P` 値が 0.05 以下であれば、5 % 水準でその要因が棄却される、すなわちその要因が有意である、 という結論が得られる。
データ入力欄
AIC MODEL | 自由パラメータ数 | `hat sigma^2` | AIC |
---|---|---|---|
MODEL(∅): | |||
MODEL(A): | |||
MODEL(B): | |||
MODEL(A, B): |
要因 | 二乗和 | 自由度 | 平均 | `F` 比 | `P` 値 |
---|---|---|---|---|---|
まりんきょ学問所 ≫ 統計活用術 ≫ 分散分析:繰り返しのある二元配置モデル