乱塊法(randomized block design)とは、ブロック因子を導入し、ブロック内で制御因子を揃えて実験し、複数のブロックにわたって実験を反復する方法である。 ここでブロック因子とは、誤差からその効果を取り除くために導入する因子で、かつ、ばらつきの大きさを評価するために導入する因子である。 ブロック因子との対比で使われるのが制御因子である。制御因子は、水準設定に再現性があり、最適水準を選ぶことに意味がある因子である。 豊田秀樹:違いを見抜く統計学も参照してほしい。
例題1 : 因子 `A` について 4 水準を設定し、1 日で 4 水準の実験をすることを計 3 日間おこなった。解析せよ。(文献[1] pp.186-188 より引用)
因子の水準 | `R_1` 第 1 日目 | `R_2` 第 2 日目 | `R_3` 第 3 日目 |
`A_1` | 2 | 5 | 12 |
`A_2` | 1 | 7 | 11 |
`A_3` | 4 | 6 | 9 |
`A_4` | 3 | 8 | 10 |
ブロック因子の水準は、制御因子と区別して `R` を使うのは通例のようである。
データの構造式に基づいて説明しよう。上記「乱塊法における実験順序」から得られる `A_iR_j` 水準のデータを `x_(ij)` と表すとき、 データの構造式や制約式は次のようになる。
制御因子とブロック因子の構造式
`x_(ij) = mu + a_i + r_j+ epsilon_(ij)`
`sum_(i=1)^4 a_i = a_1 + a_2 + a_3 + a_4 = 0`
`r_j ~ N(0, sigma_R^2)`
`epsilon_(ij) ~ N(0, sigma^2)`
繰返しのない(制御因子どうしの)2 元配置法のデータの構造式
`x_(ij) = mu + a_i + b_j+ epsilon_(ij)`
`sum_(i=1)^4 a_i = a_1 + a_2 + a_3 + a_4 = 0`
`sum_(i=1)^4 b_i = b_1 + b_2 + b_3 + b_4 = 0`
`epsilon_(ij) ~ N(0, sigma^2)`
ここで、`sigma_R^2` と `sigma^2` が異なることが、繰返しのない 2 元配置法と異なるところである。
`A\R` |
因子 | 平方和 | 自由度 | 平均平方 | `F` 値 | 限界水準(`P` 値) | `E(V)` |
---|---|---|---|---|---|---|
`A` | 140.250 | 3 | 46.75 | 37.4 | 0.00028 | `sigma^2 + 3sigma_A^2` |
`R` | 23.167 | 2 | 11.58 | 9.26 | 0.01465 | `sigma^2 + 4sigma_R^2` |
`E` | 7.500 | 6 | 1.250 | `sigma^2` | ||
`T` | 170.917 | 11 |
`E(V)` はそれぞれの分散 `V` の期待値を表す。表 1.3 の因子 `A` の `E(V)` の `sigma_A^2` の係数 3 は `A_1` 水準のデータ数 3 から来ている。 同様に因子 `R` の `E(V)` の `sigma_R^2` の係数 4 は `R_1` 水準のデータ数 4 から来ている。`A` は母数因子だから `sigma_A^2 = sum a_i^2 // phi_A` である。 また、`R` は変量因子であり、`sigma^2` は誤差 `epsilon_(ij)` の母分散である。
ついでブロック間変動(日間変動)`sigma_R^2` を推定する。`V_R = hat(sigma^2 + 4 sigma_R^2)` かつ `V_E = hat(sigma^2)` から、`hat sigma_R^2 = (V_R - V_E) // 4` であることがわかる。 `sigma_R^2 = (11.58 - 1.250) // 5 = 2.583`
工事中です。
データ入力 |
---|
因子 | 平方和 | 自由度 | 平均平方 | `F` 値 | `P` 値 |
---|
答:分散分析表を書く。全体的な流れは一元配置表のときと同じであるが、要因が2種類あるので、列どうしを比較するだけではなく、行どうしも比較することに注意する。 従って、求める `F` 値は行と列の 2 つとなり、その結果として限界水準 (`P` 値)も行と列の 2 つをそれぞれ求めて、有意か否かを判断する。