分散分析：乱塊法

乱塊法（randomized block design）とは、ブロック因子を導入し、ブロック内で制御因子を揃えて実験し、複数のブロックにわたって実験を反復する方法である。ここでブロック因子とは、誤差からその効果を取り除くために導入する因子で、かつ、ばらつきの大きさを評価するために導入する因子である。ブロック因子との対比で使われるのが制御因子である。制御因子は、水準設定に再現性があり、最適水準を選ぶことに意味がある因子である。豊田秀樹:違いを見抜く統計学も参照してほしい。

乱塊法の問題

例題1 : 因子 `A` について 4 水準を設定し、1 日で 4 水準の実験をすることを計 3 日間おこなった。解析せよ。（文献[1] pp.186-188 より引用）

乱塊法における実験順序
因子の水準	`R_1` 第 1 日目	`R_2` 第 2 日目	`R_3` 第 3 日目
`A_1`	2	5	12
`A_2`	1	7	11
`A_3`	4	6	9
`A_4`	3	8	10

ブロック因子の水準は、制御因子と区別して `R` を使うのは通例のようである。

データの構造式に基づいて説明しよう。上記「乱塊法における実験順序」から得られる `A_iR_j` 水準のデータを `x_(ij)` と表すとき、データの構造式や制約式は次のようになる。

制御因子とブロック因子の構造式

`x_(ij) = mu + a_i + r_j+ epsilon_(ij)`
`sum_(i=1)^4 a_i = a_1 + a_2 + a_3 + a_4 = 0`
`r_j ～ N(0, sigma_R^2)`
`epsilon_(ij) ～ N(0, sigma^2)`

繰返しのない（制御因子どうしの）2 元配置法のデータの構造式

`x_(ij) = mu + a_i + b_j+ epsilon_(ij)`
`sum_(i=1)^4 a_i = a_1 + a_2 + a_3 + a_4 = 0`
`sum_(i=1)^4 b_i = b_1 + b_2 + b_3 + b_4 = 0`
`epsilon_(ij) ～ N(0, sigma^2)`

ここで、`sigma_R^2` と `sigma^2` が異なることが、繰返しのない 2 元配置法と異なるところである。

表1.1 例題1の計測値
`A＼R`

表1.3 例題 1 のモデルと分散分析表
因子	平方和	自由度	平均平方	`F` 値	限界水準(`P` 値)	`E(V)`
`A`	140.250	3	46.75	37.4	0.00028	`sigma^2 + 3sigma_A^2`
`R`	23.167	2	11.58	9.26	0.01465	`sigma^2 + 4sigma_R^2`
`E`	7.500	6	1.250			`sigma^2`
`T`	170.917	11

`E(V)` はそれぞれの分散 `V` の期待値を表す。表 1.3 の因子 `A` の `E(V)` の `sigma_A^2` の係数 3 は `A_1` 水準のデータ数 3 から来ている。同様に因子 `R` の `E(V)` の `sigma_R^2` の係数 4 は `R_1` 水準のデータ数 4 から来ている。`A` は母数因子だから `sigma_A^2 = sum a_i^2 // phi_A` である。また、`R` は変量因子であり、`sigma^2` は誤差 `epsilon_(ij)` の母分散である。

ついでブロック間変動（日間変動）`sigma_R^2` を推定する。`V_R = hat(sigma^2 + 4 sigma_R^2)` かつ `V_E = hat(sigma^2)` から、`hat sigma_R^2 = (V_R - V_E) // 4` であることがわかる。 `sigma_R^2 = (11.58 - 1.250) // 5 = 2.583`

任意データ入力

伝統的な分散分析手法の場合

答：分散分析表を書く。全体的な流れは一元配置表のときと同じであるが、要因が２種類あるので、列どうしを比較するだけではなく、行どうしも比較することに注意する。従って、求める `F` 値は行と列の 2 つとなり、その結果として限界水準 (`P` 値)も行と列の 2 つをそれぞれ求めて、有意か否かを判断する。

分散分析：乱塊法

乱塊法とは

乱塊法の問題

任意データ入力

伝統的な分散分析手法の場合

文献