分散分析:乱塊法

作成日 : 2025-01-30
最終更新日 :

乱塊法とは

乱塊法(randomized block design)とは、ブロック因子を導入し、ブロック内で制御因子を揃えて実験し、複数のブロックにわたって実験を反復する方法である。 ここでブロック因子とは、誤差からその効果を取り除くために導入する因子で、かつ、ばらつきの大きさを評価するために導入する因子である。 ブロック因子との対比で使われるのが制御因子である。制御因子は、水準設定に再現性があり、最適水準を選ぶことに意味がある因子である。 豊田秀樹:違いを見抜く統計学も参照してほしい。

乱塊法の問題

例題1 : 因子 `A` について 4 水準を設定し、1 日で 4 水準の実験をすることを計 3 日間おこなった。解析せよ。(文献[1] pp.186-188 より引用)

乱塊法における実験順序
因子の水準`R_1` 第 1 日目`R_2` 第 2 日目`R_3` 第 3 日目
`A_1`2512
`A_2`1711
`A_3`469
`A_4`3810

ブロック因子の水準は、制御因子と区別して `R` を使うのは通例のようである。

データの構造式に基づいて説明しよう。上記「乱塊法における実験順序」から得られる `A_iR_j` 水準のデータを `x_(ij)` と表すとき、 データの構造式や制約式は次のようになる。

制御因子とブロック因子の構造式

`x_(ij) = mu + a_i + r_j+ epsilon_(ij)`
`sum_(i=1)^4 a_i = a_1 + a_2 + a_3 + a_4 = 0`
`r_j ~ N(0, sigma_R^2)`
`epsilon_(ij) ~ N(0, sigma^2)`

繰返しのない(制御因子どうしの)2 元配置法のデータの構造式

`x_(ij) = mu + a_i + b_j+ epsilon_(ij)`
`sum_(i=1)^4 a_i = a_1 + a_2 + a_3 + a_4 = 0`
`sum_(i=1)^4 b_i = b_1 + b_2 + b_3 + b_4 = 0`
`epsilon_(ij) ~ N(0, sigma^2)`

ここで、`sigma_R^2` と `sigma^2` が異なることが、繰返しのない 2 元配置法と異なるところである。

表1.1 例題1の計測値
`A\R`
表1.3 例題 1 のモデルと 分散分析表
因子 平方和 自由度 平均平方 `F` 値 限界水準(`P` 値) `E(V)`
`A` 140.250 3 46.75 37.4 0.00028 `sigma^2 + 3sigma_A^2`
`R` 23.167 2 11.58 9.26 0.01465 `sigma^2 + 4sigma_R^2`
`E` 7.500 6 1.250 `sigma^2`
`T` 170.917 11

`E(V)` はそれぞれの分散 `V` の期待値を表す。表 1.3 の因子 `A` の `E(V)` の `sigma_A^2` の係数 3 は `A_1` 水準のデータ数 3 から来ている。 同様に因子 `R` の `E(V)` の `sigma_R^2` の係数 4 は `R_1` 水準のデータ数 4 から来ている。`A` は母数因子だから `sigma_A^2 = sum a_i^2 // phi_A` である。 また、`R` は変量因子であり、`sigma^2` は誤差 `epsilon_(ij)` の母分散である。

ついでブロック間変動(日間変動)`sigma_R^2` を推定する。`V_R = hat(sigma^2 + 4 sigma_R^2)` かつ `V_E = hat(sigma^2)` から、`hat sigma_R^2 = (V_R - V_E) // 4` であることがわかる。 `sigma_R^2 = (11.58 - 1.250) // 5 = 2.583`


任意データ入力

工事中です。


データ入力
分散分析表
因子 平方和自由度 平均平方 `F` 値 `P` 値

伝統的な分散分析手法の場合

答:分散分析表を書く。全体的な流れは一元配置表のときと同じであるが、要因が2種類あるので、列どうしを比較するだけではなく、行どうしも比較することに注意する。 従って、求める `F` 値は行と列の 2 つとなり、その結果として限界水準 (`P` 値)も行と列の 2 つをそれぞれ求めて、有意か否かを判断する。

文献

  1. 永田靖:入門実験計画法
  2. 鷲尾泰俊:実験の計画と解析

まりんきょ学問所統計活用術 > 分散分析:乱塊法


MARUYAMA Satosi