対になったデータの組`(x, y)`があるとき、`x` と `y` の相関をゼロとみなしてよいかどうか、判定する。
例題:対になったデータの組`(x, y)`がある。 `(x,y)`は2次元正規分布に従うことがわかっているが、相関係数はゼロとみなせるか?
(1.847 -1.700),(1.531 0.226),(-0.498 1.688 ),( 1.405 -0.312 ),(0.635 0.274), (1.817 0.749),( 0.498 0.644),( 2.266 1.828 ),( -1.048 -1.370 ),(0.926 -1.071), (0.509 -0.734 ),( 0.237 0.564 ),( 0.613 -0.819 ),(1.202 1.783 ),( -0.819 1.154)
解答:
ベクトルの転置を肩の `T` で表す。2次元正規分布モデルの一般形は、`z = (x,y)^T, mu=(mu_x, mu_y)^T、 d= z - mu` として、次の通り表せる。
`MODEL(1) : f(z|mu, Sigma) = C exp ((-d^T Sigma^(-1) d) / 2) `ここで係数Cは次の式で表される。
`C = 1 / (2 pi sqrt(det (Sigma)))`det(A)は行列Aの行列式である。
またΣは分散共分散行列とよばれ、次の形をもつ。
`Sigma = ((V_(x x), V_(xy)), (V_(yx), V_(yy)))`計算式は、データ数を`n`とすれば次の通りである。
`V_(x x) ={ (x_1 - mu_x)^2 + (x_2 - mu_x)^2 + ... + (x_n - mu_x)^2 } / n,`MODEL(1)にρ=ρ0という制約を加えて得られるモデルをMODEL(0)とする。 MODEL(1)とMODEL(0)のAICは次のようになる。
`AIC(1) = 2n log 2 pi + n log(det(Sigma)) + 2n + 2 * 5`
`AIC(0) = 2n log 2 pi + n log(sigma_(xx)^2 sigma_(yy)^2) + n log (1 - rho_0^2) + 2n + 2 * 5`
これらの計算式によりAIC(1)とAIC(0)を求め、値が小さいほうのモデルをとればよい。
「コピー」ボタンをクリックすると、上記例が左下の欄に入力される。 「計算」ボタンをクリックすると、右の欄にAICが表示される。
上記の場合は、AIC(1) =96.99, AIC(0) = 95.02 となり、相関係数をゼロとみなしてよい。
なお、上記の計算過程で、相関係数を求めることができる。 相関係数` rho_(xy) `は、次の式で求めることができる。
` rho_(xy) = V_(xy) / sqrt(V_(x x)V_(yy))`