2 次元データの相関

作成日 : 2004-02-22
最終更新日 :

対になったデータの組(x, y)があるとき、x と y の相関をゼロとみなしてよいかどうか、判定する。

例題:対になったデータの組(x, y)がある。 (x,y)は2次元正規分布に従うことがわかっているが、相関係数はゼロとみなせるか?

	(1.847 -1.700),(1.531 0.226),(-0.498 1.688 ),( 1.405 -0.312 ),(0.635 0.274),
	(1.817 0.749),( 0.498 0.644),( 2.266 1.828 ),( -1.048 -1.370 ),(0.926 -1.071),
	(0.509 -0.734 ),( 0.237 0.564 ),( 0.613 -0.819 ),(1.202 1.783 ),( -0.819 1.154)

2次元正規分布モデルの一般形は、z = (x,y)T, μ=(μx, μyT、 d = z - μ として、次の通り表せる。

`MODEL(1) : f(z|mu, Sigma) = C exp ((-d^T Sigma^(-1) d) / 2) `

ここで係数Cは次の式で表される。

`C = 1 / (2 pi sqrt(det (Sigma)))`

det(A)は行列Aの行列式である。

またΣは分散共分散行列とよばれ、次の形をもつ。

`Sigma = ((V_(x x), V_(xy)), (V_(yx), V_(yy)))`

計算式は、データ数を`n`とすれば次の通りである。

`V_(x x) ={ (x_1 - mu_x)^2 + (x_2 - mu_x)^2 + ... + (x_n - mu_x)^2 } / n,`
`V_(y y) ={ (y_1 - mu_y)^2 + (y_2 - mu_y)^2 + ... + (y_n - mu_y)^2 } / n,`
`V_(x y) ={ (x_1 - mu_x)(y_1 - mu_y) + (x_2 - mu_x)(y_2 - mu_y) + ... + (x_n - mu_x)(y_n - mu_y) } / n`

MODEL(1)にρ=ρ0という制約を加えて得られるモデルをMODEL(0)とする。 MODEL(1)とMODEL(0)のAICは次のようになる。

`AIC(1) = 2n log 2 pi + n log(det(Sigma)) + 2n + 2 * 5`
`AIC(0) = 2n log 2 pi + n log(sigma_(xx)^2 sigma_(yy)^2) + n log (1 - rho_0^2) + 2n + 2 * 5`

これらの計算式によりAIC(1)とAIC(0)を求め、値が小さいほうのモデルをとればよい。

「コピー」ボタンをクリックすると、上記例が左下の欄に入力される。 「計算」ボタンをクリックすると、右の欄にAICが表示される。

上記の場合は、AIC(1) =96.99, AIC(0) = 95.02 となり、相関係数をゼロとみなしてよい。

なお、上記の計算過程で、相関係数を求めることができる。 相関係数` rho_(xy) `は、次の式で求めることができる。

` rho_(xy) = V_(xy) / sqrt(V_(x x)V_(yy))`

n x平均 y平均 Vxx Vyy Vxy ρ

モデル制約AIC
AIC(1) 制約なし
AIC(0) ρ=0
データ

まりんきょ学問所統計活用術 ≫ 2次元データの相関

MARUYAMA Satosi