自己回帰モデル

作成日 : 2004-02-14
最終更新日 :

今回は自己回帰分析を取り上げる。

時間とともに変動をする現象の観測値を時間とともに記録した並びを時系列と呼ぶ。 時系列解析とは、時系列に潜む構造を明らかにすることである。 時系列解析に使われるモデルに、自己回帰モデル(autoregression model)がある。 自己回帰モデルの呼び名は、時系列自身の過去の値を説明変数とする回帰モデルであることに由来している。

結果を表す数字(目的変数)を、影響を与えた数字(説明変数)で表す式を立てるのは、 他の回帰モデルと同様だ。 時刻 t で得られた時系列を、`x_t` と表す (いわずもがなですが、xtは等間隔で観測した値です)。 自己回帰モデルの場合は、次のようになる。

`x_t = a_1 x_(t-1) + ... + a_m x_(t-m) + epsilon`

ai (i = 1, ..., m) は自己回帰係数と呼ばれる。 また、m は次数と呼ばれる。 `epsilon` は残差と呼ばれ、平均0、分散σ2の正規分布に従うことを仮定する。 以降、簡単のため、時系列 xt の平均値は0であるとする。

後の計算では、元の時系列データから標本平均を求めて、 元の時系列から標本平均を差し引いた値を解析対象とすることで、 平均値が0であるという条件を満たすように前処理する。いいかえれば、 必ずしも平均値が0でない時系列 yt に関して、yt の平均値 m を求めて、 xt = yt - m なるxtに関して解析を行う。

さて、この式の、a1、...、amおよび分散σ2を推定する。 さらに、このプログラムでは、モデルのあてはまりのよさを評価する AIC も出力する。 AIC は以前の項でも触れましたが、パラメータ数の選択の際に役に立つ。 この場合は、次数 m を決定するための選択基準となります。

例題:2004年1月、埼玉県越谷市の日平均気温が次のとおり得られた。 このデータから、ある日までの記録に基づいて、その翌日の平均気温を予測するモデルを作れ。 (データ出所:気象庁電子閲覧室、http://www.data.kishou.go.jp/)

9.0 7.6 7.5 6.1 4.5 4.7 3.2 4.0 4.4 3.0
4.7 3.4 5.3 3.6 2.8 2.8 2.2 4.1 3.3 6.4
6.4 3.0 3.4 2.4 3.3 3.8 3.3 5.2 6.3 5.8 5.8

答:上記例では、上の表部分をコピーして、[データ入力]欄にペーストする。 あるいは、コピーボタンをクリックして、[データ入力]欄にデータをペーストする。

[計算ボタン]をクリックすると、 [次数とAIC]欄に、次数を増やした場合の分散とAICをこの順で表示する。 このとき、データ数、時系列の平均、最小のAICをとる次数と、そのときの分散、AICを上部に表示する。 自己回帰係数a[i]の欄には、 添字 i とそのときの自己回帰係数の推定値a[i]を表示する。すなわち、 `a_i (a_1, ..., a_m)` が上から順に表示される。

上記の例では、時系列の平均が4.558、最適次数が1、自己回帰係数 a1 = 0.5500 だから、 モデルは次のようになる。

xt = 0.5500 * (xt-1 - 4.558) + 4.558 + ε

ここでεは、平均0、分散1.9462 の正規分布に従う確率変数である。

データ数 平均 最適次数 最小AIC

データ入力 次数とAIC 自己回帰係数a[i]

まりんきょ学問所統計活用術 ≫ 自己回帰モデル


MARUYAMA Satosi