2015年1月30日金曜日

時系列データの季節調整はどこまで信頼がおけるのか?

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

就業者数(季節調整済)の推移のトレンド転換点を最尤法で探してみたエントリーに対して、季節調整をしたとしても月次データは信頼がおけない、年次データを見ろと言っている人がいる。傍証として年次データでも変化が見られる有効求人倍率、民間投資、銀行貸出も確認した上で結論を出したのは目に入らなかったようなのは置いておいて、季節調整がどの程度機能するかを幾つか例を挙げつつ直感的に考えてみたい。

1. 季節調整の必要性

正月やゴールデンウィークのような年中行事が人々の行動に影響を与えるのはよく知られているし、そもそも月ごとに日数も異なる。月次データを見るときは、季節バイアスの影響を考慮する必要がある。だから官公庁の統計は、原数値とともに季節調整済データを提示している。

2. 季節調整アルゴリズムのテスト方針

実際にどれぐらい補正できるのであろうか。シミュレーションをしてみよう。(a)真の非季節変動値と(b)真の季節バイアス生成し、二つを合計した(c)原数値を作る。この原数値に対してloessアルゴリズムをかけて(d)非季節変動値をloessアルゴリズムで計算し、(a)と比較を行なってみよう。(a)と(d)が近ければ近いほど精度が高いと言える。なお、データ作成方法などの詳細は「時系列データの季節調整をしてみよう」を参照して欲しい。

3. 非季節変動が二次曲線のケース

グラフ中のloessアルゴリズムが(d)になるが、ほぼ完璧に(a)と(d)が一致している。上昇/下降トレンドに同じ季節変動が加わっているデータならば、信頼性は高い。

4. 非季節変動が二次曲線+誤差項のケース

実際のデータはこれに近いが、少し大きめの誤差項を入れたケースを見てみよう。完璧ではなく、だいたい黒太線(a)と赤太線(d)が一致するようになる。二つの差は大きなものではない。実際、回帰分析を行なっても、真の値でy=0.003000*x^2 - 0.1400*x、loessアルゴリズムによる推定値でy=0.002998*x^2 - 0.1402*xとなり、分析にはほとんど影響しない。

5. 非季節変動が階段関数のケース

季節調整に信頼がおけないと主張する人が、例として「4月にしか雇用は変動しないとする。この場合移動平均だろうが年次データだろうが、年単位の精度しかもってない」と主張していたケース。4月ではなく1月にだけ変化するようにしたが、(d)loessアルゴリズムも移動平均も、トレンドが変化する月を精度をもって割り出すことが出来ている

年に一回しか非季節変動値が動かないとしても、何月に変化があるかは掴むことができるので、月単位の精度はある。トレンドが変化した時点が分かれば、その時点より後の事象が影響した可能性を排除できる。

6. 季節調整が上手くいかないケース

季節調整が上手くいかないケースももちろんある。例えば季節変動に変化が見られたとき。1998年までの季節変動と、1999年以降の季節変動が全く別の場合は、(d)loessアルゴリズムは(a)真の非季節変動値とほとんど一致しない。単純移動平均を見た方が良い。

官公庁のデータは何十年分もあるから大丈夫か不安になるが、役人はX-12-ARIMAと言う移動平均法を改良した季節調整を行なっているので、官公庁統計にはこの問題は大きな影響をもたらさない

1996年から2006年までを想定し、2001年に季節バイアスが完全に変わるデータでX-12-ARIMAアルゴリズムを適用してみよう。loessは全てに影響があるものの、X-12-ARIMAは2001年前後の乱れで済んでいる。実際は季節バイアスは徐々に変化していくので、X-12-ARIMAは季節変動の変化に影響されないと見なして良い。

7. まとめ

官公庁や民間エコノミストが使っている季節調整済の月次データを疑い出したす人は少数だと思うが、季節調整方法は公開されているし、実際に試すのも難しくは無いので、気になるのであれば調べれてから文句をつければ良い気がしなくもない。直感的に信じている自説を否定する分析に使われたからといって、分析方法に問題があるとは限らない。偽科学を信じる人々は、往々にして良く調べもせずに科学的な分析方法を疑っているものではあるが。

0 コメント:

コメントを投稿