時系列データ解析 上級編 其の一 - Hurst Exponent (2008年02月11日)

統計解析(statistical analysis) - 其の壱 で触れたが、R-R Interval は長い時間にわたる自己相関性という性質を持っている。 今回は、相関の強さを測るもう一つの方法 Hurst Exponent について解説する。

データが確率的に振舞うことを ストカスティック(stochastic) であるという。 時系列データ Xn が ストカスティック(stochastic) であるとき、その トレース(trace)

(39)

は自己相似性(self-affine)という性質を持つ。 自己相似性とは フラクタル図形が持つ「スケーリングに対して 自分自身が相似になっている」という性質と同じ事を言っている。 時系列データの自己相似性(self-affine)は、時間軸についてのスケーリングに対する相似性として 下の(40)のように表される:

(40)

ここで HHurst Exponent であり、0.0<H<1.0 の値をとる。 Xnにまったく相関が無いとき、つまり全くランダムなデータであるとき、H=0.5 となる。 0.5<H<1.0 の時は、Xn は正の相関を持っており Yn は時間がたつにつれて出発点から遠ざかって行く傾向にある。 0.0<H<0.5 の時は、Xn は負の相関を持っており Yn は時間がたつにつれて出発点に戻ってくる傾向にある。 自然界に現れる多くの時系列データは H=0.73程度と言われている。 0.5<H<1.0 の場合、H が 1.0 に近くなるほどより長い時間にわたる自己相関性を持っていると考えられる。

因みに、H=0.5 の場合の トレース(trace) はいわゆるブラウン運動(Brownian motion) になる。

Hurst Exponent (H)Yn のフラクタル次元(fractal dimension) と

(41)

という関係にある。 また、パワースペクトラム(power spectrum)の傾きと

(42)

という関係にある。 よって、

(43)

トレース(trace) YnXn の積分であり、またパワーは二乗に比例するので、Xn のパワースペクトラム(power spectrum)の傾き βYn のパワースペクトラム(power spectrum)の傾き α の間には

(44)

の関係がある[Sprott, J. C. (2006), P111-113], [Kantz, H. and Schreiber, T. (2005), P96-100]

Hurst Exponent (H) の実際の計算は、

(45)

(46)

のように行う。

では、実際のデータで試してみる。 まずは、自己相関の無い乱数から。 データは 0.0 から 1.0 の間の数値をランダムに10000データ生成した。 下の図-28は、上が Xn 下が Yn であり、それぞれ最初の1000データ分プロットしたものだ。

図-28

完全にランダムなデータは ホワイトノイズと呼ばれていて、パワースペクトラム(power spectrum)はフラットになる。 つまり、β=0.0。 よって、α=2.0になる。

Xn Yn
図-29

α=2.0 なので、(42)より理論的には H=0.5 となる。 下の図-30のように、実際の計算でも ほぼそうなっている。 ちょっと感動。(^^)

図-30

つぎは、R-R Interval を試してみる。 しかし、世の中そうそう巧くはいかない。(^^;

下の図-31は、上が R-R Interval Xn、下がその trace(trail) Yn であり、それぞれ最初の1000データ分プロットしたものだ。

図-31

R-R Interval のパワースペクトラム(power spectrum) の傾きについては 以前フーリエ解析(Fourier analysis)で求めた。 β=1.9 なので、α=3.9 になるはずだ。 下の図-32右からすると そうはなっていない・・・なんで。(?_?)

Xn Yn
図-32

実際に計算から求めた Hurst exponent (下図-33右) は、H≈0.7 となっていて、「自然界に現れる多くの時系列データは H=0.73 程度」ってことに合っていそうだ。

図-33

ここで面白いこと発見。 R-R Interval Xn のパワースペクトラム(power spectrum) の傾きは β=1.9 であり、これに(44)を適用すると α=3.9 となって、図-32右の緑のラインとマッチしない。 しかも、(42)からすると α=3.9 の場合 H=1.45 となって 上の H≈0.7 とも合わない(そもそも 0.0<H<1.0 ってことになっているはず??)。 ところが、上の右図から求められる最大値 H≈0.75 を(42)に適用すると α=2.5 となって 図-32右の緑のラインにほぼマッチする。 いったいこれはどういうことなのか・・・非常に面白い。 だから止められない。(^^)v