時系列データ解析 基礎編 其の五 - アトラクターの次元 (2007年12月23日)

次元の話になったので ついでにアトラクターの次元について説明したい。 アトラクターの次元の求め方には色々あるんだと思うけど、ここでは代表的な Correlation DimensionInformation Dimension について説明したい。

・・・と本題に入る前に、アトラクターの次元の求め方の基本的な考え方を説明しておいたほうが 後々理解が早いと思う。 まず、m 次元空間に無数の点が一様に密度 n で散らばっているとする。 一片が LL とはわずかに異なる L-(Lの上にバーのつもり) を一辺とする2つの立方体考えると それぞれの中に存在する点の数は

となって、両式の比をとると

両辺の対数をとって

従って

となる。 差分を格好良く微分にして md に書き換えると

(22)

となって、これがアトラクターの次元を計算するときの基本的な式となる。

上の例では点が m 次元空間内に一様に散らばっている場合を考えたので、(22)から求まるものは空間の次元そのものだが、アトラクターに構造があって m 次元空間内にいい具合に埋め込まれている場合 d<m となる。 ちなみに、アトラクターの次元 d が 埋め込み空間(embedded space) m より大きい場合、(22)より求まる値は m になる。

もうひとつ補足すると、(22)の分母と分子は共にある値の比になっていて、両方共に無次元だ。 従って、点の数 N の代わりに、空間の大きさ L に応じて変化する値を持ってきても 同様にアトラクターの次元を計算することが可能なのだ。

今までは簡単な式で説明してきたが、面倒になってきたので いきなりちょっと複雑な式を書いてしまう。(^^; アトラクターの次元の定義には一般化された次元(generalized dimension)というのがあって、次式であたえられる Generalized Correlation Sum が基本となる[Kantz, H. and Schreiber, T. (2005), P215] [Sprott, J. C. (2006), P337]:

(23)

(23)は何も難しいものではなく、単純に m 次元空間内の2点の距離が ε より小さい場合にカウントして正規化するというものだ。 pε は 半径 εm 次元球体の中にアトラクターが存在する確率だ。

(23)の Generalized Correlation Sum は (22)の N と同様の情報を持っていて、一般化された次元(generalized dimension) Dq

(24)

という関係にある。 従って(22)の時と同じように

(25)

として アトラクターの次元の情報を持った値 Dq が得られる。

Dq一般化された次元(generalized dimension)と呼ばれる理由は 指数 q が付いているからなのだけど、q の全ての値について Dq が重要というわけではなく、その中でも q=2Correlation Dimensionq=1Information Dimension が重要だ。

q=2Correlation Dimension は 計算が簡単で、(23)と(25)から直接的に求められる[Kantz, H. and Schreiber, T. (2005), P78-82]:

(26)

ただし、nmin は、時間的に近い点同士は アトラクターの構造に関係なく距離的にも近いことを考慮して、そういう点同士はカウントしないためにある。

式(13)、(14)で与えられる時系列データ 図-13図-17C2(ε)D2(ε)ε に対してプロットしたものが 下の図-20だ。

図-20

右図からすると、式(13)、(14)で与えられる時系列データ図-13図-17 のアトラクターの次元は、ε→0 において D2(ε)→0.8 の様にみえるのだけど、これは点の数が少なすぎることによると思われる。 より確からしい値は、D2(ε) が一定になっている ε=0.1 辺りの ≅1.4 を採るのが良い。

q=1Information Dimension の場合、(25)の C(q-1)(ε)<pε(q-1)> と置き換えて

(27)

となるのだけど、これから直接計算するのは難しい。 実際の計算では、半径 ε を与えて m 次元球体中にアトラクターが存在する確率 <pε> を算出する代わりに、m 次元球体中にアトラクターが存在する確率 p を与えて 半径 p> を算出するようにする。 すると、(24)は

(28)

となる。 (28)は q→1 においてのみ明示的に解くことができて[Kantz, H. and Schreiber, T. (2005), P216]

(29)

となる。

コンピュータでは、a をアトラクターの点の数、N をデータ点の総数としたとき p=a/N として、その時 a 個の点が作る m 次元球体の半径(直径) p> を算出し、

(30)

を使って計算する。

式(13)、(14)で与えられる時系列データ 図-13図-17C1(ε)D1(ε)ε に対してプロットしたものが 下の図-21だ。

図-21

右図からすると、式(13)、(14)で与えられる時系列データ図-13図-17 のアトラクターの次元は、ε→0 において D1(ε)→2.0 の様にみえるのだけど、これは点の数が少なすぎることによると思われる。 より確からしい値は、D2(ε) の時と同じく、D1(ε) が一定になっている ε=0.01 辺りの ≅1.4 を採るのが良い。

一般に D1(ε) は、D2(ε) より大きくなる。 D1(ε) の計算が不可能な場合、D2(ε) の値を D1(ε) の下限として採用する。