時系列データ解析 基礎編 其の四 - 埋め込み次元(embedding dimension)の求め方 (2007年12月16日)

遅延埋め込み法(delay embedding method) の次元(dimension) m の推測方法は False Closest Neighbours という方法を使う。 False Closest Neighbours 法について説明する前に、一般的な曲線や曲面が多次元空間に埋め込まれた場合について考えてみる。

「アトラクターがいい具合に多次元空間に埋め込まれた」状態というのは、アトラクターが自分自身と重なり合わず 整然と(?)している状態と思って欲しい。 例えば、1次元の曲線について考えてみよう。 曲線を2次元空間(つまり平面)に埋め込んだ場合、曲線は自分自身と重なる可能性がある。 その時の重なった部分の次元は0次元(点)だ。 直線は3次元空間に埋め込んだ時 初めて重なりがなく埋め込まれる。 では、2次元の曲面を埋め込む場合はどうだろう? 3次元空間に埋め込んだ場合 曲面は自分自身と重なる可能性がある。 その時の重なった部分の次元は1次元(曲線)だ。 では、4次元空間に埋め込んだ場合はどうだろう? 俺はまだこの目で実際に見たことは無いのだけど、まだ重なる可能性があって、その時の重なった部分の次元は0次元(点)らしい。 曲面は5次元空間に埋め込んだ時 初めて重なりがなく埋め込まれる。 ちょっと考えると分かるが d 次元のオブジェクトをいい具合に埋め込む場合 少なくとも

(20)

の次元が必要となる。 アトラクターでも同様な事が言えるのだ。

さて本題の False Closest Neighbours 法について説明に入る。 アトラクターが m 次元空間ではうまく埋め込まれているけど m-1 次元空間ではまだ重なりがある場合を考えよう。 この場合、m-1 次元の埋め込み空間(embedded space)における隣り合った2点は 実は m 次元空間では遠く離れた2点かも知れない。 丁度、離れたところにある2つの物体が 日光の下で影が重なっているような感じだ。 False Closest Neighbours 法では、そういう2点の組を数えて、全体のどのくらいの割合かを算出して 最適な(最低必要な)埋め込み次元(embedded dimension) m を求めようという方法だ。

うだうだ説明しても仕方ないので とっとと数式を書くと

(21)

ってなかんじ[Kantz, H. and Schreiber, T. (2005), P37] [Sprott, J. C. (2006), P256]。 ここで、太字の Xn(m)Xn(m+1) はそれぞれ ある1点の埋め込み次元(embedded dimension) m での座標と m+1 次元での座標を表す。 Xk(n)(m)Xn(m)最近傍点の座標で、Xk(n)(m+1) は その点の m+1 次元での座標を表す。 Θ(x) は、Step Function で、x>0 の時 1、それ以外では 0 の値を取る。 r は「近傍」を定義するスケールファクターだ。 &sigma(6)で与えられる。

(21)は 一見何が何だか分からない式なのだけど、肝心なのは右辺の分子の左側の Step Function で、ある2点の組の m+1 次元空間での距離と m 次元空間での距離の比を求めて、それがスケールファクタ r 以上だったらカウントしようというものだ。 その他の分子と分母にある Step Function は、得られる値を正規化するためのものだ。

式(13)、(14)で与えられる時系列データ 図-13図-17Rfnn(r)r に対してプロットしたものが 下の図-19だ。 ただし、遅延時間(time lag) を τ=3 とした。 理由は、アトラクターが複雑なほど 次元の差異がはっきり出るから。

図-19

アトラクターがいい具合に埋め込まれている場合、r が大きくなるにつれて Rfnn(r) が急激に小さくなるはずだ。 式(13)、(14)で与えられる時系列データ 図-13 をいい具合に埋め込むには、埋め込み次元(embedded dimension) m=2 ではまだ不十分なようであり 少なくとも m>3 が必要な様に見える。

(20)から逆算すると、式(13)、(14) で与えられる時系列データ 図-13 の次元は d=1 か又はそれより少し大きいくらいという事だ。