ガボールフィルター

今、網膜に映る画像のことを考えていますので、2次元のガボールフィルターを考察します。画像を構成する点の位置を(x,y)で表すことにますが、これをまとめてベクトルと考えて2次元の位置ベクトル\vec{x}で表すことにします。するとガボールフィルターは以下の式で表されます。

  • F(\vec{x})=G(\vec{x},\sigma)\cos(\vec{k}\cdot\vec{x}+\phi)

ここで、G(\vec{x},\sigma)は2次元のガウス分布で、x座標の平均は0、y座標の平均も0、x座標の標準偏差y座標の標準偏差\sigmaであるような分布です。また、\vec{k}はある固定のベクトルで、\phiは定数です。


まず、\vec{k}\cdot\vec{x}の意味を調べてみます。これはベクトル\vec{k}と直交する線上においては一定の値を取ります。

つまり、上図において直線L上の点をベクトル\vec{x}で表すと、この線上では\cos{\thetaが常に一定になります。よって、\vec{k}の大きさをK\vec{x}の大きさをXで表すとKX\cos\thetaが一定ということになります。よって\vec{k}\cdot\vec{x}が一定となることになります。
次に位置ベクトル\vec{x}がベクトル\vec{k}と同じ方向を向いているとすると\vec{k}\cdot\vec{x}=KXになります。よって、\cos(\vec{k}\cdot\vec{x})=\cos(KX)となります。これは波長2\pi/Kの正弦波(厳密に呼べば「余弦波」と呼ぶべきですが)になります。
以上のことから\cos(\vec{k}\cdot\vec{x})は、ベクトル\vec{k}の方向に見ると正弦波で、それと垂直の方向に見ると一定値になるような波になります。これを図示すると以下のようになります。


あと、\phiを含めて考えると\cos(\vec{k}\cdot\vec{x}+\phi)は、単に\cos(\vec{k}\cdot\vec{x})をベクトル\vec{k}と反対方向に\phi/Kだけずらしたものになっていることが分かります。


一方、G(\vec{x},\sigma)は座標(0,0)を中心をする同心円上で等しい値をとるガウス分布です。これは以下の図のようになります。


よって、G(\vec{x},\sigma)\cos(\vec{k}\cdot\vec{x})を掛け合わせたF(\vec{x})は、(0,0)付近だけが波がはっきり分かるような図形になります。

F(\vec{x})の値を濃淡で表すと以下のようになります。


これは、座標(0,0)を中心とするガボールフィルターですが、一般の位置を中心とするガボールフィルターも考えることが出来ます。中心位置を\vec{x_0}で表すならば、そのようなガボールフィルターの式は

  • F(\vec{x})=G(\vec{x}-\vec{x_0},\sigma)\cos(\vec{k}\cdot\vec{x}+\theta)

となります。
ガボールフィルターには、局所性、方向性、周波数特性、の3つの特性を持っています。

  • 局所性というのは、F(\vec{x})の絶対値が大きい領域は、ある点の周辺に限られるということです。上の式では\vec{x_0}の周辺に限られています。
  • 方向性とは、F(\vec{x})の値の大きい場所、あるは小さい場所が、ある方向に並んでいるということです。上の式では\vec{k}と垂直方向に並んでいます。
  • 周波数特性とは、F(\vec{x})がある一定の空間周波数を持っているということです。上の式では\vec{k}の大きさが空間周波数を決めています。


そしてこのような特性は、脳におけるV1(一次視覚野)にある単純細胞の受容野にそのまま当てはまる、ということです。