1個のニューロンの学習(6)

ここでさらに、

  • \vec{x}(i)\in{I^+}であるような\vec{x}(i)については\vec{v}(i)=\vec{x}(i)
  • \vec{x}(i)\in{I^-}であるような\vec{x}(i)については\vec{v}(i)=-\vec{x}(i)

というふうに\vec{v}(i)i=1,2,...,m)を定義します。すると全てのiについて

  • \vec{S}\cdot\vec{v}(i)>0・・・・(14)

となります。この時、標準デルタ則

  • s_i{\leftar}s_i+a(r-y)x_i・・・・(3)
  • (ただし、i=1,2,....,n,n+1

  • r=yならば
    • s_i{\leftar}s_i・・・・(15)
  • r{\neq}yならば
    • s_i{\leftar}s_i+av_i・・・・(16)

と書き換えることが出来ます。ただしv_iはベクトル\vec{v}i番目の成分です。さて、式(15)は明らかなので式(16)について確かめます。まずr=1y=0の場合はまずr=1から\vec{x}=(x_1,x_2,...,x_n,x_{n+1})\vec{x}\in{I^+}。よって\vec{v}=\vec{x}。よって式(3)から

  • s_i{\leftar}s_i+a(r-y)v_i

ここでr=1y=0を代入すれば式(16)になります。次にr=0y=1の場合はr=0から\vec{x}\in{I^-}。よって\vec{v}=-\vec{x}。よって式(3)から

  • s_i{\leftar}s_i-a(r-y)v_i

ここでr=0y=1を代入すればやはり式(16)になります。式(16)はベクトルを用いて

  • r{\neq}yならば
    • \vec{s}{\leftar}\vec{s}+a\vec{v}・・・・(17)

と書き直すことが出来ます。ここまでで証明の準備が整いました。


\vec{s}の最初の値を\vec{s}_1で表します。ニューロンがこの\vec{s_1}で表される設定である時にパターン\vec{x}(i)ニューロンに与えていきます。パターン\vec{x}(i)ニューロンに与える順序は任意です。このようにしてニューロンにパターンを与えていく間にどれかのパターン\vec{x}(i)ニューロンの出力が不正解、すなわちr{\neq}yになります(ならないとすれば、すでにニューロンの学習が完了していることになります)。この時のパターンを\vec{P}(1)で表し、それに対応する\vec{v}\vec{Q}(1)で表すことにします。するとニューロンは式(17)に従って\vec{s}_1\vec{s}_2に変更するとします。すると式(17)から

  • \vec{s}_2=\vec{s}_1+a\vec{Q}(1)・・・・(18)

今度はニューロンの設定が\vec{s}_2になった状態でパターンを受け付けます。そしてどれかのパターン\vec{x}(i)ニューロンの出力が不正解になります。この時のパターンを\vec{P}(2)で表し、それに対応する\vec{v}\vec{Q}(2)で表すことにします。\vec{s}_2\vec{s}_3に変化し、両者の関係は

  • \vec{s}_3=\vec{s}_2+a\vec{Q}(2)・・・・(19)

となります。同様にしてk番目に不正解になったパターンを\vec{P}(k)、それに対応する\vec{v}\vec{Q}(k)で表します。その時は

  • \vec{s}_{k+1}=\vec{s}_k+a\vec{Q}(k)・・・・(20)

が成り立ちます。ここで\vec{P}(k)\vec{x}(i) (i=1,...,m)のいずれかであることに注意して下さい。また、\vec{P}(1)\vec{P}(2)・・・・・、\vec{P}(k)の中には同じパターンがある可能性もあることに注意して下さい。例えば「1個のニューロンの学習(3)」に示した例でいえば、

  • \vec{P}(1)=(0,0,1)
  • \vec{P}(2)=(1,0,1)
  • \vec{P}(3)=(1,1,1)
  • \vec{P}(4)=(1,0,1)
  • \vec{P}(5)=(1,1,1)
  • \vec{P}(6)=(1,0,1)
  • \vec{P}(7)=(1,1,1)
  • \vec{P}(8)=(1,0,1)

となります。また、\vec{Q}(k)

  • \vec{Q}(1)=(0,0,-1)
  • \vec{Q}(2)=(-1,0,-1)
  • \vec{Q}(3)=(1,1,1)
  • \vec{Q}(4)=(-1,0,-1)
  • \vec{Q}(5)=(1,1,1)
  • \vec{Q}(6)=(-1,0,-1)
  • \vec{Q}(7)=(1,1,1)
  • \vec{Q}(8)=(-1,0,-1)

です。同じものが複数現れているのが分かります。