バックプロパゲーションに向けて(2)
そこでバックプロパゲーションではの代わりにを使います。はシグモイド関数で
- ・・・・(10)
で定義されます。との比較を下のグラフに示します。
このシグモイド関数は階段関数に似た形をしていながら、どこでも微分可能、そして
なので、をどう変更していけばよいかの情報を得ることが出来るというものです。式(10)からで、で、でであることが分かります。また、をに置換えたものをとすると
つまり
- ・・・・(11)
となりますので
よって
- ・・・・(12)
このことから、シグモイド関数をY軸で反転させたものと元のシグモイド関数を足すとの値に関わらず1になることが分かります。ということはシグモイド関数とそれを反転した関数はで線対象になっていることになります。ということはシグモイド関数それ自身は点(0, 0.5)で点対象になっていることになります。この点でもと似ています。
それにしてもにこの程度似た関数ならばほかにもいろいろありそうなのになぜシグモイド関数を使うことにしたのでしょうか? それは、シグモイド関数の微分をシグモイド関数自身で表すことが出来る、というのが理由のようです。そこで、式(10)をで微分してこのことを確認してみましょう。
よって
- ・・・・(13)
ここで式(10)から
- ・・・・(14)
式(13)(14)
から
よって
- ・・・・(15)
と表すことが出来ます。