バックプロパゲーションに向けて（４） - 工場統計力学（建設中！）

図２

今度考えるネットワークでは、今までとは異なって出力が複数あります。ニューロンの数が $q$ 個あるとします。出力も $q$ 個あることになります。 $j$ 番目のニューロンを $n_j$ で表し、その出力を $y_j$ で表すことにします。入力の個数は $n$ であって、出力の個数 $q$ とは一般には等しくありません。 $i$ 番目の入力は今までと同じように $x_i$ で表します。ニューロン $n_j$ における $x_i$ に対応するシナプス係数を $s_{ji}$ で表します。今までと同じように常に $x_0=1$ とします。

$u_j=\Bigsum_{i=0}^ns_{ji}x_i$ ・・・・(24)

で $u_j$ を定義します。 $u_j$ と $y_j$ の関係は

$y_j=f(u_j)$ ・・・・(25)

で表されるとします。ここに $f(u)$ はシグモイド関数で

$f(u)=\frac{1}{1+e^{-u}}$ ・・・・(10)

で定義されます。教師信号も各々のニューロン毎に存在するとし、ニューロン $n_j$ の教師信号を $r_j$ とします。誤差 $E$ を

$E=\Bigsum_{j=1}^q(r_j-y_j)^2$

で定義することにします。

$\frac{\partial{E}}{\partial{s}_{ji}}$

を考えます。 $s_{ji}$ はニューロン $n_j$ 内のシナプス係数の１つであり、 $n_j$ は $y_j$ 以外の出力にまったく寄与していないので

$\frac{\partial{E}}{\partial{s}_{ji}}=\frac{\partial{E}}{\partial{y_j}}\cdot\frac{\partial{y_j}}{\partial{s}_{ji}}$ ・・・・(26)

が成り立ちます。よって

$\frac{\partial{E}}{\partial{s}_{ji}}=-2(r_j-y_j)\frac{\partial{y_j}}{\partial{s}_{ji}}$
$\frac{\partial{E}}{\partial{s}_{ji}}=-2(r_j-y_j)\frac{dy_j}{du_j}\cdot\frac{\partial{u_j}}{\partial{s}_{ji}}$ ・・・・(27)