ボルツマンマシンの勉強中(2)
このエントリーは勉強であれこれ考えたことをメモしているだけですから、個人的なものです。ネットに公開しながら矛盾していますが、ごく私的なメモです。すみません。いつかはちゃんと人に説明出来るようになりたい。とにかく書いていきます。
さっそくですが昨日
英語版Wikipediaの制限ボルツマンマシンのページに登場した
の式を見た時に、おお、まさしく統計力学の式だ、と感じました。
で書いたことに疑問を持ち始めています。この式には温度が入っていない点が統計力学で登場する式と異なるのではないか? ボルツマンマシンでは温度が(物理的な温度とは別の抽象的な温度であったにしても)重要な役割をはたすのであるから、上の式で温度が登場しないのはおかしいのではないか? と思うようになりました。きちんと統計力学に即して書くならば
になるのではないか、と思っております。ここではボルツマン定数です。ここでの温度は物理的な温度とは異なる縮尺を持っていると仮定して、を新たな温度と定義し、改めてこれをと書き表すことにすれば
です。
さて、いきなり制限ボルツマンマシンについて考察するのではなく、通常のボルツマンマシンについて考察します。ボルツマンマシンを構成する各ニューロンの出力は+1か-1のいずれかであるとします。番目のニューロンの出力をで表すことにします。そしてそれらを全て並べたをこのボルツマンマシンの状態ベクトルとみなし、これをで表すことにします。このボルツマンマシンのエネルギーを状態の関数と考えと書くことにします。すると、温度がの時に、このボルツマンマシンの状態がである確率は、統計力学との類推から
- ・・・・(1)
で与えられるとします。番目のニューロン以外の全てのニューロンの出力(ただし)が決定しているとして、この状態で番目のニューロンの出力が+1になる確率、-1になる確率を求めてみます。である時のこのボルツマンマシン全体のエネルギーを、である時のこのボルツマンマシン全体のエネルギーをで表すことにします。、の値はだけで決まるのではなく、全てのニューロンの出力から決まることに注意して下さい。番目のニューロンと他のニューロンの間のシナプス係数や他のニューロンの出力によってはの場合もあり得ますし[tex:E_i^+
- ・・・・(2)
のように決まっているとします。は+1か-1の値をとるとします。他のニューロンの出力が式(2)のように定まっていてであるような状態ベクトルを、他のニューロンの出力が式(2)のように定まっていてであるような状態ベクトルを、で表すことにします。すると式(1)から
- ・・・・(3)
- ・・・・(4)
となります。の値が任意であるとして他のニューロンの出力が式(2)のようになる確率をで表すと
- ・・・・(5)
となります。他のニューロンの出力が式(2)のようになっている前提でである確率が、同じ前提でである確率がでした。よって
- ・・・・(6)
- ・・・・(7)
となります。式(6)に式(5)を代入すると
- ・・・・(8)
式(8)に式(3)(4)を代入すると
- ・・・・(9)
となります。ここで
- ・・・・(10)
と置くと式(9)は
- ・・・・(11)
となります。これで、番目のニューロンの出力が+1になる確率を求めることが出来ました。
ところで、さらに
- ・・・・(12)
と置くと式(11)は
- ・・・・(13)
となります。式(13)の右辺はシグモイド関数になっています。