6.6.2. 条件つき制限ボルツマンマシンと時間的制限ボルツマンマシン――Learning Deep Architectures for AI
Learning Deep Architectures for AI の翻訳です。
6.6.2. 条件つき制限ボルツマンマシンと時間的制限ボルツマンマシン
条件つき制限ボルツマンマシン は、若干のパラメータが自由ではなく、その代わり、他の確率変数のパラメータ化された関数であるような制限ボルツマンマシンである。例えば、式21における入力バイアス、隠れたバイアス、重み行列のパラメータを持つ、観測されたベクトルと隠れたベクトルの間の結合分布についての制限ボルツマンマシンを考察しよう。このアイディアは、隠れたバイアスが文脈変数のアフィン関数であるような文脈依存制限ボルツマンマシンのために、Taylor, Hinton, and Roweis (2006)の中で導入された。よって、この制限ボルツマンマシンはを、あるいはで周辺化してを表現する。一般に、制限ボルツマンマシンのパラメータ群は、パラメータ群でパラメータ化された関数として書き表すことが出来る。制限ボルツマンマシンの対照分岐アルゴリズムは、条件つき制限ボルツマンマシンの場合に容易に一般化出来る。パラメータについての対照分岐勾配評価子は、についての勾配評価子を得るために単純に逆伝播出来る。
(35)
Taylor et al. (2006)で研究されたアフィンの場合(ととは列ベクトルで、は行列)、条件パラメータについての対照分布更新は単純に
(36)
となる。ここで最後の乗算は外積であり、はCD-が与える更新値である。
このアイディアは、人間の動きについてのシーケンシャル・データでの条件分布をモデル化するのに適用されて成功した(Taylor et al., 2006)。ここでは、歩行や走行のような人間の動きのモーション・キャプチャ・データから計算した関節角度と他の幾何学的特徴のベクトルである。興味深いことに、これは、以前サンプルされた個のフレームから番目のフレームを次々にサンプルすることで、つまり
. (37)
と近似することで、現実的な人間の動きの一連の流れを生成することを可能にする。初期のフレームは、特殊なnull値を文脈として用いることで、あるいはのための別のモデルを使うことで生成出来る。.
Memisevic and Hinton (2007)で実証されたように、バイアスだけでなく重みも、文脈変数についての条件付きにすることは有用であり得る。その場合、我々は、相互作用パラメータによって、入力ユニットとかくれたユニットと文脈ユニットの間の3方向の相互作用をモデル化する能力を導入して、自由度の数を非常に増加させる。この方法は、動画内の画像とその前の画像とともに用いられ、そのモデルは流れの場をとらえることを学習する(Memisevic & Hinton, 2007)。
隠れた変数(いわゆる状態を持つ、シーケンシャル・データの確率モデルは、シーケンス内のさまざまな時刻での隠れた変数間の時間依存性をとらえることによって、多くのものを得ることが出来る。これは、隠れた変数が1次のマルコフチェーン(そこでは直接の依存性はとの間にしかない)であるとモデルが考えるだけである場合でさえ、隠れマルコフ・モデル (Rabiner & Juang, 1986)が長いシーケンス内の依存性をとらえることを可能にするものである。隠れマルコフ・モデルにおける隠れた変数表現がローカルである(の可能な全ての値は列挙され、特定のパラメータがこれらの値の各々に関係する)が、時間的制限ボルツマンマシンは状態の分散表現を構築するために提案されてきた(Sutskever& Hinton, 2007)。このアイディアは、上に示した条件付き制限ボルツマンマシンの拡張であるが、そこでは文脈は過去の入力だけでなく状態の過去の値も含む。例えば、我々は
(38)
のモデルを構築する。ここで文脈は図8に示すようにである。時間的制約ボルツマンマシンが生成するシーケンスのサンプル抽出は、(個々の時間ステップで、制限ボルツマンマシンからサンプル抽出するのに用いた、同じモンテカルロ・マフコフチェーン近似で)条件付き制限ボルツマンマシンにおけるのと同じように出来るが、入力が与えられた場合の隠れた状態のシーケンスの正確な推定は、もはや扱い易くはない。その代わりSutskever and Hinton (2007)は、隠れたシーケンスの事後確率の平均場フィルタリング近似を用いることを提案する。
図8:シーケンシャル・データをモデル化するための時間的制限ボルツマンマシンの例。隠れた変数間の依存性を含むもの。双方向矢印は方向のない接続、つまり制限ボルツマンマシン、を示す。一方向矢印は条件依存性を示す。制限ボルツマンマシンは、過去の入力と過去の隠れたベクトルの値によって条件づけられる。