オートエンコーダ（５） - 工場統計力学（建設中！）

前回までで何とか２次元のデータについてオートエンコーダが主成分分析による次元削減を実行することを説明しましたが、この説明を書いているうちに自分の理解の浅さに気づきました。この結果をより確かなものにするためには以下のような課題があります。

一般の次元の場合にオートエンコーダが主成分分析による次元削減を実行することを証明しなければならないでしょう。
「オートエンコーダ（３）（４）」での説明で、 $\sigma_v$ を最大にすることと主成分分析で第1主成分を $v$ 軸に採用することを同じことであるとして説明を進めましたが、よく考えるとこの理由が明らかではありません。２次元の場合、主成分分析の説明から図像的には何となくそんな気がするものの、もっと多次元になった場合に本当にそうなのか、きちんと説明する必要があります。
オートエンコーダでは入力信号と出力信号をなるべく近付けるように動作するのですが、それだけでは必ずしも中間層の出力が一意に決まるとは限らないことに気づきました。たとえば下の図で、中間層がではなくであったとしても、その代わりに出力層の関数を従来の関数に1/2を掛けたものに置き換えれば、出力信号は同じものが得られるはずです。そうすると、中間層の結果を一意にするために、中間層のニューロンの重みと出力層のニューロンの重みの間に何か制約条件を課しておきたい気になります。
「オートエンコーダ（３）（４）」の説明では座標の変換を座標の回転だけに限定しましたが、本来、このニューロンによる入力から出力への変換は一般の線形変換であって、座標の回転だけに限定されません。さらに、しきい値 $h$ も存在するので、平行移動も変換の中に含まれます。このような一般の線形変換を前提にした場合、オートエンコーダが主成分分析による次元削減を実現出来るかどうか調べる必要があります。