主成分分析(3)
ともかく行列を対角化してみましょう。直交行列を使ってを対角化します。すると
- ・・・・(3)
となります。この式(3)の意味することを調べてみましょう。「主成分分析(2)」の式(1)
- ・・・・(1)
を使うと(3)の左辺は
となります。ここでであること(「線形代数学の復習:実対称行列は対角化可能である(3)」の【補題4】参照)を用いると
となります。ここで
- ・・・・(4)
と置くと
よって式(3)は
- ・・・・(5)
となります。式(5)の左辺は式(1)の右辺と同じ形をしています。ということは、式(5)の左辺は座標系で計算した行列と解釈することが出来ます。言い換えれば、式(4)の座標変換を行った場合のの変換後の値が式(5)の右辺である、ということが言えます。そこで
- ・・・・(6)
と置き、また、の成分をとで表しましょう。つまり
です。すると、「主成分分析(2)」の式(2)
- ・・・・(2)
と同様に考えて
- ・・・・(7)
と書けます。式(5)(6)(7)から
となり、ここから
が言えます。つまり変数との共分散がゼロになっています。ということは式(4)で変換したが求める座標系だったことが分かります。分かり易くするために要素を明示して式(4)を書き直すと以下のようになります。
- ・・・・(8)
これが変数を変数に変換する式です。ではの値を具体的に求めるにはどうしたらよいでしょうか? その前に、今までの議論がもっと高次元の場合、つまりデータがとだけから成るのではなく、もっと多くの項目から成る場合にも成り立つことを簡単に確かめておきたいと思います。