主成分分析(2)
とが互いに独立になるというのは、どのようにして判断すればよいでしょうか? ここでは共分散というものを使います。との共分散は
で定義されます。ここでというのはの平均値を意味します。もしとが独立であれば、データ数が非常に多いとき
が成り立ちます。すると
となるので、結局、
となります。では逆にならばとは独立であると言えるでしょうか? 実はそうは言えないのです。そう言えないところが悩ましいところなのですが、今はとにかくをゼロにすることを考えます。
どのようにしてをゼロにするのか。それを考えるにはだけでなく次のように定義されるやと一緒に考えるほうが分かりやすいです。
上の定義から分かるようにはの分散(=標準偏差の2乗)と同じであり、はの分散と同じです。
さてをまとめて2次元の縦ベクトルで表しましょう。つまり
です。ここで行列を
- ・・・・(1)
で定義します。これを成分で書くと
よって
- ・・・・(2)
ここで
と置きましたが、これはもちろんに等しいです。つまり
です。つまり、行列は対称行列です。そしてその要素はどれも実数ですから実対称行列です。ここで、「線形代数学の復習:実対称行列は対角化可能である(1)」〜「(5)」で証明した実対称行列は対角化可能であるという定理が活躍します。