最小二乗法の復習(3)

次は主成分分析を勉強します、と前回、言っておきながら、まだ、最小二乗法のことを考えています。


では、どんな時にxの値からyの値を推定する(最良の)式」yの値からxの値を推定する(最良の)式」と一致するのでしょう?
直感的に考えて、データが一直線に並んだ時であることが分かります。確かに全てのデータが一直線に並んでいれば、「xの値からyの値を推定する(最良の)式」と「yの値からxの値を推定する(最良の)式」は同じになるのは簡単に分かります。
では、それ以外の場合で「xの値からyの値を推定する(最良の)式」と「yの値からxの値を推定する(最良の)式」が同じになる場合があるでしょうか? それを確かめてみます。そのためには最小二乗法の復習(2)の議論から式(14)

  • A=\frac{\rm{Cov}(y,x)}{\sigma_y^2}・・・・(14)

と(17)

  • A=\frac{\sigma_x^2}{\rm{Cov}(x,y)}・・・・(17)

が等しくなる必要があることが分かります。よって

  • \frac{\rm{Cov}(y,x)}{\sigma_y^2}=\frac{\sigma_x^2}{\rm{Cov}(x,y)}

\rm{Cov}(y,x)=\rm{Cov}(x,y)であることに注意すれば

  • \rm{Cov}(x,y)^2=\sigma_x^2\sigma_y^2
  • \rm{Cov}(x,y)=\pm\sigma_x\sigma_y
  • \frac{\rm{Cov}(x,y)}{\sigma_x\sigma_y}=\pm{1}・・・・(18)


ここで、式(18)の左辺が相関係数であることに気づけば、相関係数が1または-1である、ということになり、これはデータが一直線に並んだ場合であることが分かります。つまり、やはりデータが一直線に並ばないと「xの値からyの値を推定する(最良の)式」と「yの値からxの値を推定する(最良の)式」は同じにならない、ということです。


さて、相関係数\pm{1}ならばなぜ全データが一直線に並んでいると言えるのか? そこも確かめておきましょう。最小二乗法の復習(1)の式(6)

  • \rm{Cov}(x,y)=\bar{(x-\bar{x})(y-\bar{y})}・・・・(6)

から

  • \rm{Cov}(x,y)=\frac{1}{n}\Bigsum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})

ここで、x_i-\bar{x}を要素とするn次元のベクトル\vec{X}と、y_i-\bar{y}を要素とするn次元のベクトル\vec{Y}を考えます。すると、上の式は

  • \rm{Cov}(x,y)=\frac{1}{n}(\vec{X},\vec{Y})・・・・(19)

と書けます。ただし、(\vec{X},\vec{Y})\vec{X}\vec{Y}内積を表します。
また、\sigma_x^2=\rm{Cov}(x,x)なので

  • \sigma_x^2=\frac{1}{n}(\vec{X},\vec{X})=\frac{1}{n}||\vec{X}||^2

と書けます。ただし||\vec{X}||\vec{X}の大きさです。よって

  • \sigma_x=\frac{1}{\sqrt{n}}||\vec{X}||・・・・(20)

同様に

  • \sigma_y=\frac{1}{\sqrt{n}}||\vec{Y}||・・・・(21)

式(19)(20)(21)を式(18)に代入すると

  • \frac{\frac{1}{n}(\vec{X},\vec{Y})}{\frac{1}{n}||\vec{X}||\cdot||\vec{Y}||}=\pm{1}

よって

  • \frac{(\vec{X},\vec{Y})}{||\vec{X}||\cdot||\vec{Y}||}=\pm{1}・・・・(22)

ところで

  • (\vec{X},\vec{Y})=||\vec{X}||\cdot||\vec{Y}||\cos\theta

(ただし\theta\vec{X}\vec{Y}が作る角)と書けるので式(22)は

  • \frac{||\vec{X}||\cdot||\vec{Y}||\cos\theta}{||\vec{X}||\cdot||\vec{Y}||}=\pm{1}
  • \cos\theta=\pm{1}

よって

  • \theta=0または2\pi

つまり、ベクトル\vec{X}とベクトル\vec{Y}は同じ方向または正反対の方向を指していることになります。いずれにせよスカラの定数aを用いて

  • \vec{Y}=a\vec{X}

と書くことが出来ることになります。この式をベクトルの各成分で書き表すと

  • y_i-\bar{y}=a(x_i-\bar{x})

となります。これを変形すると

  • y_i=ax_i-a\bar{x}+\bar{y}

となるので、全てのデータ(x_i,y_i)が一直線に並ぶことが分かります。