固有値・固有ベクトルの解釈・意味

固有値・固有ベクトルの解釈・意味#

線形代数的な解釈#

いまいちど定義を振り返る

定義

$n \in N, A \in R^{n \times n}, x \in R^{n}, λ \in R$ について

A x = λ x

が成り立つとき、スカラー $λ$ を $A$ の固有値（eigenvalue）といい、 $x (\neq 0)$ を $A$ の $λ$ に対応する固有ベクトル（eigenvector）と呼ぶ。

定義より、線形変換 $A x$ と、ベクトルの定数倍 $λ x$ が等しい。つまり、

Tip

線形変換 $A x$ をしたときに、向きは変わらず、大きさだけが $λ$ 倍に変わるようなベクトル $x$ が固有ベクトルで、その倍率 $λ$ が固有値

と解釈できる。

統計学的な解釈#

データを行列で表したときの話

学習データの分散が最大になる方向への線形変換を求める手法である 主成分分析 を例に考える。

主成分分析は、データ $X$ と係数 $a_{j}$ の線形変換 $s_{j}$ の分散を最大化するような係数 $a_{j}$ を求める問題

\begin{array}{r} max_{a_{j}} Var [s_{j}] \\ subject to | | a_{j} | |_{2}^{2} = 1 \end{array}

を解析的に解くために

Var [\bar{X}] a_{j} = λ a_{j}

という式を立てて固有ベクトル $a_{j}$ を求めるものだった。なので、

Tip

分散を最大化する軸の方向が固有ベクトル $a_{j}$
その軸方向のデータのばらつきの大きさが固有値 $λ$

と捉えることができる。

数値例#

このようなデータがあったとする

../../../_images/b438d151e44c7a93efb6b8a41ff101ae00829f4a61c211d6d91842de73943845.png

固有値問題を解いて $λ$ と $a_{j}$ を推定していく。

x_bar = X.mean(axis=0)
X_bar = X - x_bar
Sigma = (1 / n) * X_bar.T @ X_bar
lambdas, vectors = np.linalg.eig(Sigma)
print(f"""
λ={lambdas}
a1={vectors[:, 0].round(3)}
a2={vectors[:, 1].round(3)}
""")

λ=[1.17427995 0.37150396]
a1=[0.886 0.464]
a2=[-0.464  0.886]

主成分を表す固有ベクトルの傾きに直線をプロットすると以下の通り。

係数ベクトル $a_{j}$ はノルムが1になるように制約がかけられているので、図にしても長さは同じ。

PC1方向の変換 $s_{1}$ は $a_{j}$ に対して $λ_{1} = 1.17$ 倍ということ。

../../../_images/e44f7c8b45130fea655cd8bca7580b5cc4d53a8550bec94ebc37aec320162a5f.png

推定できた $a$ の任意の次元数を使って線形変換 $s = \bar{X} a$ を作って散布図にするとこうなる

../../../_images/913fbfd652ba2beadb040ddbb83255664291cffb54eb082c079328ec993c6307.png

参考#

白田由香利. (2013). 固有値の概念の教授法: 経営学科に適した線型代数の教授法.