応用数学 ch5メモ（2次形式、対角化、固有値）

応用数学 ch5メモ（2次形式、対角化、固有値）#

Key Points

対称行列の固有ベクトルは互いに直交する（→対角化可能）
2次形式\((x, Ax)\)の標準形\(\sum_i \lambda_i x_i^{\prime 2}\)は楕円として解釈できる
行列の対角化とは、楕円を回転させてその主軸（長軸と短軸）を座標軸に揃えること（主軸変換）に等しい

対称行列の固有値#

対称行列に対しては

固有値も固有ベクトルもすべて実数
固有ベクトルは互いに直交する

という性質を持っている。

現実世界やデータサイエンス領域での応用において固有値を求めるとき、相関行列や分散共分散行列など対称行列の固有値を求めることが多いので対称行列に対する固有値のトピックに触れておくと理解しやすい。

対称行列の固有値と固有ベクトルは実数#

定理

対称行列の固有値はすべて実数であり、対応する固有ベクトルも実数ベクトルである

対称行列の固有ベクトルは直交する#

定理

対称行列の異なる固有値に対応する固有ベクトルは互いに直交する

対称行列の対角化#

定理

\(n \times n\) 対称行列 \(\boldsymbol{A}\) の固有値を \(\lambda_1, \ldots, \lambda_n\) とおき、対応する固有ベクトルの正規直交系を \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) とし、 \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) を列とする行列を \(\boldsymbol{U}=\left(\boldsymbol{u}_1 \cdots \boldsymbol{u}_n\right)\) とすると、次式が成り立つ。

\[\begin{split} \boldsymbol{U}^{\top} \boldsymbol{A} \boldsymbol{U}=\left(\begin{array}{llll} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{array}\right) \end{split}\]

対称行列の固有値分解（スペクトル分解）#

定理

\(n \times n\) 対称行列 \(\boldsymbol{A}\) の固有値を \(\lambda_1, \ldots, \lambda_n\) 、対応する固有ベクトルの正規直交系を \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) とし、 \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) を列とする行列を \(\boldsymbol{U}=(\boldsymbol{u}_1 \cdots \boldsymbol{u}_n)\) とすると、次式が成り立つ。

\[\begin{split} \boldsymbol{A}= \boldsymbol{U} \left(\begin{array}{llll} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{array}\right) \boldsymbol{U}^{\top} \end{split}\]

2次形式の標準形#

固有ベクトルの行列\(U\) と変数\(x\)の線形結合を \(\boldsymbol{x}' = \boldsymbol{U}^\top \boldsymbol{x}\) と書く。これは左から\(\boldsymbol{U}\)をかけて\(\boldsymbol{x} = \boldsymbol{U} \boldsymbol{x}'\)と書くこともできる。

このとき、2次形式\((\boldsymbol{x}, \boldsymbol{A} \boldsymbol{x})\)は次のように変形できる

\[\begin{split} \begin{aligned} (\boldsymbol{x}, \boldsymbol{A} \boldsymbol{x}) & =\left(\boldsymbol{U} \boldsymbol{x}^{\prime}, \boldsymbol{A} \boldsymbol{U} \boldsymbol{x}^{\prime}\right)=\left(\boldsymbol{x}^{\prime}, \boldsymbol{U}^{\top} \boldsymbol{A} \boldsymbol{U} \boldsymbol{x}^{\prime}\right)=\left(\boldsymbol{x}^{\prime},\left(\begin{array}{lll} \lambda_1 & & \\ & \ddots & \\ & & \lambda_n \end{array}\right) \boldsymbol{x}^{\prime}\right) \\ & =\lambda_1{x_1^{\prime}}^2+\lambda_2{x_2^{\prime}}^2+\cdots+\lambda_n x_n^{\prime 2} \end{aligned} \end{split}\]

このような変数の2乗の線形結合を2次形式の 標準形 と呼ぶ

標準形にすると何が嬉しいのか？#

標準形は\(x'y'\)の項がなく2乗の項だけになっている。

例えば

\[ 2 {x^{\prime}}^2 + 7 {y^{\prime}}^2 = 1 \]

があるとする。これを書き換えると

\[ \frac{x^{\prime 2}}{(1 / \sqrt{2})^2}+\frac{y^{\prime 2}}{(1 / \sqrt{7})^2}=1 \]

となる。これは楕円の方程式と同じ形。

楕円の標準形方程式

\[ \frac{x^2}{a^2}+\frac{y^2}{b^2}=1 \]

\(a\) は長軸半径（楕円の長い方の軸の半分）
\(b\) は短軸半径（楕円の短い方の軸の半分）

../../../_images/febdb35224e5d61e524071479b56a7e0a24cfaa478ba63093ea147d9c79462bb.png

標準形にする前の形

\[ 6 x^2 + 4xy + 3y^2 = 1 \]

も同様に楕円となっている。

../../../_images/a19f5f9a65c2901530ef7e1aa4cf5009b23d5114e8b2936175a3142d6484fc87.png

\(x= Ux'\) は \(x'\)を\(U\)だけ回転させたもの。あるいは\(x\)を\(U^{-1}\)だけ回転させたものが\(x'\)となっている。

\(U\)は直交行列なので、回転と鏡映をあわせた写像 （ 広義回転 ）である。

合同変換

正方行列\(A\)を正則行列\(U\)によって

\[ A' = U^\top A U \]

とする変換を 合同変換（congruence transformation） という。

「合同」とは形が変わらないこと、つまり広義回転だけをすること。

Tip

行列の対角化とは、楕円を回転させてその主軸（長軸と短軸）を座標軸に揃えることに等しい

\(xy\)座標系を\(U\)だけ回転すると、長軸と短軸に一致する。

単位ベクトル\(e_1,e_2\)を\(U = (u_1, u_2)\)で回転させると、\(Ue_1 = u_1, Ue_2 = u_2\)なので、固有ベクトル\(u_1,u_2\)は楕円の長軸と短軸（2つを合わせて主軸という）の方向ということ。

\(A\)の固有ベクトルは、楕円\((x, Ax) = 1\)の主軸方向である ということ。

../../../_images/ccab7973217cf7eeae185c33228c39ef3a6151f3d7013b80707713a3fdb0430d.png

まとめ

楕円\((x, Ax) = 1\)は、\(A\)の固有ベクトル\(u_1,u_2\)がその主軸方向であり、\(u_1,u_2\)の方向をそれぞれ\(x',y'\)軸にとると、その楕円が\(\lambda_1 {x'}^2 + \lambda_2 {y'}^2 = 1\)と書ける。

このように主軸を座標軸にとった座標系で表すことを 主軸変換 とよび、そのときの固有値を主値と呼ぶ。

正値対称行列と正値2次形式#

2次形式と固有ベクトル・固有値#

定理

対称行列\(A\)に対して、2次形式\((x, Ax)\)を最大化する単位ベクトル\(x\)は\(A\)の最大固有値に対する単位固有ベクトルであり、その最大値は行列\(A\)の最大固有値に等しい。

定理

対称行列\(A\)に対して、2次形式\((x, Ax)\)を最小化する単位ベクトル\(x\)は\(A\)の最小固有値に対する単位固有ベクトルであり、その最小値は行列\(A\)の最小固有値に等しい。

正定値と半正定値#

定義

固有値がすべて正の対称行列を 正定値 （または正値） 対称行列 といい、固有値がすべて0または正の対称行列を 半正定値（半正値）対称行列 という。

定理

対称行列\(A\)が正定値である必要十分条件は、任意の0でないベクトル\(x\)に対して

\[ (x, Ax) > 0 \]

であること。