2次形式と定値性#
2次形式#
変数の2次の項のみからなる式を 2次形式(quadratic form) と呼ぶ。\(n\)変数\(x_1,\dots,x_n\)の2次形式は次のように書ける
2次形式の別表記#
これは次のように表すこともできる。
ただし、\(a_{ij} = a_{ji}\)とする。
2次形式の行列表記#
行列
が\(a_{ij} = a_{ji}\)のとき、すなわち\(A\)が対称行列のとき、2次形式は次のようなベクトルの内積として表せる
このとき\(A\)を2次形式\(f\)の 係数行列 と呼ぶ。
2次形式の係数は対称行列で表せる#
2次形式の係数行列は対称行列で表すことができる。そのほうがシンプルになるし、対称行列で表せるという定理もある。
定義:反対称行列(交代行列)
\((i,j)\)要素が\((j,i)\)要素の符号を反転させた値になっていて対角要素が0の正方行列、すなわち \(A^\top = -A\) となる行列を 反対称行列 (antisymmetric matrix) あるいは 交代行列 (alternating matrix) という。
例えば
は反対称行列である。
定理:対称部分と反対称行列への分解
任意の\(n\)次正方行列\(A\)は次のように書くことができる
ただし、
である。\(A_s\)を \(A\)の対称部分 、\(A_a\)を \(A\)の反対称部分 と呼ぶ。
ここで \(A_s = \frac{1}{2} (A + A^\top)\) は対称行列、\(A_a = \frac{1}{2} (A - A^\top)\) は反対称行列となっている。
例
とすると、その転置行列は
なので
よって
定理
\((x, A x) = 0\)となる\(O\)でない行列\(A\)は反対称行列である
証明
1. \((x, A x) = 0\)ならば\(A\)は反対称行列
\(x\)を第\(i\)要素が1で残りが0のベクトルとし、\((x, Ax) = 0\)に代入すると、\(a_{ii}=0\)となる。そのため\(A\)の対角要素は\(0\)となることがわかる。
\(x\)を第\(i\)要素と第\(j ~ (j \neq i)\)要素が1で残りが0のベクトルを代入すると、\(a_{ii} + a_{ij} + a_{ji} + a_{jj} = 0\)となるが、対角要素は0なので\(a_{ij}+a_{ji}=0\)すなわち\(a_{ij} = -a_{ji}\)となり、\(A\)は反対称行列となる。
2. \(A\)が反対称行列なら\((x, A x) = 0\)
\(A\)が反対称行列なら対角要素はゼロ(\(a_{ii} = 0\))であるため、2次形式\((x, Ax)\)のうち\(x_{i}^2\)の項は\(a_{ii} x_{i}^2 = 0\)となる。
また非対角要素は\(a_{ij} = -a_{ji}\)より、2次形式のうち\(x_i x_j\)の項は\(a_{ij} x_i x_j + a_{ji} x_j x_i = 0\) と打ち消し合って0になる。
以上から次の定理が導かれる
定理
行列\(A\)を係数とする2次形式は、その対称部分\(A_s\)のみで表すことができる
証明
反対称行列\(A_a\)を係数とする2次形式は0なので、
関連する定理#
転置と内積についての定理
定理
任意の \(n \times n\) 行列 \(\boldsymbol{A}\) と任意の \(n\) 次元ベクトル \(\boldsymbol{x}, \boldsymbol{y}\) に対して、次の関係が成り立つ
証明
2次形式の標準形#
対称行列の対角化#
定理
\(n \times n\) 対称行列 \(\boldsymbol{A}\) の固有値を \(\lambda_1, \ldots, \lambda_n\) とおき、対応する固有ベクトルの正規直交系を \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) とし、 \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) を列とする行列を \(\boldsymbol{U}=\left(\boldsymbol{u}_1 \cdots \boldsymbol{u}_n\right)\) とすると、次式が成り立つ。
証明
に左から\(U^\top\)をかけると得られる
対称行列のスペクトル分解(固有値分解)#
定理
\(n \times n\) 対称行列 \(\boldsymbol{A}\) の固有値を \(\lambda_1, \ldots, \lambda_n\) 、対応する固有ベクトルの正規直交系を \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) とし、 \(\boldsymbol{u}_1, \ldots, \boldsymbol{u}_n\) を列とする行列を \(\boldsymbol{U}=(\boldsymbol{u}_1 \cdots \boldsymbol{u}_n)\) とすると、次式が成り立つ。
証明
の両辺に右から\(\boldsymbol{U}^{\top}\)をかけると得られる。
対称行列の分解の応用例:リッジ推定量が正則となる証明
\(X\)は\(n\)次の実行列とする。実対称行列\(X^\top X\)は非負値定符号行列であるため、
と分解可能。ここで\(P\)は直交行列であり、\(\Gamma = \mathrm{diag}(\gamma_1, \cdots, \gamma_n)\)は\(X^\top X\)の固有値(\(\gamma_1 \geq \cdots \geq \gamma_n \geq 0\))を対角成分にもつ対角行列。
もし\(\gamma_n = 0\)なら\(X^\top X\)の逆行列は存在せず、\(\gamma_n > 0\)なら逆行列は存在し、
となる。\(X^\top X\)の最小固有値が\(\gamma_n \to 0\)の場合、\(1/\gamma_n \to \infty\)になり逆行列が計算できない。
一方、リッジ推定量のように\(X^\top X + \lambda I\)とする(\(\lambda \in\mathbb{R}\))と、その逆行列は
となる。こちらは\(\gamma_n \to 0\)の場合であっても\(1 / (\gamma_p + \lambda I)\)は無限大に発散することがないため、\(X^\top X + \lambda I\)は正則となる。
2次形式の標準形#
固有ベクトルの行列\(U\) と変数\(x\)の線形結合を \(\boldsymbol{x}' = \boldsymbol{U}^\top \boldsymbol{x}\) と書く。 これは左から\(\boldsymbol{U}\)をかけて\(\boldsymbol{x} = \boldsymbol{U} \boldsymbol{x}'\)と書くこともできる。
このとき、2次形式\((\boldsymbol{x}, \boldsymbol{A} \boldsymbol{x})\)は次のように変形できる
このような変数の2乗の線形結合を2次形式の 標準形 と呼ぶ
例
を標準形にしたいとする。\(f\)はベクトルと行列を用いると次のように書き直すことができる。
係数行列
の固有値は
より、\(\lambda = 2, 7\)となる。
より、\(f\)の標準形は
標準形にすると何が嬉しいのか? - 標準形による主軸変換の導出#
標準形は\(x'y'\)の項がなく2乗の項だけになっている。
例えば
があるとする。これを書き換えると
となる。これは楕円の方程式と同じ形。ここから幾何学的な解釈が可能になる。
\(a\) は 長軸半径(楕円の長い方の軸の半分)
\(b\) は 短軸半径(楕円の短い方の軸の半分)
標準形にする前の形
も同様に楕円となっている。
\(x= Ux'\) は \(x'\)を\(U\)だけ回転させたもの。あるいは\(x\)を\(U^{-1}\)だけ回転させたものが\(x'\)となっている。
\(U\)は直交行列なので、回転と鏡映をあわせた写像 ( 広義回転 )である。
合同変換
正方行列\(A\)を正則行列\(U\)によって
とする変換を 合同変換(congruence transformation) という。
「合同」とは形が変わらないこと、つまり広義回転だけをすること。
Tip
行列の対角化とは、楕円を回転させてその主軸(長軸と短軸)を座標軸に揃えることに等しい
\(xy\)座標系を\(U\)だけ回転すると、長軸と短軸に一致する。
単位ベクトル\(e_1,e_2\)を\(U = (u_1, u_2)\)で回転させると、\(Ue_1 = u_1, Ue_2 = u_2\)なので、固有ベクトル\(u_1,u_2\)は楕円の長軸と短軸(2つを合わせて 主軸 という)の方向ということ。
\(A\)の固有ベクトルは、 楕円\((x, Ax) = 1\)の主軸方向である ということ。
まとめ
楕円\((x, Ax) = 1\)は、\(A\)の固有ベクトル\(u_1,u_2\)がその主軸方向であり、\(u_1,u_2\)の方向をそれぞれ\(x',y'\)軸にとると、その楕円が\(\lambda_1 {x'}^2 + \lambda_2 {y'}^2 = 1\)と書ける。
このように主軸を座標軸にとった座標系で表すことを 主軸変換 とよび、そのときの固有値を 主値 と呼ぶ。
正定値と半正定値#
定義
\(n\times n\)実対称行列\(A\)が、\(n\)次の零でない任意のベクトル\(x\)に対して、2次形式\((x, Ax)\)が必ず正になるとき、すなわち
となるとき、\(A\)は 正定値 (または 正値 positive definite) であるという。
また、
となるとき、\(A\)は 半正定値 (または 半正値 positive-semidefinite) であるという。
固有値との関係#
定理
正定値行列\(A\in\mathbb{R}^{n\times n}\)の固有値\(\lambda_i (i = 1,\dots,n)\)はすべて正である(\(\lambda_i > 0 \quad \forall i\))
証明
2次形式\((x, Ax)\)は標準形
で表すことができる。
1. 固有値がすべて正 ⇒ \((x, Ax)>0\)
固有値\(\lambda_1,\dots,\lambda_n\)がすべて正なら、任意の\(x' \neq \boldsymbol{0}\)に対しては\((x, Ax) = \lambda_1{x_1^{\prime}}^2+\cdots+\lambda_n x_n^{\prime 2}>0\)となる。 したがって任意の\(x = Ux' \neq 0\)に対して\((x, Ax)>0\)となる。
2. \((x, Ax)>0\) ⇒ 固有値がすべて正
逆に任意の\(x \neq 0\)に対して2次形式の標準形
が成り立つなら、任意の\(x' = U^\top x \neq 0\)に対して\((x, Ax)>0\)となる。
ベクトル\(x'\)のうち任意の\(i\)番目の要素が1なら、つまり
とすると \((x, Ax) = \lambda_i\) より \(\lambda_i>0\)である。
(「任意の\(x\neq 0\)に対して\((x, Ax)>0\)」という仮定により)任意の\(i\)に対してこれが成り立つため、 \(\lambda_1, \lambda_2, \ldots, \lambda_n\) はすべて正である。
定理
半正定値行列\(A\in\mathbb{R}^{n\times n}\)の固有値\(\lambda_i (i = 1,\dots,n)\)はすべて零以上である(\(\lambda_i \geq 0 \quad \forall i\))
証明
1. 固有値がすべて正 ⇒ \((x, Ax) \geq 0\)
固有値 \(\lambda_1, \lambda_2, \ldots, \lambda_n\) が正または0なら、任意の\(x' \neq \boldsymbol{0}\)に対して
となる。 したがって任意の\(x = Ux' \neq 0\)に対して\((x, Ax)\geq 0\)となる。
2. \((x, Ax)\geq 0\) ⇒ 固有値がすべて正
逆に任意の\(x \neq 0\)に対して\((x, Ax)\geq 0\)が成り立つ場合、
とすると \((x, Ax) = \lambda_i\) より \(\lambda_i \geq 0\)である。
任意の\(i\)に対してこれが成り立つため、 \(\lambda_1, \lambda_2, \ldots, \lambda_n\) はすべて正である。