線形写像#

線型写像(linear mapping)あるいは線型変換(linear transformation; 一次変換)は、ベクトルの和とスカラー倍という演算を保つ特別の写像のことを指す。

\[ % 太字のalias \newcommand{\b}[1]{\boldsymbol{#1}} % 演算子の定義 \DeclareMathOperator{\im}{ \text{Im} } \DeclareMathOperator{\rank}{ \text{rank} } \DeclareMathOperator{\span}{ \text{Span} } \DeclareMathOperator{\Ker}{ \text{Ker} } \]

線形写像#

(定義)線形写像

\(n\)次元ベクトル空間\(\mathbb{R}^n\)の任意のベクトル\(\b{a}, \b{b}\)と任意のスカラー\(c\)に対して

  1. \(f(\b{a}+\b{b}) = f(\b{a}) + f(\b{b})\)

  2. \(f(c \b{a}) = c f(\b{a})\)

が成り立つとき、\(n\)次元ベクトル空間\(\mathbb{R}^n\)から\(m\)次元ベクトル空間\(\mathbb{R}^m\)への写像

\[ f: \mathbb{R}^n \to \mathbb{R}^m \]

線形写像という。

標準基底#

\(\mathbb{R}^n\)上の次のベクトルを考える

\[\begin{split} \b{e}_1 = \begin{pmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{pmatrix} , \hspace{1em} \b{e}_2 = \begin{pmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{pmatrix} , \hspace{1em} \cdots , \hspace{1em} \b{e}_n = \begin{pmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{pmatrix} \end{split}\]

\(j=1,2,\dots,n\)としたとき、\(\b{e}_j\)\(j\)番目の要素が\(1\)、それ以外のすべての要素が\(0\)のベクトルである。

こうしたベクトルの組\(\b{e}_1, \b{e}_2, \dots, \b{e}_n\)標準基底という。

標準基底の写り方で行列が定まる#

線形写像\(f: \mathbb{R}^n \to \mathbb{R}^m\)が与えられたとする。これらの像は\(m\)次元のベクトルになる。

\[\begin{split} f(\b{e}_j) = \begin{pmatrix} a_{1j} \\ a_{2j} \\ \vdots \\ a_{mj} \end{pmatrix} \end{split}\]

\(\mathbb{R}^m\)の標準基底を\(\b{e}'_1, \b{e}'_2, \dots, \b{e}'_m\)とすると

\[\begin{split} \begin{align} f(\b{e}_j) &= \begin{pmatrix} a_{1j} \\ a_{2j} \\ \vdots \\ a_{mj} \end{pmatrix}\\ &= \begin{pmatrix} a_{1j} \\ 0 \\ \vdots \\ 0 \end{pmatrix} + \begin{pmatrix} 0 \\ a_{2j} \\ \vdots \\ 0 \end{pmatrix} + \cdots + \begin{pmatrix} 0 \\ 0 \\ \vdots \\ a_{mj} \end{pmatrix} \\ &= a_{1j} \begin{pmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{pmatrix} + a_{2j} \begin{pmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{pmatrix} + \cdots + a_{mj} \begin{pmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{pmatrix} \\ &= a_{1j} \b{e}'_1 + a_{2j} \b{e}'_2 + \cdots + a_{mj} \b{e}'_m\\ &= \sum_{i=1}^m a_{ij} \b{e}'_i \end{align} \end{split}\]

このような列ベクトルを順に並べると\(m\times n\)行列が定まる。この行列を\(A\)と書くことにすると

\[\begin{split} A = \begin{pmatrix} f(\b{e}_1) & f(\b{e}_2) & \cdots & f(\b{e}_j) & \cdots & f(\b{e}_n) \end{pmatrix} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1j} & \cdots & a_{1m}\\ a_{21} & a_{22} & \cdots & a_{2j} & \cdots & a_{2m}\\ \vdots & \vdots & & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nj} & \cdots & a_{nm}\\ \end{pmatrix} \end{split}\]

つまり、線形写像\(f: \mathbb{R}^n \to \mathbb{R}^m\)が与えられると、それに応じて\(m\times n\)行列が定まる

超ざっくりまとめると「行列は写像である」ということになる。

線形写像で行列が定まる

任意の線形写像\(f: \mathbb{R}^n \to \mathbb{R}^m\)に対して

\[ f(\b{e}_j) = \sum_{i=1}^m a_{ij} \b{e}'_i \]

によって\(m\times n\)行列

\[ A=(a_{ij}) \]

が定まる

線形写像はベクトルに行列をかけることにより与えられる#

\(\mathbb{R}^n\)のベクトルを\(\b{x}\)で表すことにする。

\[\begin{split} \b{x} = \begin{pmatrix} x_1 \\ x_2 \\ \vdots\\ x_n \end{pmatrix} = x_1 \b{e}_1 + x_2 \b{e}_2 + \cdots + x_n \b{e}_n \end{split}\]

\(f(\b{x})\)は、線形写像が満たしている線形性の条件を使って整理すると

\[\begin{split} \begin{align} f(\b{x}) &= f(x_1 \b{e}_1 + x_2 \b{e}_2 + \cdots + x_n \b{e}_n)\\ &= f(x_1 \b{e}_1) + f(x_2 \b{e}_2) + \cdots + f(x_n \b{e}_n)\\ &= x_1 f(\b{e}_1) + x_2 f(\b{e}_2) + \cdots + x_n f(\b{e}_n)\\ &= x_1 \begin{pmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{pmatrix} + x_2 \begin{pmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{pmatrix} + \cdots + x_n \begin{pmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{pmatrix}\\ &= \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1j} & \cdots & a_{1m}\\ a_{21} & a_{22} & \cdots & a_{2j} & \cdots & a_{2m}\\ \vdots & \vdots & & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nj} & \cdots & a_{nm}\\ \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ \vdots\\ x_n \end{pmatrix}\\ &= \b{A x} \end{align} \end{split}\]

となる。

線形写像はベクトルに行列をかけることにより与えられる

\(\mathbb{R}^n\)の任意のベクトル\(\b{x}\)に対して

\[ f(\b{x}) = \b{A x} \]

が成り立つ

行列は線形写像を定義する#

逆に、行列が与えられると線形写像が定義される。

任意の\(m\times n\)行列\(A=(a_{ij})\)が与えられたとき、写像

\[ f_A: \mathbb{R}^n \to \mathbb{R}^m \]

\[ \b{x} \in \mathbb{R}^n \]

に対して

\[ f_A(\b{x}) = \b{A x} \]

によって定義する。

この写像\(f_A\)は以下を満たすため線形写像である

  1. \(f_A(\b{x} + \b{y}) = A(\b{x}+\b{y}) = A\b{x} + A\b{y} = f_A(\b{x}) + f_A(\b{y})\)

  2. \(f_A(c \b{x}) = A(c \b{x}) = c A\b{x} = c f_A(\b{x})\)

線形写像の合成と行列の積#

2つの線形写像

\[ f: \mathbb{R}^n \to \mathbb{R}^m \hspace{2em} g: \mathbb{R}^m \to \mathbb{R}^l \]

があり、それぞれに対応する行列を\(A, B\)とする。

2つの写像の合成

\[ f \circ g: \mathbb{R}^n \to \mathbb{R}^l \]

も線形写像になり、これに対応する行列を\(C\)とすると

\[ C = BA \]

である

定理

2つの線形写像の合成に対応する行列は、それぞれの写像に対応する行列の積に等しい

(証明)

\(A=(a_{ij}), B=(b_{kj})\)とし、

\(\mathbb{R}^n\)の標準基底を\(\b{e}_1, \cdots, \b{e}_n\)

\(\mathbb{R}^m\)の標準基底を\(\b{e}'_1, \cdots, \b{e}'_m\)

\(\mathbb{R}^l\)の標準基底を\(\b{e}''_1, \cdots, \b{e}''_l\)

とすると

\[\begin{split} \begin{aligned} g \circ f\left(\boldsymbol{e}_i\right) & = g\left(\sum_{j=1}^m a_{j i} \boldsymbol{e}_j^{\prime}\right) = \sum_{j=1}^m a_{j i} g\left(\boldsymbol{e}_j^{\prime}\right) = \sum_{j=1}^m a_{j i} \sum_{k=1}^l b_{k j} \boldsymbol{e}_k{ }^{\prime \prime} \\ & =\sum_{j=1}^m \sum_{k=1}^l a_{j i} b_{k j} \boldsymbol{e}_k{ }^{\prime \prime} = \sum_{k=1}^l\left(\sum_{j=1}^m b_{k j} a_{j i}\right) \boldsymbol{e}_k^{\prime \prime}\\ &= \sum_{k=1}^l c_{ki} \b{e}_k'' \end{aligned} \end{split}\]

ベクトルとして等しいため各成分同士が等しいということであり、\(\b{e}_k''\)の係数がそれぞれ等しい

\[ \sum_{j=1}^m b_{k j} a_{j i} = c_{ki} \]

行列の各成分でも等しいことが成り立つため

\[ BA = C \]

\(\text{Im}\)#

\(n\times m\)行列\(A = (\b{a}_1, \dots, \b{a}_n)^T\)

Aで移れる範囲を像\(\im A\)という。値域(range)と言うこともあるらしい

\(x_1, \dots, x_n\)を色々な値にしたときの線形和\(x_1 \b{a}_1 + \cdots + x_n \b{a}_n = A \b{x}\)\(\im A\)であり、\(\b{a}_1, \dots, \b{a}_n\)が張る線型部分空間\(\span \{ \b{a}_1, \dots, \b{a}_n \}\)でもある

\[ \im A = \span \{ \b{a}_1, \dots, \b{a}_n \} = x_1 \b{a}_1 + \cdots + x_n \b{a}_n = A\b{x} \]

例:最小二乗法

最小二乗推定量\(\hat{\boldsymbol{\beta}} = (X^\top X)^{-1} X^\top \boldsymbol{y}\)\(\hat{\boldsymbol{y}} = X \hat{\boldsymbol{\beta}}\)に代入すると

\[ \hat{\boldsymbol{y}} = \underbrace{ X (X^\top X)^{-1} X^\top }_{P} \boldsymbol{y} = P \boldsymbol{y} \]

つまり、ベクトル\(\boldsymbol{y}\)を行列\(P = X (X^\top X)^{-1} X^\top\)で射影したものとみなすことができる。

この行列\(P\)は対称行列で、\(P^2=P\)となる。対称行列で\(P^2=P\)となる行列を射影行列という。

射影行列は、\(X\)の列空間\(\Im X\)にベクトルを正射影するという性質がある。\(\boldsymbol{y}\)\(\Im X\)への射影が\(\hat{\boldsymbol{y}}\)で、垂線の足が誤差\(\boldsymbol{u}\)となる。

最小二乗法は\(\boldsymbol{y}\)から\(\Im X\)への射影を求める操作であると捉えることができる。

#

\(Ax = o\)に移ってくるような\(x\)の集合(写像\(A\)で結果がぺちゃんこに潰される方向)を\(A\)核(kernel) と呼び、\(\mathop{ \text{Ker} } A\)と書く

ぺちゃんこに潰れない行列の場合、\(\Ker A\)\(0\)次元(原点\(\b{o}\)のみ)

次元定理#

\(m\times n\)行列\(A\)について、

\[ \dim \Ker A + \dim \Im A = n \]

が成り立つ。

\[ \begin{align} \underbrace{ n }_{元の次元} - \underbrace{ \dim \Ker A }_{ぺちゃんこに潰れる次元} = \underbrace{ \dim \Im A }_{残った次元} \end{align} \]

ランク#

\(m\times n\)行列\(A\)に対し、\(A\)が定義する線形写像

\[ A: \mathbb{R}^n \to \mathbb{R}^m \]

の像空間の次元のことを ランク(階数) といい、\(\rank A\)と表す。

\[ \rank A := \dim \Im A = \dim \span\{ \boldsymbol{a}_1, \dots, \boldsymbol{a}_n \} \]

\(A \in \mathbb{R}^{m\times n}\)なら、\(m\)次元の定義域から\(n\)次元の値域に移す写像なので、

\[\begin{split} \rank A \leq m\\ \rank A \leq n \end{split}\]

参考文献#