統計量#

SEMでは相関行列や共分散行列などを多用するのであらためて整理しておく

積率・共分散・相関係数#

観測対象×観測変数の多変量データの行列\(X\)があるとする。

変量\(x_i\)と変量\(x_j\)があり、変換した行列として偏差行列\(V\)と標準化データ行列\(Z\)があるとする。

偏差は\(v_{ij} = x_{ij} - \bar{x}_j\)\(\bar{x}_j = \frac{1}{N} \sum^N_{i=1} x_{ij}\))、標準化データは\(z_{ij} = \frac{ v_{ij} }{ s_{i} } = \frac{ x_{ij} - \bar{x}_i }{ s_i }\)である。

標本積率、標本共分散、標本相関係数はそれぞれ

\[\begin{split} \begin{align} m_{ij} &= \frac{1}{N} \sum^N_{k=1} x_{ik} x_{jk} \\ s_{ij} &= \frac{1}{N} \sum_{k=1}^N v_{ik} v_{jk} = \frac{1}{N} \sum_{k=1}^N (x_{ik} - \bar{x}_i)(x_{jk} - \bar{x}_j) \\ r_{ij} &= \frac{1}{N} \sum_{k=1}^N z_{ik} z_{jk} = \frac{1}{N} \sum_{k=1}^N \frac{v_{ik}}{s_i} \frac{v_{jk}}{s_j} = \frac{1}{N} \sum_{k=1}^N \frac{x_{ik} - \bar{x}_i}{s_i} \frac{x_{jk} - \bar{x}_j}{s_j} \end{align} \end{split}\]

母積率、母共分散、母相関係数は

\[\begin{split} \begin{align} \sigma_{mij} &= E[x_i x_j]\\ \sigma_{ij} &= E[v_i v_j] = E[(x_i - \mu_i)(x_j - \mu_j)]\\ \sigma_{rij} &= E[z_i z_j] = E\left[\left(\frac{x_i - \mu_i}{ \sigma_i }\right) \left(\frac{x_j - \mu_j}{ \sigma_j }\right)\right] \end{align} \end{split}\]

標本積率行列\(M\)、標本共分散行列\(S\)、標本相関行列\(R\)

\[\begin{split} \begin{align} M &= \frac{1}{N} X X^T\\ S &= \frac{1}{N} V V^T\\ R &= \frac{1}{N} Z Z^T \end{align} \end{split}\]