概要#

一般化線形モデル(generalized linear model: GLM)は誤差項が正規分布以外の分布に従う場合の正規分布も扱うことができる統計モデリングの理論体系である。

例えば二項分布であればロジスティック回帰、ポアソン分布であればポアソン回帰といったものが存在する。

3つの構成要素#

一般化線形モデルは

  1. 変量成分

  2. 系統的成分

  3. リンク関数

の3つから構成される

変量成分#

変量成分(random component)は、目的変数Yi (i=1,2,,n)が従う確率分布を仮定する。

通常の回帰分析であれば正規分布を仮定する(YiN(μi,σ2))。

目的変数の値が「成功」「失敗」のような二値や「成功」の回数である場合、変量成分は二項分布となる

系統的成分#

系統的成分(systematic component)は、目的変数を説明する成分を表す。

β0+β1X1i+β2X2i++βmXmi

リンク関数#

リンク関数(link function)は、目的変数の期待値と系統成分との関係を表す。

g(μi)=β0+β1X1i+β2X2i++βmXmi

恒等リンク#

例えば通常の回帰分析では恒等リンク(identity link)g(μi)=μiを使っているため

μi=β0+β1X1i+β2X2i++βmXmi

となる。

対数リンク#

ロジスティック回帰では対数リンク(log link)g(μi)=log(μi)を使っているため

log(μi)=β0+β1X1i+β2X2i++βmXmi

となり、両辺の指数を取ると

μi=exp(β0+β1X1i+β2X2i++βmXmi)

となって期待値が正の値をとるようになる。そのためポアソン回帰モデルでも対数リンクを用いる。

参考文献#

  • 本橋永至(2015)『Rで学ぶ統計データ分析』、オーム社。