離散選択モデル#

概要#

  • 離散選択問題:意思決定者(例えば消費者や企業)が取りうる行動の選択肢の中から自身の目的関数(例えば効用や利潤)を最大化するような行動を選ぶという意思決定問題

    • ある商品の需要を考えるために、他の製品との代替性を考える

  • 動学的な意思決定を考える場合は「今日この行動をとる」と「今日は見送る(明日以降に行動するという選択肢を残す)」の両者の利得の現在割引価値を比較することになる

  • ここでは、ある製品を購入するかどうかの例で考えていく。

効用関数#

消費者\(i\)が製品\(j\)を購入した場合の間接効用\(U_{ij}\)を、製品から消費者が平均的に得る効用\(V_j\)と個々人の好みよる効用\(\epsilon_{ij}\)(選好ショック)とに分けて捉える。

\[ U_{ij} = V_j + \epsilon_{ij} \]

ここで \(V_j = \beta^0 + \sum_{k=1}^K \beta^k x^k_j - \alpha p_j\)で、\(\alpha, \beta^0, ..., \beta^k\) はパラメータである。

「購入しない」という選択肢は outside goods と呼ばれ、\(j=0\)で表す。

以上をまとめると効用は次のように表される。

効用関数

消費者\(i\)が製品\(j\)を購入した場合の間接効用\(U_{ij}\)

\[\begin{split} U_{ij} = \begin{cases} \beta^0 + \sum_{k=1}^K \beta^k x^k_j - \alpha p_j + \epsilon_{ij} & j = 1, ...,J\\ \epsilon_{ij} & j=0 \end{cases} \end{split}\]
  • \(\alpha, \beta^0, ..., \beta^k\) :パラメータ

  • \(x_j^k\):製品属性

  • \(\epsilon_{ij}\):その製品に対する個人特有の選好で、特定の確率分布に従う確率変数(誤差項)

離散選択問題#

以上の効用関数のもとで、消費者\(i\)は最も高い効用が得られる選択肢\(d_i\)を選ぶと考える。

\[ d_i=\underset{j \in\{1, \ldots, J\}}{\operatorname{argmax}} U_{i j} \]

分析者の視点では\(\epsilon_{ij}\)は直接観測できず、誤差項のようなものである。

そのランダム性を考慮して確率で考えると、消費者\(i\)が製品\(j\)を選択する確率は、選択肢\(j\)から得られる効用\(U_{ij}\)が他の選択肢から得られる効用\(U_{il}\)よりも高くなるような事象が発生する確率

\[ \operatorname{Pr}\left(d_i=j\right)=\operatorname{Pr}\left(\left\{\epsilon_{i j}\right\}_{j=0}^J \mid V_j+\epsilon_{i j}>V_l+\epsilon_{i l}, \forall l \neq j\right) \]

となる。この確率は\(\epsilon_{ij}\)が従うと仮定する確率分布の設定によって変わる。

二項選択モデル#

最も単純なケースとして、選択肢の数\(J=2\)の場合を考える。各財から得られる効用を、平均的な満足度\(\beta_j\)、価格\(p_j\)、ランダムな選好ショック\(\epsilon_{ij}\)で表す:

\[\begin{split} \begin{aligned} & U_{i 1}=\beta_1-\alpha p_1+\epsilon_{i 1} \\ & U_{i 2}=\beta_2-\alpha p_2+\epsilon_{i 2} \end{aligned} \end{split}\]

このとき、消費者\(i\)がとる選択肢\(d_i\)は:

\[\begin{split} d_i= \begin{cases}1 & \text { if } \beta_1-\alpha p_1+\epsilon_{i 1}>\beta_2-\alpha p_2+\epsilon_{i 2} \\ 2 & \text { if } \beta_1-\alpha p_1+\epsilon_{i 1} \leq \beta_2-\alpha p_2+\epsilon_{i 2}\end{cases} \end{split}\]

したがって購入確率は

\[\begin{split} \begin{aligned} \operatorname{Pr}\left(d_i=1\right) & =\operatorname{Pr}\left(\beta_1-\alpha p_1+\epsilon_{i 1}>\beta_2-\alpha p_2+\epsilon_{i 2}\right) \\ & =\operatorname{Pr}\big(\epsilon_{i 1}-\epsilon_{i 2}>-\left(\beta_1-\beta_2-\alpha\left(p_1-p_2\right)\right)\big) \end{aligned} \end{split}\]

となる。

二項プロビットモデル#

\(\epsilon_{ij}\)が独立かつ同一の正規分布\(\mathcal{N}(0, 0.5)\)に従うと仮定する場合をprobit modelという。
この場合、財1の購入確率は、標準正規分布の累積分布関数\(\Phi(\cdot)\)を使って次のように表すことができる。

\[ \operatorname{Pr}\left(d_i=1\right) = \Phi\left(\beta_1-\beta_2-\alpha\left(p_1-p_2\right)\right) \]

二項ロジットモデル#

選好ショック\(\epsilon_{ij}\)が第I種極値分布 \(P(\epsilon_{i j} \leq x)=F(x)=e^{-e^{-x}}\) に従うと仮定する場合、言い換えると選好ショックの差分\(\epsilon_{i1} - \epsilon_{i2}\)が標準ロジスティック分布 \(F(t)=P(X \leq t)=\frac{1}{1+\exp (-t)}\) に従うと仮定する場合、財1の購入確率は次のように表すことができる。

\[\begin{split} \begin{aligned} \operatorname{Pr}\left(d_i=1\right) & =\frac{1}{1+\exp(-\{ \beta_1-\beta_2-\alpha\left(p_1-p_2\right)\})}\\ & =\frac{\exp \left(\beta_1-\beta_2-\alpha\left(p_1-p_2\right)\right)}{1+\exp \left(\beta_1-\beta_2-\alpha\left(p_1-p_2\right)\right)} \end{aligned} \end{split}\]

多項ロジットモデル#

二項選択モデルを一般化して多項にした場合、多項プロビットモデルは複雑な数値計算が必要になりあまり用いられない。ここでは多項ロジットモデルについて書く。

選好ショック\(\epsilon_{ij}\)が第I種極値分布 \(P(\epsilon_{i j} \leq x)=F(x)=e^{-e^{-x}}\) に従うと仮定する場合、消費者にとっての製品\(j\)の購入確率を以下のように書くことができる。

\[ Pr(d_i=j) = \frac {\exp( \beta^0 + \sum_{k=1}^K \beta^k x^k_j - \alpha p_j )} {1 + \sum^J_{l=1} \exp( \beta^0 + \sum_{k=1}^K \beta^k x^k_l - \alpha p_l )} \]

\(j\)の選択確率は自身の価格\(p_j\)や製品属性\(x_j^k\)のみならず、他の選択肢の価格や製品属性\((p_l, x_l^k)\)にも依存する点に注意。

最尤推定#

顕示選好(「ある製品の選択肢のもとで、人々が実際にどの選択肢を選んだのか」が選好を反映している、とする考え方)の考え方を反映したものが、データを用いた最尤推定である。

製品の価格や性能などのデータ\(\{p_j, x^1_j,\cdots,x^K_j\}^J_{j=1}\)と、各消費者がどれを購入したかというデータ\(\{d_i\}^N_{i=1}\)が利用可能であるとする。このとき、多項ロジットモデルから尤度関数を以下のように書くことができる

\[ L(\theta) = \prod_{i=1}^N \prod_{j=0}^J (Pr(d_i=j))^{1(d_i=j)} \]

この尤度関数をパラメータ\(\theta=(\alpha, \beta^0, \cdots, \beta^K)\)について最大化することで消費者の効用関数内のパラメータを得ることができる。

反実仮想シミュレーション#

一度関数が推定できれば、例えば値下げ時の効用の変化は効用関数に代入する製品価格を下げればシミュレーションができ、売上高の予測もできる。

期待効用#

多項ロジットモデルにおける期待効用は

\[ E_{\{\epsilon_{ij}\}_j} [\max_{j\in \{0,1,\cdots,J\}} U_{ij}] \]

で、これは「選好へのショックが発生する前の時点で最も高い効用をエられるように選択した場合に得られる効用の期待値」となる。

ロジットモデルでは期待効用は以下のように書くことができる。

\[ E_{\{\epsilon_{ij}\}_j} [\max_{j\in \{0,1,\cdots,J\}} U_{ij}] = \log \left( \sum^J_{j=0} \exp(V_{ij}) \right) + C \]

ここで\(V_{ij} = \beta^0 + \sum_{k=1}^K \beta^k x^k_j - \alpha p_j\)である。この右辺の形はログ・サム公式(log-sum formula)と呼ばれる。

ランダム効用モデル#

こうした確率的なショック項を入れた離散選択モデルはランダム効用モデルとも呼ばれる

文献#

経済セミナー サポートサイト#

直接効用と間接効用#

https://www.i-repository.net/contents/outemon/ir/102/102830312.pdf

直接効用関数 \(u(x)\)#

数量と効用の関係を表す。

間接効用関数 \(v(p, m)\)#

予算制約線の元での効用最大化問題を解いた後の、価格との関係性 $\( \max_x u(x_1, \cdots, x_j)\\ \text{s.t.} \ p_1x_1 + \cdots + p_jx_j\\ \)\( から決定される需要関数 \)\( x_i = D_i(p_1, \cdots, p_j, m) \)\( を効用関数に代入すると \)\( u(x_1, \cdots, x_j)\\ =u[D_1(\boldsymbol{p}, m), \cdots, D_j(\boldsymbol{p}, m)]\\ =v(\boldsymbol{p}, m) \)$

となる。これを間接効用関数と呼ぶ。