例：クーポンの配布

例：クーポンの配布#

ECサイトにおいてクーポンをユーザーに配布する施策を行った状況を想定し、クーポンという処置が購入する確率に与えた影響を調べたいとする。その際に、

ランダムにクーポン配布が行われたケース
前月に購入したユーザーのうちランダムに選んだ半分にクーポンが配布されたケース

という2つの処置割当メカニズムがあったと仮定して比較を行う。クーポンは同じもので効果も同じとする。

また、ユーザーは通常の顧客と、成約率が高いロイヤルカスタマーの2種類いるとする。

乱数を生成してシミュレーションしてみる

../_images/f16548f307f7966c4ca33d051b69e5482b86e259684817523c940d4d7ac3cfd9.svg

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
np.random.seed(0)

ate = 0.1  # 真の効果
n = 1000
users = pd.DataFrame()

# 通常の顧客とロイヤルカスタマーの2つのグループがあり、毎月の成約率が異なるとする
p_normal = 0.2
p_loyal = 0.5

# ロイヤルカスタマーは全体の2割いるとする
is_loyal = np.random.binomial(n=1, p=0.2, size=n)


def generate_data():
    # 先月の購入の有無
    is_buy_normal = is_loyal * np.random.binomial(n=1, p=p_loyal, size=n)
    is_buy_loyal = (1 - is_loyal) * np.random.binomial(n=1, p=p_normal, size=n)
    users.loc[:, "prev_purchase"] = is_buy_normal + is_buy_loyal

    # 1. ランダム配布の場合
    d = np.random.binomial(n=1, p=0.5, size=n)
    is_buy_normal = d * np.random.binomial(n=1, p=p_normal + ate, size=n) + (1 - d) * np.random.binomial(n=1, p=p_normal, size=n)
    is_buy_loyal = d * np.random.binomial(n=1, p=p_loyal + ate, size=n) + (1 - d) * np.random.binomial(n=1, p=p_loyal, size=n)
    users.loc[:, "purchase_1"] = is_loyal * is_buy_loyal + (1 - is_loyal) * is_buy_normal
    users.loc[:, "assignment_1"] = d

    # 2. ユーザーを選ぶ場合
    d = users["prev_purchase"] * np.random.binomial(n=1, p=0.5, size=n)
    is_buy_normal = d * np.random.binomial(n=1, p=p_normal + ate, size=n) + (1 - d) * np.random.binomial(n=1, p=p_normal, size=n)
    is_buy_loyal = d * np.random.binomial(n=1, p=p_loyal + ate, size=n) + (1 - d) * np.random.binomial(n=1, p=p_loyal, size=n)
    users.loc[:, "purchase_2"] = is_loyal * is_buy_loyal + (1 - is_loyal) * is_buy_normal
    users.loc[:, "assignment_2"] = d

    return users

--- ナイーブな推定量 ---
1. ランダム配布の場合
対照群： 成約率=0.248 n=533
処置群： 成約率=0.347 n=467
成約率の差： 0.0992

2. ユーザーを選ぶ場合
対照群： 成約率=0.238 n=849
処置群： 成約率=0.424 n=151
成約率の差： 0.186

df.corr()

	prev_purchase	purchase_1	assignment_1	purchase_2	assignment_2
prev_purchase	1.000000	0.112856	0.012899	0.136315	0.667983
purchase_1	0.112856	1.000000	0.108676	0.083434	0.089539
assignment_1	0.012899	0.108676	1.000000	-0.010079	0.002704
purchase_2	0.136315	0.083434	-0.010079	1.000000	0.150649
assignment_2	0.667983	0.089539	0.002704	0.150649	1.000000



	(1)	(2)	(3)

Intercept	0.248^***	0.238^***	0.228^***
	(0.020)	(0.015)	(0.016)
assignment_1	0.099^***
	(0.029)
assignment_2		0.186^***	0.133^**
		(0.039)	(0.052)
prev_purchase			0.063
			(0.041)

Observations	1000	1000	1000
R²	0.012	0.023	0.025
Adjusted R²	0.011	0.022	0.023
Residual Std. Error	0.453 (df=998)	0.437 (df=998)	0.437 (df=997)
F Statistic	11.928^*** (df=1; 998)	23.176^*** (df=1; 998)	12.779^*** (df=2; 997)

Note:	^p<0.1; ^p<0.05; ^**p<0.01

ランダムじゃない割り付けだったpurchase_2のほうでも、 prev_purchase を入れるとバイアスが減少している

モンテカルロシミュレーション#

purchase_2 ~ assignment_2 + prev_purchaseの推定値がたまたまではないことを確認する

tau_hats = []
for i in range(1000):
    np.random.seed(i)
    df = generate_data()
    res = smf.ols('purchase_2 ~ assignment_2 + prev_purchase', data=df).fit()
    tau_hat = res.params["assignment_2"]
    tau_hats.append(tau_hat)

tau_hats = pd.Series(tau_hats)

../_images/ab45fe02ff7a6c7270f6cf4cbe413f2756313f278a6c63ac7d7d629d5f258061.png

例：クーポンの配布

Contents

例：クーポンの配布#

モンテカルロシミュレーション#