傾向スコア解析とUplift Modelling
-
Upload
yohei-sato -
Category
Documents
-
view
4.715 -
download
1
Transcript of 傾向スコア解析とUplift Modelling
![Page 2: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/2.jpg)
AGENDA
◆ 本発表の目的
◆ 自己紹介
◆ 傾向スコア解析
◆ Uplift Modelling
◆ まとめ
2012年5月26日土曜日
![Page 3: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/3.jpg)
AGENDA
◆ 本発表の目的
◆ 自己紹介
◆ 傾向スコア解析
◆ Uplift Modelling
◆ まとめ
2012年5月26日土曜日
![Page 4: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/4.jpg)
時系列解析や異常検知などの方法論を実ビジネスに適用するデータマイニングエンジニア
◆ 名前: 里 洋平
◆ 職業: データマイニングエンジニア
◆ ID : yokkuns
◆ 統計解析 パターン認識 機械学習 データマイニング NLP 金融工学などを勉強中
自己紹介
2012年5月26日土曜日
![Page 5: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/5.jpg)
Tokyo.R主催
パッケージ本執筆しました!
活動例: 勉強会の主催・執筆
2012年5月26日土曜日
![Page 6: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/6.jpg)
閲覧されている動画の情報を用いておすすめ動画を表示する
活動例: 動画レコメンド
2012年5月26日土曜日
![Page 7: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/7.jpg)
Web上の情報から市場予測
活動例: 市場予測
2012年5月26日土曜日
![Page 8: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/8.jpg)
異常な振る舞い
複数時系列の異常検知
時系列A
時系列B 時系列C
ケースA
ケースB
ケースC
例2:CM効果のノイズ除去
異常な振る舞いの時系列を検出
異常な振る舞いをしているケースを除外して、CMの効果を算出する
CM効果トラフィックA
トラフィックB
トラフィックC
例1:トラフィック異常検知
異常な振る舞いをしているトラフィックの原因を調査する
調査
AB
C
時系列のモデリング
時系列A
時系列B
時系列C
Anomaly detection
複数時系列から異常な振る舞いを検知する
85
活動例: 異常検知
2012年5月26日土曜日
![Page 9: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/9.jpg)
-117.0000
1912.2500
3941.5000
5970.7500
8000.0000
4/4週4/11週4/18週4/25週5/2週5/9週5/16週5/23週5/30週6/6週6/13週6/20週6/27週7/4週7/11週7/18週7/25週-3.0000
-2.2500
-1.5000
-0.7500
0
0.7500
1.5000
2.2500
3.0000
t
異常スコア推移
異常値モデル構築
異常スコアの算出
◇例 : ARIMAモデル
◇例 : 対数損失
Anomaly detection
新しいデータと過去時系列モデルの乖離から異常検出
86
活動例: 時系列解析と異常検知
2012年5月26日土曜日
![Page 10: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/10.jpg)
87
CM時系列
各KPIの時系列
CM
新規登録
ARPU
ARPPU
継続率
ケース
イベント
その他外部要因
TV Commercial Effects
時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出
活動例: 時系列解析と影響分析
2012年5月26日土曜日
![Page 11: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/11.jpg)
活動例: データマイニングCROSS
2012年5月26日土曜日
![Page 12: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/12.jpg)
AGENDA
◆ 本発表の目的
◆ 自己紹介
◆ 傾向スコア解析
◆ Uplift Modelling
◆ まとめ
2012年5月26日土曜日
![Page 13: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/13.jpg)
本発表の目的傾向スコア解析とUplift Modellingが
扱う効果やデータを切る軸が似ていて混乱するので整理する
介入を受けた
場合の結果
介入を受けない
場合の結果
処置群 対照群
No
Yes
Yes No
介入を受けた場合の反応
介入を受けなかった場合の反応傾向スコア解析のデータを切る軸 Uplift Modellingのデータを切る軸
介入効果 = 処置群の値介入がなかった場合の処置群の値-
2012年5月26日土曜日
![Page 14: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/14.jpg)
傾向スコア解析とUplift Modelling傾向スコア解析とUplift Modellingは
やりたい事や扱うデータの対象が大きく違う
傾向スコア解析 Uplift Modelling
やりたい事 因果効果の推定 費用対効果の最大化
扱うデータ 観察データ 実験データ
アプローチ 共変量を使って処置群と対照群の傾向を調整して因果効果を算出する
処置群と対照群の両方を使って介入による行動変化をモデル化して
それを最大化するような分類を行う
2012年5月26日土曜日
![Page 15: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/15.jpg)
介入による効果の扱いどちらも介入による効果を扱うが
その目的はと扱うデータは大きく異なる
介入効果 = 処置群の値介入がなかった場合の処置群の値-
◆ 傾向スコア解析:
◆ Uplift Modelling:
・実験出来ないデータにおいて、割当による影響を除外して介入効果を推定する
・実験可能なデータを用いて、介入効果を最大にするようなグループ分けを行う
2012年5月26日土曜日
![Page 16: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/16.jpg)
実験出来るデータでは因果効果は単純な処置群と対照群の差になる
実験出来るデータの因果効果
処置群のデータ
対照群のデータ
処置群 対照群
因果効果 = 処置群の平均 - 対照群の平均
2012年5月26日土曜日
![Page 17: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/17.jpg)
実験出来るデータでは因果効果は単純な処置群と対照群の差になる
実験出来るデータの因果効果
処置群のデータ
対照群のデータ
処置群 対照群
処置群と対照群をランダムに割当
因果効果 = 処置群の平均 - 対照群の平均
2012年5月26日土曜日
![Page 18: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/18.jpg)
実験出来るデータでは因果効果は単純な処置群と対照群の差になる
実験出来るデータの因果効果
処置群のデータ
対照群のデータ
処置群 対照群
処置群と対照群をランダムに割当
因果効果 = 処置群の平均 - 対照群の平均
欠測
欠測
介入を受けた場合の結果
介入を受けない場合の結果
2012年5月26日土曜日
![Page 19: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/19.jpg)
処置群のデータ
対照群のデータ
処置群 対照群
処置群と対照群をランダムに割当
因果効果 = 処置群の平均 - 対照群の平均
欠測
欠測
介入を受けた場合の結果
介入を受けない場合の結果
•対照群が介入を受けていた場合の期待値と介入を受けた処置群の期待値は同じ
•処置群が介入を受けない場合の期待値と介入を受けなかった対照群の期待値は同じ
期待値が等しい!
実験出来るデータでは因果効果は単純な処置群と対照群の差になる
実験出来るデータの因果効果
2012年5月26日土曜日
![Page 20: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/20.jpg)
割当によって処置群と対照群に差が生じるため両者を単純に比較することが出来ない
実験出来ないデータの因果効果
処置群のデータ
対照群のデータ
処置群 対照群
因果効果 ≠ 処置群の平均 - 対照群の平均
2012年5月26日土曜日
![Page 21: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/21.jpg)
割当によって処置群と対照群に差が生じるため両者を単純に比較することが出来ない
実験出来ないデータの因果効果
処置群のデータ
対照群のデータ
処置群 対照群
因果効果 ≠ 処置群の平均 - 対照群の平均
処置群と対照群の割当(コントロール出来ない)
2012年5月26日土曜日
![Page 22: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/22.jpg)
割当によって処置群と対照群に差が生じるため両者を単純に比較することが出来ない
実験出来ないデータの因果効果
処置群のデータ
対照群のデータ
処置群 対照群
因果効果 ≠ 処置群の平均 - 対照群の平均
処置群と対照群の割当(コントロール出来ない)
欠測
欠測
介入を受けた場合の結果
介入を受けない場合の結果
2012年5月26日土曜日
![Page 23: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/23.jpg)
処置群のデータ
対照群のデータ
処置群 対照群
因果効果 ≠ 処置群の平均 - 対照群の平均
処置群と対照群の割当(コントロール出来ない)
欠測
欠測
介入を受けた場合の結果
介入を受けない場合の結果
•対照群が介入を受けていた場合の期待値と介入を受けた処置群の期待値が異なる
•処置群が介入を受けない場合の期待値と介入を受けなかった対照群の期待値が異なる
期待値が違う!
割当によって処置群と対照群に差が生じるため両者を単純に比較することが出来ない
実験出来ないデータの因果効果
2012年5月26日土曜日
![Page 24: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/24.jpg)
AGENDA
◆ 本発表の目的
◆ 自己紹介
◆ 傾向スコア解析
◆ Uplift Modelling
◆ まとめ
2012年5月26日土曜日
![Page 25: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/25.jpg)
処置群のデータ 欠測
対照群のデータ 欠測
共通で得られている変数
介入を受けた場合の結果
介入を受けない場合の結果
共変量項目
処置群 対照群
処置群と対照群の割当(コントロール出来ない)
共変量で割当をモデリング傾向スコアの算出
傾向スコアを用いた調整◇マッチング◇層別解析◇共分散分析
実験出来ないデータの因果関係を解析する
傾向スコア解析
2012年5月26日土曜日
![Page 26: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/26.jpg)
処置群のデータ 欠測
対照群のデータ 欠測
介入を受けた場合の結果
介入を受けない場合の結果
処置群 対照群
z=1 z=0
y1とy0は両方存在するが割当によって観測出来ないと考える
割当によって観測出来ない潜在的変数を考える
欠測データ
2012年5月26日土曜日
![Page 27: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/27.jpg)
処置群のデータ 欠測
対照群のデータ 欠測
介入を受けた場合の結果
介入を受けない場合の結果
処置群 対照群
z=1 z=0
処置群と対照群の割当 z
処置群での平均介入効果average treatment effect on the treated
z=1の時のy1とy0の差を知りたいがどちらか一方は観測出来ない
割当変数zと求めたい因果効果
欠測データ
2012年5月26日土曜日
![Page 28: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/28.jpg)
処置群のデータ 欠測
対照群のデータ 欠測
介入を受けた場合の結果
介入を受けない場合の結果
処置群 対照群
z=1 z=0
処置群と対照群の割当 z
共通で得られている変数 共変量項目
強く無視出来る割当条件
共変量の影響を除去した因果効果
::
共変量の値が等しい時は割当はランダムという仮定
共変量の影響を除去した因果効果
欠測データ
2012年5月26日土曜日
![Page 29: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/29.jpg)
処置群のデータ 欠測
対照群のデータ 欠測
介入を受けた場合の結果
介入を受けない場合の結果
処置群 対照群
z=1 z=0
処置群と対照群の割当 z
共通で得られている変数 共変量項目
強く無視出来る割当条件
共変量の影響を除去した因果効果
::
共変量が同じならz=1のy0の期待値をz=0の時のy0の期待値で代用出来る
共変量の影響を除去した因果効果
欠測データ
2012年5月26日土曜日
![Page 30: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/30.jpg)
第i対象者の割当変数の値
第i対象者の共変量の値
対象者の群1へ割り当てられる確率
傾向スコア
2012年5月26日土曜日
![Page 31: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/31.jpg)
プロビット回帰やロジスティック回帰で推定する
傾向スコアの推定
2012年5月26日土曜日
![Page 32: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/32.jpg)
• マッチング• 2つの群で傾向スコアが等しい(近い)対象者をペアにしてその差の平均を因果効果とする
• 層別解析• 傾向スコアの大小によっていくつかのサブクラスに分け、その各クラスで処置群と対照群の平均の計算と、全体としての効果の推定量を計算する
• 共分散分析• 割当変数と傾向スコアを説明変数とした線形の回帰分析を行う
傾向スコアを用いた調整
2012年5月26日土曜日
![Page 33: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/33.jpg)
傾向スコアを用いた調整
傾向スコアの逆数による重み付け平均
2012年5月26日土曜日
![Page 34: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/34.jpg)
傾向スコアを用いた調整傾向スコアの逆数を重みづけたyの期待値は
y1の周辺平均の不偏推定量
2012年5月26日土曜日
![Page 35: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/35.jpg)
因果効果
因果効果の分散
傾向スコアを用いた調整
因果効果の推定値とその分散が計算出来る
2012年5月26日土曜日
![Page 36: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/36.jpg)
Matching パッケージ
lalondeデータセット
age 年齢 re74 74年実質賃金educ 教育年数 re75 75年実質賃金black 黒人かどうか re78 78年実質賃金hisp ヒスパニックかどうか u74 74年の賃金が0かどうかmarried 結婚してるかどうか u75 75年の賃金が0かどうかnodegr 高校卒業有無 treat NSW対象者有無
NSW職業訓練データ
Rによる実行
2012年5月26日土曜日
![Page 37: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/37.jpg)
Matching パッケージ
Match(Y=NULL, Tr, X, caliper=F,...)
Y : 結果ベクトルTr : 割当ベクトルX : 共変量または傾向スコアcaliper : キャリパーマッチングをやる場合にTRUE...
Rによる実行
2012年5月26日土曜日
![Page 38: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/38.jpg)
Matchingパッケージとデータセットの読み込み
Rによる実行
2012年5月26日土曜日
![Page 39: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/39.jpg)
ロジスティック回帰分析で傾向スコアを算出
Rによる実行
2012年5月26日土曜日
![Page 40: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/40.jpg)
マッチングで因果効果を推定
NSWプログラムの効果
Rによる実行
2012年5月26日土曜日
![Page 41: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/41.jpg)
マッチングのペアの確認
Rによる実行
2012年5月26日土曜日
![Page 42: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/42.jpg)
マッチングのペアの確認
処置群のindex
対照群のindex
Rによる実行
2012年5月26日土曜日
![Page 43: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/43.jpg)
キャリパーマッチングで因果効果を推定
キャリパーマッチング : ペアが特定の距離以上になる時はマッチングしないマッチング
NSWプログラムの効果
Rによる実行
2012年5月26日土曜日
![Page 44: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/44.jpg)
傾向スコアの逆数による重みベクトルを作成
RでIPW推定量
2012年5月26日土曜日
![Page 45: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/45.jpg)
lmで重みベクトルを指定してIPW推定量を算出
RでIPW推定量
2012年5月26日土曜日
![Page 46: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/46.jpg)
lmで重みベクトルを指定してIPW推定量を算出
処置群のIPW推定量と標準誤差
対照群のIPW推定量と標準誤差
RでIPW推定量
2012年5月26日土曜日
![Page 47: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/47.jpg)
lmで重みベクトルを指定してIPW推定量を算出
処置群のIPW推定量と標準誤差
対照群のIPW推定量と標準誤差
因果効果 = 6213.0 - 4589.4 = 1623.6
標準誤差 = √(462.2^2+436.4^2) = 635.668
RでIPW推定量
2012年5月26日土曜日
![Page 48: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/48.jpg)
AGENDA
◆ 本発表の目的
◆ 自己紹介
◆ 傾向スコア解析
◆ Uplift Modelling
◆ まとめ
2012年5月26日土曜日
![Page 49: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/49.jpg)
あまのじゃく 無関心
テッパン 説得可能!
介入を受けた場合の反応
介入を受けなかった場合の反応YES
No
YES
No
Uplift Modellingとは費用対効果の最大化を目的とした最新のデータマイニング手法
介入による行動変化をモデル化し効果を最大化する
介入による4つの行動パターン
2012年5月26日土曜日
![Page 50: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/50.jpg)
これまでのマーケティングモデル顧客を有望な顧客とそうでない顧客に分類し
有望な顧客だけをターゲットにする事で費用対効果を向上させる
◆ 浸透モデル
◆ 購入モデル
◆ レスポンスモデル
・既に製品を購入した顧客を特徴づけるモデル
・最近購入した顧客を特徴づけるモデル・浸透モデルに似てるが、最近の履歴に注目し、顧客の特性の変化を捉える
・マーケティング活動に反応して購入した顧客を特徴づけるモデル
2012年5月26日土曜日
![Page 51: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/51.jpg)
これまでのマーケティングモデル顧客を有望な顧客とそうでない顧客に分類し
有望な顧客だけをターゲットにする事で費用対効果を向上させる
◆ 浸透モデル
◆ 購入モデル
◆ レスポンスモデル
・既に製品を購入した顧客を特徴づけるモデル
・最近購入した顧客を特徴づけるモデル・浸透モデルに似てるが、最近の履歴に注目し、顧客の特性の変化を捉える
・マーケティング活動に反応して購入した顧客を特徴づけるモデル
2012年5月26日土曜日
![Page 52: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/52.jpg)
処置群
Training Data 従来のレスポンスモデリング
予測対象
分類結果“反応あり”の場合良いターゲット
レスポンスモデリング処置群の反応データを用いて
レスポンスをモデル化し、ターゲットを決める
処置群
反応なし 反応あり
2012年5月26日土曜日
![Page 53: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/53.jpg)
処置群
Training Data 従来のレスポンスモデリング
予測対象
分類結果“反応あり”の場合良いターゲット
レスポンスモデリングの課題
処置群
反応なし 反応あり
無関心
あまのじゃく
テッパン
説得可能!
処置群だけで学習しているため介入による行動変化を考慮出来ていない
2012年5月26日土曜日
![Page 54: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/54.jpg)
処置群
Training Data 従来のレスポンスモデリング
予測対象
分類結果“反応あり”の場合良いターゲット
レスポンスモデリングの課題
処置群
反応なし 反応あり
無関心
あまのじゃく
テッパン
説得可能!
処置群だけで学習しているため介入による行動変化を考慮出来ていない
介入しなければ反応した
介入しなくても反応した
2012年5月26日土曜日
![Page 55: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/55.jpg)
処置群
Training Data
予測対象
処置群と対照群を用いた学習
処置群
反応なし 反応あり
処置群と対照群の両方を学習データとする事で介入による行動変化を捉える
対照群
対照群
無関心
あまのじゃく
テッパン
説得可能!
無関心
説得可能!
テッパン
あまのじゃく
2012年5月26日土曜日
![Page 56: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/56.jpg)
処置群
Training Data
予測対象
処置群と対照群を用いた学習
処置群
反応なし 反応あり
処置群と対照群の両方を学習データとする事で介入による行動変化を捉える
対照群
対照群
無関心
あまのじゃく
テッパン
説得可能!
無関心
説得可能!
テッパン
あまのじゃく
2012年5月26日土曜日
![Page 57: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/57.jpg)
処置群
Training Data
予測対象
処置群と対照群を用いた学習
処置群
反応なし 反応あり
処置群と対照群の両方を学習データとする事で介入による行動変化を捉える
対照群
対照群
無関心
あまのじゃく
テッパン
説得可能!
無関心
説得可能!
テッパン
あまのじゃく
2012年5月26日土曜日
![Page 58: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/58.jpg)
処置群
Training Data Response Uplift Modelling
予測対象
Uplift Modelling
処置群
L R
単純な”反応あり”・”反応なし”ではなく介入による行動変化をモデル化しターゲットを決める
対照群
対照群
無関心
あまのじゃく
テッパン
説得可能!
無関心
説得可能!
テッパン
あまのじゃく
分類結果“R”の場合
良いターゲット
2012年5月26日土曜日
![Page 59: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/59.jpg)
分割基準行動変化によるレスポンス率増とその重要性を最大化する分割を行う
処置群(T)
L R
対照群(C)
無関心
あまのじゃく
テッパン
説得可能!
無関心説得可能!
テッパン
あまのじゃく
URUL
2012年5月26日土曜日
![Page 60: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/60.jpg)
分割基準行動変化によるレスポンス率増とその重要性を最大化する分割を行う
処置群(T)
L R
対照群(C)
無関心
あまのじゃく
テッパン
説得可能!
無関心説得可能!
テッパン
あまのじゃく
URUL
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗)
2012年5月26日土曜日
![Page 61: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/61.jpg)
分割基準行動変化によるレスポンス率増とその重要性を最大化する分割を行う
処置群(T)
L R
対照群(C)
無関心
あまのじゃく
テッパン
説得可能!
無関心説得可能!
テッパン
あまのじゃく
URUL
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗)
2012年5月26日土曜日
![Page 62: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/62.jpg)
分割基準行動変化によるレスポンス率増とその重要性を最大化する分割を行う
処置群(T)
L R
対照群(C)
無関心
あまのじゃく
テッパン
説得可能!
無関心説得可能!
テッパン
あまのじゃく
URUL
L
L R
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗)
2012年5月26日土曜日
![Page 63: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/63.jpg)
介入による行動変化の定式化
処置群(T)L R
対照群(C)
URUL
介入による効果
グループ効果
相互作用
介入による効果
グループ効果
相互作用
介入による効果
グループ効果
相互作用
介入による効果
グループ効果
相互作用
※Cの介入効果 = Lのグループ効果 = CR相互作用 = TL相互作用 = CL相互作用 = 0 とおく
介入による行動変化を介入効果とグループ効果の相互作用として表現
2012年5月26日土曜日
![Page 64: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/64.jpg)
介入による行動変化の推定
処置群(T)L R
対照群(C)
URUL
介入による効果
グループ効果
相互作用
介入による効果
グループ効果
相互作用
介入による効果
グループ効果
相互作用
介入による効果
グループ効果
相互作用
※Cの介入効果 = Lのグループ効果 = CR相互作用 = TL相互作用 = CL相互作用 = 0 とおく
相互作用はRグループとLグループの増分の差で推定される
2012年5月26日土曜日
![Page 65: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/65.jpg)
介入による行動変化の推定値の誤差と重要性
T:1, C:0 R:1, L:0 Xi1Xi2
基準値
介入効果
グループ効果
相互作用
介入による行動変化は回帰係数として算出されその重要性はt統計量で与えられる
◆ t統計量の2乗◆ 標準誤差の算出
2012年5月26日土曜日
![Page 66: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/66.jpg)
分割基準行動変化によるレスポンス率増とその重要性を最大化する分割を行う
処置群(T)
L R
対照群(C)
無関心
あまのじゃく
テッパン
説得可能!
無関心説得可能!
テッパン
あまのじゃく
URUL
L
L R
◆ 行動変化によるレスポンス率の増分
◆ 重要性 (t統計量の2乗)
2012年5月26日土曜日
![Page 67: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/67.jpg)
AGENDA
◆ 本発表の目的
◆ 自己紹介
◆ 傾向スコア解析
◆ Uplift Modelling
◆ まとめ
2012年5月26日土曜日
![Page 68: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/68.jpg)
傾向スコア解析とUplift Modelling傾向スコア解析とUplift Modellingは
やりたい事や扱うデータの対象が大きく違う
傾向スコア解析 Uplift Modelling
やりたい事 因果効果の推定 費用対効果の最大化
扱うデータ 観察データ 実験データ
アプローチ 共変量を使って処置群と対照群の傾向を調整して因果効果を算出する
処置群と対照群の両方を使って介入による行動変化をモデル化して
それを最大化するような分類を行う
2012年5月26日土曜日
![Page 69: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/69.jpg)
AGENDA
◆ 本発表の目的
◆ 自己紹介
◆ 傾向スコア解析
◆ Uplift Modelling
◆ まとめ
2012年5月26日土曜日
![Page 70: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/70.jpg)
次回以降の
発表者・LTを募集しています!
2012年5月26日土曜日
![Page 71: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/71.jpg)
ご清聴ありがとうございました!
2012年5月26日土曜日
![Page 72: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/72.jpg)
参考資料
http://www.slideshare.net/yokkuns/r-9387843
◆ Rで学ぶ傾向スコア解析入門
http://www.slideshare.net/yokkuns/uplift-modelling-1
◆ Uplift Modelling 入門(1)
2012年5月26日土曜日
![Page 73: 傾向スコア解析とUplift Modelling](https://reader033.fdocument.pub/reader033/viewer/2022052300/58f2f7021a28aba0408b4575/html5/thumbnails/73.jpg)
欠測データ観測出来ない方のデータを欠測してると考える
因果推論、選択バイアス、データ融合を統一的に扱えるデータ構造
処置群のデータ 欠測
対照群のデータ 欠測
共通で得られている変数
介入を受けた場合の結果
介入を受けない場合の結果
共変量項目
処置群 対照群
選択者のデータ 非選択者のデータ
共通で得られている変数
従属変数
共変量項目
選択者 非選択者
購買履歴調査のデータ
欠測
市場調査の回答データ
欠測
共通で得られている変数
購買履歴
質問紙項目
共変量項目
購買履歴データ 市場調査データ
因果推論
選択バイアス
データ融合
2012年5月26日土曜日