# Uplift 2022-01-19 報告分 ### 今後(再掲) - テストデータを揃える(前回解決済) - AUUCを表にするなどして定性的に評価 - feature impotanceを見てみる(cpn特徴が効いていることを期待) ## 問題設定 初見のキャンペーンについて効果の高いユーザーを当てる課題 全21キャンペーンについて、20キャンペーンで訓練 ⇒ 残りの1キャンペーンでテストという形で実験 +One model approachを試してみました +feature importanceを見てみました (+Factorization Machineを試しています) ### 予測モデル lightGBMの2モデル予測 `UpliftScore = 介入したときに訪れる確率 - 介入しなかったときに訪れる確率` lightGBMの1モデル予測 <img src="https://i.imgur.com/oXoefsP.png" width="250"> `UpliftScore = 2P(z=1|x) - 1` > Jaskowski+, Uplift modeling for clinical trial data, 2012 ### キャンペーン特徴を入れて学習 20キャンペーンで訓練 ⇒ 残りの1キャンペーンでテスト cpn特徴なし:青、cpn特徴あり:緑  ### 共有ファイル内容 * one model approachの結果:`one_model/` * feature importance:`feature_importance/` * 各モデル&cpnの性能比較:`scores.xlsx` ## 結果と考察 one model approachでは11/21cpnで性能が向上と微増しているが、Baselineの性能が下がったのが原因という印象もあります。 feature_importanceを見ると、cpn_feature の重要度が軒並み低めでした(特にone-hot部分)。 one-hot部分が疎なことが影響している可能性を考え、FMによる学習を検討しています。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up