赞
踩
废话文学一下:入门学习因果推断三周,总算是入了个门…
就着智能权益方面的两个问题(给什么人发券?+ 发什么券?)简单总结一下两个问题的通用框架
(借一张哈罗顺风车的图,如上)
可以从很多已经落地工程化的案例中看到,在智能补贴或智能营销场景,常常需要解决两个递进的问题以及各自的解决方式,这里小结通用框架(这个套路又有点像之前学的预算分配的通用框架:A Unified Framework for Marketing Budget Allocation[1]):
类型 | 解法 |
选人:给什么人发券? | Uplift model的各类模型 |
权益:发什么券? | 线性规划、贪心分配、背包问题 |
很显然,活跃转化是最主要的人群,大多的方法都是uplift model,那么uplift model也有几类:
•uplift方法一:元学习方法(Meta-learning methods)
•Conditional Outcome Modeling (COM) / S-learner•Grouped COM (GCOM) / T-Learner•X-Learner•R-learner•特殊meta学习:The Class Transformation Method
•uplift方法二:Tree-Based Method(增量直接建模)
• 分布散度下的Uplift-Tree• CausalForest• 对uplift直接建模的CTS Tree
•NN-Based Method
还有uplift model评估问题也很关键后面可以再看看。
在实践中使用的方法是用一个新的LightGBM去拟合离线评估最优模型产出的
,并用这个新模型的特征重要度来近似评估各个维度特征的重要性,以此来决策是否加入和剔除特征。
选择LightGBM的原因是我们对于这个模型的精度并没有太高的要求,相反我们希望它能够比较快速地在训练流程中对新加入特征的给出反馈。
LightGBM高效地训练速度和不需要过多特征工程的优点比较契合我们的需求。
例如广告的CTR/CVR预估模型;该类模型对广告效率的预估,会预先将原始的复杂特征做汇总。基于此,整体的思想就是基于原生的广告搜索模型做迁移学习。将所有特征都连到一个DNN里面,采用了ResNets的思想,如上图所示:左侧网络对用户搜索请求预期的转换效率进行建模,右侧网络对“广告是否投放”产生的影响进行建模,最后通过线性模型加以合并。对于广告效应的推断方面,这种模型相比于DNN会有一定的提升(uplift Qini指数提升至0.6)。
除了meta-learning外还尝试了Tree-Based,uplift model 下的树模型通过对增量直接建模,对特征点进行分裂, 将 X 划分到一个又一个 subspace 中,那划分准则与传统的决策树信息熵或者基尼系数不一样,这边主要是采用分布散度或者CTS分裂准则。
nn-based我们还没有尝试,他是将propensity score估计即倾向性得分和uplift score估计合并到一个网络实现。
这里基本是线性规划占主导
黄色区域是基于uplift model的实时预测的模块,当一条用户的请求过来的时候,我们会实时去数据库中取用户的特征以及影片的特征,同时结合当前的环境特征预测用户在当前状态下真实的敏感度,基于这个敏感度可以进行后续分发的面额决策等。
对增量预估完毕后,接下来就需要具体地为用户池中用户分配补贴券。在基于增量预估的基础上,我们尝试了两种分发策略:
贪心分配
很多时候,运营对于使用的券类别和每个券类别的预算分配都有比较大的限制和约束。在这样的约束下,我们的做法是按照券值面额从低到高,为每个券类别计算可支配数量,然后对用户池所有用户按照预估出的Uplift值和计算出的可发放数量倒排截断,并将分配完毕的用户从备选用户池中移除。
这样一个用户如果在各种券类别下uplift都很高时,我们将会优先为他/她配置券值较低的补贴券。这样做法的好处是简洁明了实现简单,在人工干预较强的时候对于运营的可解释性也比较强。缺点当然就是在自由度更高情况下,显然不能达到全局最优。
整数规划
而当我们对于预算和券种的设置拥有了更多的自主权时,我们也尝试了在预算约束下的最大化求解,具体的求解公式如下:
v3版本有提到,要借由运筹学给不同人配不同券 :
比如xij 代表第i个用户是否发放第j种券,那约束条件是:每个用户至多发一种劵,以及所有用户的发券总和不能超过实际预算,优化目标可以是所有用户的增益值最大,也可以是gmv最大或者roi最大等
运筹优化的求解主要是整数规划,整数规划目前采用谷歌的ortools来求解。但是优化器当求解参数上千万时,性能就出问题了,要算十个小时左右,这是不能接受的。目前的解决方案是分而治之,通过分城市来求解优化器,因为每个城市间的用户相对来说是相互独立的,互不干扰。
[1]
A Unified Framework for Marketing Budget Allocation: https://arxiv.org/abs/1902.01128?context=cs.DS
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。