优惠券系统设计的方法,优惠券码生成算法

  

  随着互联网和人工智能的普及,个性化营销已经渗透到我们生活的方方面面。如何找到真正的营销敏感人群,将更多的预算投入到能带来‘增量’的用户中,以提高整体营销roi,成为后时代精细化运营的关键。   

  

  隆起模型可以很好地解决这个问题。本文将介绍这一模型以及如何将其应用于智能营销的基本原理。   

  

  01   

  

  什么是Uplift模型?   

  

  用一个简单的例子来介绍这个模型。假设我们是一个电商平台,一个标价300元的产品,用户的购买率是6%。现有预算可以给用户发放10元优惠券,提高购买率。我需要给每个用户发优惠券吗?答案显然是否定的,那么这些优惠券应该发给平台的哪些用户呢?   

  

  当前,我们心中有四种类型的用户:   

  

  *可说服性:不发优惠券就不买;如果你发优惠券,你会买;   

  

  *确定的事情:不管是否发优惠券都会被购买;   

  

  *遗失原因:不会购买优惠券或不购买;   

  

  * Sleeping Dogs:会在不发优惠券的情况下购买,但在发优惠券后不会购买;   

  

     

  

  左上角的Persuadables用户在被发放优惠券后发生了积极的变化,从从未购买到购买,干预后购买率有所提高。这部分是我们真正想做触摸干预的营销敏感用户。   

  

  当然,用户在右上角,迷失在左下角   

  

  导致用户无论是否发放优惠券都不会改变自己原有的购买行为,给这些用户发送优惠券会造成资源的浪费。睡在右下角   

  

  狗狗(请勿打扰)用户可能对营销相对反感,干预会起到相反的效果。我们尽量避免打扰这样的用户。   

  

  four模型要解决的问题是通过建模和预测对这四类用户进行准确分类。我们获得的训练数据是不完整的。对于单个用户来说,不可能同时观察有无干预(发放凭证)的表现,这也是因果推断中的反事实问题。   

  

  平均因果效应可以从用户的角度来估计。如果我们有两组同质用户,一组用户会被发放优惠券,另一组不会被发放优惠券。之后统计两组人在购买转化率上的差异,这个差异可以近似认为是可能的平均因果效应。隆起建模需要服从CIA条件独立性假设,最简单的解决方案是ab实验。因为样本在特征上均匀分布,所以随机实验是隆起。   

  

  模型建模过程中一个非常重要的前提条件。如果在随机实验中不同类别的用户群体数量和性质相似,那么这种user模型可以准确预测向用户发放优惠券的收益。   

  

  *首先,我们选取了部分用户(有足够样本量建模的小流量实验),随机分为实验组和对照组。对照组不发放优惠券,实验组发放优惠券,用户最终是否购买是0-1变量;   

  

  *然后,对整体实验数据用户购买行为进行建模;   

  

  *最后,利用小流量实验训练得到的模型,估计我们需要预测的所有用户的条件平均处理效果,预测发放优惠券带来的增益值;   

  

  假设有n个用户,没有优惠券的用户I的购买结果为Yi(0),有优惠券的用户I的购买结果为Yi(1)。这时,给这个用户发送优惠券的收益就是上传分数。   

  

  (i)=Yi(1)-Yi(0).隆起时   

  

  当得分为正时,意味着干预项目对用户,即上述的Persuadables用户有正向的增益作用。   

  

  02   

  

  几种建模方法   

  

  1、Two-Learner   

  

  二   

  

  学习者是基于两个模型的微分模型。我们分别对实验组(有干预)和对照组(无干预)的购买行为进行建模,然后利用训练得到的两个模型分别预测所有用户的购买行为。此时,一个样本用户可以得到有干预和无干预两种购买行为的预测值。两个预测值之间的差异是期望的提升。   

  

  得分.   

  

  这种建模方法简单易懂,可以通过回归、GBDT等模型直接实现。但是有一些限制:   

  

  *对照组和实验组分别建模,两个模型完全隔离。有可能两种模型各有偏差,导致预测误差较大。其次,建模的目标是响应而不是直接隆起,因此模型对隆起的预测能力有限。   

  

  *策略只能是离散值,不能是连续变量,因为有几个策略需要构建几个模型。因此,当干预条件只有‘是否发放优惠券’时,这种建模方法是可行的,但当涉及到‘多券面额/副本组合策略’或‘作为连续变量策略发放多少面额优惠券’时,可能就不太有用了;   

  

  2、Single-Learner   

  

  两人一组学习   

  

  学习者、对照组的数据和实验组的数量进行比较。   

据放在一起建模,使用一个模型对处理效果进行估计,然后计算该样本用户进入实验组和对照组模型预测的差异作为对实验影响的估计。与Two-

  

Learner不同的是,本模型将实验分组【干预项】作为一个单独特征和其他变量一起放入模型中对用户购买行为进行建模,干预项可以是多种组合策略或者连续变量。

  

训练样本共用可以使此模型学习更加充分,通过单个模型的学习也可以避免双模型打分累积误差较大的问题。此外模型可以支持干预项为多策略及连续变量的建模,实用性较强。但此模型在本质上依然还是对Response建模,对Uplift的预测还是比较间接。

  

3、Class Transformation Method

  

Class Transformation Method模型既可以将实验组与对照组数据打通,同时它又是直接对Uplift

  

score进行预测,计算用户在实验组中购买概率与在对照组中购买概率的差值,其核心思想是将实验组和控制组样本混合并创建新的变量z满足:

  

* 当用户在实验组(发券)且用户最终购买时,z=1

  

* 当用户在对照组(无干预)且用户最终未购买时,z=1

  

* 当用户在实验组(发券)且用户最终未购买时,z=0

  

* 当用户在对照组(无干预)且用户最终购买时,z=0

  

可以证明,P(Z=1│Xi) 和Uplift Score是线性正相关的,且当实验组与控制组样本比例为1:1时,Uplift Score

  

=2P(Z=1│Xi)-1,目标从预测Uplift Score转化为了预测P(Z=1│Xi)

  

03

  

Uplift模型评估

  

根据Uplift

  

Score的定义,分数越高的用户即所谓的营销增益就越大。增益模型由于不能同时观测同用户在不同干预项下的真实增量,通常是通过划分十分位数来观测实验组用户和对照组用户样本来进行间接评估。

  

1、Uplift 十分位柱状图

  

将测试集预测出的用户按照Uplift Score由高到低平均分为10组,分别是top 10%用户,top 20%用户……top

  

100%用户。分别对每个十分位内的用户求实验组和对照组预测分数的均值,然后相减,计算不同分段中真正的实验提升收益。然后根据每个分组得出的实验收益,绘制十分位柱状图。这样,即可较直观观察到有多少的用户大概可以获得多少的营销增益。

  

  

2、qini曲线(qini curve)

  

计算每组用户百分比的qini系数,将这些系数连接起来,得到一条qini曲线。qini系数公式如:

  

  

* 是按照Uplift Score由高到低排序的用户数量占实验组或对照组用户数量的比例, = 0.3即表示实验组或对照组中前30%的用户。

  

* nt,y=1()表示在前百分比多少用户中,实验组中预测结果为购买的用户数量。nc,y=1()表示在同样百分比用户中,对照组预测结果为购买的用户数量。

  

* Nt和Nc则分别代表实验组和对照组总用户样本数。

  

02bbd' />

  

上图橙色线是随机曲线,qini曲线与随机曲线之间的面积作为评价模型的指标,面积越大表示模型结果远超过随机选择的结果。

  

可以看到当横轴为top40%时,qini曲线与随机曲线之间距离最大,对应的纵轴大概是0.037,表示uplift

  

score等于0.037可以覆盖前40%的用户数量,这部分用户也就是我们可以对其进行营销干预的persuadable用户。

  

但如果实验组和对照组用户数量不平衡,则会导致指标失真。另一种累积增益曲线可以避免这个问题。

  

  

最后,我们总结一下Uplift模型可能的应用场景:

  

* 精准定位策略敏感人群:如全文所述,我们希望找出来一些对干预项【例如发券、投放等】比较敏感的用户,继而对其进行精准策略/营销;

  

* 测算收益空间:Uplift模型可以帮助我们测算如果对策略做一些人群向优化,业务收益将会提升多少;

  

作者:赵小洛 快手数据分析师

  
© 版权声明
相关推荐
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender