当前位置:   article > 正文

京东搜索商品隐式建模的理解_京东 商品标签数据模型

京东 商品标签数据模型

1 搜索广告CTR预估模型
在线广告,比如搜索广告都是搜索引擎,电商平台或者社交媒体平台重要的商业模式之一。在这里插入图片描述
上图就是一个典型的搜索广告模式,用户在产生一个query之后,会经过粗排,精排,重排阶段。每个阶段关注的侧重点也不相同,同时数据量级也是从上亿级别到最后的个十级别给用户展示。
2 CTR预估模型的发展

  • 目前整个行业来说,CTR模型的发展分两个方面,一个是在做特征优化,一个是在做模型结构优化;特征优化包括静态特征到动态特征,多模态特征,全域特征的引入;模型结构方面包括单模型到多模型的发展,不同领域模型的发展等。

3 上下文特征的应用

  • 说起上下文特征,第一个想起来的就是用户的点击行为序列,这个特征在推荐中发挥着非常重要的作用,可以获取用户的动态兴趣分布;
  • 在下面这篇论文中作者提出了一种新的上下文特征,作者因为点击行为序列可能会出现一些问题,比如冷启动问题,新用户点击行为序列不友好;行为序列过程的问题,会出现序列噪声的问题。
  • 基于此作者提出一种商品隐式的上下文特征,去解决上面提出的问题,论文链接如下:

论文链接

4 商品隐式建模
在这里插入图片描述
4.1 模型结构
模型结构分为三个部分,分别是:

  • select模块: 对候选的item做曝光概率建模
  • CIE模块: 将用户感知的所有Item做建模构成上下文特征
  • Backbone模块: 作为CTR预估模型的特征

4.2 select模块
在这里插入图片描述
该模块是根据用户粗排之后的所有Item去做建模,通过MLP的网络模型,最终得分每个Item的曝光概率;粗排的结果可能有上百个,那会对每个Item有最终的一个曝光权重;
4.3 CIE模块
在这里插入图片描述
该模块是本论文的最核心的模块,根据每个候选的Item,根据用户的感知去建模用户的上下文向量,这个模块的模型结构是典型的transformer结构。

  • transformer的encoder: 每个候选Item会有一个embedding,同时每个embedding会根据上一个select模块预估的曝光权重做一个相乘,作为本阶段的输入;
  • transformer的decoder: 本阶段是targer-attention模式,每个候选Item会根据target的结果动态调整每个候选Item的权重,最终得到一个用户的上下文Embedding。

4.4 Backbone模块
在这里插入图片描述
这个阶段是CTR的预估模型阶段,它可以加上一阶段建模好的上下文向量,也可以加入用户特征,query特征,商品特征等信息作为CTR预估模型的特征做建模,最终给用户做结果推荐。

4.5 损失函数
损失函数分两个部分: 点击率损失, select模块曝光概率损失
在这里插入图片描述
4.6 效果
在这里插入图片描述
论文的效果展示如上图,第一列是用户的query,第二列是用户点击的商品,第三列是CIE模块对粗排商品按照权重的排序结果,从左到右权重由高到低,我们可以看出前三个权重最高的商品不管从品牌,价格还是规格上都跟用户点击过的商品比较相似,而后三个明显效果就不好了。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/183524?site
推荐阅读
相关标签
  

闽ICP备14008679号