赞
踩
采用pairwise的方式,以{booked listing, not-booked listing}作为训练 样本,计算正负样本的分数差,然后和都是1的向量计算cross entropy损失。
对pairwise loss加权:权重为交换pair中两个listing的位置,NDCG的差值。这样加权的好处是,将listing从位置2提升到1,比将位置从10提升到9,权重更大。在实际的搜索系统中,top-3的结果非常重要,所以这样做对提升线上效果很有意义。
NN中dense特征要做归一化:因为NN对数值特征很敏感,过大过小会严重影响学习。
特征分布要平滑:对于特殊的特征,例如地理位置经纬度等,做特殊处理,使其分布尽可能平滑。作者可视化分析了NN中,output、 hidden layer的分布,解释NN有效的原因是:神经网络的有效性,是因为有强大的组合能力,虽然特征组合空间非常大,但是每一层都服从一个平滑的分布后,NN就能很好地预测。
Real-time Personalization using Embeddings for Search Ranking at Airbnb,KDD 2018
Applying Deep Learning To Airbnb Search,KDD 19
Improving Deep Learning For Airbnb Search,KDD 20
Managing Diversity in Airbnb Search,KDD 20
Practical lessons from predicting clicks on ads at facebook. ADKDD 2017.
Deep Multifaceted Transformers for Multi-objective Ranking in Large-Scale E-commerce Recommender Systems, CIKM 2020.
关于深度学习排序艺术
深度学习排序艺术,聚焦人工智能、深度学习在互联网搜索、推荐、广告中的应用,这里有最前沿的学术论文、最新的互联网公司技术分享,欢迎对互联网、搜索、推荐、广告、排序算法、深度学习、AI感兴趣的朋友们,关注微信公众号/知乎专栏:深度学习排序艺术。 微信公众号:Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。