赞
踩
在最近新闻推荐的比赛中, 接触到了一个排序模型LGBMRanker, 该模型与普通的分类模型LGBMClassifier不太一样, 普通的分类模型在进行推荐的时候, 往往是先预测某个商品或者文章用户会不会点击, 也就是它的目标是预测用户点击某篇文章或者某个商品的概率, 然后根据这个概率值进行排序, 排完之后,把最靠前的几个返回回来给用户进行推荐。 而LGBRanker模型, 它不关心用户点击某篇文章的概率, 而是根据用户点击或者不点击的这个行为, 直接去预测最后商品或者文章的一个相对顺序, 返回一个排好序的列表回来。 然后我们把最靠前的几个返回给用户进行推荐。 这样就会发现, 分类模型和排序模型最终的目标是不一样的, 这样也就导致了他们的训练数据集和损失函数等也会有所不同。 但仍然是监督学习的问题, 数据依然也是Feature+Label的形式, 只不过利用的时候发生了一些区别。 关于普通的分类模型LGBMClassifier, 这里不做过多的描述。
这里主要是介绍一下LGBMRanker的原理和使用。 但是介绍这个之前呢? 我们需要先了解一下LambdaRank的原理。 关于这个, 我大部分的内容都是参考的下面链接里面的第一篇文章, 因为感觉人家讲的很清晰了, 通过LambdaRank的介绍, 估计就知道LGBMRanker在干一个什么样的事情了,然后再介绍一下LGBMRanker的使用。 下面开始。
在互联网应用场景中,排序是非常核心的模块。一个最直接的应用,就是日常生活常用到的搜索引擎。用户通过搜索框提交query, 搜索引擎就会返回以一些与query相关的文档,并根据相关大小排序后展示给用户。 这一应用场景中, 最相关的一些文
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。