赞
踩
顾名思义,“协同过滤”就是协同⼤家的反馈、评价和意见⼀起对 海量的信息进⾏过滤,从海量信息中筛选出⽬标⽤户可能感兴趣的信息的推荐过程。
图2-2描述了⼀个电商⽹站场景下的协同过滤推荐过程,其推荐过 程按照图2-2(a)~(f)的顺序共分为6步。
以上描述了协同过滤的算法流程。
在协同过滤的过程中,⽤户相似度的计算是算法中最关键的⼀ 步。共现矩阵中的⾏向量代表相应⽤户的⽤ 户向量。那么,计算⽤户i和⽤户j的相似度问题,就是计算⽤户向量i和 ⽤户向量j之间的相似度,两个向量之间常⽤的相似度计算⽅法有如下 ⼏种。
余弦相似度衡量了⽤户向量i和⽤户向量j之间的向量夹⾓⼤⼩。显然,夹⾓越⼩,证明余弦相似度越⼤,两个⽤户越相似。
相⽐余弦相似度,⽪尔逊相关系数通过使⽤⽤户平均分对各独⽴评分进⾏修正,减⼩了⽤ 户评分偏置的影响。其中,Ri,p代表⽤户i对物品p的评分。 Ri代表⽤户i对所有物品的平均评分,P代表所有物品的集合。
基于⽪尔逊系数的思路,还可以通过引⼊物品平均分的⽅ 式,减少物品评分偏置对结果的影响
其中, Rp代表物品p得到所有评分的平均分。
假设“⽬标⽤户与其相似⽤户的喜好是相似的”,可根据相 似⽤户的已有评价对⽬标⽤户的偏好进⾏预测。在获得Top N相似⽤户之后,利⽤⽤户相似度和相似⽤户的评价的加权平均获得⽬标⽤户的评价预测:
其中,权重wu,s是⽤户u和⽤户s的相似度,Rs,p是⽤户s对物品p 的评分。
在获得⽤户u对不同物品的评价预测后,最终的推荐列表根据预测 得分进⾏排序即可得到。⾄此,完成协同过滤的全部推荐过程。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。