当前位置:   article > 正文

推荐算法之协同过滤算法详解(原理,流程,步骤,适用场景)_协同过滤推荐算法详解

协同过滤推荐算法详解

1.推荐算法之协同过滤算法

1.0推荐系统流程

推荐系统的流程是什么?

在这里插入图片描述

流程就是: 要给A进行推荐,那么找到与A最相似的前K个用户 ,然后取他们前TOPN个物品进行召回去重,然后进行排序,把结果存储到一个数据库里。及时推荐给A

  • 现实场景中用户和用户观看的电影往往不会一一对应上,在计算相似度时,均值计算时可选用的是:
    • 1>用户评分所有值求平均值
    • 2>用户与用户交集的均值
      我们通常选用1 ----原因
    • 1>如果我们选用2。每一个交集都得计算一次均值,为了减少计算量
    • 2>选用1时与效果2不会有太大的误差。

1.1协同过滤推荐方法CF理论基础

在这里插入图片描述
基于记忆的协同过滤主要分为:
  相似统计方法得到具有相似兴趣爱好的用户
基于模型的协同过滤主要分为:
  先用历史数据得到一个模型,在用此模型进行预测。基于模型的推荐广泛应用使用的技术包括神经网络技术、潜在语义LFM分析、贝叶斯网络聚类算法模型、分类算法模型、回归算法模型、矩阵分解模型、神经网络模型图模型、隐语义模型
  在这里插入图片描述

1.1关系矩阵相似度推荐

在推荐系统中,“关系”是用关系矩阵的形式来创建和存储下来的。以视频推荐为例,可以归纳为用户关系矩阵U-U矩阵、视频(物品)关系V-V矩阵和用户-视频(物品)关系U-V矩阵。
  基于记忆的协同过滤主要是依赖于对U-U矩阵和V-V矩阵处理分析,通过相似度计算得到用户相似度和视频或物品相似度,并在此基础上形成推荐结果。

1.1.1U-U矩阵相似度推荐-Pearson

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

1.算法原理

在这里插入图片描述

2.算法流程

在这里插入图片描述

  • 1>访问用户最近的行为数据
  • 2>提取用户视频二维矩阵
  • 3>通过相似度计算,获得与用户U具有相似爱好的相似用户集合N
  • 4>计算用户u对视频的偏好。
  • 5>很据喜好进行排序
  • 6>输出TOP-N视频列表。

归纳提取总结以上流程

3.算法步骤

在这里插入图片描述

4.Pearson系数存在的问题

Pearson相关系数计算用户相似度很突出,但是仍然存在以下问题:

  • 不能应对不同用户可能对某一件广受欢迎的项目都给予高评分的情况
  • 在遇到用户只对非常少的共同项目评分时出现预测不准的情况。
    相关文献提出了改进的方案。
    提高了对有争议的共同评价的相对重要性,降低了广受欢迎项目有共同评价的相对重要性

1.1.2V-V矩阵相似度推荐-cos

在这里插入图片描述

1.算法原理

在这里插入图片描述

在这里插入图片描述

2.算法流程

在这里插入图片描述

3.算法步骤

在这里插入图片描述

1.1.3U-V矩阵的相似度推荐

在这里插入图片描述


1.2基于用户的CF

基于U-V矩阵构建基于用户和基于物品的协同过滤算法:
在这里插入图片描述
基于记忆的协同过滤算法:
基于记忆的协同过滤算法(Memory-based CF)直接使用整个已知的(所谓“记忆”)评分矩阵去预测用户对未知项目的评分或者推荐,又可以分为基于用户的协同过滤算法基于物品的协同过滤算法
在这里插入图片描述

  • KNN求相似用户或相似项目,根据相似用户或项目来辅助预测用户对项目的评分,指标一般是RMSE MAE
  • TOPN,可以理解为,在预测用户对未选择项目的评分,然后排序, 取前TOPN个项目(用户没有选择过的)推荐给用户,看命中率,指标一般是RECALL PRECISION AUC
  • TopN和kNN目的不同,TopN在kNN基础之上进行推荐,KNN只预测评分没做推荐
    在这里插入图片描述
1.算法原理

在这里插入图片描述

2.算法流程

在这里插入图片描述

  • 1>访问用户最近的行为数据
  • 2>提取用户视频二维矩阵
  • 3>通过相似度计算,获得与用户U具有相似爱好的相似用户集合N
  • 4>计算用户u对视频的偏好。
  • 5>很据喜好进行排序
  • 6>输出TOP-N视频列表。
基于用户的CF对物品的评分流程图

在这里插入图片描述

3.算法步骤

注意:UU矩阵的输出就是UserCF的输入矩阵
在这里插入图片描述

4.算法举例

在这里插入图片描述
课堂笔记:
在这里插入图片描述

5.算法适用场景

当用户数据量比物品数量大很多时候,采用基于物品的CF。原因如下:
在这里插入图片描述


1.3基于物品的CF

在这里插入图片描述

1.算法原理

在这里插入图片描述

2.算法原理

在这里插入图片描述
在这里插入图片描述
对上述公式修正:
在这里插入图片描述

3.算法流程

在这里插入图片描述

4.算法步骤

在这里插入图片描述

5.算法举例

在这里插入图片描述
课堂笔记:
在这里插入图片描述

6.适用场景

适用于物品数量变化小于用户数量变化的场景。

在这里插入图片描述


2.UserCF和ItemCF区别和联系

在这里插入图片描述
在这里插入图片描述

1.协同过滤优点:
  • 实现快
  • 对商品和物品没有要求
  • 效果有保障
2.协同过滤缺点:
  • 冷启动
  • 马太效应
  • 推荐解析模糊
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/454504
推荐阅读
相关标签
  

闽ICP备14008679号