搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
很楠不爱3
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
深度学习毕设项目 深度学习实现行人重识别 - python opencv yolo Reid_yolo 行人重识别
2
MySQL存储引擎及索引机制
3
【Web开发】Vue+Springboot项目服务器部署(环境搭建+部署流程)_vue+springboot项目如何部署
4
RxJava应用_rxjava使用
5
Node isRunning函数_is_running
6
Qt对excel操作_qaxobject是什么模块的
7
Mac 开启局域网smb文件共享(附全平台连接方法)_mac samba
8
JavaWeb毕设分享100个(四)_基于javaweb的毕业设计选题
9
如何在windows下运行.sh文件_windows .sh
10
Android中实现如win7里边屏幕保护图案中三维文字的效果。_android 立体字
当前位置:
article
> 正文
推荐系统 --- 推荐算法 --- 基于用户行为的推荐算法 - 概述_基于用户行为数据的网站体验评分算法
作者:很楠不爱3 | 2024-03-05 19:17:47
赞
踩
基于用户行为数据的网站体验评分算法
数据反馈信息
显性反馈数据和隐性反馈数据
显性反馈数据
概述
显性反馈行为包括用户明确表示对物品喜好的行为。这里的主要方式就是评分和喜欢/不喜欢。
特点
用户兴趣:明确
数量:较少
存储:数据库
实时读取:实时
正负反馈:都有
案例
视频网站:用户对视频的评分
电子商务网站:用户对商品的评分
门户网站:用户对新闻的评分
音乐网站:用户对音乐/歌手/专辑的评分
隐性反馈数据
概述
隐性反馈行为指的是那些不能明确反应用户喜好 的行为。最具代表性的隐性反馈行为就是页面浏览行为。
特点
用户兴趣:不明确
数量:庞大
存储:分布式文件系统
实时读取:有延迟
正负反馈:只有正反馈
案例
视频网站:用户观看视频的日志、浏览视频页面的日志
电子商务网站:购买日志、浏览日志
门户网站:阅读新闻的日志
音乐网站:听歌的日志
正反馈和负反馈
正反馈指用户的行为倾向于指用户喜欢该物品
负反馈指用户的 行为倾向于指用户不喜欢该物品。
一般来说,不同的数据集包含不同的行为, 目前比较有代表性的数据集有下面几个
无上下文信息的隐性反馈数据集
每一条行为记录仅仅包含用户ID和物品ID。 Book-Crossing 就是这种类型的数据集。
无上下文信息的显性反馈数据集
每一条记录包含用户ID、物品ID和用户对物品的评分。
有上下文信息的隐性反馈数据集
每一条记录包含用户ID、物品ID和用户对物品产生行为的时间戳。Lastfm数据集就是这种类型的数据集。
有上下文信息的显性反馈数据集
每一条记录包含用户ID、物品ID、用户对物品的评分和评分行为发生的时间戳。Netflix Prize 提供的就是这种类型的数据集。
用户行为分析
用户活跃度和物品流行度的分布
用户活跃度和物品流行度的关系
基于邻域的算法
基于用户的协同过滤算法
基于物品的协同过滤算法
隐语义模型(LFM)
概述
隐语义模型是最近几年推荐系统领域最为热门的研究话题,它的核心思想是通过隐含特征 (latent factor)联系用户兴趣和物品。
人工对物品进行分类的难点
编辑的意见不能代表各种用户的意见。
编辑很难控制分类的粒度。
编辑很难给一个物品多个分类。
编辑很难给出多维度的分类。
编辑很难决定一个物品在某一个分类中的权重。
算法概览
pLSA
LDA
隐含类别模型(latent class model)
隐含主题模型(latent topic model)
矩阵分解(matrix factorization)
算法
LFM在显性反馈数据(也就是评分数据)上解决评分预测问题并达到了很好的精度。
在隐性反馈数据集上应用LFM解决TopN推荐的第一个关键问题就是如何给每个用户 生成负样本。
方法
对于一个用户,用他所有没有过行为的物品作为负样本。
对于一个用户,从他没有过行为的物品中均匀采样出一些物品作为负样本。
对于一个用户,从他没有过行为的物品中采样出一些物品作为负样本,但采样时,保证 每个用户的正负样本数目相当。
对于一个用户,从他没有过行为的物品中采样出一些物品作为负样本,但采样时,偏重 采样不热门的物品。
特点
对每个用户,要保证正负样本的平衡(数目相似)。
对每个用户采样负样本时,要选取那些很热门,而用户却没有行为的物品。
基于图的模型
概述
用户行为 数据是由一系列二元组组成的,其中每个二元组(u, i)表示用户u对物品i产生过行为。这种数据集 很容易用一个二分图① 表示。
一般来说图中顶点的相关性主要取决于下面3个因素
两个顶点之间的路径数;
两个顶点之间路径的长度;
两个顶点之间的路径经过的顶点。
分支主题
分支主题
算法
PersonalRank算法
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/很楠不爱3/article/detail/193272
推荐阅读
article
【腾讯云
Cloud
Studio
实战
训练营
】
Cloud
Studio
实现健康上报小
程序
(
代码
开源...
Cloud
Studio
是基于浏览器的集成式开发环境(IDE),为开发者提供了一个永不间断的云端工作站。用户在使用 C...
赞
踩
article
一
个
字
符
串
A
的
子
串
被定义成从A中
顺次
选出若干
个
字
符
构成
的
串
。如A=“
cdaad
"
,
顺次
选1,3,5...
一
个
字
符
串
A
的
子
串
被定义成从A中
顺次
选出若干
个
字
符
构成
的
串
。如A=“
cdaad
"
,
顺次
选1,3,5
个
字
符
就
构成
子
串
"
...
赞
踩
article
Python
爬
虫之
爬
取并
下载
哔哩哔哩
视频
...
它可以
爬
取并
下载
视频
文件和音频文件!亲自使用过,太好用了。
Python
爬
虫之
爬
取并
下载
哔哩哔哩
视频
...
赞
踩
article
Python
办公
自动化
之
Excel
做表
自动化
:全网最全,看这一篇就够了!
_
python
怎么画出exc...
0.
Python
Excel
库对比1.
Python
xlrd 读取 操作
Excel
2.
Python
xlwt 写入 操作...
赞
踩
article
Pytorch
深度学习-----
神经
网络
之
卷积
层用法详解_
pytorch
实现
神经
络中的
卷积
层...
从上述可知,总共有9个参数,具体解释如下:in_channels:表示输入的图片通道数目。out_channels:表示...
赞
踩
article
安装
pytorch
(
CPU
版本
)避坑!!!_
cpu
版本
的
pytorch
...
安装
CPU
版本
的
Pytorch_
cpu
版本
的
pytorch
cpu
版本
的
pytorch
我
安装
的
目...
赞
踩
article
使用
python
爬取
重庆
二手房
的
信息
,得到
的
数据写到
csv
文件...
实验目
的
:用
python
语言解决实际问题。实验要求:独立完成,并上机实践实验内容:分析某房产网站,利用
python
程序爬...
赞
踩
article
Github
上传
的
图片
不能显示的问题
_
githubreadme
图片
看
不了
...
之后在github的readme文件中引用该
图片
就可以了
_
githubreadme
图片
看
不了
githubreadme
图片
...
赞
踩
article
GitHub
加速神器
FastGithub
的
使用...
GitHub
加速神器
FastGithub
的
使用_fastgithubfastgithub &nb...
赞
踩
article
LPIPS
评价指标的计算
_
lpips
代码
...
import torchimport
lpips
# from IPython import embedimport os...
赞
踩
article
6U
VPX
架构
XCKU115
(
FPGA
)+
XCZU9EG
(
MPSOC
)+
TMS320C6678
(D...
6U
VPX
架构
XCKU115
(
FPGA
)+
XCZU9EG
(
MPSOC
)+
TMS320C6678
(DSP)的高速
信号处理
...
赞
踩
article
低功耗
蓝牙
和
传统
蓝牙
的
区别
_
蓝牙
和
低功耗
蓝牙
区别
...
经典
蓝牙
(BT):泛指支持
蓝牙
协议在4.0以下的模块,一般用于数据量比较大的传输,如:语音、音乐等较高数据量的传输。高速...
赞
踩
article
Tool
-微软
Edge
浏览器
打开
github
慢的
问题
解决_
edge
github
插件
...
Edge
打不开
github
或者加载很慢,如果不是个人网络有
问题
,可以尝试在
Edge
浏览器
的Extensions里搜索“g...
赞
踩
article
date
命令详解使用(六)_failed
to
set
time
: au
to
matic
time
s...
在类UNIX系统中,日期被存储为一个整数,其大小为自世界标准时间(UTC)1970年1月1日0时0分0秒起流逝的秒数。_...
赞
踩
article
不为人知
的
程序员
真实世界
_
程序员
的
工作世界...
先来看看
程序员
们
的
自嘲:一杯茶一包烟一个bug改一天。首先你要知道,
程序员
和其他普通
的
工作岗位一样,每天面对脑力和体力
的
...
赞
踩
article
nginx
upstream
的五种分配方式_
nginx
weight
=
1
backup
...
Nginx负载均衡选项
upstream
用法举例
1
、轮询(
weight
=
1
)默认选项,当
weight
不指定时,各服务器we...
赞
踩
article
为什么说最
厉害
的
程序员
是
c
语言
程序员
,他们到底
厉害
到哪里?_
c
语言
精通后
厉害
吗...
其实哪有最优秀
的
程序员
,C
语言
程序员
被很多人觉得优秀
是
因为,他们大都
是
做底层开发
的
,对操作系统、编译原理等非常熟悉,所以...
赞
踩
article
Github
加速器
fast
Github
,
解决
Github
进不去的问题_
githubfast
...
fastGitHub是一个可以帮助解决无法连接到GitHub的问题的工具。它支持Windows
,
Linux和Mac操作系...
赞
踩
article
拉取
gitlab
代码
_
gitlab
怎么
看别人分享
的
源码...
今天算是第一次使用
gitlab
,之前也这么使用过GitHub,但是时间太久了忘记
怎么
配置了,所以在此做个笔记。今天算是第...
赞
踩
article
《中国
区块
链
发展
报告(2023)》发布 和
数
集团
推动
区块
链
发展
...
随着时代的
发展
,现在的年轻人越来越喜爱潮流的玩法与创意,而和
数
集团
凭借着多样化、场景化、
区块
链
技术等优势,让更多的传统企...
赞
踩
相关标签
腾讯云
小程序
开源
python
爬虫
音视频
办公自动化
Excel
xlwings
openpyxl
深度学习
pytorch
神经网络
知识图谱
机器学习
开发语言
FastGitHub
gpu
cuda
实时信号处理产品
KU115
XCZU9EG
TMS320C6678
6U VPX架构