搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
很楠不爱3
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
深入理解Android布局:ConstraintLayout和RecyclerView的使用_constraintlayout recyclerview
2
es 字段截取聚合分组_es 聚合 script 字符串长度
3
【SpringBoot】 SpringBoot核心
4
Ubuntu下查看Nvidia显卡驱动_ubuntu 无需重启查看nvidia驱动
5
threejs之显示Label-CSS2DRenderer
6
uniapp微信小程序分包
7
Vite 基本配置及原理_vite sourcemap
8
Linux设备使用阿里云盘终极方案_阿里云盘 linux
9
【Linux】shell命令以及运行原理和Linux权限的理解_linux内核 访问方式 shell
10
微信小程序数据mock以及接口封装_mockjs 微信小程序
当前位置:
article
> 正文
推荐系统 --- 推荐算法 --- 基于用户行为的推荐算法 - 概述_基于用户行为数据的网站体验评分算法
作者:很楠不爱3 | 2024-03-05 19:17:47
赞
踩
基于用户行为数据的网站体验评分算法
数据反馈信息
显性反馈数据和隐性反馈数据
显性反馈数据
概述
显性反馈行为包括用户明确表示对物品喜好的行为。这里的主要方式就是评分和喜欢/不喜欢。
特点
用户兴趣:明确
数量:较少
存储:数据库
实时读取:实时
正负反馈:都有
案例
视频网站:用户对视频的评分
电子商务网站:用户对商品的评分
门户网站:用户对新闻的评分
音乐网站:用户对音乐/歌手/专辑的评分
隐性反馈数据
概述
隐性反馈行为指的是那些不能明确反应用户喜好 的行为。最具代表性的隐性反馈行为就是页面浏览行为。
特点
用户兴趣:不明确
数量:庞大
存储:分布式文件系统
实时读取:有延迟
正负反馈:只有正反馈
案例
视频网站:用户观看视频的日志、浏览视频页面的日志
电子商务网站:购买日志、浏览日志
门户网站:阅读新闻的日志
音乐网站:听歌的日志
正反馈和负反馈
正反馈指用户的行为倾向于指用户喜欢该物品
负反馈指用户的 行为倾向于指用户不喜欢该物品。
一般来说,不同的数据集包含不同的行为, 目前比较有代表性的数据集有下面几个
无上下文信息的隐性反馈数据集
每一条行为记录仅仅包含用户ID和物品ID。 Book-Crossing 就是这种类型的数据集。
无上下文信息的显性反馈数据集
每一条记录包含用户ID、物品ID和用户对物品的评分。
有上下文信息的隐性反馈数据集
每一条记录包含用户ID、物品ID和用户对物品产生行为的时间戳。Lastfm数据集就是这种类型的数据集。
有上下文信息的显性反馈数据集
每一条记录包含用户ID、物品ID、用户对物品的评分和评分行为发生的时间戳。Netflix Prize 提供的就是这种类型的数据集。
用户行为分析
用户活跃度和物品流行度的分布
用户活跃度和物品流行度的关系
基于邻域的算法
基于用户的协同过滤算法
基于物品的协同过滤算法
隐语义模型(LFM)
概述
隐语义模型是最近几年推荐系统领域最为热门的研究话题,它的核心思想是通过隐含特征 (latent factor)联系用户兴趣和物品。
人工对物品进行分类的难点
编辑的意见不能代表各种用户的意见。
编辑很难控制分类的粒度。
编辑很难给一个物品多个分类。
编辑很难给出多维度的分类。
编辑很难决定一个物品在某一个分类中的权重。
算法概览
pLSA
LDA
隐含类别模型(latent class model)
隐含主题模型(latent topic model)
矩阵分解(matrix factorization)
算法
LFM在显性反馈数据(也就是评分数据)上解决评分预测问题并达到了很好的精度。
在隐性反馈数据集上应用LFM解决TopN推荐的第一个关键问题就是如何给每个用户 生成负样本。
方法
对于一个用户,用他所有没有过行为的物品作为负样本。
对于一个用户,从他没有过行为的物品中均匀采样出一些物品作为负样本。
对于一个用户,从他没有过行为的物品中采样出一些物品作为负样本,但采样时,保证 每个用户的正负样本数目相当。
对于一个用户,从他没有过行为的物品中采样出一些物品作为负样本,但采样时,偏重 采样不热门的物品。
特点
对每个用户,要保证正负样本的平衡(数目相似)。
对每个用户采样负样本时,要选取那些很热门,而用户却没有行为的物品。
基于图的模型
概述
用户行为 数据是由一系列二元组组成的,其中每个二元组(u, i)表示用户u对物品i产生过行为。这种数据集 很容易用一个二分图① 表示。
一般来说图中顶点的相关性主要取决于下面3个因素
两个顶点之间的路径数;
两个顶点之间路径的长度;
两个顶点之间的路径经过的顶点。
分支主题
分支主题
算法
PersonalRank算法
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/很楠不爱3/article/detail/193272
推荐阅读
article
mysql
索引
类型
有哪些?
_
mysql
四种
索引
类型
...
在Mysql数据库当中,我们经常会谈到Sql语句,当然也会谈到
索引
优化,那么在数据库当中有哪些
索引
类型
呢,博主在这里进行...
赞
踩
article
概率
基础——
多元
正态分布
_
概率
分布...
本文介绍了
多元
正态分布
及Python实现,叙述了每个随机变量都服从
正态分布
,且不同随机变量之间可能存在相关性的
多元
正态分...
赞
踩
article
【
PyTorch
】使用
PyTorch
创建卷积
神经网络
并在
CIFAR
-
10
数据集上进行
分类
...
在深度学习的世界中,图像
分类
任务是一个经典的问题,它涉及到识别给定图像中的对象类别。
CIFAR
-
10
数据集是一个常用的基...
赞
踩
article
nrf52832
之
gpio
配置
方法_
nrf52832
配置
gpio
...
gpio
操作是单片机最基本的操作,也是最常用的、例如
配置
gpio
控制led灯,检测按键输入等功能。当然手册里面有详细的g...
赞
踩
article
Typora
+
PicGo
+
Gitee
上传
图片
实现过程与排坑_
tyopra
中插入的
图片
发给别人还有吗...
Typora
+
PicGo
+
Gitee
上传
图片
实现过程与排坑前言最近在用
Typora
写笔记什么的时候,发现写好的文档发给别...
赞
踩
article
如何根据
样本
估计
总体
的
均值
、比例与
方差
?如何进行
参数
估计
及选择对应公式?_
均值
和
方差
的
估计
值
...
7.1
参数
估计
的基本原理7.1.1
估计
量与
估计
值
_名词解释
均值
和
方差
的
估计
值
...
赞
踩
article
程序员
诗
2
首:悲催
诗
(
史)与爱情
诗
...
我不是
诗
人,所以,只能够把爱你写进程序,当作不可解的密码,作为我一个人知道的秘密。_
程序员
诗
程序员
诗
...
赞
踩
article
linux
mysql
服务
停止
不了_
Linux
服务
器
mysql
数据库自动
停止
的解决方法...
最近网站更换
服务
器,由原来的虚拟主机换成centos
服务
器,配置好后运行了半个月,各种折腾,也是一边学习一边捣鼓各种功能...
赞
踩
article
#
解决办法
:
Github
访问
异常
(
无法
访问
或
访问
速度缓慢)_
github
无法
访问
...
Github
访问
异常
的问题解决及优化_
github
无法
访问
github
无法
访问
一...
赞
踩
article
gitlab
_
数据备份
之容器和
源码
_
gitlab
-
data
中
查看
源码
...
1,用容器启动备份# docker run -d --hostname
gitlab
.example.com\ -p 4...
赞
踩
article
Python
办公
自动化
之
Excel
做表
自动化
:全网最全,看这一篇就够了!
_
python
怎么画出exc...
0.
Python
Excel
库对比1.
Python
xlrd 读取 操作
Excel
2.
Python
xlwt 写入 操作...
赞
踩
article
mysql
增加
缓存
的命令,
MySQL
查询
缓存
...
一、
查询
缓存
说明
MySQL
Query Cache是用来
缓存
我们所执行的SELECT语句以及该语句的结果集,MySql在...
赞
踩
article
Proxmox
VE
安装
和在
P
VE
上
安装
群晖DSM7.01_
pve
安装
nas
...
工作的电脑硬盘都满了,很多大型软件舍不得删除,也没合适的服务器存放,就找了一台空闲机器当服务器使用了,为了后面方面扩展,...
赞
踩
article
MySQL
为什么第二次
查询
会快一些?
缓存
?不一定_
mysql
第一次
查询
慢第二次快...
最近在公司组织了一次SQL优化大赛,出现了一个问题引起了一位同事的不爽,为什么我优化出来SQL跟他的一样,为什么时间会相...
赞
踩
article
淘宝
爬虫
:看看房地产
拍卖
行情怎么样?附
可视化
分析
_淘宝
采集
司法
拍卖
...
本文对杭州市法拍房数据进行了从数据
采集
到
分析
结果呈现的介绍,讲解了
爬虫
的知识点:
分析
网页结构、动态加载的数据、jsonp...
赞
踩
article
git
上
有哪些
html
源码,
使用
git
lab管理网站
源代码
...
1、新建项目:新建项目钱,先创建项目所在的组(也就是说这个项目文件是保存在那个组里)新建组:打开项目地址:http://...
赞
踩
article
Python3.7
版本
安装
TensorFlow
CPU
版本
_
python3.7
对应
的
tensor...
Python3.7
版本
安装
TensorFlow
1. 创建 python 其他
版本
环境1.1 Linux 打开终端,W...
赞
踩
article
mysql
四种常用
的
索引
_四种常见
的
索引
类型
...
主键
索引
:数据记录里面不能有 null,数据内容不能重复,在一张表里面不能有多个主键
索引
。普通
索引
:使用字段关键字建立
的
...
赞
踩
article
用
tsm
动作识别
训练
自己的数据集_
annotations
/
train
.
list
...
使用TSM(Temporal Shift Module)方法进行动作识别
训练
自己的数据集。需要准备数据,生成class....
赞
踩
article
Proxmox
VE
安装
使用心得记录...
Proxmox
VE
是电脑系统虚拟化平台,基于Debian Linux开源系统,有完整的虚拟化功能,既支持KMV虚拟机,...
赞
踩
相关标签
数据库
概率论
python
pytorch
cnn
分类
经验分享
悲催诗史
爱情诗
程序员诗
linux mysql 服务停止不了
服务器
运维
github
办公自动化
Excel
xlwings
openpyxl
mysql增加缓存的命令
pve
nas
MySQL
query cache
buffer pool