赞
踩
作者:刘佳玮,北京邮电大学博士生
知乎专栏:https://zhuanlan.zhihu.com/p/137223381
近几年有很多工作将图模型应用于推荐系统,并为推荐系统带来了更好的实体表示和更强的解释能力。本文将介绍2020年放在arXiv上的两篇图推荐综述,不会涉及太多细节,旨在为大家展示将图与推荐系统结合的基本范式和常规思路。
第一篇是《A Survey on Knowledge Graph-Based Recommender Systems》,介绍了如何将知识图谱作为辅助信息,提升推荐效果。
arXiv链接:https://arxiv.org/abs/2003.00911
推荐系统有两大基本范式:基于协同过滤(交互)的推荐和基于内容(特征)的推荐,而混合推荐旨在结合二者,并引入了多种辅助信息(用户社交网络、商品评论、知识图谱等)。
知识图谱作为辅助信息有两大优势:一是关系丰富,可以整合user、item、feature等多级异构关系于一体,尤其对于交互数据稀疏的场景,为提升推荐准确性带来了很多可能;二是关系明确,由于知识图谱里的关系已经显式构建好了,通过关系序列可以为推荐结果提供可解释性。
本文调研了知识图谱(KG)+推荐(RS)的工作,并探讨了下列三个方面:
注:为了方便起见,结合知识图谱的推荐系统简称为KGRS。
知识图谱(事实图谱)是表示大规模信息的实用方法,遵循资源描述框架(RDF)标准,用节点代表实体,用边代表实体间的关系,由边形成的三元组(即,头部实体-关系-尾部实体)代表一条事实,实体的K-1阶邻居为头实体的三元组称为该实体的波纹集(ripple set)。由于节点和边类型多样,知识图谱是异质图,并可以用元路径/元图抽象出由多跳邻居构成的事实序列/子图的一般范式。知识图谱中的节点和边常在低维向量空间得到嵌入表示(KGE),以便运算和存储。根据覆盖的知识范围不同,知识图谱可以分成跨领域的(如YAGO、Satori等)和特定领域的(如Bio2RDF等),列表如下:
推荐系统旨在为user匹配一个(或一系列)未观测的item,基本步骤如下:
KGRS的方法分成三类:
基于embedding的方法:基本思想是借助KGE算法,直接利用KG的信息丰富item/user的表示。KGE算法主要包括翻译距离模型(如,TransE、TransH、TransR、TransD)和语义匹配模型(如,DistMult)等。
根据KG中是否包含user,基于embedding的方法可以分为两类:
最近的一些工作(如KTGAN、BEM)将KGE算法与GAN、贝叶斯框架结合,旨在提升user和item的表示效果;或使用多任务学习策略来联合训练推荐模块以及与知识图相关的任务,以提高推荐质量,如KTUP、MKR、RCF等。然而,基于embedding的方法忽略了图中的信息连通模式,通常无法为推荐结果提供解释。
基于path的方法:基本思想是考虑到user和/或item的连通相似性(语义相似性/结构对等性),进而提升推荐效果。连通相似性的定义依赖metapath/metagraph等结构(规则,或称为广义的path)。根据对path的不同利用方式,基于path的方法可以分为两类:
基于path的方法有天生的可解释性,但早期的方法没有结合embedding的思想,对user/item的表示较为简单,准确性仍有提升空间。
联合方法:基本思想是利用嵌入传播(常使用GNN)完善user/item在KG中有多跳邻居的表示,传播过程可以看作是在KG中发现user的偏好模式,这类似于在基于path的方法中发现连接模式。
根据KG中是否包含user,联合方法可以分成两类:
联合方法结合了基于embedding和基于path的方法,兼具准确性和可解释性,逐渐成为KGRS的主流方法。
如下图所示,推荐场景可以大致分为七类。对数据集来说,结合知识图谱的方法可以分为两类:一类是构建item图,并引入Satori等外部知识库丰富item的属性;另一类是直接利用数据集里的交互历史和item属性,构建user-item图。
动态推荐。在商品/新闻/社交平台等推荐中都有需要,主要包括两个方面:item的动态更新,user兴趣的动态建模。多任务学习。将知识图谱中的任务与推荐任务结合,如关系补全(链接预测)、实体分类(节点分类)等,旨在对知识图谱的信息进一步挖掘。跨域推荐。不同领域的交互数据可以互为补充,或利用信息丰富的源域数据辅助对信息缺乏的目标域的推荐。知识增强的语言表示。将外部知识库与富文本推荐任务(如,新闻推荐)进一步融合,提升item的表示效果。知识图嵌入方法。为不同推荐场景找到合适的特定KGE方法。考虑用户侧信息。现有工作大多基于user-item交互图或item图,加强user端建模(如,用户属性和社交网络等)可能提升推荐效果。
第二篇是《Graph Learning Approaches to Recommender Systems: A Review》,与第一篇中关注如何将知识图作为辅助信息提升推荐效果不同,这篇文章关注如何将推荐系统应用于各种图,简要介绍了不同类型的图学习算法。
arXiv链接:https://arxiv.org/abs/2004.11718
推荐系统中的涉及到的对象(user、item、feature等)大多数显式或隐式连接,构成天然的图并互相影响。基于图的推荐系统(GLRS)考虑到对象间的复杂关系,不仅可以丰富对象表示,还可以借助图推理提升推荐系统的可解释性。
如何考虑不同的图结构的信息,为推荐系统带来了不同的挑战:
不同的图学习方法,可以解决上面的挑战:
本文提出了三个研究方向:对动态图做推荐。基于因果推理的图学习。大规模实时推荐。小结:图推荐既需要关注如何挖掘和扩展数据中的图模式(从核心的user-item图,到外部的知识库等),又需要关注图学习和推理算法的设计(效率、准确度、可解释性等)。两篇综述的出发点不同,都具有一定的启发意义。希望大家有所收获~
推荐阅读
AINLP年度阅读收藏清单
中文命名实体识别工具(NER)哪家强?
学自然语言处理,其实更应该学好英语
斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用
太赞了!Springer面向公众开放电子书籍,附65本数学、编程、机器学习、深度学习、数据挖掘、数据科学等书籍链接及打包下载
数学之美中盛赞的 Michael Collins 教授,他的NLP课程要不要收藏?
自动作诗机&藏头诗生成器:五言、七言、绝句、律诗全了
模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法
这门斯坦福大学自然语言处理经典入门课,我放到B站了
征稿启示 | 稿费+GPU算力+星球嘉宾一个都不少
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。