赞
踩
最近在研究异质信息网络,发现知识图谱无论是在建模方式还是下游任务都与异质信息网络有很大的相似性。
文中截图来源于自己做的组会分享ppt,非常简陋…
部分比较精美的图片来源于知乎文章的插图和 https://www.zhihu.com/people/Jhy1993 一片分享ppt
现实生活中形形色色的系统,通常由大量类型各异、彼此交互的组件构成,例如生物、社交和计算机系统等。利用异质网络建模这种类型丰富且交互复杂的数据,可以保留更全面的语义及结构信息。
相较于同质网络,异质网络建模带来了两方面的好处:
基于以上分析,在设计具有异质图注意机制的图神经网络体系结构时,需要满足以下新需求。
知识图谱定义
知识图谱,本质上,是一种揭示实体之间关系的语义网络。–不同的实体可以抽象成不同类型的信息
“客观规律的归纳和总结” 似乎有些难以实现。Quora 上有另一种经典的解读,区分 “信息” 和 “知识” 。
知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Object)。
在知识图谱中,我们用RDF形式化地表示这种三元关系。RDF(Resource Description Framework),即资源描述框架,是W3C制定的,用于描述实体/资源的标准数据模型。RDF图中一共有三种类型,International Resource Identifiers(IRIs),blank nodes 和 literals。下面是SPO每个部分的类型约束:
我们其实可以认为知识图谱就包含两种节点类型,资源和字面量。借用数据结构中树的概念,字面量类似叶子节点,出度为0。例如“罗纳尔多·路易斯·纳萨里奥·德·利马”作为字面量,是不能有指向外部节点的边。
异质图神经网络跟知识图谱都是以图的形式进行表示,都是为了得到节点的分布式表示。但是他们的原理方法上有点不一样:
对于异质图神经网络而言,其节点表示学习也就是图嵌入从宏观上来讲大致分为两个步骤:
对于异质图网络而言,不同节点的连接关系更像是一种标注的邻居间信息聚合的标签,对于标签本身的含义关系没有进行深入挖掘(这里有一类研究方向是元路径的选择也就是不同类型节点的链接—随机游走获取邻居、针对于下游任务学习元路径),来声明利用神经网络进行信息聚合时的不同策略。这里的策略在异质图神经网络中可以表现为GAT注意力机制或者Transformer的注意力机制(个人认为其实从根本上看是一样的,都是为了区分不同连接类型采取不同的处理方式)。至于第二步语义级别的嵌入在我所看的论文中全部采取注意力机制,理由同上
而知识图谱是受到word2vec能自动发现implicit relation的启发(king-man=quene-women),重点在学习图数据时强调的是节点跟关系的表示,知识图谱在应用更关注于关系建模。但是两中方法也可以互相借鉴的。 例如 WWW 2020 MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding 在基于元路径的邻居信息聚合方式上将知识图谱嵌入中的 RotatE 方法泛化到异质信息网络中,由于异质信息网络和知识图谱的相似性,两者互相借鉴的创新方法还有待进一步研究
后续会整理一下知识图谱嵌入相关的方法
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。