赞
踩
本讲介绍了图数据挖掘的常见任务、典型方法、应用场景、编程工具。图是描述大自然各种关联现象的通用语言,图无处不在。不同于传统数据分析中样本独立同分布假设,图数据自带了关联结构,需要使用专门的图神经网络进行深度学习。 本讲介绍了斯坦福CS224W公开课的课程大纲;在节点、连接、子图、全图各个层面进行图数据挖掘的典型任务,以及在蛋白质结构预测、生物医药、内容推荐、文献挖掘、社交网络、开源项目评价等领域的应用。
图结构和网络结构是非常常见的数据结构,常见的事件图、计算机网络、事务网、社交网络和人际关系等都是图状结构。
图就是用来描述每一个样本之间相互之间有关联的,在此之前描述样本之间都是独立同分布的,而图可以使用节点和边的形式来表述样本之间的关系。
常见的表示方式使用节点集合N和边集合E构成一个图结构 G ( N , E ) G(N, E) G(N,E)
图中哪些作为节点,哪些作为边就是本体图考虑的问题
如下图所示就是一个本体图,通常我们在开始做图学习的任务之前,在导入数据之前,我们就应先构建出本体图,在具体导入数据的时候只不过是在本体图对应的节点中填入实际的数值而已
本体图的设计取决于将来想解决什么问题,而且本体图可以是唯一的,可以是不唯一的
区别就在于边是否具有方向性,节点的度(node degree)表示包含这个节点的边的数量,而在有向图中又可以具体分为出度和入度。
图中的节点或者连接会有不同的类型
很多图都是异质图,例如:
一种特殊的图结构,可以将图中的节点分成两个不相交的集合U和V,使得图中的任意一条边的两个顶点分别属于U和V,如
同构图中,节点的种类和连接关系都只有一种。比如:人际关系网络
异构图,是一个与同构图相对应的新概念,节点的种类和连接关系有多种类型。比如:学术网络
无向图:
有向图:
节点连接数可以用来表示节点的重要性(中心度/枢纽度)
(1)邻接矩阵
无向图:
有向图:
稀疏矩阵:
(2)连接列表和邻接列表
连接列表:
邻接列表:
(3)带权图和不带权图
不带权图:
带权图:
不管是带权图还是不带权图,无向图计算连接总数都是1/2矩阵中非零节点求和,平均连接总数都是2E / N
(1)连通图
(2)不连通图
(3)强连通图
(4)弱连通图
SCC
)SCC
中指出来的节点称为Out-component
SCC
的节点称为In-component
https://github.com/lyc686/CS224W_notes/
https://github.com/shenhao-stu/CS224W-Fall2021
https://andyguo.blog.csdn.net/article/details/128908145
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。