当前位置:   article > 正文

【同济子豪兄斯坦福CS224W中文精讲】学习笔记一_斯坦福大学公开课cs224w笔记

斯坦福大学公开课cs224w笔记

Introduction

图无处不在:图是描述关联数据的通用语言。
机器学习、深度学习所解决的大多数任务中数据都满足独立同分布彼此孤立无关这两个假设,而图并非如此,因此我们需要使用全新的方法来处理图数据挖掘问题
常见的图:particle networks、underground networks、social networks、economic networks、knowledge graphs、
那么对于图这样一种与传统的序列、网格状数据不同的数据结构,我们应该怎么对其进行数据挖掘?

图深度学习的困难在何处?
图尺寸可能很大,拓扑结构可能很复杂
图没有固定的节点顺序和参考锚点
图往往是动态变化的并且会表现出多模态的特征(如音乐推荐,视频推荐等)

图深度学习流程图
image.png
使用图深度学习需要什么技术?
使用representation learning将图数据表示为机器可以使用的向量,

我们在这门课上会需要学习什么?Machine Learning and Representation Learning
image.png

图机器学习的常见任务

image.png
image.png

图的基本表示

图的基本组成

image.png

图的本体设计

图的顶点表示什么,边表示什么?这就是图的本体ontology的设计问题,这回决定我们的图到底能在多大程度将网络数据表示出来。通常情况下,我们需要根据待解决的问题定义来决定图的本体设计

the way you assign links will determine the nature of the question you can study

图的种类

有向图:collaborations | Friendship on Facebook…
无向图:phone calls | following on Twitter
异质图:图中出现了不同类型的顶点。如电商网络图中会存在商家node,用户node。特别的,仅有两种node且edge只出现在两种节点之间的异质图被称为二部图(bipartite)
image.png

二部图举例:
Authors-to-Papers Graph
Actors-to-Movies Graph
Users-to-Movies Graph

与二部图相对应的展开二分图 “folded” network
比如 Author collaboration networks、Movie co-rating networks
image.png

节点连接数

k k k表示
对于undirected graph 直接用 k i k_i ki表示
对于derected graph 使用 k i i n k_i^{in} kiin k i o u t k_i^{out} kiout表示节点的入度和出度

图的基本表示

邻接矩阵 adjacency matrix
image.png
在邻接矩阵中的一些计算
某节点的度:无向图中 k i = ∑ j = 1 N A i j = ∑ j = 1 N A j i k_i = \sum_{j=1}^NA_{ij} = \sum_{j=1}^NA_{ji} ki=j=1NAij=j=1NAji 有向图中 k i o u t = ∑ j = 1 N A i j k_i^{out}=\sum_{j=1}^NA_{ij} kiout=j=1NAij k i i n = ∑ i = 1 N A i j k_i^{in}=\sum_{i=1}^NA_{ij} kiin=i=1NAij
无向图中连接数 L = 1 2 ∑ i = 1 N k i = 1 2 ∑ i j N A i j L = \frac{1}{2}\sum_{i=1}^Nk_i = \frac{1}{2}\sum_{ij}^NA_{ij} L=21i=1Nki=21ijNAij 有向图中连接总数 L = ∑ i = 1 N k i i n = ∑ i = 1 N k i o u t = ∑ i , j N A i j L = \sum_{i=1}^Nk_i^{in} = \sum_{i=1}^Nk_i^{out} = \sum_{i,j}^NA_{ij} L=i=1Nkiin=i=1Nkiout=i,jNAij
使用邻接矩阵表示图的缺点:矩阵过于稀疏,并且在实际问题上大多数网络都是很sparse的,结果是矩阵中有很多0

邻接列表 adjacency list
邻接列表在处理大型的稀疏网络具有优势
我们可以容易地获得某节点的所有邻接节点
image.png

连接列表 list of edges
每条边用一个二元组表示,(node1, node2)表示node1和node2之间有一条边相连

图的连通性

图论中的基本知识
对于无向图而言,连通图指任意两个节点之间都通过某路径连接的图。一个非连通图可以被划分为多个连通域
对于有向图,连通图分为强连通图(strongly connected directed graph)和弱连通图(weakly connected directed graph)。
强连通图指在考虑边方向时任意两个节点均连通的图。
弱连通图指不考虑边方向时任意两个节点均连通的图。

参考资料

  1. 同济子豪兄课程repo地址:https://github.com/TommyZihao/zihao_course/tree/main/CS224W
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/589081
推荐阅读
相关标签
  

闽ICP备14008679号