赞
踩
诸神缄默不语-个人CSDN博文目录
cs224w(图机器学习)2021冬季课程学习笔记集合
YouTube 视频观看地址1 视频观看地址2 视频观看地址3 视频观看地址4
本章主要内容:
本章首先介绍了图生成模型generative models for graphs的基本概念和意义。
接下来介绍了一些真实世界网络的属性(度数分布、聚集系数、connected component、path length等,可参考1)(也是图生成模型希望可以达到的要求)。
最后介绍了一些传统的图生成模型(Erdös-Renyi graphs, small-world graphs, Kronecker graphs)。
介绍了传统的图生成模型,每种模型都对图生成过程提出了不同的先验假设。
下一章将介绍直接从原始数据学习图生成过程的深度图生成模型。
在图论的数学理论部分中,ER模型(Erdős–Rényi model)可指代两个密切相关的随机图生成模型中的任意一个。这两个模型的名称来自于数学家Paul Erdős(保尔•厄多斯)和Alfréd Rényi(阿尔弗烈德•瑞利),他们在1959年首次提出了其中一个模型,而另一个模型则是Edgar Gilbert(埃德加•吉尔伯特)同时并且独立于Erdős和Rényi提出的。在Erdős和Rényi的模型中,节点集一定、连边数也一定的所有图是等可能的;在Gilbert的模型中,每个连边存在与否有着固定的概率,与其他连边无关。在概率方法中,这两种模型可用来证明满足各种性质的图的存在,也可为几乎所有图的性质提供严格的定义。
尽管到目前为止讨论的Kronecker结构产生的图具有一系列所需的特性,但其离散性质在程度和频谱数量上会产生“阶梯效应”,这仅仅是因为单个值具有较大的多重性。例如,图邻接矩阵的特征值的度分布和分布以及主要特征向量分量的分布(即“网络”值)都受此影响。这些数量是多重分布的,这导致具有多个重复的单个值。下图说明了阶梯效应(这部分来自Jure等人的论文18)
会发现得到的图邻近矩阵的结构是很规则的(因为邻近矩阵的元素都是1或者0),
类似于具有规则结构的网格一样,这样的当然好(利于我们分析),
可是这样的图结构就很难capture真实复杂网络的信息了,那么要怎么办?-----答案是引入随机性!
这里在初始矩阵引入随机性的意思是:放松初始矩阵–邻近矩阵只有0或者1元素的条件,而是可以有[0,1]之间的元素,也就是
(1)初始矩阵的每个元素反应的是特定边出现的概率
(2)对初始矩阵进行Kronecker积运算,以获得较大的随机邻接矩阵,在该矩阵中,大型矩阵的每个元素数值再次给出了特定边出现在大图中的概率,这样的随机邻接矩阵定义了所有图的概率分布
在随机克罗内积的矩阵中,每条边的生成概率就是 k k k 阶克罗内积矩阵中元素的生成概率,也就是 k k k 层initiator matrix中选择到对应象限的概率的累乘结果:
我之前撰写的课程笔记:
cs224w(图机器学习)2021冬季课程学习笔记1 Introduction; Machine Learning for Graphs_诸神缄默不语的博客-CSDN博客
cs224w(图机器学习)2021冬季课程学习笔记2: Traditional Methods for ML on Graphs_诸神缄默不语的博客-CSDN博客 ↩︎ ↩︎
这是我根据理解自己扯的定义,大概是这么个意思,但是很可能不严格。有缘的话我再去看看严格定义。
另外就是还有一个weakly还是strongly的connected component概念,这里没区分。这个可以参考4。不过这点应该问题不大,在有向图上需要区分的话一般会说明的吧。 ↩︎
就以我对图算法的理解,我觉得DFS应该也可以? ↩︎
我之前写的笔记:cs224w(图机器学习)2021冬季课程学习笔记1 Introduction; Machine Learning for Graphs_诸神缄默不语的博客-CSDN博客 和 cs224w(图机器学习)2021冬季课程学习笔记16 Community Detection in Networks_诸神缄默不语的博客-CSDN博客脚注16。
另一个来自Connectivity (graph theory) - Wikipedia的对weakly connected component的定义:A directed graph is called weakly connected if replacing all of its directed edges with undirected edges produces a connected (undirected) graph。对strongly connected component的定义:It is strongly connected, or simply strong, if it contains a directed path from u to v and a directed path from v to u for every pair of vertices u, v. ↩︎ ↩︎ ↩︎
有个所谓的六度分隔理论就是跟这个差不多的嘛。 ↩︎
原论文:Erdös, P. and Rényi, A. (1960) On the Evolution of Random Graphs. Publication of the Mathematical Institute of the Hungarian Academy of Sciences, 5, 17-61.
原文下载地址是这个:http://snap.stanford.edu/class/cs224w-readings/erdos60random.pdf
或者这个:https://old.renyi.hu/~p_erdos/1960-10.pdf
在我之前的笔记里面也写过这个模型:cs224w(图机器学习)2021冬季课程学习笔记15 Frequent Subgraph Mining with GNNs_诸神缄默不语的博客-CSDN博客 ↩︎ ↩︎
但要说为什么会这样,我也不知道。 ↩︎
phase transition在物理学中指相变(可参考:Phase transition - definition of phase transition by The Free Dictionary)。
而在图论中:
Erdős and Rényi (1960) showed that for many monotone-increasing properties of random graphs, graphs of a size slightly less than a certain threshold are very unlikely to have the property, whereas graphs with a few more graph edges are almost certain to have it. This is known as a phase transition (Janson et al. 2000, p. 103).(出处:Phase Transition – from Wolfram MathWorld)
上文所提及的文献:
Erdős, P. and Rényi, A. “On the Evolution of Random Graphs.” Publ. Math. Inst. Hungar. Acad. Sci. 5, 17-61, 1960.6
Janson, S.; Łuczak, T.; and Ruciński, A. “The Phase Transition.” Ch. 5 in Random Graphs. New York: Wiley, pp. 103-138, 2000. 原书:Janson, S., Luczak, T. and Rucinski, A. (2000) Random Graphs. John Wiley & Sons, New York. http://dx.doi.org/10.1002/9781118032718这本书我没有找到免费的正版下载渠道,所以就算了。 ↩︎ ↩︎
其实expansion这部分我也没搞懂,我只是将我的不充分不完整的理解姑且先写出来了。 ↩︎
关于社交网络的社区相关概念,可参考我之前写的笔记:cs224w(图机器学习)2021冬季课程学习笔记16 Community Detection in Networks_诸神缄默不语的博客-CSDN博客 ↩︎
这一部分我是属实没有看懂……
fact我就没搞懂,我能理解这个每两层节点之间的边数是之前节点总和乘以
α
\alpha
α(这就是expansion的定义嘛),但这个
S
′
S'
S′ 和
S
S
S 是啥关系?这怎么推出来的复杂度和路径长度?虽然我知道树的深度是对数,但是这个对数到底是怎么推的对数啊?
Jure在视频中说这部分可以从数学上证明,但是证明内容对本课程来说超纲了,所以建议自己看论文。我搜了一下相关的资料,一个是The expansion of random regular graphs,一个是Random Graph Dynamics。都没看,有缘再说吧。 ↩︎
D. Wattts and S. Strogatz, Collective dynamics of ’small-world’networks, Nature
这个不是免费的,但是浙大买了,所以我能下。如有需要,一般建议通过学校购买、或淘宝或sci-hub等特殊方式获取,实在弄不到可以私聊我。 ↩︎
总结一下小世界模型这部分我没搞懂的内容:
①regular lattice graph和随机图这两种图是可以拿一块比的吗,是两种图的节点个数和平均度数固定的意思吗?
②lattice和ring两种表示形式是等价的吗?如果是,画成ring那样子是因为nature的文章就是要好看吗?
③小世界模型的summary都是什么鬼,它怎么就提供了clustering和small-world之间交互的见解了?它怎么就解释真实图中的高聚集系数了,这一点不是本身就已知的事实吗?还有就是小世界模型的度数分布与实际情况不同,这事在直觉上很好想象,要是相同了才不好想象,但是这个又咋证明呢? ↩︎
原论文应该是这篇:Realistic, Mathematically Tractable Graph Generation and Evolution, Using Kronecker Multiplication
另外还有一篇也是Jure他们写的克罗内图相关的论文:Scalable Modeling of Real Graphs using Kronecker Multiplication ↩︎
这个probability matrix的元素只要是0到1之间的概率就行,不需要加总为1的。
这个随机克罗内图会让我联想到随机邻接矩阵,但这个显然不是,就它不是转移矩阵,它就是每个元素单独地作为一个概率这样,所以没有每行或每列或所有元素加总为1的要求。 ↩︎
PPT里给的论文路径是谷歌学术的,我最近不方便上谷歌学术,所以就去找了个Jure主页下的文件路径:Leskovec et al., Kronecker graphs: an approach to modeling networks., JMLR
也可以通过acm下载:https://dl.acm.org/doi/10.5555/1756006.1756039 ↩︎ ↩︎
里面有一些我没见过的属性我去找了一下资料,还没看:
triangle participation / TPR: Defining and evaluating network communities based on ground-truth
scree plot碎石图
也可以直接看原论文的解释。 ↩︎
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。