当前位置:   article > 正文

CS224W摘要04.Link Analysis: PageRank_random walk stationary distribution

random walk stationary distribution


CS224W: Machine Learning with Graphs
公式输入请参考: 在线Latex公式
从矩阵的角度来理解图,从而可以:
Determine node importance via random walk (PageRank)
Obtain node embeddings via matrix factorization (MF)
View other node embeddings (e.g. Node2Vec) as MF
总之,将图看成矩阵是以上算法的中心思想。

PageRank

网页看做图结构这个没问题,需要注意的是,现在的互联网除了超链接方式进行连接之外,还有提交post,评论,点赞,购买等关系。
在网页构成的有向图中,不是每个页面都是同样重要。
有三种方法来分析网页的重要性:
PageRank
Personalized PageRank (PPR)
Random Walk with Restarts

Links as votes

把链接数量看做重要性的衡量标准,相当于把度当做重要性标准,由于网页图是有向图,那么
第一个问题就是用出度还是入度作为衡量标准?用入度,因为出度比较容易作假
第二个问题既然链接重要性不一样,那么不同链接应该有不同的权重,重要的链接应该占有更大比重,这样使得问题变成了递归计算。
用以下公式表示节点 j j j的重要度“rank”:
r j = ∑ i → j r i d i r_j=\sum_{i\rightarrow j}\cfrac{r_i}{d_i} rj=ijdiri
重要性和出度有关,出度越大,分到的重要度越小。
在这里插入图片描述
上图中: r j = r i / 3 + r k / 4 r_j=r_i/3+r_k/4 rj=ri/3+rk/4

Matrix Formulation

Stochastic adjacency matrix

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/572188
推荐阅读
相关标签