赞
踩
网页看做图结构这个没问题,需要注意的是,现在的互联网除了超链接方式进行连接之外,还有提交post,评论,点赞,购买等关系。
在网页构成的有向图中,不是每个页面都是同样重要。
有三种方法来分析网页的重要性:
PageRank
Personalized PageRank (PPR)
Random Walk with Restarts
把链接数量看做重要性的衡量标准,相当于把度当做重要性标准,由于网页图是有向图,那么
第一个问题就是用出度还是入度作为衡量标准?用入度,因为出度比较容易作假
第二个问题既然链接重要性不一样,那么不同链接应该有不同的权重,重要的链接应该占有更大比重,这样使得问题变成了递归计算。
用以下公式表示节点
j
j
j的重要度“rank”:
r
j
=
∑
i
→
j
r
i
d
i
r_j=\sum_{i\rightarrow j}\cfrac{r_i}{d_i}
rj=i→j∑diri
重要性和出度有关,出度越大,分到的重要度越小。
上图中:
r
j
=
r
i
/
3
+
r
k
/
4
r_j=r_i/3+r_k/4
rj=ri/3+rk/4
Stochastic adjacency matrix
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。