赞
踩
TextRank: Bringing Order into Texts
在网上看了很多关于pagerank和textrank的博客,关于pagerank的算法还算勉强能看懂,到了textrank就看不懂了,很多博客抄来抄去的,我只看懂了textrank是由pagerank演变而来的,但具体怎么实现还是看不懂,直到找到这篇2004年的原文,才恍然大悟。看英文原文确实费点时间,但是比起胡乱地找资料来说,反而更有效率。为避免自己忘记,在此通过原文记下自己地心得。
pagerank是很早谷歌提出的一种基于无权有向图的网页排序算法,把每个网页当作节点,每个节点上有评分,通过图的入度和出度对评分进行迭代计算,公式形式很简单:
S(Vi)表示节点评分,d为阻尼系数,通常设为0.85.
表示 j 节点指向其他网页的数量。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。