赞
踩
内容参考:
https://www.bilibili.com/video/BV1UR4y1E7fa?spm_id_from=333.337.search-card.all.click
TextRank基于图的排序算法,来源于谷歌的PageRank算法,把文本单元分割成若干组成单元(单词或句子)并建立图模型,利用投票机制对文本的重要成分进行排序,仅仅利用****单篇文档本身的信息就可以实现关键词提取,摘录。和LDA,HMM等模型不同,TextRank不需要对多篇文档进行训练。
从一端给定的文本自动抽取有意义的若干词语或词组,TextRank算法是利用局部词汇之间的关系(共现窗口)对后续关键词进行排序,直接从文本本身抽取:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。