当前位置:   article > 正文

【收藏】使用jieba 进行基于 TextRank 算法的关键词抽取_jieba提取关键词代码textrank csdn

jieba提取关键词代码textrank csdn

Python中通过jieba.analyse.textrank 进行基于 TextRank 算法的关键词抽取
算法论文见 TextRank: Bringing Order into Texts

基本思想:

  • 将待抽取关键词的文本进行分词
  • 以固定窗口大小(默认为5,通过span属性调整),词之间的共现关系,构建图
  • 计算图中节点的PageRank,注意是无向带权图

Python用法说明

# sentence 为待提取的文本
# topK 为返回几个 TF/IDF 权重最大的关键词,默认值为 20
# withWeight 为是否一并返回关键词权重值,默认值为 False
# allowPOS 仅包括指定词性的词,默认值为空,即不筛选
jieba.analyse.textrank(sentence, topK=20<
  • 1
  • 2
  • 3
  • 4
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/666545
推荐阅读
相关标签
  

闽ICP备14008679号