当前位置:   article > 正文

提取中文文本摘要_from gensim.summarization.summarizer import summar

from gensim.summarization.summarizer import summarize

环境 python3, gensim

from gensim.summarization.summarizer import summarize
from pyltp import SentenceSplitter
import jieba
text="""国际标准化组织对机器人的定义是:机器人是一种能够通过编程和自动控制来执行诸如作业或移动等任务的机器。我国科学家对机器人的定义是:机器人是一种自动化的机器,所不同的是这种机器具备一些与人或生物相似的智能能力,如感知能力、规划能力、动作能力和协同能力,是一种具有高度灵活性的自动化机器。"""
print(len(text))
sents = SentenceSplitter.split(text)
print(len(sents))
ss = []
for sent in sents:
    temp = list(jieba.cut(sent, cut_all = False))
    ss.append(" ".join(temp))   
output = ". ".join(ss)
summ = summarize(output, word_count=100)
summ=summ.replace(".","")
summ=summ.replace(" ","")
summ=summ.replace("\n","")
print(summ)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/281797?site
推荐阅读
相关标签
  

闽ICP备14008679号