赞
踩
chinese_keyphrase_extractor (CKPE)
一个从 中文自然语言文本 中抽取 关键短语 的工具,只消耗 35M 内存
A tool for automatic keyphrase extraction from Chinese text.
本项目即将迁移至 jionlp 工具包,性能更好,速度更快哦~~~
应用场景 Application scenario
1.抽取关键短语
在很多关键词提取任务中,使用tfidf、textrank等方法提取得到的仅仅是若干零碎词汇。
这样的零碎词汇无法真正的表达文章的原本含义,我们并不想要它。
In many keyword extraction tasks, only a few fragmentary words are extracted when using tfidf, textrank and other methods.
Such fragmentary words cannot really express the original meaning of the article. We do not want it.
例如:
For example:
>>> text = '朝鲜确认金正恩出访俄罗斯 将与普京举行会谈...'
>>> keywords = ['俄罗斯', '朝鲜', '普京', '金正恩', '俄方']
我们往往需要更细化的短语描述,来作为文本的关键信息展示。这样的需求在生成词云、提供摘要阅读、关键信息检索等任务中都非常重要。
We often need more detailed phrase descriptions to display the key information of the text. Such requirements, namely keyphrases extraction, are very important in generating word cloud, providing abstract reading, key information retrieval and other tasks.
例如: For example:
>>> phrases = ['俄罗斯克里姆林宫', '邀请金正恩访俄', '最高司令官金正恩',
'朝方转交普京', '举行会谈']
2.扩展相关短语词汇
有时产
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。