赞
踩
对代码、编程感兴趣的可以关注「老K玩代码」公众号和我交流!
分享代码、经验、项目和资讯
关键词提取是自然语言处理中常见的业务模块; 要实现关键词提取,Python已经有比较好的现成的开源库可以用,比如我今天要介绍的jieba。 让我们来看看如何进行关键词提取:
import jieba.analyse as ana
keyword = ana.textrank(sentence)
可选参数说明: - topK: 输出的关键词数量,如果是None则全部关键词都输出; - withWeight: 输出的关键词是否附带textrank计算出来的权重值; - allowPOS: 该参数为列表,表示仅显示符合该参数设置词性的关键词; - withFlag: 输出的关键词是否附带词性;
TextRank TextRank算法是利用局部词汇之间关系(共现窗口)对后续关键词进行排序,直接从文本本身抽取。 参考详文: https://www.cnblogs.com/xueyinzhe/p/7101295.html
keyword = ana.tfied(sentence)
可选参数说明: - topK: 输出的关键词数量,如果是None则全部关键词都输出; - withWeight: 输出的关键词是否附带textrank计算出来的权重值; - allowPOS: 该参数为列表,表示仅显示符合该参数设置词性的关键词; - withFlag: 输出的关键词是否附带词性;
TFIDF TFIDF算法是利用根据词频和逆文档频率得出关键词的权重,直接从文本本身抽取。 参考详文: https://blog.csdn.net/zrc199021/article/details/53728499
如果你也对编程感兴趣,记得加老K玩代码公众号和我交流哦!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。