当前位置:   article > 正文

提取文本关键词?很 easy 啊,用 Python 三行搞定_python提取中文文本中的关键内容

python提取中文文本中的关键内容

从大量文本中提取有用的关键信息是数据分析的一个重要环节。

Python 作为一门广泛应用于数据分析领域的编程语言,有着强大的文本处理库。

整理了几个用于文本关键词提取的优秀工具,一起学习下。

1、jieba

jieba 是一个中文分词库,可以将一段文本分割为单独的单词。可以使用 jieba 库来提取中文文本的关键词。

1.安装

使用pip安装:

pip install jieba -i https://pypi.tuna.tsinghua.edu.cn/simple

这里使用清华大学的源地址     

2. 示例代码

  1. import jieba.analyse
  2. text = "Python 是一个非常优秀的语言,它可以用于 Web 开发,人工智能,数据分析等领域。"
  3. # 抽取5个关键词
  4. keywords = jieba.analyse.extract_tags(text, topK=15)
  5. print(keywords)

输出:

2、textrank库

 TextRank算法可以用来从文本中提取关键词和摘要(重要的句子)。TextRank4ZH是针对中文文本的TextRank算法的python算法实现。

2.1 安装

使用pip安装:

pip install scipy -i https://pypi.tuna.tsinghua.edu.cn/

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/140803
推荐阅读
相关标签
  

闽ICP备14008679号