赞
踩
“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
词云”就是数据可视化的一种形式。给出一段文本的关键词,根据关键词的出现频率而生成的一幅图像,人们只要扫一眼就能够明白文章主旨。
如下图:
工具:
matplotlib
matplotlib,不用多讲,用python学习过机器学习的人都知道,是一个绘图库,最终词云的绘制需要用到它。
jieba
jieba,最好用的开源中文分词工具。他最主要的两个功能是分词和关键词的抽取。在词云的生成过程中都需要用到。
wordcloud
wordcloud是一个词云生成器,只要进行相关的配置就能生成相应的词云。
实现的过程简单来讲,两步走,1. 提取关键词,2. 生成词云。
关于如何使用代码生成词云,参考:
https://blog.csdn.net/weixin_43926091/article/details/85078763
https://www.cnblogs.com/Leo_wl/p/7643308.html
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。