当前位置:   article > 正文

Python——wordcloud词云库_wordcloud中文词云

wordcloud中文词云

一、操作前的准备(下面代码均用Jupyter NoteBook)

wordcloud:快速生成词云图

jieba:中文分词库feng

matplotlib:一个2D绘图库

查询命令:

pip show wordcloud

pip show jieba

pip show matplotlib

安装命令:

pip install wordcloud

pip install jieba

pip install matplotlib

二、应用

1、生成步骤:

创建词云对象——>加载词云文本——>输出词云图片

PS:每次运行后生成的词云图片都不一样,所以最后生成的图片也不一样

2、默认的矩形词云图片 

(1)、导入模块

从PTL(Python Imaging Library)中导入Image图片库模块(严格大小写)

(2)、创建词云对象

font_path(): 文字路径,默认不支持中文,可通过该参数指定字体,支持OTF和TTF格式

文字路径在C盘的windows文件夹中的font文件夹中找到

要写入特定编码的文本文件,请给open()函数传入encoding参数,将字符串自动转换成指定编码

with open(file) as f:               #对f进行文件操作
相当于
f = open(file)                     #对f进行文件操作 f.close()

e,g,:

with open ("花名册2.doc", "w", encoding="utf-8") as f : f.write("王小溪")
上述2段代码实现的功能都是新建一个doc文件,并向文件写入王小溪。

(3)、加载词云文本

generate(text):根据文本生成词云图,返回对象本身

(4)、输出词云图片

to_file(文件名):将词云对象转化为文件并保存

(5)、读取文件

3、输出中文词云

代码效果:

无法输出文字,因为word cloud只支持英文分词,不支持中文分词,所以我们需要调用jiaba这个第三方库。

导入jieba模块

再次运行:

jieba的常用用法:

①、jieba.lcut( ):切割,把完整的text文本按照中文词库的标准完成拆分

②、jieba.join( ):连接,将拆分的文本链接起来

4、提供图的词云图片

Ⅰ:使用image显示

(1)、导入模块

imageio是一个用于读取和写入图像及视频数据的库,支持多种格式,且可以使用NumPy数组进行操作。

imread():从文件中读取图像数据并返回一个NumPy数组

(2)、读取词云文本文件

(3)、读取遮罩图片

(4)、创建词云对象

需要严格区分大小写

(5)、加载词云文本

(6)、输出词云图片

输出成功:

(7)、读取文件

Ⅱ:使用pyplot显示

 (1)、导入模块

matplotlib 是 Python的一个 2D 绘图库,它提供了一套表示图、操作图以及图内部对象处理的一些函数,借助它可以绘制各种各样的数据图,如线性图、直方图、饼图等。

pyplot 是一个有命令风格的函数集合,和 MATLAB 非常相似,通过调用相关函数不断完善绘图。

(2)、读取词云文本文件

(3)、读取遮罩图片

(4)、创建词云对象

需要严格区分大小写

(5)、加载词云文本

(6)、输出词云图片

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/921304
推荐阅读
相关标签
  

闽ICP备14008679号