当前位置:   article > 正文

python知识快速补充6——jieba以及wordcloud使用_jieba和wordcloud制作词云

jieba和wordcloud制作词云

经过疯狂的刷课,这两天刷完了python的基础课程的五周,马上就可以进入到python数据处理课程了。在最后,我们使用jieba库和wordcloud库,生成一朵词云。
首先我们要在Anaconda中执行以下命令
pip install jieba
pip install wordcloud
配置两个包。

wordcloud 库的运用:

wordcloud库的运用主要就是三个函数,这三个函数也通俗易懂,其中最重要的函数是这个:w=wordcloud.WordCloud()
参数:
width,height;宽度,高度
min_font_size,max_font_size;最小字体,最大字体
font_step,font_path;步进间隔,字体路径
max_words,stop_words;词云显示最大单词数量,词云排除集合,数据类型为集合
mask;指定词云形状,为一张图片
background_color:背景颜色

其中,mask的使用如下:
mk=imread(“pic”)#这里是一张图片的路径
在参数中mask=mk即可。

jieba库的使用:

jieba库主要用于文本词语的切分,有以下三种模式:
精确模式:将文本精确的切开, 不存在冗余词汇
全模式:将文本所有可能的词语扫描出来,有冗余
搜索引擎:精确模式情况下再切分长词语
常用函数:
jieba.lcut("中国是一个伟大的国家") 精确模式
返回列表[‘中国’,‘是’,‘一个’,‘伟大’,‘的’,‘国家’]
jieba.lcut("中国是一个伟大的国家",cut_all=True)全模式
[‘中国’,‘国是’,‘一个’,‘伟大’,‘的’,‘国家’]
jieba.lcut_for_search(s)搜索引擎模式
jieba.add_world(w)向分词词典添加新词汇
其实这里面最常用的就是第一个了。。。。。

好了,我们来做一个词云试试看:

import jieba
import wordcloud 
f = open("D:\\wenben1.txt")
t=f.read()
f.close()
ls=jieba.lcut(t)#已经得到了词汇列表
txt=" ".join(ls)#词汇列表整合称为一个词语之间用空格分隔的字符串,因为w.generate()参数只能是由词汇和空格组成的字符串
w=wordcloud.WordCloud(font_path="msyh.ttc",width=800,height=500,
background_color="white",max_font_size=40)
#参数没有顺序,这里为了方便就写几个。
w.generate(txt)#生成词云
w.to_file("gvmt.png")#保存
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

效果如下:
在这里插入图片描述
这里方便起见,没有调用其他参数,大家可以自行调整。网上找了一张好看的图,激发一下学习的兴趣:
在这里插入图片描述
图片来源是这里:https://image.baidu.com/search/detail?ct=503316480&z=0&ipn=d&word=%E8%AF%8D%E4%BA%91&step_word=&hs=0&pn=1&spn=0&di=124520&pi=0&rn=1&tn=baiduimagedetail&is=0%2C0&istype=0&ie=utf-8&oe=utf-8&in=&cl=2&lm=-1&st=undefined&cs=3551847269%2C1676575473&os=1467432224%2C534072971&simid=3470652530%2C465394191&adpicid=0&lpn=0&ln=1363&fr=&fmq=1580822334090_R&fm=&ic=undefined&s=undefined&hd=undefined&latest=undefined©right=undefined&se=&sme=&tab=0&width=undefined&height=undefined&face=undefined&ist=&jit=&cg=&bdtype=0&oriquery=&objurl=http%3A%2F%2F5b0988e595225.cdn.sohucs.com%2Fimages%2F20180105%2Fd2c7deda9d3841e29c47768882889177.jpeg&fromurl=ippr_z2C%24qAzdH3FAzdH3Fojt4jtkw_z%26e3Bv54AzdH3Ff5AzdH3F4w62tgws%25E0%25lA%25b9%25Ec%25la%25bD%25Eb%25AF%25bD%25Ec%25BD%25Ad%25Ec%25BC%25bF_z%26e3Bip4s&gsm=&rpstart=0&rpnum=0&islist=&querylist=&force=undefined
好了,到这里为期三天的python基础知识突击课程就结束了,让我们进入数据处理的课程吧。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/728932
推荐阅读
相关标签
  

闽ICP备14008679号