当前位置:   article > 正文

python删除中文停用词_Python数据分析及可视化实例之词云(9)

可视化的时候中文逗号怎么利用停用词不显示

f512f62b22910112eab51bafb39e9238.png

系列文章总目录:Python数据分析及可视化实例目录


6286da8a0fedb83cb9a537b38e1b5bfe.png

安装步骤:

敲黑板~~~~中文显示按此操作,英文可以无视:

1、准备好一个中文字体,如 simhei.ttf;

2、将其复制到wordcloud安装根目录中;

3、在 wordcloud.py 中修改 FONT_PATH 为相应字体。

当然,你也可以在实例化的时候手动制定路径,上面方法一劳永逸。

  1. # WordCloud类
  2. class WordCloud(object):
  3. def __init__(self, font_path=None, width=400, height=200, margin=2,
  4. ranks_only=None, prefer_horizontal=.9, mask=None, scale=1,
  5. color_func=None, max_words=200, min_font_size=4,
  6. stopwords=None, random_state=None, background_color='black',
  7. max_font_size=None, font_step=1, mode="RGB",
  8. relative_scaling=.5, regexp=None, collocations=True,
  9. colormap=None, normalize_plurals=True)
  10. .......
  11. # 关键参数含义
  12. width : int (default=400)
  13. 画布宽度
  14. height : int (default=200)
  15. 画布高度
  16. ranks_only : boolean (default=False)
  17. 是否只用词频排序而不是实际词频统计值,默认 False
  18. prefer_horizontal : float (default=0.90)
  19. 词语水平出现的频率,默认 0.9 (即垂直出现频率为 0.1
  20. mask : nd-array or None (default=None)
  21. 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。
  22. scale : float (default=1)
  23. 计算与绘制图像间的比例。对于较大的词云图像,使用比例而非较大的画布会显著提升绘图速度,但是可能会造成词语间的粗糙拟合。
  24. max_words : number (default=200)
  25. 词语的最大数量
  26. stopwords : set of strings
  27. 停用词
  28. max_font_size : int or None (default=None)
  29. 最大词的最大字号;如果不指定,则为图像高度。
  30. # 其他参数自行测试理解

举个例子:

  1. from collections import Counter # 统计词频
  2. from wordcloud import WordCloud, STOPWORDS #生成词云、通用词
  3. import matplotlib.pyplot as plt # 在线显示
  4. data = [open('红楼梦.txt','r',encoding='utf-8').read()]
  5. # print(data[:10])
  6. wc = WordCounter(data) # 基于Counter自定义的子类(留作业:结巴分词、停用词)
  7. wordcloud = WordCloud(background_color="white",width=600, height=400, margin=5).fit_words(dict_fre)
  8. plt.imshow(wordcloud)
  9. plt.axis("off")
  10. plt.show()

显示效果

06efbab85ffaf7e8f1a450ec3a1d32fd.png
yeayee:Python数据分析及可视化实例目录​zhuanlan.zhihu.com
6e92cc971639ecdbfdfc3d74d12a8954.png

67dd49e0b8f84b21f57969f1ebbf6c64.png

最后,别只收藏不关注哈

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/617462
推荐阅读
相关标签
  

闽ICP备14008679号