当前位置:   article > 正文

Python文本分析可视化词云图WordCloud练习及错误总结_python词云制作心得体会

python词云制作心得体会

Python文本分析可视化整体思路:

一.导入待可视化文本文件,分词并统计词频。

二.筛选出高频词。

三.根据词频绘制形状词云图。

  1. import os
  2. print(os.getcwd())
  3. os.chdir("e:\\")
  4. print(os.getcwd())

首先通过“os.getcwd()”确认当前工作的目录与待分析的文本文件位置是否在同一目录下,

并利用“os.chdir()”改变位置,保证操作系统能成功找到文本文件。

  1. import jieba#导入jieba库处理中文文本
  2. with open("BNYJ.txt",'r',encoding='utf-8')as f:
  3. renmin=f.read()#打开文本
  4. seg_list=jieba.cut(renmin,cut_all=False)#以精准模式处理文本的分词
  5. #print('【精准模式】:'+'/'.join(seg_list))
  6. jieba.load_userdict('BLC.txt')#添加保留词,进行二次分词
  7. tf={}#建立空字典,以键值对的形式存放词频统计结果
  8. for seg in seg_list:#遍历分词结果列表
  9. if seg in tf:
  10. tf[seg]+=1
  11. else:
  12. tf[seg]=1
  13. ci=list(tf.keys())
  14. with op
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/921307
推荐阅读
相关标签
  

闽ICP备14008679号