赞
踩
词云基于关键词出现的频率,可以直观地反映出一个文本、概念或想法中各个关键词的重要性大小。
根据自定义的形状和文本颜色构建图形词云,导入用户自定义词典,计算每个词出现的频率,并存入txt文件,然后根据词语出现的频率来决定字体放大或缩小的程度。
1.分词并统计词频。首先对分析的对象(即一段文本)进行分词,换句话说,就是把一句话拆成一个个词语。然后对词语重复出现的次数进行统计。
2.根据词频绘图。根据词频统计结果,绘制词云,频率高的词字体更大。
# coding:utf-8 from os import path from PIL import Image import numpy as np import matplotlib.pyplot as plt from matplotlib import colors from wordcloud import WordCloud, STOPWORDS from collections import Counter import jieba # 二值化处理 def cv(): im = Image.open("1.png") Lim = im.convert('L') threshold = 185 table=[] for i
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。