当前位置:   article > 正文

【Python】文本情感分析及绘制词云_情感分析高词频统计

情感分析高词频统计

码字不易,喜欢请点赞!!!

这篇文章主要分享了使用Python来对文本数据进行情感分析以及绘制词云。
主要步骤包括:
1.文本预处理
2.文本分词
3.去除停用词(这里设置为单个词和一些常见的停用词)
4.词频统计
5.情感分析
6.绘制词云

首先导入所需的程序办和文本数据:

#带入程序包
import pandas as pd
import re
import jieba
import collections
from wordcloud import WordCloud, ImageColorGenerator, STOPWORDS
import matplotlib.pyplot as plt
from PIL import Image

#读取数据
path = r"data.txt"
with open(path) as f:
    data = f.read()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

1.使用正则表达式对文本数据进行预处理,这里主要去除数据的一些没用的符号

# 文本预处理
pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|"')
data = re.sub(pattern, '', data)
  • 1
  • 2
  • 3

2.使用精准模式对文本进行分词

# 文本分词--精确模式分词
seg_list_exact  = jieba.cut(data,cut_all = False)
  • 1
  • 2

3.去除停用词,这里主要去除了一些常见的停用词和单个词

object_list = []
# 自定义常见去除词库
remove_words = [u'的'
  • 1
  • 2
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/354721
推荐阅读
相关标签
  

闽ICP备14008679号