赞
踩
标签: 机器学习
1. 关于影评的数据集
2. 关于影评的情感标签
3. python的各种运算库
关于影评的数据集与情感标签点击此处下载
运算库请自行下载
(好吧,图文无关)
对影评的每一个单词进行提取,通过神经网络找到单词之间与情绪的联系,进而进行预测
准确率达85%以上,运算速率可达7000条影评/秒
g = open('reviews.txt','r') # What we know!
reviews = list(map(lambda x:x[:-1],g.readlines()))
g.close()
g = open('labels.txt','r') # What we WANT to know!
labels = list(map(lambda x:x[:-1].upper(),g.readlines()))
g.close()
from collections import Counter
import numpy as np
import time
import sys
import numpy as np
class SentimentNetwork:
def __init__(self, reviews,labels,min_count = 10,polarity_cutoff = 0.1,hidden_nodes = 10, learning_rate = 0.1):
np.random.seed(1)
################神经网络的数据预处理#################
self.pre_process_data(reviews, labels, polarity_cutoff, min_count)
##########神经网络的数据初始化###########
self.init_network(len(self.review_vocab),hidden_nodes, 1, learning_rate)
###################################################
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。