赞
踩
vader是一种基于词库和语法规则的情感识别方法,发布于2014年AAAI会议。
与基于模型的情感识别方法不同的是,vader是通过人工标记情感词。(含7000+个情感词,情感等级范围为-4—+4。此外还包括颜文字,如(:))以及缩写词)。vader还对标点、大小写、程度副词、连词以及否定词比较敏感。
相较传统的词袋模型(忽略词序和语法,仅仅将文本看做是一个词集合)能够更为准确的体现句子的真实语义。
相较于基于模型的情感识别方法,vader具有更好的泛化能力,在多种数据上均具有较好的分类性能。
vader所做的情感词标记等只是针对于英文来做的,对于中文并不友好,不能直接使用,需要先进行翻译,然后才能使用。
from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer import re import sys from translate import Translator url_google = 'http://translate.google.cn' reg_text = re.compile(r'(?<=TRANSLATED_TEXT=).*?;') user_agent = r'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ' \ r'Chrome/44.0.2403.157 Safari/537.36' def translate_cn_api(content): translator= Translator(to_lang="zh") translation = translator.translate(content) return translation def translate_en_api(content): translator= Translator(to_lang="en",from_lang='zh') translation = translator.translate(content) return translation def print_sentiment_scores(tweets): analyser = SentimentIntensityAnalyzer() vadersenti = analyser.polarity_scores(tweets) return vadersenti['compound'] def main(question): #英文翻译 questionEn = translate_en_api(question) print("问题英文版:", questionEn) #情感评分 result = print_sentiment_scores(questionEn) #将情感评分-1至1的区间转换到0-1的区间。 X_scale = (1 + result) / 2.0 print("情感评分:", X_scale) if __name__ == '__main__': question=input("请输入你的问题:") print("问题中文版:", question) main(question)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。