赞
踩
一、文本数据集描述
1、数据集来源以及使用目的
数据集weibo_sentiment.csv来自于GitHub上的开源数据集,可以用于机器学习中的中文文本情感分析的练习任务。
2、数据规模、以及如何划分数据集
sentiment.csv 数据集中的数据规模即共有120000条中文文本,基本正面和负面的评论都差不多,
3、数据集的组成和类型
数据集主要是来自微博上的各种评论,包括各种各样不同类别的评论内容,每行文本的组成是情感标签和评论的具体内容。标签和内容的样式示例如下所示:
情感标签与情感类别的对应
情感标签
情感类别
0
负向评论
1
正向评论
————————————————
获取链接链接:https://pan.baidu.com/s/1wlorPLGsyjEMJgx8Noxx-A?pwd=d0rg
提取码:d0rg
--来自百度网盘超级会员V1的分享
未经允许不可转载
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。