赞
踩
为了方便理解,本博客对电影评论数据(IMDB)数据集进行分类,其中该数据集一共包括50000电影评论,每个评论的标签都被标注为正面的或负面的。而在Pytorch中的常用库torchext支持直接加载该数据集,并可将其划分为训练集和测试集两部分。
from torchtext import datasets
train_data, test_data = datasets.IMDB.splits(TEXT, LABEL)
通过打印来简单看一下训练集和测试集的数据个数,如下所示,训练集和测试集数据个数相同:
print('Number of train examples: {}&
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。