赞
踩
MovieLens 数据集是由 GroupLens 项目组制作的公开数据集。MoveieLens数据集可以说是推荐系统领域最为经典的数据集之一,其地位类似计算机视觉领域里的MNIST数据集。
MovieLens 是一系列数据集的统称。根据创建时间、数据集大小等划分为若干个子数据集。例如:
每个数据集都可以在官网进行下载。
我们以 MovieLens 1M Dataset 为例进行分析。
首先,我们下载 MovieLens 1M Dataset 后得到压缩包 ml-1m.zip。对其进行接下后可以得到四个文件:
README 文件中描述了数据集的相关信息,有兴趣的同学可以自行查阅。我们主要关注另外三个文件的内容和格式。
ratings.dat 文件里面的内容包含了每一个用户对于每一部电影的评分。打开文件,我们可以看到以下内容 (我们仅展示一部分):
1::1193::5::978300760
1::661::3::978302109
1::914::3::978301968
1::3408::4::978300275
1::2355::5::978824291
1::1197::3::978302268
1::1287::5:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。