赞
踩
网站目前提供约 70 个最新数据集,涵盖了计算机视觉、自然语言理解和音频三大领域。
还在愁到哪里找到需要的机器学习数据集吗?
每年都有很多大型、高质量的数据集发布,其中大多数数据集都发布在各自的网站上,通过谷歌搜索很难找到所有这些数据集。
现在,一位名叫 Nikola Pleša 的开发人员做了一个项目,将所有机器学习的大型数据集收集在一个网站上,方便大家取用。
网站一经发布,好评如潮。网站目前提供约 70 个数据集,涵盖了计算机视觉、自然语言理解和音频三大领域,包括每个数据集的链接、简介、许可类型、论文等,并且作者表示将继续增加数据集数量。
传送门:
https://www.datasetlist.com/
下面,我们分别介绍 CV、NLP 的最新 10 大数据集,以及 4 个音频数据集。
计算机视觉(46个)
1. IBM 人脸多样性数据集
IBM 的人脸多样性 (DiF) 数据集是一个庞大而多样化的数据集,旨在促进人脸识别技术中公平性和准确性的研究。DiF 是第一个此类数据集,包含 100
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。