赞
踩
是机器学习和统计建模中使用的一个术语,它指的是一组数据,这些数据被用来训练和评估模型。数据集可以包含各种类型的数据,例如数值数据、文本、图像、音频或视频。
数据集通常分为几个部分:训练集、验证集和测试集。
在机器学习中:
训练数据集是样本内的数据,用于样本集的建模。
验证数据集是样本外的数据,用于检验模型或评估模型表现。
任何一种模型都既要有训练数据集也要有验证数据集,才能确保模型表现得更好。
在机器学习的算法中,一般两个数据集都是随机指定的。比如在总体样本中随机指定70%的数据是训练数据集,剩下30%的数据是验证数据集。
测试数据集则用于评估模型的最终性能。它是一组在训练过程中未使用的数据,为模型的预测性能提供了无偏的评估。
findata-科学数据搜索引擎
https://findata.cn/search?search=Iris%E6%95%B0%E6%8D%AE%E9%9B%86&page=1
五号雷达_专注于发现数据集的引擎
DatasetSearch -专注于数据集搜索引擎
https://datasetsearch.research.google.com/search?src=3&query=iris&docid=L2cvMTFzM3pwMWZkcQ%3D%3D
https://datasetsearch.research.google.com/search?src=2&query=mnist&docid=L2cvMTF5M21xOXRrbQ%3D%3D
https://findata.cn/search?search=MNIST&page=1
https://www.5radar.com/search?key=7a318a8752924b42aec17c7ff98c7496
https://findata.cn/search?search=Titanic&page=1
https://www.5radar.com/search?key=7399cbd2888243218f06558c3abacbc7
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。