赞
踩
9## 介绍
提前声明一点,过采样和欠采样是针对一组图像数据集来说的,而上采样和下采样是对与单张图片来说的。
1.过采样和前采样:
欠采样(undersampling):当数据不平衡的时,比如样本标签1有10000个数据,样本标签0有6000个数据时,为了保持样本数目的平衡,可以选择减少标签1的数据量,这个过程就叫做欠采样。
**过采样(oversampling)**减少数据量固然可以达到以上效果,并且在一定程度上防止过拟合,但是这也牺牲了数据,因此存在另一种增加样本的采样方法,也就是增加标签0的样本数,最经典的过采样算法就是SMOTE,这里就不深入介绍了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。