赞
踩
损失函数:
1、绝对值损失函数
2、平方损失函数 (回归任务)
3、指数损失函数
4、交叉熵损失函数 (分类任务)
正则化:
L1正则化是指权值向量中各个元素的绝对值之和,可以实现让参数矩阵稀疏,让参数稀疏的好处,可以实现对特征的选择
L2正则化是指权值向量中各个元素的平方和然后再求平方根,解决过拟合问题。
1*1卷积: 实现跨通道交互、升降维、增加非线性
过拟合: 泛化能力差,原因:
网络太复杂,数据量不够; ---调小模型,增加数据集
训练集与测试集特征分布不一致;--正则化,dropout
样本中噪声数据干扰太大,
迭代次数太多了 -----提前停止
BN以及BN在测试阶段如何处理 ?
对每一个batch的数据根据求得的均值和方差进行归一化处理,主要作用是加速训练收敛,防止过拟合。
测试阶段,可以根据训练数据机每一个batch的均值和方差做平滑处理或者求均值,得到全局的均值和方差
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。