赞
踩
文章发表于【2022】AAAI Technical Track on Machine Learning I
这篇文章,通过结合统计学习理论和 Kolmogorov-Arnold-Moser (KAM) 理论,为哈密顿神经网络提供在学习误差不完全为零时的行为的理论分析。
–
即
d
u
d
t
=
S
∂
H
N
N
∂
u
.
\frac{du}{dt} =S\frac{\partial H_{NN}}{\partial u}.
dtdu=S∂u∂HNN.
被视为扰动的哈密顿系统。
Rademacher complexity:一定概率下损失函数期望的界限
covering number:用于估计Rademacher complexity的界。
因此得到引理1
引理2证明
上述定理得到原文的lemma2
证明
第一部分:损失函数的平均值,训练时是让损失函数不断变小
第二部分:Rademacher complexity用Covering number估计,Covering number由定理7估计。
即满足定理3的条件
套用定理3,得出结论。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。