当前位置:   article > 正文

【文献阅读笔记】KAM Theory Meets Statistical Learning Theory: Hamiltonian Neural Networks with Non-Zero Trai

hamiltonian neural networks

文章发表于【2022】AAAI Technical Track on Machine Learning I


文章目的

这篇文章,通过结合统计学习理论和 Kolmogorov-Arnold-Moser (KAM) 理论,为哈密顿神经网络提供在学习误差不完全为零时的行为的理论分析。

一、主要内容:

1.用统计学习理论证明哈密顿神经网络的训练模型是原系统的扰动


d u d t = S ∂ H N N ∂ u . \frac{du}{dt} =S\frac{\partial H_{NN}}{\partial u}. dtdu=SuHNN.
被视为扰动的哈密顿系统。

2.应用KAM理论得出神经网络学习误差行为。

在这里插入图片描述

二、第一部分任务:证训练系统是扰动

2. 1. 主要概念Rademacher complexity&Covering number

Rademacher complexity:一定概率下损失函数期望的界限
covering number:用于估计Rademacher complexity的界。

2. 2. 定义理解:Rademacher complexity

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 2. 1. 引理1:用Rademacher complexity估计损失函数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
因此得到引理1
在这里插入图片描述

2. 3. 定义理解:Covering number

在这里插入图片描述
在这里插入图片描述

2. 3. 1 引理2:用Covering number估计Rademacher complexity

引理2证明在这里插入图片描述
上述定理得到原文的lemma2
在这里插入图片描述

2. 4. 引理3: 给Covering number一个估计

证明
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 4. 得出结论引理5:

在这里插入图片描述
第一部分:损失函数的平均值,训练时是让损失函数不断变小
第二部分:Rademacher complexity用Covering number估计,Covering number由定理7估计。
即满足定理3的条件
在这里插入图片描述

二、第二部分任务:应用KAM得出神经网络学习误差行为。

套用定理3,得出结论。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/577640?site
推荐阅读
相关标签
  

闽ICP备14008679号