赞
踩
1.文生图的畸形的检测方式?
2.VAE 的loss如何计算?
3.classifier-freeguidance?
4.DDIM为什么能加速?
5.VQGAN有几个损失?codebook正向传播和反向传播?
6.DDPM和DDIM有什么区别?
DDIM非马尔科夫变体,去噪的步骤可以更少,有一个噪声表,通过更少的步骤获得更好的效果。
7.解释一下lora原理?lora有没有激活函数?如果给lora加激活函数,什么比较好,能收敛吗?
lora 本身假设模型是过参数化的,有更小的一个内在维度,模型在训练过程中的改变是低秩的,lora就是去学习这个改变量,lora的生成和泛化能力依然来源于原始的模型。lora中没有激活函数。
优雅谈大模型9:大模型的激活函数_大模型常用激活函数-CSDN博客文章浏览阅读1k次,点赞12次,收藏12次。实验证明“大激
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。