深度学习概念

作者：花生_TL007 | 2024-04-19 23:42:49

踩

深度学习概念

AIGC数据生产：

AIGC在生成小图片时效果更佳(因为小图信息量更少，相同算力下效果更好)；所以适合构造一些交通场景。比如护栏损坏：只mask原图的部分区域(图中白色区域)，即可引导模型在mask处生成损坏的护栏。

基于此方法，可以大量生成交通稀缺样本用于模型训练。

多模型开集检索：多模态在此处指模型同时具备处理图像和文本的能力，开集是可以输入任意文本。

利用大模型对项目上采集的大量数据进行预处理生成特征底库。利用文本特征(比如用"塑料袋"文本生成的特征)在底库中进行搜索，对搜索结果进行topK排序，即可从大量数据中获取到包含塑料袋的图片。

基于此方法，可以基于大量真实数据搜索到稀缺样本用于模型训练。

主动学习指：使用训练好的模型对Raw data(比如项目上收集的大量数据)做检测，人工校验后形成训练集；

使用大模型模拟主动学习的过程：

1. 大模型对Raw data做检测，初步形成训练集(内部可能有错误标注)

2. 使用置信学习，对1中的训练集进行进一步处理形成最终训练集(错误标注大大降低)

关于置信学习，参考
https://zhuanlan.zhihu.com/p/394985481
https://github.com/cleanlab/cleanlab

此方法，几乎不需要人工参与，达到了半监督学习的效果，可大量自动化生成训练数据

蒸馏：利用交通大模型(推理成本高、速度慢) 生成小模型(推理成本低、速度快) ；类似老师(大模型)教学生(小模型)

混合位置蒸馏：小模型的学习目标不只是logits特征，还包括了卷积特征；理论上蒸馏效果更好

混合架构蒸馏：大模型和小模型的结构不同，比如用transformer架构训练的大模型，蒸馏到纯CNN架构的小模型，或蒸馏到同时包含transformer、CNN架构的小模型；

预训练蒸馏：指使用已经训练好的模型蒸馏小模型

训练时蒸馏：相对预训练蒸馏而言，训练时蒸馏指同时训练大模型和小模型，可以让小模型学习到大模型的动态能力

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/花生_TL007/article/detail/454221