搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Li_阴宅
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
alarm唤醒系统过程分析_wakealarm编写
2
ISE14.7逻辑综合与实现工作过程_ise综合电路一长串
3
springboot3整合SpringSecurity实现登录校验与权限认证(万字超详细讲解)_springboot security
4
手把手教你监控canal高可用集群的同步进度附实现思路、实现过程和相关的脚本_canal 同步异常监控
5
云计算(03)——命令行基础、mount挂载、目录及文件管理、新建、复制、删除、移动_mount 目录
6
MT6816磁编码IC在工控机器人中的应用
7
如何看懂现货黄金日k线图_怎么看现货k线走势图
8
Verilog FPGA实现除法——整除与四舍五入_fpga做除法运算 四舍五入
9
用户权限管理模块的数据库设计_wpf prism 用户权限设计
10
mysql编写函数_mysql函数编写
当前位置:
article
> 正文
迁移学习 --- 元学习_元迁移学习
作者:Li_阴宅 | 2024-07-17 13:22:49
赞
踩
元迁移学习
C. 人工智能 — 迁移学习 - 元学习
概述
概念
Learn to learn
本质上,就是输入训练资料,生成一个 目标函数
也可以说是Domain Adaptation
问题
Too many tasks to learn, to learn more efficiently
Faster learning methods
Better hyper-parameter/learning algorithms
Related to:
transfer learning
domain adaptation
multi-task learning
life-long learning
…
Too little data, to fit more accurately - few-slot learning
Traditional supervised may not work(容易过拟合)
步骤
定义一组学习算法,学习不同的component,需要不同的方法
Net Architecture
Initial Prameters
Learning Rate
…
定义loss函数
数据
需要的是一组的训练任务(任务里面包含训练数据和测试数据)
训练任务和测试任务,需要有差别
不同的任务的loss相加,作为最终的Loss
寻找最优的函数
与机器学习对比
相同点
会有过拟合问题
增加训练任务来提升效果
Task augmentation:扩充任务
同样需要调参
Development task(验证任务?)
不同点
机器学习:within-task
元学习:accross-task
与Pre-training相比
相同点
都是预先训练好之后,再调参
不同点
标注资料
MAML:用到了
Pre-training:没有用到
将多个任务资料倒在一起训练找到一组好的初始化参数(multi-task learning),通常将预训练得到的模型准确率作为MAML的baseline。
分类
Model Parameters(Few-slot framework)
Initializations
Embeddings/Representations/Metrics
Optimizers
Reinforcement learning(Policies/ other settings)
Hyperparameters(e.g. AutoML)
Hyperparameters search
Network architectures -> Network architecture search(NAS)(related to: evolutional strategy, genetic algorithm…)
Others
Algorithm itself(literally, not a network)
算法
Black-box((memory)Model)based
MANN
SNAIL
MetaNet
Optimization(gradient)based(Parametric)
learn to initialize
MAML
目标
针对神经网络的参数初始化。之前的参数初始化,都是随机的(或者通过特定的分布)
评估
评估的标准不是初始参数的好坏,而是通过初始参数训练之后的结果的好坏
因为期间涉及到 local point、global point、鞍点 等
评估的时候,拿的是一次迭代之后的结果评估
Train的时候,是一次迭代
效率
防止过拟合
Test的时候,可以多次迭代
优化算法
Meta-SGD
优化learning rate
MAML++
AlphaMAML
DEML
CAVIA
ANIL
Reptile:源自MAML
参数的梯度方向,跟MAML不一样
learn to Optimizer
优化器中的参数也可以通过Meta Learning学出来,比如学习率等。
这里有一篇关于Meta Learning根据训练任务自动学习Optimizer的文章,训练方式类似于训练一个LSTM。利用学习到的学习率比直接手调的效果要好一些。这篇文章最后还给出测试任务对应网络结构改变或者激活函数改变,会对最后结果产生不同程度的影响。
网络结构优化(Network Architecture Search/NAS)
Reinforcement Learning
Evolution Algorithm
Data Augmentation
数据处理的方式也是可以通过Meta Learning学出来的。比如数据增强的过程,可以通过学习的方式学出来
Sample Reweighting
另外还可以给不同的sample(样本)在训练时赋予不同的权重(weight)
其他
Meta-LSTM
different meta-parameters
iMAML
R2-D2/LR-D2
ALPaCA
MetaOptNet
Bayesian meta-learning
应用场景
Uncertainty problems
算法
Black-box
VERSA
Optimization
PLATIPUS
Bayesian MAML(BMAML)
Probabilistic MAML(PMAML)
Non-parametric(Metric based)Learn to compare
上面的方法都是基于Gradient Descent(梯度下降),有没有一种可能,给训练资料,然后直接输出网络参数,目前也有人在做相关的研究
我们所有模型建立的过程都是,先利用Learning Algorithm学出一个模型,然后用训练得到的模型经过测试集得到分类结果。有没有一种可能,就是直接将训练资料和验证资料都扔给一个Function,就可以直接根据验证资料输出对应的结果。这种方法叫做Learning to compare(Metric-based Approach)
Face Verification(脸部验证)(二分类?)
Siamese Network
训练任务
输入 训练图片 和 测试图片,输出是不是同一个人
测试任务
需要跟 训练任务 不一样(图片在训练中不一样)
处理
通过CNN,计算每张图片的 embedding,看两个 embeddings 的相似度
跟 AutoEncoder的不一样
相同的人,分数尽可能的相近,不相同的人,分数尽可能远
5-ways 1-shot
Prototypical Network
训练任务
N分类问题
处理
通过CNN,计算每张图片的 embedding,看两个 embeddings 的相似度
计算 testing data 和 训练数据的每个类的 embeddings的相似度
通过softmax分类
Matching Network
训练任务
N分类问题
处理
通过Bidirectional LSTM,计算每张图片的 embedding,看两个 embeddings 的相似度
计算 testing data 和 训练数据的每个类的 embeddings的相似度
通过softmax分类
Relation Network
训练任务
N分类问题
处理
计算每张图片的 embedding,看两个 embeddings 的相似度
把测试图片的embedding 接到 训练图片的 embedding 后面
在通过另外一个 神经网络 学习
General neural network
输入
图片
图片对应的类别
处理
图片通过CNN生成 embedding
类别用one-hot编码
embedding和类别编码 拼接成一个向量
通过 LSTM 训练预测分类
直接使用LSTM没有效果,通过 MANN(Neural Turing Machine)、SNAIL(Using Attention) 可以
其他
IMP
Hybrid
跟机器学习相关的技术
Reinforcement learning
Meta-RL is a massive active research area
GNN & Adversarial attack
Metric-based, feature extraction
Attack on GNN by meta learning
GAN:metaGAN
Transfer learning:Meta-transfer Learning(MTL)
应用场景
Few-shot Image
难点
Each class only has a few images
思路
N-ways K-shot classification
通过 Generator 生成新的图片
Meta Learning还可以应用于其他任务中,比如语音辨识、文本分类等等
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Li_阴宅/article/detail/840136
推荐阅读
article
cmake
编译
opencv
的
cuda
库的注意事项_
cmake
编译
opencv
cuda
...
cmake
编译
opencv
的
cuda
库注意事项,版本:
cuda
8.0.60+
opencv
3.4.16+vs2013+wi...
赞
踩
article
AI
写
SQL
真的靠谱吗?
腾讯
游戏
在
AI
+
湖仓
一体的实践_ai写
sql
真的靠谱吗...
作者:
腾讯
游戏
数据技术负责人 刘岩
腾讯
游戏
是全球领先的
游戏
开发和运营商,其数据团队拥有十余年、700+ 款大型
游戏
的数据...
赞
踩
article
OSPF
注意事项
、
学习
要点
及其总结...
OSPF
注意事项
、
学习
要点
及其总结 转载于:https://blog.51cto.com/danet/36469...
赞
踩
article
javaWeb
进销存
后台
管理系统
源代码_
进销存
web
源码...
本文详细描述了一套采用SpringMVC、Hibernate等技术开发的在线
进销存
系统,涵盖销售、采购、库存、财务和经营...
赞
踩
article
包
和
模块
...
typora-root-url: ./我的听课笔记,课程链接:https://www.bilibili.com/vide...
赞
踩
article
MySQL
学习篇(四)
数据库
结构
设计
目的
、基本字段
类型
介绍和实战内容_
sql
数据库
设计
目的
...
目录
数据库
优化的
目的
数据库
结构
设计
的步骤
数据库
设计
范式
数据库
第一范式
数据库
第二范式
数据库
第三范式
数据库
设计
的
目的
实战需求...
赞
踩
article
PMP
项目
管理
第六章
:
项目
进度
管理
(5)&核心知识点_一个不可预见
的
事件导致公共工程...
六、控制
进度
Inputs1.
项目
管理
计划
:
进度
管理
计划
进度
基准 范围基准 绩效测量基准2.
项目
文件
:
经验教训登记册 项...
赞
踩
article
十大
开源
测试
工具和
框架
,
一定有你需要
的
_
开源
自动化
测试
框架
...
免费
的
开源
框架
和工具由于其
开源
特性
,
现在逐渐成为
自动化
测试
的
首选解决方案。区别在于
,
你是喜欢使用类库编写一个全新
的
自动化
...
赞
踩
article
开源
要
正式写进法律
了
?_
保护
开源
软件
法案
...
作者 | 何苗 出品 | CSDN(ID:CSDNnews)去年,当大家还在为
开源
的快速发展而欢呼之际,影响
了
全球数百万...
赞
踩
article
c++
生成
随机
字符串
【转】...
转自:
c++
随机
生成
字符串
有数字和字母组成这里的每个数字被选取的几率大于每个字母被选取的几率,但小写字母、大写字母、数...
赞
踩
article
Stable
Diffusion
插件
开发基础讲解_
stable
diffusion
插件
放在哪个文件...
近来
Stable
diffusion
扩散网络大热,跟上时代,简单的文生图,图生图,其实可以满足绝大多数设计师的应用,但是...
赞
踩
article
人工
智能
会话
代理
在
医疗保健
中的有效性:系统
综述
_
智能
代理
在医学的应用文献
综述
...
会话在医疗方面的论文
综述
_
智能
代理
在医学的应用文献
综述
智能
代理
在医学的应用文献
综述
...
赞
踩
article
数据库
报文
解析
最终篇——基于
godlp
的
实际应用,对
mongodb
的
返回
报文
解析
并对内容进行识别
脱敏
...
因为之前redis
的
报文
解析
脱敏
已经用netty做过了,所以从当初决定选用了
godlp
开始就决定要要基于
mongodb
的
...
赞
踩
article
随着
计算机
越来越
多
应用
于
教育,
人机
交互
设备
是人与机器的
交互
接口,
随着
计算机
技术
和通信
技术
的发展,人的...
人机
交互
设备
是人与机器的
交互
接口,
随着
计算机
技术
和通信
技术
的发展,人的
视觉
、
脑电
等生理
信息
越来越
多地
应用
于
人机
交互
技术
,...
赞
踩
article
SQL Server
数据库
设计
_sql
server
java
数据库
设计
...
一、
数据库
设计
的必要性 在实际的软件项目中,如果系统中需要存储的数据量比较大,需要
设计
的表比较多,表与表之间的关系比...
赞
踩
article
工作难找
,
Android
大龄
程序员
出路在哪里?_40岁
android
开发人员
转型...
如今
,
随着科技的不断发展
,
计算机行业成为了一个非常热门的领域。很多人都选择了从事
程序员
这个职业
,
希望通过自己的努力在这个...
赞
踩
article
如何完美解决 org.
springframework
.
http
.
converter
.HttpMess...
在Spring Boot项目中,是一个常见的错误。本博客将详细介绍该错误的原因、解决方案以及最佳实践,帮助开发者在项目中...
赞
踩
article
ofo
的
snapchat
效应:
成功
从
校园
走出去
已
成功
一半...
以阅后即焚功能著称
的
SnapChat
已
向纽交所提交IPO申请,计划以250亿美金
的
估值募资30亿美元,这是2014年阿里...
赞
踩
article
微
服务
架构下
消息
服务
多
通道
设计
思路
_
业务
消息
通道
常见
设计
...
在微
服务
架构软件中,
消息
是极其重要的一部分,一般会独立成一个
服务
,称为 message
服务
。其主要作用就是发送
消息
,并...
赞
踩
article
致
创业
者:你
死
的
太快,是因为做
的
太慢_
说
自己
创业
死
得快...
文|曾响铃 来源|科技向令
说
(xiangling0815)浩浩荡荡
的
创业
大潮中,真正修成正果
的
人少之又少。有数据报告显示...
赞
踩
相关标签
opencv
cuda
opencv_contrib
计算机视觉
人工智能
sql
游戏
数据库
数据仓库
湖仓一体
网络
java
python
编程语言
数据库设计
测试工具
软件测试
自动化测试
前端框架
开源
log4j
c/c++
stable diffusion
ai