搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Li_阴宅
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【Uniapp软件库源码带社区论坛发帖功能】
2
hadoop安装_hadoop-2.7.3.tar.gz
3
大数据工程师简历_大数据工程师简历专业技能怎么写
4
python ascii码转字符_我用Python库在 控制台 激情演绎 舞曲No body
5
数据仓库(7)数仓规范设计
6
数据治理-从理论到实践(一)_数据治理理论
7
卷积层计算量(FLOPS)和参数量的计算_卷积参数量
8
Chrome-Chrome源码剖析_chrome源码剖析 【序】 && 【一】
9
什么是有限自动机?
10
C++——new关键字_c++ new
当前位置:
article
> 正文
迁移学习 --- 元学习_元迁移学习
作者:Li_阴宅 | 2024-07-17 13:22:49
赞
踩
元迁移学习
C. 人工智能 — 迁移学习 - 元学习
概述
概念
Learn to learn
本质上,就是输入训练资料,生成一个 目标函数
也可以说是Domain Adaptation
问题
Too many tasks to learn, to learn more efficiently
Faster learning methods
Better hyper-parameter/learning algorithms
Related to:
transfer learning
domain adaptation
multi-task learning
life-long learning
…
Too little data, to fit more accurately - few-slot learning
Traditional supervised may not work(容易过拟合)
步骤
定义一组学习算法,学习不同的component,需要不同的方法
Net Architecture
Initial Prameters
Learning Rate
…
定义loss函数
数据
需要的是一组的训练任务(任务里面包含训练数据和测试数据)
训练任务和测试任务,需要有差别
不同的任务的loss相加,作为最终的Loss
寻找最优的函数
与机器学习对比
相同点
会有过拟合问题
增加训练任务来提升效果
Task augmentation:扩充任务
同样需要调参
Development task(验证任务?)
不同点
机器学习:within-task
元学习:accross-task
与Pre-training相比
相同点
都是预先训练好之后,再调参
不同点
标注资料
MAML:用到了
Pre-training:没有用到
将多个任务资料倒在一起训练找到一组好的初始化参数(multi-task learning),通常将预训练得到的模型准确率作为MAML的baseline。
分类
Model Parameters(Few-slot framework)
Initializations
Embeddings/Representations/Metrics
Optimizers
Reinforcement learning(Policies/ other settings)
Hyperparameters(e.g. AutoML)
Hyperparameters search
Network architectures -> Network architecture search(NAS)(related to: evolutional strategy, genetic algorithm…)
Others
Algorithm itself(literally, not a network)
算法
Black-box((memory)Model)based
MANN
SNAIL
MetaNet
Optimization(gradient)based(Parametric)
learn to initialize
MAML
目标
针对神经网络的参数初始化。之前的参数初始化,都是随机的(或者通过特定的分布)
评估
评估的标准不是初始参数的好坏,而是通过初始参数训练之后的结果的好坏
因为期间涉及到 local point、global point、鞍点 等
评估的时候,拿的是一次迭代之后的结果评估
Train的时候,是一次迭代
效率
防止过拟合
Test的时候,可以多次迭代
优化算法
Meta-SGD
优化learning rate
MAML++
AlphaMAML
DEML
CAVIA
ANIL
Reptile:源自MAML
参数的梯度方向,跟MAML不一样
learn to Optimizer
优化器中的参数也可以通过Meta Learning学出来,比如学习率等。
这里有一篇关于Meta Learning根据训练任务自动学习Optimizer的文章,训练方式类似于训练一个LSTM。利用学习到的学习率比直接手调的效果要好一些。这篇文章最后还给出测试任务对应网络结构改变或者激活函数改变,会对最后结果产生不同程度的影响。
网络结构优化(Network Architecture Search/NAS)
Reinforcement Learning
Evolution Algorithm
Data Augmentation
数据处理的方式也是可以通过Meta Learning学出来的。比如数据增强的过程,可以通过学习的方式学出来
Sample Reweighting
另外还可以给不同的sample(样本)在训练时赋予不同的权重(weight)
其他
Meta-LSTM
different meta-parameters
iMAML
R2-D2/LR-D2
ALPaCA
MetaOptNet
Bayesian meta-learning
应用场景
Uncertainty problems
算法
Black-box
VERSA
Optimization
PLATIPUS
Bayesian MAML(BMAML)
Probabilistic MAML(PMAML)
Non-parametric(Metric based)Learn to compare
上面的方法都是基于Gradient Descent(梯度下降),有没有一种可能,给训练资料,然后直接输出网络参数,目前也有人在做相关的研究
我们所有模型建立的过程都是,先利用Learning Algorithm学出一个模型,然后用训练得到的模型经过测试集得到分类结果。有没有一种可能,就是直接将训练资料和验证资料都扔给一个Function,就可以直接根据验证资料输出对应的结果。这种方法叫做Learning to compare(Metric-based Approach)
Face Verification(脸部验证)(二分类?)
Siamese Network
训练任务
输入 训练图片 和 测试图片,输出是不是同一个人
测试任务
需要跟 训练任务 不一样(图片在训练中不一样)
处理
通过CNN,计算每张图片的 embedding,看两个 embeddings 的相似度
跟 AutoEncoder的不一样
相同的人,分数尽可能的相近,不相同的人,分数尽可能远
5-ways 1-shot
Prototypical Network
训练任务
N分类问题
处理
通过CNN,计算每张图片的 embedding,看两个 embeddings 的相似度
计算 testing data 和 训练数据的每个类的 embeddings的相似度
通过softmax分类
Matching Network
训练任务
N分类问题
处理
通过Bidirectional LSTM,计算每张图片的 embedding,看两个 embeddings 的相似度
计算 testing data 和 训练数据的每个类的 embeddings的相似度
通过softmax分类
Relation Network
训练任务
N分类问题
处理
计算每张图片的 embedding,看两个 embeddings 的相似度
把测试图片的embedding 接到 训练图片的 embedding 后面
在通过另外一个 神经网络 学习
General neural network
输入
图片
图片对应的类别
处理
图片通过CNN生成 embedding
类别用one-hot编码
embedding和类别编码 拼接成一个向量
通过 LSTM 训练预测分类
直接使用LSTM没有效果,通过 MANN(Neural Turing Machine)、SNAIL(Using Attention) 可以
其他
IMP
Hybrid
跟机器学习相关的技术
Reinforcement learning
Meta-RL is a massive active research area
GNN & Adversarial attack
Metric-based, feature extraction
Attack on GNN by meta learning
GAN:metaGAN
Transfer learning:Meta-transfer Learning(MTL)
应用场景
Few-shot Image
难点
Each class only has a few images
思路
N-ways K-shot classification
通过 Generator 生成新的图片
Meta Learning还可以应用于其他任务中,比如语音辨识、文本分类等等
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Li_阴宅/article/detail/840136
推荐阅读
article
Layer1
隐私安全项目
Partisia
Blockchain
空投计划邀你瓜分
2500W
枚...
一文解锁
Partisia
空投计划参与方法和详情指南
Layer1
隐私安全项目
Partisia
Blockchain
空...
赞
踩
article
外挂
知识库
的
基本知识
与内容_
kimi
外挂
知识库
...
RAG,即LLM在回答问题或生成文本时,会先从大量文档中检索出相关的信息,然后基于这些信息生成回答或文本,从而提高预测质...
赞
踩
article
Vue
项目
实战 —— 哔哩哔哩移动端开发
,
小型公司
web
开发_
vue
仿哩
布哩布
ai
...
由于篇幅限制
,
pdf文档的详解资料太全面
,
细节内容实在太多啦
,
所以只把部分知识点截图出来粗略的介绍
,
每个小节点里面都有更...
赞
踩
article
AI
智能
时代:
ChatGPT
如何
在
金融
市场发挥策略分析与预测能力?_民生证券
chatgpt
系列报告 ...
本书是一部全面而深入的量化
金融
实战指南,从基础的Python编程和量化
金融
概念出发,逐步引领读者进入
金融
数据分析、量化策...
赞
踩
article
从0
到
1教
你
画
原型
图
_如何
快速
画
原型
图
...
引言相信很多刚入行的产品新人,接
到
的第一项工作任务就是针对公司产品需求
画
一份
原型
图
出来,怎么样才能顺利的完成任务呢?这篇...
赞
踩
article
CobaltStrike
安装_
cobalt
strike安装...
CobaltStrike
是一款渗透测试神器,被业界人称为 CS 神器。
CobaltStrike
分为客户端与服务端,服...
赞
踩
article
钓鱼
攻击
- 基础学习...
钓鱼
攻击
是一种典型的欺诈式
攻击
手段,
攻击
者通过伪装成可以信任的角色,利用电子邮件或其他通信渠道向被
攻击
者发送植入了木马的...
赞
踩
article
NVIDIA
Jetson
Xavier NX 刷机记录(使用
SDK
Manager
方法,并重新安装...
本文章仅适用于使用
SDK
Manager
对
NVIDIA
Jetson
系列的emmc产品进行刷机。_
jetson
...
赞
踩
article
视觉模型对比BaseNet、
Hourglass
、LaneNet、
SCNN
、SAD、Ultra-Fas...
YOLOV3 YOLOV4 CenterNet笔记本 thikpad 960max() X1 1650ti台式机 105...
赞
踩
article
作为
测试
开发岗
的
面试官
,我都是怎么
选
人
的
?_
测试
题 不同
的
候
选
人
怎么
选
...
最近一段时间面试了不少人,主要是一些
测试
开发岗,中高级
的
初级
的
也都有;也有一些偏业务
测试
岗
的
候
选
人
。总结出了一些方法论,...
赞
踩
article
SQL Server
数据库
原理
实验
六 简单
数据库
应用系统
设计
_sql
server
实验
6
数据库
程...
SQL Server
实验
系列
实验
六 简单
数据库
应用系统
设计
与实现
实验
目的:(1)理解并能运用
数据库
设计
的常见步骤来
设计
满...
赞
踩
article
《
华为
数据
之道
》
读书笔记
_
华为
数据
之道
读书心得...
基于统一的
数据
管理规则,确保
数据
源头质量以及
数据
入湖,形成清洁、完整、一致的
数据
湖。业务与
数据
双驱动,加强
数据
联接建设,...
赞
踩
article
链表
基础知识
总结_什么
是
链表
...
链表
和数组作为算法中的两个基本数据结构,在程序设计过程中经常用到。尽管两种结构都可以用来存储一系列的数据,但又各有各的特...
赞
踩
article
linux
常用
命令
_
sshd
服务
状态
命令
...
linux
_
sshd
服务
状态
命令
sshd
服务
状态
命令
1: #实例:递归查找当前文件夹下...
赞
踩
article
Mac
some
iTunes
Converter
for
Mac
(DRM移除和音乐转换器)3.5.0...
iTunes
Converter
for
Mac
是一款非常容易操作实用,具有直观的界面的音乐转换器,
iTunes
Co...
赞
踩
article
ChatGLM
大模型
外挂
(向量)
知识库
_
chatglm
外挂
知识库
...
如果我们想往大模型里边注入知识,最先能想到的就是对大模型进行微调。笔者曾实验过,只用几十万量级的数据对大模型进行微调并不...
赞
踩
article
使用
Spring
Cloud
Stream
和
RabbitMQ
实现事件驱动的微服务_
spring
cl...
这里写自定义目录标题使用
Spring
Cloud
Stream
和
RabbitMQ
实现事件驱动的微服务必要配置配置rabb...
赞
踩
article
搭建个人
知识
管理
库
_个人
知识
数据
库
网站...
今天介绍一下如何搭建个人
知识
管理
库
,个人
知识
管理
库
的重要性就不用多说了。下面介绍如何做:你需要:1、一个 主机空间,支持...
赞
踩
article
OpenVINO
环境搭建_
cmakelist
openvino
...
本文介绍了在Windows环境下搭建
OpenVINO
的步骤,包括下载安装
OpenVINO
、安装Visual Studio...
赞
踩
article
数据结构
——
归并
排序
和
计数
排序
的介绍_
归并
排序
数据结构
rcdtype
为什么
要加一...
本篇文章简单介绍了
归并
排序
和
计数
排序
的实现_
归并
排序
数据结构
rcdtype
为什么
要加一
归并
排序
数据结构
rcdtype
为什...
赞
踩
相关标签
安全
区块链
Partisia
Blockchain
人工智能
前端
vue.js
javascript
chatgpt
java
linux
web安全
网络安全
运维
渗透测试
网络攻防
红队
钓鱼
ubuntu
深度学习
自动驾驶
神经网络
面试
功能测试