赞
踩
无监督表征学习的实例对比(对比学习) → \rightarrow → 无监督域自适应的类别对比
两个主要的相关工作:
L s u p = l ( G ( X s ) , Y s ) (1) \mathcal{L}_{s u p}=l\left(G\left(X_s\right), Y_s\right) \tag{1} Lsup=l(G(Xs),Ys)(1)
L I n f o N C E = ∑ x q ∈ X − log ∑ i = 0 N 1 ( k i ∈ q ) exp ( q ⋅ k i / τ ) ∑ i = 0 N exp ( q ⋅ k i / τ ) (2) \mathcal{L}_{\mathrm{InfoNCE}}=\sum_{x_q \in X}-\log \frac{\sum_{i=0}^N \mathbb{1}\left(k_i \in q\right) \exp \left(q \cdot k_i / \tau\right)}{\sum_{i=0}^N \exp \left(q \cdot k_i / \tau\right)} \tag{2} LInfoNCE=xq∈X∑−log∑i=0Nexp(q⋅ki/τ)∑i=0N1(ki∈q)exp(q⋅ki/τ)(2)
从实例对比学习的角度来研究UDA
定义:
细节:
理论:CaCo可以被建模为期望最大化(EM)的一个例子
数据集 | 类别数 | 样本数 |
---|---|---|
GTA5 | 19 | 24,966 |
Cityscapes | 16 | 2,975+500 |
SYNTHIA | 16 | 9,400 |
任务:GTA5 → \rightarrow →Cityscapes,SYNTHIA → \rightarrow →Cityscapes
目标检测:
任务:Cityscapes
→
\rightarrow
→Foggy Cityscapes,Cityscapes
→
\rightarrow
→BDD-daytime
图像分类:
数据集 | 类别数 | 域 | 样本数 |
---|---|---|---|
VisDA17 | 12 | 源域 | 152,409 |
目标域 | 55,400 | ||
Cityscapes | 16 | Amazon | 2817 |
Webcam | 795 | ||
DSLR | 498 |
任务 | 架构 | 骨干网络 |
---|---|---|
语义分割 | DeepLabV2 | ResNet-101 |
目标检测 | Faster R-CNN | VGG16 |
图像分类 | ResNet101(VisDA17) | |
ResNet50(Office-31) |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。