赞
踩
本文通过拆解特征学习和分类器训练得出, Instance-sampling能学习到足够好的特征, 我们只需对分类器进行一些处理, 就能得到更好的处理结果.
针对长短尾的数据, 我们常用重采样的方式来应对, 一般的采样方式可以表述为如下的形式:
p
j
=
n
j
q
∑
i
=
1
C
n
i
q
,
j
=
1
,
2
,
⋯
,
C
p_j = \frac{n_j^q}{\sum_{i=1}^C n_i^q}, \quad j = 1,2,\cdots, C
pj=∑i=1Cniqnjq,j=1,2,⋯,C
其中
p
j
p_j
pj是采样第
j
j
j类的概率,
n
j
n_j
nj是第
j
j
j的训练数据的数目, 共有
C
C
C类.
通过指定不同的
q
∈
[
0
,
1
]
q \in [0, 1]
q∈[0,1], 有下面的不同采样方式:
分类器作者列举了三种:
注: 这些分类器训练的时候, 也是可以应用re-balance方法的.
注: 按照作者的说明, 看来作者训练encoder的方式就是单纯联合训练, 我以为使用自监督方法.
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。