当前位置:   article > 正文

Gumbel-Softmax trick_gumbel_softmax和softmax的区别

gumbel_softmax和softmax的区别

Gumbel-Softmax 是一种可导采样技巧,它可以用来对离散分布进行重参数采样。与softmax区别是,gumbel-softmax得到得是样本(即采样,对于神经网络,离散输入常转化为one-hot形式,采样出来的样本是经soft后one-hot向量 [ x 1 , x 2 , . . . , x n ] [x_1,x_2,...,x_n] [x1,x2,...,xn]),而softmax得到是样本得均值(即各分类概率, [ p 1 , p 2 , . . . , p n ] [p_1,p_2,...,p_n] [p1,p2,...,pn])。
假设每个类别得概率是 p 1 p_1 p1, p 2 p_2 p2,…, p k p_k pk, 那么下述过程提供了一种依概率采样类别的方案,称为Gumbel Max:
arg max ⁡ i [ l o g p 1 − l o g ( − l o g ϵ 1 ) ,   l o g p 2 − l o g ( − l o g ϵ 2 ) ,   . . . ,   l o g p k − l o g ( − l o g ϵ k ) ] , ϵ

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/78611
推荐阅读
相关标签
  

闽ICP备14008679号