当前位置:   article > 正文

粗读Zero-Shot Text-to-Image Generation

zero-shot text-to-image generation

        云里雾里的文章,没看懂,方向和我的方向不同就算了,作者写得也感觉有点乱。

        第一阶段是用dEVA编码器把图像编码为32*32的图像标记(iamge tokens)

        第二步用dEVA解码器把标记还原为图像。

        最后用transformer计算图像和token之间的关联度,找出关联度最大的。之后,将读入的文字转为token,就能解码出图像。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/721302
推荐阅读
相关标签
  

闽ICP备14008679号