粗读Zero-Shot Text-to-Image Generation

作者：weixin_40725706 | 2024-06-15 06:49:09

zero-shot text-to-image generation

云里雾里的文章，没看懂，方向和我的方向不同就算了，作者写得也感觉有点乱。

第一阶段是用dEVA编码器把图像编码为32*32的图像标记(iamge tokens)

第二步用dEVA解码器把标记还原为图像。

最后用transformer计算图像和token之间的关联度，找出关联度最大的。之后，将读入的文字转为token，就能解码出图像。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/721302