赞
踩
源码: https://github.com/XavierXiao/Dreambooth-Stable-Diffusion
DreamBooth是Google推出的是一种新的文本到图像个性化扩散模型,只需要几张图片,便可以微调出一个模型,用来实现带有训练图片内容的图像生成。DreamBooth基于Imagen,不开源,无法给广大网友带来福利。
外国网友基于"An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion"实现了相同功能。
根据代码仓库里的guide,准备好少量样本后,RTX3090上训练1个小时,便可以获得非常完美的效果。训练本身很简单,这里不做过多介绍,原理类似 StyleGAN的潜向量的优化方法,只不过改成在text embedding上做。
附几个效果不错的应用例子:
小李cosplay超人
明星半身卡通: 安妮海瑟薇
图片输入卡通生成
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。