赞
踩
对于ai训练来说,处理训练集是模型训练的重要环节。训练集的质量对最终模型的质量影响巨大。这里以二次元角色为例,记录下训练集处理的流程和一些心得。
素材准备有以下几个需要注意的点:
stable diffusion常用的模型是基于SD1.5的,建议尺寸不要高于768,不小于512。尺寸过大对于显存的要求会很高。
素材裁剪可以使用【分割过大的图像】,重叠比例可以适当调高,这样裁剪出来的图像更多,更适合挑选。
素材打标通常是先自动打标,再根据一定的规则进行手动删改。
自动打标可以使用WD1.4反推工具。
简单介绍WD1.4的用法
单次处理和批量处理的原理是一样的。这里主要涉及两个概念,反推模型与阈值。
反推模型:反推模型的作用是将一幅图片的提示词推理出来,推荐反推模型中的wd14-vit-v2-git、wd14-convnextv2-v2-git和wd14-swinv2-v2-git,其中wd14-vit-v2-git最快,wd14-swinv2-v2-git最准确。
阈值:低于阈值则删除这个关键词,三次元建议0.35,二次元动漫人物建议0.5。
自动打标的标签可以直接使用,但是通常我们会基于自身需求对TAG做一些删改。删改的原则如下:
标签编辑器如上图所示。在批量编辑描述中,可以选择特定的TAG进行删除。
比如这次训练的一个角色,我将她的固有特征TAG进行删除,这样就可以让模型学习到这些特征,比如“短发”,“兽耳”,“红眼”。因为这些特征希望生成图片时默认存在。
衣服,动作,表情之类的TAG全部进行了保留,这样用提示词为人物更换衣服,动作,表情效果会更明显。
修改完后点击保存所有更改,并在文件夹中删除所有的过程文件即可。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。