赞
踩
为了让你快速上手从 0 到 1 的绘图流程,在这篇文章中,我们将重点讲解 Prompt 提示词。
1、解析提示词的概念
在深入讲解之前,我们首先来了解一些基本概念,以便更好地学习和理解。
提示词,也就是 Prompt,主要是指用户输入的文本或图像信息,其目的是为了引导模型根据特定需求生成相应的作品。简单来说,就是用来告诉 AI 我们想要创作什么样的图片,这可以被理解为一种与 AI 沟通的特定格式的语言。
在之前的文章中,我们介绍了 SD 的「文生图」和「图生图」两种功能。
「文生图」主要通过文字与 AI 模型沟通,而这就需要使用到我们的提示词。
「图生图」则是通过图片来传递信息给 AI 模型,这里同样会用到提示词。
提示词在 AI 绘图中的应用范围非常广泛,包括但不限于图片的主题、风格、场景、人物特征、服装特点和其他额外参数等。
有时候为了生成一幅图片,我们可能需要用到十几行的提示词。事实上,许多提示词都是固定和规律的。
描述越详细,提示词就越长,AI 模型就能更精确地输出与我们需求一致的作品。
2、分类与书写提示词
那么,我们该如何书写提示词呢?
书写提示词其实没有严格的限制,不管你输入什么,AI 都会尝试为你生成一幅图片。但如果你想让 AI 更准确地理解你的需求,那么掌握基本的语法和规则是非常必要的。
以 SD 为例,在「文生图」操作中,你会看到输入「正向提示词」和「反向提示词」的区域。
首先,提示词仅支持英文输入。如果你的英语水平尚可,你可以直接输入英文;否则,你可以借助翻译工具。
其次,提示词应以词组为基本单位,各个词组之间用英文逗号「,」分隔。
例如,如果你想要 AI 为你生成「一个又高又瘦的女生和一杯又浓又香的咖啡」的图片,你可以将其拆分为以下词组:「女生, 高, 瘦, 咖啡, 浓, 香」。
这样,AI 就能更好地理解你想要生成什么样的图片,甚至比口头描述更加精准。
根据以上提示词,你可以尝试直接生成图片。可能结果会符合你的期望,但也可能会出现一些奇怪的效果。这是因为 AI 在处理时具有一定的「随机性」,每次生成的图片都不会完全相同。
例如,「一个又高又瘦的女生,和一杯又浓又香的咖啡」这个描述其实非常抽象和简短。这个女孩是学生还是上班族?时间是白天还是夜晚?场景是在咖啡店还是在家里?这些都是 AI 无法从简短的描述中得知的信息。
因此,如果提示词过于抽象和笼统,AI 就只能根据自己的理解随机生成一幅图片。
实际上,一个完整的提示词通常是通过不断与 AI 调试、逐步细化和微调而成的。
那么在提示词的基础上我们还需要添加哪些内容呢?
我们可以将其简单概括为以下几大类,以方便你在微调关键词和补充细节时,能够迅速找到合适的词组,从而快速生成你想要的作品。
主要包括五类:人物特征提示词、环境提示词、场景提示词、视角提示词、画质提示词。
例如,我们可以将前面的提示词进一步细化和补充,形成一组标准化的提示词,以便更好地引导 AI 生成高质量的图片。参考如下:
这种标准化的提示词可以使我们的图像更加细致和丰富。
使用这些标准化提示词后,是否感觉图像的质感和细节更加丰富了?
至此,我们实际上已经很清楚地了解了如何从零开始编写提示词。提示词的结构已经为你清晰地划分出来。
如果想要让AI更准确地理解提示词,内容应该既丰富又有明确的标准。
另外,我还为你提供了一个如何书写提示词的模板。点击下方链接并关注我们的公众号后,在后台回复「提示词模板」即可获得。
提示词的词组化结构在微调时非常方便,不需要重新组织整个语句,只需直接修改对应的词组即可,图像也会根据这些修改进行相应的变化。
3、提示词权重与负面提示词介绍
你可能已经注意到,我们的提示词中有些是带有特定的符号,如 ( ) 或 { } 。这些符号代表什么含义呢?这正是本节要讲的「提示词权重」。
在现实场景中,当你在书写描述时,可能会有多个描述词组。例如,你可能描述了头发的长度(long hair)、衣服的颜色(white dress)以及面部表情(smiling)。但AI可能并不总是能够准确地识别所有的描述。
对于这种情况,我们可以通过调整权重来强调某个词组的重要性,使其在图像中更加突出。增加权重主要有两种方法:一种是使用括号,另一种是使用数字权重。
经过权重调整后的图像,是否感觉加权的提示词更加突出了?
当你发现某些描述没有被AI准确地反映在图像中时,你就可以考虑「增加提示词权重」来强调它们的重要性。
但是,请注意不要将权重设置得过高,这可能导致图像内容严重失真。
一般来说,提示词权重的安全范围为0.5至1.5。如果某个词组的权重超出这个范围,生成的图像可能会出现扭曲。
至于「负面提示词」,它主要用于指定我们不希望在图像中出现的元素。反向提示词可以为空,但通常,为了标准化图片,我们会选择加入一些常见的词组。
为了更方便地输入提示词,我们推荐使用如下插件:
插件地址:
安装该插件后,你将在提示词页面看到新增的功能。
4、AI 绘图必备提示词工具
许多在线工具可以帮助你编写提示词。例如:
这些工具的使用方法非常简单,你只需选择相应的参数和风格,然后复制生成的提示词到SD中。
5、AI 绘图工具:ChatGPT DALL·E 3与 Midjourney比较
在 AI 绘图领域,ChatGPT 的 DALL·E 3 和 Midjourney 无疑是两大巨头。而对于很多用户来说,了解它们之间的不同可能会影响其选择。以下是两者的详细比较。
1. 功能性与易用性:
- ChatGPT 的 DALL·E 3:DALL·E 3 的最大优势在于其与 ChatGPT 的无缝集成。用户只需通过文本聊天框提供指示,即可生成所需的图像。这种自然语言处理方式使得使用起来非常直观和简单,无需复杂的界面和操作。
- Midjourney:虽然 Midjourney 也为用户提供了直观的界面,但其更偏向于专业用户,可能需要更多的学习和适应。
2. 图像质量与创意性:
- ChatGPT 的 DALL·E 3:DALL·E 3 生成的图像细节丰富,能够准确捕捉到用户的意图并将其转化为有趣的图像创意。它的技术使其在理解复杂的描述和生成相应图像方面表现出色。
- Midjourney:Midjourney 在艺术效果和专业质量方面表现出众,更适用于需要高水平审美和专业领域的场景。
3. 适用领域:
- ChatGPT 的 DALL·E 3:由于其易用性和广泛的应用范围,DALL·E 3 更适合日常用户和非专业人士,例如内容创作者、博主和设计爱好者。
- Midjourney:由于其艺术性和专业性,Midjourney 更适合设计师、艺术家和专业团队使用,特别是在需要高质量输出的项目中。
4. 开放性与集成:
- ChatGPT 的 DALL·E 3:由于是 OpenAI 的产品,DALL·E 3 有可能与 OpenAI 的其他产品进行集成,这为未来的发展和扩展提供了更多的可能性。
- Midjourney:作为一个独立的平台,Midjourney 在与其他系统集成时可能需要更多的工作和调整。
总结,选择 ChatGPT 的 DALL·E 3 还是 Midjourney 主要取决于个人或团队的需求。对于那些需要快速、简单的图像生成的人,DALL·E 3 可能是更好的选择。而对于那些追求专业质量和艺术效果的人,Midjourney 可能更具吸引力。
如果你觉得这些内容对你有所帮助,请分享给你的朋友。如果你需要更多的资料,可以扫描下方的二维码加我为微信好友(chatgptplus2023)。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。