为了让你快速上手从 0 到 1 的绘图流程,在这篇文章中,我们将重点讲解 Prompt 提示词。

1、解析提示词的概念

在深入讲解之前,我们首先来了解一些基本概念,以便更好地学习和理解。

提示词,也就是 Prompt,主要是指用户输入的文本或图像信息,其目的是为了引导模型根据特定需求生成相应的作品。简单来说,就是用来告诉 AI 我们想要创作什么样的图片,这可以被理解为一种与 AI 沟通的特定格式的语言。

在之前的文章中,我们介绍了 SD 的「文生图」和「图生图」两种功能。

「文生图」主要通过文字与 AI 模型沟通,而这就需要使用到我们的提示词。

1726485481170.jpg

「图生图」则是通过图片来传递信息给 AI 模型,这里同样会用到提示词。

1726485481335.jpg

提示词在 AI 绘图中的应用范围非常广泛,包括但不限于图片的主题、风格、场景、人物特征、服装特点和其他额外参数等。

有时候为了生成一幅图片,我们可能需要用到十几行的提示词。事实上,许多提示词都是固定和规律的。

描述越详细,提示词就越长,AI 模型就能更精确地输出与我们需求一致的作品。

2、分类与书写提示词

那么,我们该如何书写提示词呢?

书写提示词其实没有严格的限制,不管你输入什么,AI 都会尝试为你生成一幅图片。但如果你想让 AI 更准确地理解你的需求,那么掌握基本的语法和规则是非常必要的。

以 SD 为例,在「文生图」操作中,你会看到输入「正向提示词」和「反向提示词」的区域。

1726485481524.jpg

首先,提示词仅支持英文输入。如果你的英语水平尚可,你可以直接输入英文;否则,你可以借助翻译工具。

其次,提示词应以词组为基本单位,各个词组之间用英文逗号「,」分隔。

例如,如果你想要 AI 为你生成「一个又高又瘦的女生和一杯又浓又香的咖啡」的图片,你可以将其拆分为以下词组:「女生, 高, 瘦, 咖啡, 浓, 香」。

1726485481674.jpg

这样,AI 就能更好地理解你想要生成什么样的图片,甚至比口头描述更加精准。

根据以上提示词,你可以尝试直接生成图片。可能结果会符合你的期望,但也可能会出现一些奇怪的效果。这是因为 AI 在处理时具有一定的「随机性」,每次生成的图片都不会完全相同。

1726485481828.jpg

例如,「一个又高又瘦的女生,和一杯又浓又香的咖啡」这个描述其实非常抽象和简短。这个女孩是学生还是上班族?时间是白天还是夜晚?场景是在咖啡店还是在家里?这些都是 AI 无法从简短的描述中得知的信息。

因此,如果提示词过于抽象和笼统,AI 就只能根据自己的理解随机生成一幅图片。

实际上,一个完整的提示词通常是通过不断与 AI 调试、逐步细化和微调而成的。

那么在提示词的基础上我们还需要添加哪些内容呢?

我们可以将其简单概括为以下几大类,以方便你在微调关键词和补充细节时,能够迅速找到合适的词组,从而快速生成你想要的作品。

主要包括五类:人物特征提示词、环境提示词、场景提示词、视角提示词、画质提示词。

1726485481988.jpg

例如,我们可以将前面的提示词进一步细化和补充,形成一组标准化的提示词,以便更好地引导 AI 生成高质量的图片。参考如下:

1 girl, high, thin, coffee, thick, fragrant,

white dress, blonde hair, long hair, smiling, beautiful, happy, outdoor, day, sunlight, blue sky, close-up,

best quality, ultra detailed, masterpiece, 8k, extremely detailed CG unity 8k wallpaper,

painting, illustration, anime, game cg,

这种标准化的提示词可以使我们的图像更加细致和丰富。

使用这些标准化提示词后,是否感觉图像的质感和细节更加丰富了?

1726485482159.jpg

至此,我们实际上已经很清楚地了解了如何从零开始编写提示词。提示词的结构已经为你清晰地划分出来。

1726485482313.jpg

如果想要让AI更准确地理解提示词,内容应该既丰富又有明确的标准。

另外,我还为你提供了一个如何书写提示词的模板。点击下方链接并关注我们的公众号后,在后台回复「提示词模板」即可获得。

提示词的词组化结构在微调时非常方便,不需要重新组织整个语句,只需直接修改对应的词组即可,图像也会根据这些修改进行相应的变化。

3、提示词权重与负面提示词介绍

你可能已经注意到,我们的提示词中有些是带有特定的符号,如 ( ) 或 { } 。这些符号代表什么含义呢?这正是本节要讲的「提示词权重」。

1726485482448.jpg

在现实场景中,当你在书写描述时,可能会有多个描述词组。例如,你可能描述了头发的长度(long hair)、衣服的颜色(white dress)以及面部表情(smiling)。但AI可能并不总是能够准确地识别所有的描述。

1726485482603.jpg

对于这种情况,我们可以通过调整权重来强调某个词组的重要性,使其在图像中更加突出。增加权重主要有两种方法:一种是使用括号,另一种是使用数字权重。

1726485482734.jpg

经过权重调整后的图像,是否感觉加权的提示词更加突出了?

1726485482892.jpg

当你发现某些描述没有被AI准确地反映在图像中时,你就可以考虑「增加提示词权重」来强调它们的重要性。

但是,请注意不要将权重设置得过高,这可能导致图像内容严重失真。

一般来说,提示词权重的安全范围为0.5至1.5。如果某个词组的权重超出这个范围,生成的图像可能会出现扭曲。

至于「负面提示词」,它主要用于指定我们不希望在图像中出现的元素。反向提示词可以为空,但通常,为了标准化图片,我们会选择加入一些常见的词组。

为了更方便地输入提示词,我们推荐使用如下插件:

插件地址:

https://github.com/Physton/sd-webui-prompt-all-in-one.git

安装该插件后,你将在提示词页面看到新增的功能。

1726485483051.jpg

4、AI 绘图必备提示词工具

许多在线工具可以帮助你编写提示词。例如:

– https://ai.dawnmark.cn/- https://civitai.com/images- https://openart.ai/discovery

这些工具的使用方法非常简单,你只需选择相应的参数和风格,然后复制生成的提示词到SD中。

5、AI 绘图工具:ChatGPT DALL·E 3与 Midjourney比较

在 AI 绘图领域,ChatGPT 的 DALL·E 3 和 Midjourney 无疑是两大巨头。而对于很多用户来说,了解它们之间的不同可能会影响其选择。以下是两者的详细比较。

1726485483202.jpg

1. 功能性与易用性:

– ChatGPT 的 DALL·E 3:DALL·E 3 的最大优势在于其与 ChatGPT 的无缝集成。用户只需通过文本聊天框提供指示,即可生成所需的图像。这种自然语言处理方式使得使用起来非常直观和简单,无需复杂的界面和操作。

– Midjourney:虽然 Midjourney 也为用户提供了直观的界面,但其更偏向于专业用户,可能需要更多的学习和适应。

2. 图像质量与创意性:

– ChatGPT 的 DALL·E 3:DALL·E 3 生成的图像细节丰富,能够准确捕捉到用户的意图并将其转化为有趣的图像创意。它的技术使其在理解复杂的描述和生成相应图像方面表现出色。

– Midjourney:Midjourney 在艺术效果和专业质量方面表现出众,更适用于需要高水平审美和专业领域的场景。

3. 适用领域:

– ChatGPT 的 DALL·E 3:由于其易用性和广泛的应用范围,DALL·E 3 更适合日常用户和非专业人士,例如内容创作者、博主和设计爱好者。

– Midjourney:由于其艺术性和专业性,Midjourney 更适合设计师、艺术家和专业团队使用,特别是在需要高质量输出的项目中。

4. 开放性与集成:

– ChatGPT 的 DALL·E 3:由于是 OpenAI 的产品,DALL·E 3 有可能与 OpenAI 的其他产品进行集成,这为未来的发展和扩展提供了更多的可能性。

– Midjourney:作为一个独立的平台,Midjourney 在与其他系统集成时可能需要更多的工作和调整。

总结,选择 ChatGPT 的 DALL·E 3 还是 Midjourney 主要取决于个人或团队的需求。对于那些需要快速、简单的图像生成的人,DALL·E 3 可能是更好的选择。而对于那些追求专业质量和艺术效果的人,Midjourney 可能更具吸引力。

Leave a Reply

Your email address will not be published. Required fields are marked *