前言
随着AIGC技术不断发展,以Midjourney为代表的AI绘画工具现已成为创意工作者、设计师和艺术家等必备工具之一。无论你是希望生成抽象艺术还是具体场景,都离不开专业的提示词(prompts)。
目前,相信大家或多或少的使用过至少一款AI绘图工具,但是如何随心所欲生成自己想要的图像,依然是一些同学的挑战。
如何告别随机抽卡,通过Midjourney提示词优化,提升AI绘画出图的质量,帮助我们更精确地控制生成的图像。
知己知彼
想要精准控图,首先需要理解AI绘画的提示词机制
本文以Midjourney提示词为例,提示词(prompts)的作用是向AI提供指令,告诉它你想生成什么样的图像。“提示词” 是我们与生成模型之间的桥梁,它定义了图像的内容、风格和氛围。
提示词可以是简单的一句话,也可以是详细描述,包括颜色、光线、纹理、风格等元素。
提示词的基本结构
提示词由核心主题、修饰词、风格参考以及其他细节组成。
例如:a futuristic city at sunset, in cyberpunk style, neon lights, high detail 日落时分的未来城市,赛博朋克风格,霓虹灯,高细节
在这个提示词中:
核心主题:“未来城市” “futuristic city”修饰词:“日落”、“霓虹灯” “sunset” “neon lights“风格参考:“赛博朋克” “cyberpunk”其他细节(辅助词):“高细节” “high detail“6大关键技巧来助力
关键技巧1:使用更加具体的描述具体描述能够帮助Midjourney更好地理解你想要生成的图像。
详细的提示词,提供给AI更多的信息,使其生成的结果更接近我们的期望。与模糊的描述相比,清晰且具体的语言可以明显提高出图的效果。
示例对比:– 示例1:“a forest” 一片森林– 示例2:“a dense, fog-covered forest in autumn, with tall pine trees and golden leaves on the ground, soft light filtering through the mist”秋天,浓雾笼罩着茂密的森林,地上高大的松树和金色的树叶,柔和的光线透过薄雾
– 从对比可以明显看出,示例2的提示词给出了更加具体的场景描述,包括季节、光线效果和环境氛围,从而生成更加细腻的图像。
关键技巧2:风格与艺术方向的控制除了更加详细描述图像的内容外,还可以在提示词中增加艺术风格来控制生成效果。
Midjourney支持使用特定风格的描述来定义图像的整体审美,如“油画风格”、“霓虹风格”或“未来主义风格”等。你还可以通过参考特定的艺术家风格(如梵高、莫奈等)来影响生成图像的质感和表现形式。
– 提示词中增加特定风格(如艺术家)
示例对比:
– 示例3:“a portrait of a woman” 一个女人的肖像– 示例4:“a portrait of a woman, in the style of Van Gogh” 梵高风格的一幅女子肖像– 从对比可以明显看出,示例4的引入了梵高风格,从而生成具有梵高绘画风格的图像。
– 快去尝试引入不同的艺术风格参考(如巴洛克、超现实主义)让图像的调性更加生动。
关键技巧3:颜色与情感氛围的控制众所周知,色彩和氛围是视觉艺术中至关重要的元素。在提示词中添加颜色、光线和情绪的描述,可以帮助AI更好地把握图像的整体基调,显著影响生成图像的情感和视觉冲击力。
示例对比:
– 示例5:“a calm beach at sunrise, with pastel pink and orange sky, soft golden light on the sand” 日出时平静的海滩,淡粉色和橙色的天空,柔和的金光洒在沙滩上(这种描述会产生柔和、温暖的氛围)– 示例6:“a dark, eerie forest at night, with cold blue moonlight and deep shadows” 夜晚一片黑暗、怪异的森林,有着冰冷的蓝色月光和深深的阴影 (这种描述能创造出冷色调、神秘的氛围)通过颜色的指引,你可以控制画面的光影效果,使图像在情感表达上更加契合你的创作意图。
关键技巧4:结合图片参考(垫图)Midjourney允许用户上传图片作为“参考图像”,这对于生成与特定风格或场景一致的图像尤为有效。我们可以通过图片参考来更好地控制AI的输出,尤其是希望生成的图像与现有作品保持风格一致时,垫图非常好用。示例对比:
– 示例7:“an epic battle scene” 史诗般的战斗场面
添加参考图:参考图来源网络,仅做案例展示,版权归原作者所有
– 示例8:“URL1 an epic battle scene” 垫图+史诗般的战斗场面
– 示例9:“URL1 an epic battle scene –iw 1.5” 垫图+史诗般的战斗场面 权重1.5– 通过上传现有作品(意向图),获取图片链接进行垫图,并使用”–iw”参数来控制图片参考权重,来控制生成图片的效果。可以看出,权重越高,生成的图像越接近参考图。
– 提示词与图片参考(垫图)结合使用,可以帮助AI生成与垫图风格更相似的风格和结构。
关键技巧5:处理复杂场景与多角色生成包含多个角色或复杂场景的图像时,提示语的“层次结构”和描述顺序尤为重要。如果提示词过于杂乱或模糊,AI可能无法区分不同角色或元素。
通过合理分段和细致描述,可以有效避免生成图像中的元素彼此混淆。
示例:
– 示例10:中世纪战斗场景
初始提示语:”a knight and a dragon fighting in front of a castle” 一个骑士和一条龙在城堡前战斗
虽然这条提示词描述了核心场景,但它可能会让Midjourney难以区分出细节或正确安排画面中的元素。生成结果可能会出现骑士和龙的比例不对,甚至画面氛围不足。优化后的提示语:“a medieval knight in shining armor, standing with a sword raised, fighting a large fire-breathing dragon in a dynamic pose. Behind them is a tall stone castle, with mountains and a sunset sky in the background” 一位身穿闪亮盔甲的中世纪骑士,举剑站立,以一种动感的姿势与一条巨大的喷火龙搏斗。他们身后是一座高大的石头城堡,背景是山脉和日落的天空
优化分析:先描述骑士,明确他的姿势、装备和位置(站立、举剑)。
再描述龙,突出其大小、动作(如喷火)和与骑士的关系(战斗状态)。
最后描述场景背景,增加城堡、山脉、天空等环境信息,帮助生成图像有层次感。
通过这种分阶段的提示词,Midjourney能够更好地理解角色的关系和场景细节,生成的图像会更有条理。
– 示例11:城市街头与多角色初始提示词:”a crowded street with people walking, neon signs, and futuristic buildings” 熙熙攘攘的街道上到处都是行人,霓虹灯和未来主义建筑
这条提示词虽然描述了城市场景,但可能会生成一个模糊的画面,角色之间可能会缺乏清晰度,背景和角色也容易混淆。
优化后的提示词:”a bustling futuristic city street at night, with neon signs illuminating the scene. In the foreground, a young woman in a leather jacket is walking confidently, while behind her, a group of people in suits are standing under a glowing billboard. The street is filled with pedestrians and flying cars in the background, with towering skyscrapers and bright lights filling the skyline” 夜晚熙熙攘攘的未来主义城市街道,霓虹灯照亮了整个场景。在前景中,一位穿着皮夹克的年轻女子自信地走着,而在她身后,一群西装革履的人站在一块发光的广告牌下。街道上到处都是行人和飞行汽车,高耸的摩天大楼和明亮的灯光点缀着天际线
优化分析:
先描绘主要人物,如年轻女子的外貌、服装和姿势,放置在画面的前景。
然后介绍次要角色,如一群穿西装的人,描述他们的相对位置和活动。
补充场景背景,如飞行汽车、霓虹灯、摩天大楼等,确保细节丰富而不凌乱。
通过对前景、人物、背景进行清晰描述,Midjourney会更容易处理复杂场景,并且生成图像时元素之间不会相互遮挡。
关键技巧6:避免常见问题AI生成图像时,常见的问题包括角色细节失真(特别是手部和面部)、场景布局混乱、以及提示词的误解。通过优化提示词,可以有效减少这些问题的发生。
示例:
– 示例12:手部生成问题AI生成手部时常常出错,生成不符合生理结构的手指。为此,提示词需要特别清晰地描述手的姿势和细节。
初始提示词:”a person holding a sword” 拿着剑的人可能的生成问题:手指过多或形状奇怪,持剑的姿势不自然。
优化后的提示词:“a warrior holding a sword firmly in one hand, with fingers wrapped tightly around the hilt, showing clear and defined knuckles, the other hand resting on their side” 一名战士一只手握剑,手指紧紧地包裹在剑柄上,显示出清晰而明确的指关节,另一只手放在身体两侧优化分析:具体描述手部的动作,例如“紧握剑柄”、“手指缠绕”。
提到“清晰可见的指节”帮助Midjourney生成自然的手部细节。
将另一只手的姿势也具体描述,以避免手部姿态模糊。
– 示例13:场景错乱当提示词没有足够清晰地描述场景和角色的关系时,AI可能会生成模糊不清或逻辑错乱的图像。
初始提示词:”a girl standing next to a horse, in a forest” 森林里,一个女孩站在一匹马旁边生成的问题可能是:女孩和马的位置随机,背景的森林随机。
优化后的提示词:“a young girl with long blonde hair, standing to the left of a large brown horse. The girl’s hand is gently resting on the horse’s side. Behind them is a dense green forest with sunlight streaming through the trees” 一个金发女孩,站在一匹棕色大马的左边。女孩的手轻轻地放在马身上。她们身后是一片茂密的绿色森林,阳光透过树木照射进来优化分析:明确女孩和马的相对位置,特别是“左边”的定位词。
详细描述手的动作“轻轻放在马的身侧”,使Midjourney可以更好处理人与动物的互动。
补充背景细节,尤其是“阳光穿透树梢”帮助提升场景的氛围感。
通过这些精确的描述,Midjourney可以更有效地理解提示语,并生成更符合预期的图像。
实践案例
实践案例:优化提示词的具体流程
通过前面关键技巧,来实践一下优化流程:– 初始提示词:”a cat in a city” 城市中的一只猫– 优化提示词:”a black cat with green eyes, sitting on a cobblestone street at night, with neon signs reflecting in puddles, cyberpunk style” 一只绿眼睛的黑猫,夜晚坐在鹅卵石街道上,霓虹灯标志反射在水坑里,赛博朋克风格通过添加具体的细节(如猫的颜色、眼睛、街道类型、光线效果和风格),我们显著提升了生成图像的复杂性和视觉效果。
结语
提示词优化是一个不断学习和实践的过程,随着Midjourney模型的更新和完善,我们将能够获得越来越精确和个性化的生成结果。
V7版本即将发布,可能引入更多的细化控制选项,让创作更加自由和灵活。通过学习提示词优化技巧,不仅能帮助我们更好地随心掌控生成图像,并在探索中通过Midjourney释放出巨大创意潜力。
看百遍,不如做一遍,操练起来,让我们都能轻松掌握精确、具体的提示词生成高质量图像,进一步提升作品水平。
END
分享各类有用有趣的设计学习技巧AI绘画学习分享欢迎关注我的公众号欢迎交流,一起成长如果对你有用,动动小手,为我点亮再看/点赞