关注公众号【真智AI】
TOP AI模型智能问答|绘图|识图|文件分析
每天分享AI教程、赚钱技巧和前沿资讯!
Flux是由AI初创公司Black Forest Labs最近几周发布的人工智能图像生成器,它迅速成为同类中最强大和最受欢迎的工具之一,甚至与市场领导者Midjourney不相上下。与Midjourney不同,后者是一个封闭且付费的服务,仅由Midjourney公司提供,Flux则是一个开源模型,可以下载并在本地或各种平台上运行,如Freepik、NightCafe和Hugging Face。
为了确定Flux是否达到了Midjourney的照片真实感和准确的人物描绘水平,我设计了5个描述性提示,并在两个平台上运行它们。我使用通过Pinokio AI安装程序安装的ComfyUI来生成Flux图像。
创建提示词
Midjourney和Flux都依赖于描述性提示词。为了从模型中获得你想要的效果,最好描述不仅仅是人物,还要包括风格、光照和结构。
1. 厨师在厨房
Midjourney生成的厨师图像
Flux生成的厨师图像
第一个测试结合了生成复杂皮肤纹理和动态环境的需求——即专业厨房。提示要求描绘一位50多岁的女性,正在准备一顿饭。它还要求在背景中展示副厨师,并在“洁白无瑕的双排扣厨师夹克”上显示厨师的名字。
描述如下:
一位50多岁的资深女厨师正忙碌于专业厨房中。她的黑白相间的头发整齐地塞在洁白的厨师帽下,只有几缕发丝从鬓角处逃逸出来。她的脸上带有笑纹,显示出她在用木勺品尝酱汁时的专注神情。她的眼睛是温暖的棕色,稍微眯起,品味着调味。厨师穿着洁白的双排扣厨师夹克,胸前口袋上绣有她的名字。黑白格子裤和防滑木屐完成了她的专业装束。她围裙上五颜六色的酱汁污渍讲述着忙碌服务的故事。身后,厨房一片忙碌的景象。明亮的顶灯下,不锈钢表面闪闪发光,反映出晚餐服务的控制混乱。副厨师们穿着白色夹克,在工作站之间有条不紊地移动,蒸汽从工业炉上的锅里升腾。在前景中,大理石台面上散布着新鲜的香草和异国香料。附近堆放着一堆饱经风霜的烹饪书,暗示着厨师对她的技艺和不断学习的奉献。整体场景捕捉到了高端烹饪艺术的强度、精确度和激情。
赢家: Midjourney
Midjourney因其主要角色的真实感获胜。虽然它并不完美,我更喜欢Flux图像的动态性,但挑战在于创造准确的人物形象,而Midjourney在这方面更接近,皮肤纹理更好。
2. 街头音乐家
Midjourney生成的街头音乐家图像
Flux生成的街头音乐家图像
下一个提示要求两个AI图像生成器展示一位30多岁的街头音乐家在繁忙的城市街角表演,沉浸在音乐的瞬间。提示的一部分要求包括一个欣赏的路人、吉他盒里的硬币,以及背景中模糊的城市生活。
描述如下:
一位30多岁的街头音乐家被定格在繁忙城市街角充满激情的表演瞬间。他的长长的黑色脏辫在空气中摇摆,有些落在他的脸上,其他则在他周围舞动。他的眼睛紧闭,眉头微微皱起,手指在一把旧的、深受喜爱的原声吉他上熟练地移动。音乐家穿着一件鲜艳的手工编织毛衣,毛衣由蓝色、绿色和紫色的拼布组成。它松松垮垮地挂在破旧的牛仔裤上,膝盖上有艺术性的补丁。他脚上穿着磨损的棕色皮靴,随着音乐的节奏轻轻敲击。多条彩色编织手链装饰着他的手腕,增强了他的波希米亚风格。他站在一条破旧的街道上,脚边是一个破旧的吉他盒,里面散落着欣赏的路人留下的硬币和钞票,以及几片落下的秋叶。背景中,城市生活在模糊的运动中展开:行人匆匆而过,黄色出租车在拥挤的街道上鸣笛,霓虹灯随着黄昏的到来开始闪烁。在前景中,一个孩子稍微失焦,拉着母亲的手,试图停下来听音乐。这个场景捕捉到了街头表演的原始能量和情感,背景是一个繁忙、冷漠的城市。
赢家: Midjourney
Midjourney再次获胜,因为人物的真实感。v6.1的纹理质量再次使其略胜一筹。整体来说,图像在结构、布局和背景方面也更好。
3. 园丁
Midjourney生成的园艺图像
Flux生成的园艺图像
生成老年人图像对于AI图像生成器来说总是一个挑战,因为需要更复杂的皮肤纹理。在这个场景中,我们希望看到一位80多岁的女性在屋顶花园中照料植物。图像描绘了包括爬藤植物和傍晚金色阳光在内的场景元素,背景是城市天际线。
描述如下:
一位80多岁的老太太在繁忙的城市背景下,温柔地照顾她的屋顶花园里的植物。她银白色的头发扎成一个松散的发髻,有些发丝散落,勾勒出她慈祥的、布满皱纹的脸庞。她的蓝眼睛闪烁着满足的光芒,当她微笑着看着手中温柔捧着的一颗成熟的番茄时,显得格外温暖。她穿着一件柔和色彩的花卉图案连衣裙,上面罩着一件磨损的、土色的围裙。她穿着舒适的便鞋,戴着一顶宽边草帽。脖子上挂着一副老花镜的链子,随时准备在她需要查阅园艺日记时使用。她周围的屋顶变成了一个绿色的绿洲。高架床里满是各种蔬菜和花卉,形成了一个色彩斑斓的拼贴。藤蔓覆盖的棚架高高耸立,陶土盆里种满了香草,排列在边缘。一角还可见一个小型温室,玻璃面板反射着金色的晚霞光芒。背景中,城市天际线显得尤为宏大——混凝土和玻璃组成的森林,与这个充满活力的花园形成鲜明对比。夕阳洒下温暖的光芒,突出显示出茂盛的植物和这个女人脸上的宁静,她在她的都市伊甸园中找到了平静。
赢家: Midjourney
Midjourney再次因为纹理质量而获胜。它在处理戴手套的手指时有些挣扎,但仍比Flux做得好。这并不意味着Flux的图像不好,但它不如Midjourney。
4. 紧急情况中的急救员
Midjourney生成的急救员图像
Flux生成的急救员图像
这次的提示我选择了一些更具动作感的内容,重点是描绘在雨天匆忙赶往救护车的急救员。这包括对眼睫毛上挂着的水滴和反光条纹的描述。这对于AI图像生成器来说是一个更具挑战性的提示,因为它必须捕捉到更暗的环境。“黄金时间”的光线对AI来说更容易处理,而夜晚和黄昏则更具挑战性。
描述如下:
一位20多岁的年轻急救员在雨夜中紧急行动的瞬间被捕捉到。她的短发因雨水而紧贴在前额,水滴挂在她的睫毛上。她的蓝眼睛锐利而专注,反映出急救车辆的闪光灯。她的表情显示出决心和控制下的紧迫感。她穿着一件带有反光条纹的深蓝色制服,夹克部分敞开,露出里面的浅蓝色衬衫。听诊器挂在她的脖子上,随着她的移动轻微晃动。她穿着重型黑色靴子,溅过水坑,手腕上的防水手表在黑暗中亮起,便于阅读。她双手紧握着一个大红色的急救包,稳步穿过湿滑的路面。身后,救护车庞然大物般矗立,红蓝灯光在雨水浸透的街道上投射出一种诡异的光芒。她的搭档在背景中,正从车后搬运担架。前景中,雨水和运动使得场景模糊不清,关切的旁观者们在雨伞下聚集,看似发生了车祸,场景外隐约可见。湿滑的街道反射出急救灯光,形成了一种在黑暗中跳动的戏剧性色彩。整个场景充满了紧张感和紧急情况的氛围。
赢家: 平局
我认为这一轮没有哪个AI图像生成器获胜。两者都因光线问题导致脸部纹理被冲淡,显得过于“塑料化”。Midjourney在匹配场景描述方面做得稍好一些。
5. 退休的宇航员
Midjourney生成的退休宇航员图像
Flux生成的退休宇航员图像
最后一个场景设置在学校。我要求AI模型生成一位60多岁的退休宇航员,他正在做关于太空的演讲。他表现良好,健康状况良好,展示NASA标志。背景有详细描述,包括海报、名言和观众的反应。
描述如下:
一位60多岁的退休宇航员正在科学博物馆进行生动的演讲。他的银发整齐修剪,尽管年事已高,但他站得笔直,这得益于多年来严格的身体训练。他的蓝眼睛闪烁着热情,他指向悬挂在天花板上的大型太阳系模型。他穿着海军蓝的西装外套,翻领上别着一个小而醒目的NASA徽章。里面穿着一件浅蓝色的扣衬衫和卡其色裤子。他的左腕戴着一块手表,看起来像是曾在太空任务中佩戴过的那种。尽管双手显露出年龄的痕迹,但他移动时依然精确而有控制力,仿佛仍然习惯于零重力操作。他周围是一群专注聆听的学生。有些人在奋笔疾书,另一些人则半举着手,迫不及待地想提问。观众包括各种年龄和背景的人,都因对太空探索的热情而聚集在此。演讲空间的墙上挂着银河、星云和行星的高清照片。探险和发现的励志名言点缀其间。在一角,一套真正的宇航服被放在玻璃柜中,为演讲者的话语增添了真实性。阳光透过大窗户洒进来,照亮了空气中漂浮的尘埃,仿佛夜空中的星星。整个场景充满了奇迹与可能性,退休宇航员为热切的观众架起了地球与宇宙之间的桥梁。
赢家: Flux
这一轮我把胜利给了Flux。它因其皮肤纹理和人物真实感在某种程度上与Midjourney持平,甚至略胜一筹,而且图像整体结构更好,背景人物也更真实。
Flux与Midjourney: 哪个模型获胜
Midjourney
Flux
厨师在厨房
街头音乐家
园丁
紧急情况中的急救员
退休的宇航员
这几乎是Midjourney的全面胜利,主要原因在于Midjourney在v6.1中对皮肤纹理渲染的改进。不过,尽管从表面上看Midjourney更胜一筹,很多情况下Flux的整体图像结构和背景处理更好。值得注意的是,Flux在文本渲染上比Midjourney更稳定——但这次测试的重点是人物和生成逼真的数字人类。
这表明,即使是在AI图像生成的最前沿,每张图像中仍然有一些迹象表明它是由AI生成的。
关注公众号【真智AI】
TOP AI模型智能问答|绘图|识图|文件分析
每天分享AI教程、赚钱技巧和前沿资讯!