文章主题:验证, Midjourney 5.1, 表现, 相同文字提示词

666AI工具大全,助力做AI时代先行者!

IT之家 5 月 4 日消息,AI 作图工具 Midjourney 近日发布了最新的 5.1 版本,宣称能够为用户带来更高质量、更有个性的 AI 艺术作品。

Midjourney 是一家提供生成式 AI 艺术服务的公司,用户只需在 Discord 上输入一些文字或图片,就可以让 AI 根据自己的喜好和风格创作出独一无二的艺术作品。Midjourney 的引擎经过多次升级,目前已经达到了 5.1 版本,据官方介绍,这一版本的引擎更加“有主见”,能够生成出更接近 4.0 版本的效果,但质量更高。此外,还有一个“原始”模式,供那些不想要太强个性化效果的用户使用。其他方面的改进包括:准确度提高,图像中不想要的边框减少,文字失真情况减少,锐度增强。

为确保 Midjourney 5.1 性能的可靠性,知名媒体 Forbes 与 IT之家共同进行了一项实验。本次实验中,它们使用了相同的文字提示词,在 5.0 和 5.1 两个版本中分别生成了四张图片并进行对比分析。在实验过程中,除图片外,其余所有设置均保持一致,且 Midjourney 设置基于基础质量和中等风格。具体来说,在以下的图片中,左侧四张展示的是 Midjourney 5.0 的效果,而右侧四张则是 5.1 版本的成果。

第一个提示词是“女人走在鹅卵石街道上,走向日落”:

在Midjourney 5.0版本中,一直存在着一个显著的问题,即过度强烈且不真实的镜头光晕效果。然而,在5.1版本中,这一问题终于得到了妥善解决。改进后的日落画面显得更为自然,同时天空也呈现出更加温馨和有趣的色调。

第二个提示词是“油漆厂爆炸,矢量艺术”:

同样地,5.1 版本的图片比 5.0 版本的更出色,颜色运用得更好,构图也更有动感。

人脸是 Midjourney 的一个强项,下一张图片的提示词是“戴着泳镜的孩子的特写”:

在Midjourney 5.1版本中,我们可以明显感受到其“主见”特性的提升。相较于5.0版本中较为普通的图片,5.1版本的图像质量有了显著提高。它不再仅仅是孩子戴着眼镜的普通照片,而是具有更强烈艺术感的作品,仿佛出自专业摄影师之手。这样的改进无疑为用户带来了更好的视觉体验,也展示了Midjourney软件在图像处理方面的进步。

在最终的测试中,5.1 版本的性能表现得到了验证,其确实能够有效地解决文字失真的问题。这一点从“街角卖报纸的人,1950 年代风格,棕褐色”这个提示词中可以看出。

两个版本都未能准确理解提示词的含义,所生成的场景均呈现出一名持有报纸的推销员,而非真正售卖报纸的角色,这方面的修正可以通过调整提示词来实现。在两组图片中,背景均存在文字元素,但彼此间并无显著差异。从整体来看,两组图片中的文字尚可,然而,一旦放大观察,便会发现其中大部分文字并无实际意义。相较于5.1版本,其图片构图更为强烈,主题在画面中所占空间也相对较大。

目前,Midjourney 5.1 版本仍在测试阶段,但用户已可通过在Discord上输入 /settings 命令选择使用此版本。据公司计划,Midjourney 5.1 将在本周末前成为默认模式。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注