一个默默无闻的文生图模型,直接给 DALL·E、Midjourney 和 FLUX 秒了?|AI横评
作者|丸丸柚贝 邮箱|wangxianxian@pingwest.com 前两天Ideogram 更新了 2.0版本,并且现在可以免费体验。 体验链接:https://ideogram.ai/t/explore/design 网友:什么?干嘛的? 一年前发布的Ideogram 确实在AI生图领域没什么太大水花,甚至很多人都不知道它。 但Ideogram在更新2.0版本后直接点名挑战前几天爆火的FLUX和DALL·E3以及众多文生图模型。 Ideogram 官方声称,2.0版本要比FLUX和DALL·E3要强,并且在生成逼真图像、图形设计、排版等方面具有行业领先的功能。还在许多质量指标上都显着优于其他文生图模型,包括图像文本对齐、总体主观偏好和文本渲染准确性。 优于其他模型?口说无凭,我们先来测测实力,让Ideogram和最近爆火的FLUX以及、DALL·E3、Midjourney一起接受我们的考验。 我们按照以下统一标准进行测评,每个标准设置1分,每题5分共4题,总分20分。 (PS:prompt统一使用英文投喂,仅在文中翻译为中文。) 评价标准: 准确性:生成的图像是否准确地反映了文本描述的内容和细节。 清晰度:图像的分辨率和细节清晰度,是否能够清晰地看到图像中的元素。 逼真度:图像的逼真程度,包括颜色、纹理、光影效果等是否接近现实世界。 创造性:AI在生成图像时展现的创造性,是否能够根据文本描述创造出新颖和有趣的图像。 多样性:AI在生成图像时是否能够提供多种风格或视角的图像,以适应不同的需求。 1 写实风格 prompt:小丑在专业摄影环境中优雅行走的特写镜头。他沐浴在霓虹红、蓝色和紫色的灯光中。 Ideogram FLUX DALL·E3 Midjourney Ideogram、FLUX、DALL·E3和Midjourney四家对小丑的理解一致性还挺高的,基本都还原了杰昆·菲尼克斯饰演的亚瑟·弗莱克的形象,并且基本还原了提示词中的内容。 Ideogram和FLUX在整体的画质和人物的真实感和一些细节(比如衣服褶皱,光影明暗对比)方面表现比较好;DALL·E3生成的效果有点生硬,不够自然真实;Midjourney生成效果风氛围强,但光影对比效果不明显。 Ideogram:FLUX:DALL·E3:Midjourney 5:5:3:4 1 广告创意设计 Ideogram FLUX DALL·E3 Midjourney Ideogram对于提示词中的文字生成最准确,画面的真实感表现的最好,光影反射也符合物理规律,图片的质感和设计感表现突出;其次是FLUX,环境背景真实,但汽车的线条有点不自然,文字生成有一点错误;Midjourney生成的汽车背景和光影还算自然,但文字生成与提示词有明显出入,最后DALL·E3,背景真实感强,但是主体汽车生成不自然,文字生成有些模糊。 Ideogram:FLUX:DALL·E3:Midjourney 5:4:2:3 1 漫画海报设计 Ideogram FLUX DALL·E3...