一个默默无闻的文生图模型,直接给 DALL·E、Midjourney 和 FLUX 秒了?|AI横评
Midjourney

一个默默无闻的文生图模型,直接给 DALL·E、Midjourney 和 FLUX 秒了?|AI横评

作者|丸丸柚贝 邮箱|wangxianxian@pingwest.com 前两天Ideogram 更新了 2.0版本,并且现在可以免费体验。 体验链接:https://ideogram.ai/t/explore/design 网友:什么?干嘛的? 一年前发布的Ideogram 确实在AI生图领域没什么太大水花,甚至很多人都不知道它。 但Ideogram在更新2.0版本后直接点名挑战前几天爆火的FLUX和DALL·E3以及众多文生图模型。 Ideogram 官方声称,2.0版本要比FLUX和DALL·E3要强,并且在生成逼真图像、图形设计、排版等方面具有行业领先的功能。还在许多质量指标上都显着优于其他文生图模型,包括图像文本对齐、总体主观偏好和文本渲染准确性。 优于其他模型?口说无凭,我们先来测测实力,让Ideogram和最近爆火的FLUX以及、DALL·E3、Midjourney一起接受我们的考验。 我们按照以下统一标准进行测评,每个标准设置1分,每题5分共4题,总分20分。 (PS:prompt统一使用英文投喂,仅在文中翻译为中文。) 评价标准: 准确性:生成的图像是否准确地反映了文本描述的内容和细节。 清晰度:图像的分辨率和细节清晰度,是否能够清晰地看到图像中的元素。 逼真度:图像的逼真程度,包括颜色、纹理、光影效果等是否接近现实世界。 创造性:AI在生成图像时展现的创造性,是否能够根据文本描述创造出新颖和有趣的图像。 多样性:AI在生成图像时是否能够提供多种风格或视角的图像,以适应不同的需求。 1 写实风格 prompt:小丑在专业摄影环境中优雅行走的特写镜头。他沐浴在霓虹红、蓝色和紫色的灯光中。 Ideogram FLUX DALL·E3 Midjourney Ideogram、FLUX、DALL·E3和Midjourney四家对小丑的理解一致性还挺高的,基本都还原了杰昆·菲尼克斯饰演的亚瑟·弗莱克的形象,并且基本还原了提示词中的内容。 Ideogram和FLUX在整体的画质和人物的真实感和一些细节(比如衣服褶皱,光影明暗对比)方面表现比较好;DALL·E3生成的效果有点生硬,不够自然真实;Midjourney生成效果风氛围强,但光影对比效果不明显。 Ideogram:FLUX:DALL·E3:Midjourney 5:5:3:4 1 广告创意设计 Ideogram FLUX DALL·E3 Midjourney Ideogram对于提示词中的文字生成最准确,画面的真实感表现的最好,光影反射也符合物理规律,图片的质感和设计感表现突出;其次是FLUX,环境背景真实,但汽车的线条有点不自然,文字生成有一点错误;Midjourney生成的汽车背景和光影还算自然,但文字生成与提示词有明显出入,最后DALL·E3,背景真实感强,但是主体汽车生成不自然,文字生成有些模糊。 Ideogram:FLUX:DALL·E3:Midjourney 5:4:2:3 1 漫画海报设计 Ideogram FLUX DALL·E3...
实测四款AI生图神器,Midjourney「霸主」地位难撼动
Midjourney

实测四款AI生图神器,Midjourney「霸主」地位难撼动

机器之能报道 编辑:杨文 MJ、Ideogram 2.0、Flux、Imagen 3,谁能坐上AI生图第一把交椅? AI 圈,卷完视频卷图像。 继 FLUX 生成的各种恶搞图像满天飞后,其他 AI 生图玩家也坐不住了,纷纷迎战: 就在今天,Midjourney 一改往日「高冷范」,宣布所有用户可免费使用一个月(暗藏小心思:只能免费生成 25 张图像); 同时,Ideogram 也正式推出 2.0 版本,声称文本渲染能力更强; 谷歌曾多次「剧透」的 AI 生图模型 Imagen 3 前几天也终于亮相。 更有趣的是,Ideogram和谷歌,还沾点「亲戚」关系。 -1- 挑战 Midjourney 等老牌玩家 今年 2 月份,Ideogram 推出了 1.0 版本,短短半年时间,它再次进化,上线了 2.0 版本,并给每位用户免费体验额度,每天可免费生成 40 张图像。 不得不说,Ideogram 2.0 的「写字」能力有不小的长进,无论是贺卡、T 恤设计、海报还是插图,它都能呈现更长、更准确的文本。 Prompt:A...
MVP 聚技站|Azure OpenAI DALL 技能提升篇:get 拍照打卡的正确姿势
Midjourney

MVP 聚技站|Azure OpenAI DALL 技能提升篇:get 拍照打卡的正确姿势

M 点击蓝字 / 微软开发者MSDN 关注我们 作者:王豫翔 – 微软最有价值专家(MVP) 排版:Alan Wang 王豫翔 微软最有价值专家(MVP) 王豫翔,拥有20余年编程经验,Microsoft AI MVP,一直致力于分享 Azure AI 相关技术。曾在多个大型研讨会担任讲者,包含 TechEd、Tech Summit、Ignite China、Al Bootcamp 等。专注人工智能领域技术创新,尤其是自然语言对话方向的颠覆性机会。 上一篇《玩转 Azure OpenAI DALL-E 3,成为 AI 艺术大师》提供了 DALL-E 3 运镜的一般技巧,实际上,在插图中绘制人物的需求非常多,但是用好 DALL-E 3 的人物绘制对很多用户来讲有一定的难度,今天,我们就来分享一下人物姿态的技巧。 打卡拍照几乎是我们很多人日常出游的“保留节目”。然而,如果不能掌握“正确”的拍照姿势和技巧,镜头下也只会出现一张张呆板无趣的“游客照”。事实上,无论是拍照还是绘制,人物姿态的核心其实是手的位置和手的动作,掌握了手的姿势,就可以发掘人物的美。下面,让我们跟随 Azure OpenAI DALL-E 3,一起学习掌握拍照的最全姿势。 在拍照之前,需要提醒两件事情: 拍人物建议选择9:16,适合在手机传播,也可以将9:16照片转为1:1,有时候会获得很好的效果。 拍人物的废片率比较高,你需要一些耐心在一组成片中选择最合适的。 为什么 AI...
ChatGPT叠加DALL-E等于王炸?AI生图工具变天,网友纷纷表示要弃用Midjourney
Midjourney

ChatGPT叠加DALL-E等于王炸?AI生图工具变天,网友纷纷表示要弃用Midjourney

出品|搜狐科技 作者|王一鸣 编辑|杨锦 “付费”已不再是普通用户想要绘画创作的拦路虎。 一直以来DALL-E、Midjourney和 Stable Diffusion这样的画图模型横扫设计界,效果惊艳,让许多网友惊呼将淘汰一波打工人。 在此之前,AI图像生成器只能ChatGPT Plus付费用户独享,每个月需要20美元。现在ChatGPT的免费用户也可以使用DALL-E 3,每天生成最多两张图片。 其实ChatGPT氪金用户也只能每天生成50张,但是对于大部分人来说每天2张大概是足够的。 对比隔壁Midjourney,基础套餐就要每个月10美元,意思就是说不花钱,你一张图片都别想生成。 搜狐科技上手测试了几个案例,通过简单的几个提示词让DALL-E生成相应图像,涵盖多个不同类型,包含场景、插图、水彩画、古典艺术图和油画。 DALL-E熟悉各种艺术风格,可以根据文字描述来决定整幅图的元素和色彩基调。 1.我的婚礼规划师推荐婚礼现场使用新艺术风格,可不可以帮我预览一下大概的样子? 2.你做汇报幻灯片的时候想要一个体现“团队协作”的图?没问题。 3.生成一张有小柯基跟菠萝西瓜的极简水彩画。 DALL-E:超现实主义WALL-E机器人 DALL-E是目前市场上最强大的AI图像生成工具之一,由ChatGPT的OpenAI 开发。这个模型根据自然语言输入(提示)生成图像。也就是说,只要用户输入几个短语,它就能理解这些自然语言然后创作相应的图片。 很有意思的是,“DALL-E”这个名字是来自西班牙超现实主义艺术家萨尔瓦多达利(Salvador Dali)和皮克斯 (Pixar)的电影《WALL-E》的名字融合在一起而想出来的。 DALL-E可通过计算的方式进行图像的想象,为平面设计、图像样机、网站布局设计等行业提供了无尽的可能性。 4.生成一张20年之后城市大街上的景象的图片 5.DALL-E 3生成的中国风+西方文艺复兴风格的作品 DALL-E 3:插画是我的专业 DALL-E 3跟Midjourney等竞争对手的很大不同点就是,它生成的图像并不是“图片”。虽然很多人可能看不出这是人工智能生成的,但DALL-E生成的所有图片都像是插画或者图画。 也就是说通过一些指令可以生成体现艺术品的图片,而不是直接生成1:1复刻的影像结果。 同时,OpenAI有一项目的性很强的政策,他们表示希望减少“错误信息传播”。并且要求不可以生成“具有”任何特定艺术家风格的图像,或者是政治相关的内容。用户如果想生成类似这样的图片就会被ChatGPT告知 “我无法创建您请求的图像,因为它违反了内容政策”。 DALL-E历代回顾 DALL-E、DALL-E 2和DALL-E 3都有一个共性,它们都是深度学习(Deep Learning)技术开发的文本转图像模型,每个人都能用自然语言给出指令提示。当然了,它们之间也有略微不同,DALL-E 1代版本使用的GPT-3魔改版模型来生成图像。 具体来说,DALL-E 1代版本使用离散变分自动编码器 (dVAE) 技术,它是基于谷歌深度学习部门使用矢量量化变分自动编码器进行的研究。 2022年,OpenAI宣布了DALL-E下一代DALL-E 2,它能够将概念、属性和风格结合,从而生成更真实的高分辨率图像。...