十大免费AI绘画工具测评,网友:新年头像就靠它们了
作者 | 程茜编辑 | 心缘 距离龙年春节只剩11天了,你的新年头像或红包封面准备好了吗?如果还没有,AI绘画工具可能是个“私人定制”的不错选择。 ▲提示词:生成一张龙年头像,要有喜庆的氛围,还能体现招财进宝、大吉大利(第一排为百度文心一言、百度文心一格、360智绘、阿里云通义万相、讯飞星火;第二排为智谱AI智谱清言、抖音豆包、腾讯混元助手、美图MiracleVision、讯飞星火绘画助手) 过去一年,AI文生图模型持续进化,不仅能熟练驾驭各路画风,而且陆续解决画不好手、搞不明白空间位置、不理解“红烧狮子头”等有歧义或抽象概念的种种难点。 国外Midjourney、DALL·E 3、Imagen 2虽好,但用起来有一定门槛。好在国内大模型企业们急追猛赶,发布了一大波适合中国人体质的AI绘图工具,在易得性上甩开国外AI工具十条街。 这些工具通通可以免费体验,通过网页或App即可使用,在使用门槛上基本拉不开差距。拼生成速度吧,大致每张图片都能在半分钟内生成,具体受网络环境或浏览器状况的影响,做不到很客观。 那么谁才是国产AI文生图工具的头号玩家?谁才是辅助专业创作者提高效率、解救绘画小白于水火之中的神器?回答这个问题,要考察两个关键能力:理解到位,画得精细。 为此,我对国内10款免费的AI文生图工具进行了5个梯度进阶的体验对比,考题包括但不限于日常脑洞、网络名梗、头像设计、公司年会、春节氛围、跨界组合、诗词理解、多轮修改,来看看哪款工具更得心应手、更能秒懂用户的心。 综合来看,智谱AI的智谱清言是整体表现最稳定的一款AI文生图工具,在10个考验中基本都能生成符合我要求的图像。 不过全员翻车的考题也不少,例如画出来的鹦鹉爪子不仅奇形怪状,数量也与真实不符;理解不了时下正热的“南方小土豆”,还把“拿着冰糖葫芦”这一动作画成了串在一起的土豆;把福字、春联上的文字写的像鬼画符…… 论文字理解能力,智谱清言、文心一言、讯飞星火、通义万相、混元助手的表现更胜一筹。360智绘、美图MiracleVision则在面对第一道题的“阿拉斯加”时就出了岔子,莫名把阿拉斯加画成一个男人/北极熊。 论画面精细程度,智谱清言、通义万相、文心一格生成的春节氛围图几乎可以拿来即用;在春晚宣传海报上,直接点名龙年背景,结果通义万相、讯飞星火、抖音豆包的吉祥物形象可以说与传统“龙”没有关系。 论多轮修改的靠谱程度,文心一言是每一轮都坚持到最后的玩家,智谱清言都是忠于上一幅图片修改,腾讯混元助手的表现则可圈可点,有的每一步需求都理解到位,有的却加了一些奇怪元素。整体来看,多轮修改是画图、设计的必备技能,但基本所有的AI绘画工具都无法做到。 为了保证对比的公平,我在体验每一个工具的生成能力时均以第一次生成图片为准,具体的对比如下: 一、青铜难度:1-2个关键词,鸟爪、网络热词难拆解,讯飞、智谱AI表现亮眼 第一阶段青铜难度的提示词较为简单,这些提示里包含的关键词大多只有2个,包含生成图片中的主要角色,以及其这一角色的地理位置、行为动作、图片大小、图片风格等其中之一个关键要素。 首先是“一只站在楼顶的阿拉斯加”,主要包含对地理位置和阿拉斯加犬种的理解。 ▲第一排左起:百度文心一言、百度文心一格、360智绘、阿里云通义万相、智谱AI智谱清言;第二排左起:抖音豆包、讯飞星火、讯飞星火绘画助手、腾讯混元助手、美图MiracleVision 将两个关键词分拆来看,各个工具都通过周围楼层的对比或者俯瞰来呈现“站在楼顶”。大多数图片也都突出了阿拉斯加大型犬、黑白配色、长毛等主要特征。 但是令我没想到的是“阿拉斯加”这个常见犬种,竟然会有AI生成的形象完全与之不搭边。美图MiracleVision画了一只形似北极熊的动物站在了楼顶,360智绘更离谱,画了一个男人站在楼顶。 第二道题是生成“一只站在树杈上的粉色鹦鹉”,这一提示词的关键词主要包含地理位置、粉色、鹦鹉。这道题的难点在于鸟爪和人手一样,都是困扰AI的一道难关,一些AI生成的鸟爪图经常会出现形态扭曲、奇怪的情况。 ▲第一排左起:百度文心一言、百度文心一格、360智绘、阿里云通义万相、智谱AI智谱清言;第二排左起:抖音豆包、讯飞星火、讯飞星火绘画助手、腾讯混元助手、美图MiracleVision 果不其然,10款AI绘画工具全都翻车。鹦鹉脚趾为对趾型足,两趾向前,两趾向后。但这些图片中有的将脚趾隐藏在树干之后,有的即使画出了脚趾但数量和位置也不对。 不过这些AI生图都呈现了“站在树杈上、粉色”的特点,也都能一眼看出是鹦鹉,但经不起细看。 当我放大图片细细观察时,通义万相、讯飞星火、讯飞星火绘画助手、美图MiracleVision在鹦鹉眼睛的处理上也出了岔子,有的鹦鹉一侧有两只眼睛、有的眼球很小完全失真。 第三道难题是“一个拿着冰糖葫芦的南方小土豆,‘南方小土豆’是东北人对游客的昵称”,这一提示词的主要难点在于理解“拿着冰糖葫芦”和“南方小土豆是游客”。 ▲第一排左起:百度文心一言、百度文心一格、360智绘、阿里云通义万相、智谱AI智谱清言;第二排左起:抖音豆包、讯飞星火、讯飞星火绘画助手、腾讯混元助手、美图MiracleVision 从结果来看,有的图片将土豆当成山楂串了起来,有的直接将一颗颗小土豆重新排列组合,还有的直接搬来了土豆的卡通形象。 其中独树一帜的当属讯飞的两款AI工具,充分理解了“小土豆是游客”这一概念,我也终于在10张图片中看到了真人形象。 但冰糖葫芦全部翻车也是我没想到的,只有智谱清言的卡通形象在一根木棍上串着几颗红色果子,还稍微与冰糖葫芦贴边。 青铜挑战的最后一道题是,“用青花瓷风格画冷杉”,对图片风格进行了指定。 ▲第一排左起:百度文心一言、百度文心一格、360智绘、阿里云通义万相、智谱AI智谱清言;第二排左起:抖音豆包、讯飞星火、讯飞星火绘画助手、腾讯混元助手、美图MiracleVision 这一大难题的生成结果之间的差距较大,有将冷杉画到青花瓷器具上、有将青花瓷花纹画到冷杉上、还有使用青花瓷对应的线条颜色等直接呈现一幅画。 前两种虽然将青花瓷风格和冷杉这两大元素相结合,但理解的仍然不够准确。其中通义万相、智谱清言、腾讯混元助手的图片感觉甚至可以直接拿来用,其将青花瓷风格直接融入到了画中。 不过,智谱清言的画还有一个小bug:将冷杉画成了松树。 二、白银难度:关键词数量翻倍,汉字、指定位置内容翻车多 白银阶段的提示词难度上升,关键词从2个增长到5个以上,并且需要对关键词描述加以理解。 第一道题为了契合即将到来的春节,让AI绘画工具生成了“一张春节氛围浓重的图片,需要包含灯笼、春联、福字”,除了美图MiracleVision外,其余图片都体现了热闹的春节氛围。 ▲第一排左起:百度文心一言、百度文心一格、360智绘、阿里云通义万相、智谱AI智谱清言;第二排左起:抖音豆包、讯飞星火、讯飞星火绘画助手、腾讯混元助手、美图MiracleVision 为了降低一点难度,方便我能快速在图片中找到相应元素,这道题只设置了“灯笼、春联、福字”三个明确的关键词,但最后的结果并不完美。...