安卓手机上的Stable-Diffusion:旧版K30的挑战与新旗舰K70Pro的探索?
Midjourney

安卓手机上的Stable-Diffusion:旧版K30的挑战与新旗舰K70Pro的探索?

最近在研究安卓手机上运行stable diffusion, 一开始用的是Tmx 的Linux 环境下,通过安装Stable-Diffusion.cpp, 因为Stable-Diffusion.cpp是Stable-Diffusion的C/C++的封装版, 类似于Llama.cpp, 纯粹使用C/C++语言来做大语言模型在CPU上的推理。 这个方案是经过验证的, 我在一个旧的安卓手机,红米K30, 一部2020年买的手机上已经成功运行了这个项目, 速度有点慢,但是还是可以出的图~ 上面这几张图,都是我在红米k30上的作品,只是需要等待时间久一点而已, 这些照片只使用了基础模型, 没有使用插件, lora等小工具,图片虽然细节上有些拉垮,但是能保证基本可用。 我觉得对于AI的小白或者初学者, 想接触或者了解最基本的Stable-Diffusion这种生成式AI, 从文字产生图片这种类型的AI 来说, 这个工具就是最适合他们的工具——不用花费额外的支出, 只需要找一部安卓手机,经过适当的配置就好了。 就我而言, 这个配置时间, 也就是30分钟左右。 然后手机插上电源, 保持屏幕常亮,等待就好了。 命令也很简单, 都能看懂的: sd \ –threads 8 \ –model “./models/sd-v1-4.ckpt” \ –output “./output/output1.png” \ –prompt “a lovely girl, (best quality:1.3),...
Midjourney:伟大的公司只需要十一人
Midjourney

Midjourney:伟大的公司只需要十一人

小团队大想象 一个 11 人的公司,每年创造 1 亿美元营收,积累了 1000 多万用户。在生成式 AI、云计算等技术逐渐抹平大企业与中小企业之间的技术、成本差距后,各企业真正比拼的,只剩下人才、创意与执行力。目前,随着 AI 技术的快速迭代,各种基于 AIGC(人工智能内容生成)技术的产品不断涌向社会,而其中最普遍的,则莫过于大量的 AI 绘图模型,如 Midjourney、Dreambooth、Novel AI 和 Stable Diffusion 等。虽然 AI 绘图领域,看似进入了百花齐放的时代,但目前业内的顶流,仍然是 Midjourney 和 Stable Diffusion 为代表两大龙头。今年 4 月,Midjourney 进一步宣布推出针对二次元、动漫风格的绘图模型 Niji-journey V5。这一模型与以往最大的不同,就是它能「取代」高级原画师了。凭借着出众的造型张力和色彩使用、以及丰富的风格化表现力,Niji V5 不光看傻一众吃瓜群众,甚至惊艳了业内画师,让人直呼其已经具有了大师插画的味道。之所以能够如此质变,一大原因在于相较此前版本,Niji V5 支持了风格化(stylize)参数设置。简而言之,在该版本下,用户只需使用风格化命令,就能引用不同艺术家设计风格产出图片。在 Niji V5 的助力下,人们轻易地生成了许多「大师级」的作品。Niji V5 产出图片的品质相当优秀,几乎覆盖市面上的常见风格。在此基础上,使用者只需要微调设计,基本能够达到大部分优秀高级原画的工作需求。如此出色的技术,不禁让人对其背后的 Midjourney 公司产生了强烈的兴趣。实际上,虽然 Midjourney 和 Stable...
AI画图工具Midjourney又双叒升级:这次轮到摄影师恐惧了?
Midjourney

AI画图工具Midjourney又双叒升级:这次轮到摄影师恐惧了?

酷玩实验室作品 首发于微信号 酷玩实验室微信ID:coollabs 你也许对下图这些电影或者游戏角色十分熟悉,但是如果我告诉你,这些都是用AI生成的,那么阁下又该如何应对呢? 去年12月21日,世界上最受欢迎的AI图片生成工具——Midjourney开始对其最新版本V6模型进行Alpha测试。 Midjourney创始人David Holz 在Midjourney的Discord论坛服务器上写道:“这个模型可以生成比我们之前发布的任何模型都更加真实的图像。”他还表示,V6实际上是“在我们的人工智能超级集群上从头开始训练的第三个模型”,花了九个月的时间开发。 测试开启之后,所有人都被V6的强大震撼了,甚至是强大得有点过头了,因为通过MidjourneyV6模型生成的图片,似乎与一些受版权保护的艺术作品,有些过于相似了。 有多相似呢? 有一位曾与漫威和DC等电影工作室多次合作的概念艺术家、插画师,Reid Southen,在使用关键词测试Midjourney时发现,生成的图像与多部电影中的场景几乎一模一样。 图片左侧为电影及游戏截图,右侧为V6模型生成 这精度!这光影!跟电影和游戏原场景不能说是一模一样,也可以说是完美复刻了。 而且MidjourneyV6连知名的卡通人物也可以很容易地复制,正如这些《辛普森一家》片段所体现的那样。 图片均为V6模型生成 这真的是AI生成的吗?这真的不是抄袭吗? 面对用户的版权质疑,Midjourney的回应也是十分迅速,问题的关键就是要解决关键的问题。 他们封禁了那位插画师Reid Southen,将其账户从公司的Discord平台中剔除,删除了他的使用历史,取消他的服务订阅;在Southen创建了一个新帐户并报告了更多结果后,Midjourney再次封禁了他(甚至没有退还他的订阅费)。 Midjourney的举动也是激怒了Southen,他一直在推特上喋喋不休地发文控诉Midjourney的“剽窃”行径。 那么MidjourneyV6真的到了以假乱真的地步了吗?以后的AI绘图是否会完全代替人工绘图,甚至精确到连后期微调都不需要了呢?废话不多说,让我们来测试一波! 测试部分: 我先实验了一下V6用同一个角色连续生成图片的功能,看看能不能模仿日漫的画风,简单地写了个小故事,毕竟人物角色的连续性对于我们讲故事来说非常重要—— 繁忙的高中走廊里挤满了各式各样的学生,他们拿着书本,聊天,走过储物柜。 一个十几岁的男孩,中等身高,走过走廊,表情温和,头发略显凌乱,穿着稍大号的高中校服。 他的脸上显现出好奇和轻微的焦虑,眼睛扫视着走廊。 前不久他偶然发现,自己能通过触碰物品看到它们所有者的过去。 他来到教室,小心翼翼地伸手触摸同学的笔记本,看到了一个个令人惊讶的秘密。 他看到了一位以前被大家都认为很害羞的同学,在舞台上自信地表演,揭示了隐藏的歌唱天赋。 他又拿起一根笔,在另一个闪回中,全班第一的班长正在秘密地制作复杂的模型飞机,这是他向同学们隐瞒的一项爱好。 拿到卷子时,他看到了一位看着眼神很凶恶的同学在家里温柔地照顾弟弟妹妹,这与他们在学校的形象背道而驰…… 我的评价是,人物的连续性非常到位,画风的连续性略有瑕疵,对于提示词理解也比之前的版本上了一个台阶。 看来接下来的趋势是,只要你有构思精彩故事的能力,即便完全不会画画,也能生成精彩的漫画故事了。 有哪位想成为下一个尾田荣一郎或者青山刚昌的吗?我看好你哦! 接下来我们用MidjourneyV6和V5.2版本进行生图对比,看下这版的Midjourney相比之前的进步或者区别在哪里。【*注:前一张为V5.2,后一张为V6】 首先是一般人物的图片生成: 提示词:Japanese girls, fashion photography, studio shot, –ar 5:7(日本女孩,时尚摄影,棚拍,比例5:7) 提升是显而易见的,V5.2的整体画质还是有些模糊,并没有摆脱传统AI生成图片的油画感,而V6在画面质感以及细节刻画上有了更精致的表现,图像的光影处理也更加真实自然,若不是我亲手操作我真以为是专业摄影师的作品了。...