解锁AI未来,与智慧同行!关注公众号,获取前沿AI资讯,体验尖端AI工具,让智能科技改变您的生活!

ai_linghr_sousou2.png

文章主题:stable diffusion, AI图像生成, 文生图

666AI工具大全,助力做AI时代先行者!

前几个月AIGC可谓是大热了一把,各种高质量的生成图片层出不穷,而其中最重要的开源模型Stable Diffusion也受到了各种技术商业上的热捧,以很快的速度不断的向前迭代着。之前作为一个没有相关知识基础的小白,为了了解相关的技术知识,找了很多文章看,最后还是发现Jay Alammar的这篇文章讲的最为通俗易懂,于是决定简单翻译一下,方便更多人从零开始了解这项强大的技术。

由于原文篇幅较长,所以这里分为三篇文章进行讲解:

第一篇,也就是本篇,主要讲“是什么”的问题,包括Stable Diffusion是什么,里面的各个模块是什么第二篇,主要讲“怎么办”的问题,也就是Diffusion怎么训练以及怎么使用的问题。第三篇,主要讲“如何控制”的问题,具体阐述语义信息到底是怎么影响生成图片的过程的。

在本篇文章中,我们将正式探讨Stable Diffusion的概念,并深入剖析其内部包含的一些核心模块。

原文链接:The Illustrated Stable Diffusion

有能力和时间的小伙伴还是更推荐阅读原文噢

作者:Jay Alammar译者:曾飞飞(知乎)

近期,人工智能图像生成的潜力展示出了令人震撼的进步。只需从简洁的文字描述出发,AI就能如同魔法般生成出高质量图片。这无疑极大地拓展了人类利用艺术创作的方式。在此背景下,Stable Diffusion的发布显得尤为重要,它不仅向公众开放了一个极高质量的模型,而且这个模型还能保持高速运行和低显存需求,堪称卓越之极。

在尝试过Diffusion技术之后,你或许会对它的出色表现感到好奇,想要了解其背后的原理。接下来,我们将用通俗易懂的语言为你揭示这个神秘技术的奥秘。

Stable Diffusion模型展现出了极高的灵活性,能够应对多种任务,包括但不限于文本到图像的生成、图像到图像的生成、特定角色的塑造,以及超分辨率处理和图像修复等。然而,作为对该模型最基础、最入门的介绍,我们将重点放在其最核心的“文本到图像”生成模块,也就是txt2img的部分。如下图所示,这是一个典型的文生图展示,输入的是“天堂(paradise)”、“广袤的(cosmic)”和“海滩(beach)”,而最终生成的图片完美地符合了这些输入的要求。画中不仅展现了蓝天白云的美丽景象,更是呈现出了一片无垠的海滩。

1701428770116.jpg

最最简单的txt2img示意图,之后我们会不断细化和分解这张图里txt2img的过程

在本篇文章中,尽管我们尚未深入探讨图生图模块(亦称img2img),但我们仍需对其进行简要概述。此模块的示意图如下所示,展示了一种输入形式从纯文本转变为图片与文字结合的情况。在这种模式下,生成的成果由原始图片与文字提示词共同决定。以下是一个例子,我们将输入设为“海盗船(pirate ship)”,并观察到生成的结果将输入图片中的帆船成功地转化为海盗船。

1701428770294.jpg

img2img示意图,输入是

stable diffusion, AI图像生成, 文生图

aigc666aigc999_6.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *