Midjourney_Page 56_666智慧设计

Midjourney

这篇深入浅出贴助你早日实现Stable diffusion自由

我也不想标题党，可它们就是好萌啊！看看下面这些你认识多少？我是憨憨，一个不会画画的设计师。过去半年里，AI绘画曾经多次引爆公众讨论，网络上那些精致的二次元同人插画、堪比真人的AI穿搭博主、打破次元壁的赛博Coser……背后都有一个“幕后黑手” —— Stable Diffusion，其背后的技术便是人们常说的扩散模型（扩散模型这个概念源自热力学，在图像生成问题中得以应用）。想知道上面这些精致的插画是如何实现的吗？接下来，我将结合这个案例带你走进 Stable Diffusion 的世界，帮你系统性地了解并掌握这神奇AI绘画魔法。虽然我们把这个过程称之为AI绘画，但实际上它并不是像人类画图一样打草稿、构线描边，再去上色、对细节加工……这样按部就班地去完成一幅画作的，它采取了一个人类不曾设想的路径 —— Diffusion（扩散）。一、Diffusion：眼一闭一睁，一张图画好了有一个非常形象的方式，来解释 Diffusion 的原理。这是我家的傻狗，你可以将自己的角色带入到执行绘画指令的AI中，现在让你把这幅画用宫崎骏风格重新绘制一遍，你做得到吗？你可以尝试着把眼睛眯成一条缝去看它（如果你近视可以摘掉自己的眼镜），它是不是变得模糊了？保持这个状态，想象着它正在逐渐变成动漫里的样子，随后慢慢睁开眼睛…… 这就是一个扩散模型工作的基本流程了。在这个过程中，AI会将图片通过增加噪声的方式进行“扩散”，使它变得模糊，就像是眯起眼睛的你一样，当内容模糊了以后，你就有更充分的空间去从它原本的形态抽离，并且想象它是否能变成其他模样。AI通过深度学习的方式，将很多不同的图像都转换成了这样的抽象内容，并逐渐开始理解了这个“扩散”的过程，每学一张图，它就会通过一些方式提取图像里的信息特征，并和它的原图建立关联。在刚才的例子中，当提到宫崎骏风格的时候，你的脑海里肯定也会跳出跟这类作品相关的风格特质来，因为你看过并且记得，这个时候，我们开始去想象它变成动画片里的样子，并且用一个动漫的方式“睁开眼睛”，让图片恢复清晰，这就是在对图像进行逆向的扩散，也就是去噪。这幅画，就已经被你脑海里关于宫崎骏的想象重新绘制一遍了。这一原理，为我们在AI绘画中的操作提供了理论基础和指导思想。当然，这只是一个简单的比喻，在真实的AI图像生成过程中要远复杂得多，我们只需要知道，在SD里面我们能接触到的各种提示词、模型、controlNet 等，其实控制的都只是AI的学习、转化、去噪过程，而非它一笔一画的动作。二、一副AI绘画作品 = 提示词 + 参数设置 + 模型这是 Stable Diffusion webUI，我们所有的操作都是在这里完成的。webUI其实只是一个执行的程序，用来屏蔽掉 Stable Diffusion 复杂的模型和代码操作。当你在浏览器里打开了这个webUI以后，就可以利用它开始作画了。 WebUI 上面一整排标签栏对应了不同的功能，做图最常用的是前两个：文生图与图生图，它代表的是两种绘制的基本方式，第三个标签的更多主要用于对图片进行AI放大处理，它可以让你生成更清晰的大图。看过《哈利波特》的影迷一定会记得，在霍格沃滋的魔法世界里，一个魔咒想要成功施展，不仅需要集中精神念对咒语，还需要一根魔杖，以及正确地挥动魔杖的手势，任何一个步骤出现错误，都有可能导致魔咒发动的失败，极端情况甚至会被反噬，在AI绘画的魔法世界里也是类似。 1、提示词：指挥AI作图的咒语 WebUI 中被我们输入进去的描述文字或图像信息，就是 Prompts (提示词)：用于生成图像的文字输入，需要使用英文输入，但你也可以通过探索 Extensions 来实现中文输入。提示词的涵盖范围很广，可以包括：主体、风格、颜色、质感特点等一些具体要素。...

8 months前 3

稳态扩散3：反转路径的新颖技术，如何打造高分辨率图像和颠覆性的文本到图像合成?

🎉探秘AI！『AI在用』带你轻松上手，一案例洞悉未来科技🔥

九月守望终成真？MidjourneyV6震撼上线！你准备好了吗？uire200,神级升级已开启！

这篇深入浅出贴助你早日实现Stable diffusion自由