文章主题:稳定扩散, 图片生成, 参数调整
Stable Diffusion 是由 CompVis、Stability AI 和 LAION 共同开发的一个文本转图像模型,它通过 LAION-5B 子集大量的 512×512 图文模型进行训练,我们只要简单的输入一段文本,Stable Diffusion 就可以迅速将其转换为图像,同样我们也可以置入图片或视频,配合文本对其进行处理。先来看几个示例吧。
Prompt: In a cyberpunk city, a police car is on the street, raining, light effect, Simon Stalenhag, Ian McQue, Ghibli Studio, Beeple, Kaino University
Prompt: Glowing crystals in the depths of the black valley, Simon Stalenhag, Ian McQue, Ghibli Studio, Beeple, Kaino University, high-definition picture, unreal engine
Prompt: A silver mech horse running in a dark valley, in the night, Beeple, Kaino University, high-definition picture, unreal engine, cyberpunk
Prompt: An astronaut floating in the universe
Prompt: Grass and flowers by the sea, forest, clear sky, light effect, Beeple, Caspar David Friedrich, Alphonse Mucha
Prompt: Two knife-wielding pirates dueling on a pirate ship, dusk, heavy rain, unreal engine, 8k, high-definition, by Alphonse Mucha and Wayne Barlowe
使用 Stable Diffusion 目前有几种不同的途径:
01. Stable Diffusion Demo,这是官方发布的一个简单的体验版,无需登录,只需要「输入描述文本」,然后点击「生成图像」即可,可进行简单的设置,需要排队,等待时长根据排队人数而定,通常需要几分钟,完成后图片会展示在文本下方,可右击保存,只可生成 512×512 像素的图片。
02. DreamStudio Beta,这是官方发布的公测版,可以对参数进行调整,需要注册登录,注册后会获得 200 积分(generations/credits),每次生成需要消耗相应的积分,积分用完后需要购买才可继续使用,价格 10 英镑(80 元左右)1000 积分。
在界面的右侧区域,用户可以轻松地进行参数调节,以便根据需求优化图片的大小、文本描述与成图的契合度、生成图片的数目、采样模式以及种子的选择。一般情况下,我们可以按照默认参数来进行设置,这样可以更好地节省积分。值得注意的是,图片尺寸和步数的选择会对消耗的积分产生一定影响。虽然增加步数并不会带来明显的改变,但建议用户 still 选择默认的 50 步。至于各种尺寸和步数所需的积分,具体数据如下所示。
在生成图片之后,用户可以轻松地点击图片中心处的下载按钮来获取图片。如果一次性生成了多张图片,用户还可以点击图片下方的“Download All”按钮来一次性下载所有图片。需要注意的是,当前在生成多张图片时,如果用户点击某张图片进行放大预览,将无法返回到多图预览界面,也就无法继续下载其他图片。因此,如果生成了多张图片,我们强烈建议用户先将所有图片全部下载下来。
在本文中,您可以通过点击界面左上角的「History」选项来访问历史记录页面。在这个页面上,您可以查看到之前生成的图片的相关记录,这些记录主要包括每次生成的Prompt、尺寸以及种子信息等内容。如果您希望对过去生成的图片进行优化或者调整,您可以在此处复制Seed值,然后返回到Dream页面,在界面右下角的Random Seed按钮处,粘贴刚刚复制的Seed值,接下来就可以对图片的参数或者描述进行调整,最后再次生成图片即可。
点击界面右上角自己的头像,选择「Membership」进入个人中心,可查看个人积分余额及充值。
03. Stable Diffusion ,这是官方发布的 Google Colab 版本,无生成次数限制,需要注册 Hugging Face 账号,需要谷歌账号,需要科学上网,这个版本的流程有点繁琐,不推荐,这边不做介绍了。
04. Stable Diffusion WebUI 1.4,这是由 @altryne 制作的有 WebUI 的 Google Colab 版本,无生成次数限制,需要注册 Hugging Face 账号,需要谷歌账号,需要科学上网,这算是目前比较好用的一版,这边详细介绍一下。
在开始撰写这篇文章之前,我们需要做好充分的准备工作。这包括对主题的深入研究,收集并整理相关的资料,确定文章的结构和逻辑,以及选择合适的表达方式和语言风格。此外,我们还需要确保文章的格式和引用符合学术规范,以确保文章的可读性和可信度。
04.01. 注册谷歌账号并登录。
04.02. 注册 Hugging Face 账号并登录(注册后去邮箱验证一下)。
04.03. 打开 CompVis/stable-diffusion-v1-4 页面,找到下图部分,勾选同意选项,点击「Access repository」,开通模型访问权限。(这里列出了使用协议,可以自己看一下)
04.04. 打开 CompVis/stable-diffusion 页面,找到「stable-diffusion-v-1-4-original」并单击打开链接。(如果以后更新版本了,请打开对应版本的链接)
在文章中,我们鼓励读者们积极地参与讨论和交流。为了更好地实现这一目标,我们推出了一项新的功能。请查看图片中的部分,并选择您同意的选项。接下来,点击「Access repository」按钮,即可开通模型下载权限。这将为我们提供一个有效的途径来收集读者的反馈意见,以便我们不断完善和改进我们的内容和服务。
04.06. 打开 Access Tokens 页面,点击「New Token」按钮,起个名字,Role 选 read 或者 write 都可以,点击「Generate a token」,点击 Show 后面的复制按钮复制 Token。
对于初学者而言,掌握一门新技能或知识往往需要从入门开始。在这个过程中,一份详尽的入门教程能够帮助学习者快速了解基本概念、技巧和方法,从而建立扎实的基础。本文将重点探讨如何为初学者提供一份高效实用的入门教程,以便他们在学习过程中能够事半功倍。
04.1. 打开 Stable Diffusion WebUI 1.4,若未自动登录谷歌账号请点击页面右上角「登录」按钮,登入你的谷歌账号。
04.2. 点击「复制到云端硬盘」或点击「文件」选择「在云端硬盘中保存一份副本」。
04.3. 副本创建完成会出现「笔记本的副本已完成」弹窗,点击「在新标签页中打开」。
在本教程中,您将学习如何通过点击“Stable Diffusion WebUi – Altryne”的副本来修改笔记本名称。此操作并非强制性,您可以自由选择是否进行更改。一旦完成,您就可以随时从您的云端硬盘便捷地打开此文件并运行 Stable Diffusion。
在文章中,我们将在“设置阶段”的步骤部分寻找“连接到Google Drive”的小三角图标。接着,我们需要将第四步复制的token粘贴在这个图标所在的位置上,并且勾选“下载缺失”的选项。
04.6. 点击「代码执行程序」选择「全部运行」。
04.7. 弹出「笔记本需要高 RAM」的窗口,点击「确定」。(接下来需要等待一段时间,你看到 1 – Setup stage 下面的按钮在转圈圈就表示程序正在运行,需要下载一些文件,第一次运行等待时间会稍长一些)
04.8. 弹出「您还在设备面前吗?」的窗口,点击「进行人机身份验证」,按指令进行验证。(如果没有弹出可忽略)
04.9. 弹出「允许此笔记本访问您的 Google 云端硬盘文件吗?」的窗口,点击「连接到 Google 云端硬盘」。
04.10. 弹出「登录 – Google 账号」窗口,选择你的谷歌账号,点击「允许」。(如果等待过程中 Google Colab 图标变红,网络中断,可点击页面右上角的重新连接,重连后会继续运行)
04.11. 点击「3 – Launch WebUI for stable diffusion」前面的小三角展开单元,当这个单元最下方出现「Running on public URL: https://57651.gradio.app」就表示程序启动成功,点击「https://57651.gradio.app」打开 WebUI。(每次会得到不同的地址)
04.12. 在如图位置输入prompt(描述文本),设置好图片尺寸和生成图片张数,其他建议按默认值,点击「Generate」就开始生成了。
04.13. 回到 Stable Diffusion WebUi – Altryne 的页面,你会在「3 – Launch WebUI for stable diffusion」的末尾看到实时进度,以下图为例,Iteration: 1/12 表示总数 12 张图的第 1 张图片,以此类推,前面的 100% 是完成进度,50/50 是当前完成步数/总步数,00:42
稳定扩散, 图片生成, 参数调整
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!