文章主题:关键词:Stable Diffusion XL 1.0, 文本到图像生成模型, AIGC 时代
编辑:蛋酱、梓文
Stable Diffusion XL 1.0 闪亮登场,给你不一样的色彩体验。
在AIGC时代的开启下,Stability AI这家明星AI初创公司所推出的文本到图像生成模型Stable Diffusion在全球范围内掀起了一股热潮。
尽管存在着从文本到图像的众多生成模型,但Stable Diffusion模型仍然是最受欢迎的开源选择。这不仅吸引了众多开发者的关注,还激发了他们基于Stable Diffusion模型进行二次创作的热情。由此,各种具有创意和个性的AIGC(人工智能生成内容)应用应运而生,呈现出丰富多彩的形式。
最近,Stability AI 宣布推出了一款全新的产品——Stable Diffusion XL 1.0,这是一款先进的文本到图像生成模型,标志着其在进化过程中的又一次重要突破。
这是 Stability AI 最新的旗舰图像模型,也是当前图像生成领域最好的开源模型。
在 SDXL 1.0 版本尚未面世之际,Stability AI 于六月份发布的 SDXL 0.9 仅限于科研领域使用。然而,如今 SDXL 1.0 即将正式开源,可通过 Stability AI 的 API 供开发者使用。这样一来,普通用户也能借助消费级应用 Clipdrop 和 DreamStudio 来体验这一先进技术。
SDXL 1.0 是一款备受关注的深度学习框架,其凭借卓越的性能和广泛的应用场景赢得了广大开发者和工程师的关注。值得一提的是,由于与我方在业务上的紧密合作,SDXL 1.0 已经成功接入亚马逊云科技的基础模型托管服务 Amazon Bedrock,这无疑将为双方在人工智能领域的合作带来更加强大的动力。除此之外,SDXL 1.0 的应用场景将进一步拓宽,预计将很快正式上线 Amazon SageMaker JumpStart。作为我国人工智能领域的重要推手,亚马逊一直致力于为广大开发者提供优质、高效的人工智能解决方案。而 SDXL 1.0 在 Amazon SageMaker JumpStart 中的成功运行,标志着亚马逊在推动我国人工智能产业发展方面的努力取得了新的成果。总的来说,SDXL 1.0 与亚马逊的合作关系不仅推动了其在人工智能领域的技术进步,也为双方在未来的合作提供了更加广阔的空间。我们期待着 SDXL 1.0 在 Amazon SageMaker JumpStart 中的表现,并相信它将为我国人工智能产业的发展做出更大的贡献。
SDXL 1.0,什么进化了?
1. 生成概念与风格更具挑战的作品
SDXL 1.0是一款具有卓越性能的开源模型,它几乎可以生成各种艺术风格的高质量图像,且在实现真实效果上表现尤为出色。该模型允许用户在不具备特定创意灵感的情况下进行提示,从而确保了风格的充分自由性,生成了诸多独具特色的图像。此外,SDXL 1.0在色彩鲜艳度与准确性方面进行了精细调整,相较于上一代模型,其对比度、光线以及阴影都有所提升,同时采用了全 native 1024×1024 分辨率,为用户呈现更为细腻的视觉体验。
除此之外,SDXL 1.0 可以生成图像模型难以渲染的概念,例如手、文本以及空间的排列。
图源:Stability AI 官网
图源:Stability AI 官网
2. 语言更简洁、更智能
SDXL 1.0 只需几句话就能创建复杂、细致、美观的图像。用户不再需要用华丽的辞藻进行修饰就能够获得想要的高质量图像。
它甚至能够区分「The Red Square」(红场,一个著名景点)和「red square」(红色正方形)。
3. 微调和高级控制
有了 SDXL 1.0 ,根据自定义数据对模型进行微调比以往任何时候都要容易。可生成自定义 LoRA 或检查点,减少数据处理的需要。Stability AI 正在利用专门用于 SDXL 的 T2I / ControlNet 构建下一代任务特定结构、样式和组成控制。这些功能目前处于测试预览阶段,可以随时关注微调的更新。SDXL 1.0 上的图像控制也即将推出。
自 4 月 13 日发布 SDXL beta 版本以来,ClipDrop 用户已经使用该模型生成超过 3500 万张图片,而 Stability AI 的 Discord 社区平均每天生成 2 万张图片。
看看用户使用 SDXL 1.0 的效果吧。
推特:@pratzlowcode
从网友的图片生成效果来看,SDXL 1.0 在光线上把握更加精准,光线效果、色彩对比更加真实。
推特:@foxtrotfrog
可以看到,在色彩的运用上,SDXL 1.0 更加大胆,饱和度较高的情况下光线与阴影的细节依然在线。
推特:@ai_for_success
在这张图片中可以看到,景深较为合适,主体突出,色彩之间的过渡,甚至真实度都十分优秀。
推特:@sizubito
网友制作了 SDXL 0.9 与 SDXL 1.0 的对比图,左边为 SDXL 0.9 生成图像,右边为 SDXL 1.0 生成图像。可以明显看出二者对于色彩运用的差距。SDXL 1.0 的色彩更加丰富且真实,光效表现也更加出色。
也有网友在 SDXL 1.0 中使用 Midjourney 中的旧 prompt,评论中纷纷感叹,它的效果不比 Midjourney 差,甚至有些出乎意料的优秀。
SDXL 1.0 细节:Base 和 Refiner 模型
Stability AI 将 SDXL 1.0 与各种模型进行了对比测试:与 Stable Diffusion1.5/2.1、SDXL 0.9 等模型相比,人们更喜欢由 SDXL 1.0 生成的图像。
SDXL 1.0 也是所有开放式图像模型中参数量最多的模型之一,它建立在一个创新的新架构上,由一个 35 亿参数的基础模型和一个 66 亿参数的细化模型组成。
完整模型包括一个用于潜在扩散的专家混合管道:第一步,基础模型生成(噪声)潜在变量,然后用专门用于最终去噪步骤的细化模型对其进行进一步处理。
基础模型也可以作为独立模块使用。细化模型为基础模型的输出添加更精确的颜色、更高的对比度和更精细的细节。
这种两阶段架构可确保图像生成的稳健性,而且不会影响速度或需要过多的计算资源。SDXL 1.0 可在配备 8GB VRAM 的消费级 GPU 或随时可用的云实例上有效运行。
© THE END
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!