驯化Transformer:图像生成新策略
StableDiffusion

驯化Transformer:图像生成新策略

这篇文章主要介绍了与稳定扩散相关的几篇经典图像扩散论文以及CLIP多模态预训练模型的任务设计和优势。CLIP利用对比学习在大量文本数据上进行预训练,实现了在无微调情况下 zero-shot 的效果,并在文生图领域取得了一定成功。然而,其粒度较大,难以调控。文章提出了一种结合CNN先验偏置和transformer建模序列泛化性的解决方案,即通过CNN GAN Transformer结构生成高精度图像。
StableDiffusion背后的秘密英雄
StableDiffusion

StableDiffusion背后的秘密英雄

Stable Diffusion背后真正的功臣是 Mostaque,他通过深入研究、澄清事实和积极应对法律诉讼,为Stable Diffusion的发展做出了重要贡献。尽管面临诸多挑战,Mostaque始终坚定地支持项目,并成功缓解了版权问题,使得Stable Diffusion在市场上取得了良好的口碑和成绩。
探究可口可乐Y3000:人工智能的营销包装
StableDiffusion

探究可口可乐Y3000:人工智能的营销包装

可口可乐于探索新口味,通过AI主题的营销套餐和基于移动Web的应用程序,结合人类设计师和稳定扩散的思想,创造出Y3000的独特口味,实际并未涉及AI开发味道,但有人工智能参与设计Y3000的图形品牌,突出未来主义和乐观的视觉形象。虽然“人工智能”一词在某些情况下可能并无意义,但作为一家跨国公司的营销术语,其含义可能会持续淡化。
SDXLStableDiffusion模型:图片生成新突破
StableDiffusion

SDXLStableDiffusion模型:图片生成新突破

新版本的Stable Diffusion模型在图片生成上超越了先前版本,其生成的图片在质感和逼真度上更胜一筹,能准确理解并生成五指等人类特征,真实性得到进一步提升。此外,其配置要求与之前版本一致,仍需16GB内存和NVIDIA RTX20系列或更高显卡(8GB以上显存),支持Win10、Win11和Linux发行版。值得一提的是,Stability AI计划今年7月推出SDCL的1.0版本,值得期待。