文章主题:稳定AI, 视频生成, Stable Diffusion, SVD
Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群
白交 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
Stable Diffusion要王者归来了?
Stability AI CEO Emad Mostaque最新推文,四段视频引人无数遐想。
不少网友怀疑,这是Stable Video Diffusion新版本的演示Demo。
因为从效果上看,不管是画面清晰度、一致性还是流畅度都十分惊人。
比如这只毛绒熊带着泳镜潜水。
毛绒熊动作十分流畅,甚至还眨眼睛。而背后也有丰富的海水细节。
再加上Emad Mostaque本人,自今年1月1日开始就消失了几星期,始终未曾在社交网络上露面。
网友觉得,这一波更像是憋了个大新闻。Stability AI is back?
(一度以为Stability AI已经在竞争中落后)
Stable Diffusion杀回来了?
从释出的四秒Demo来看,应该是针对SVD视频生成功能的升级。
不过基于文本还是图像生成尚不能断定,直接来感受一下效果。
还有这种动漫风夜晚的街道。
去年11月,Stable Video Diffusion(SVD)这一创新技术正式亮相。它的出现不仅标志着图像、文本到视频的转换领域取得了重大突破,而且还实现了物体3D合成的功能。
根据当时公布的规划,SVD仅作为基本模型,未来仍将不断扩展,以构建完整的Stable Diffusion生态体系。
当时网友对Demo的反馈包括光影不对、而且整体不连贯(视频帧与帧之间闪烁)。
而从现在Demo看,以一个类似视频作对比:绿色机器人躺在床上。
可以看到,机器人,以及旁边的杯子灯盏,甚至床被枕头的褶皱细节都更为丰富了。
而且在机器人脸上也有明显的光影映射。
不过更多更新信息还得等官方版本发布才能知晓。
值得一提的是,在这条推文之后,Emad Mostaque还发了条类似的。
没有文字,四张静图。
网友们表示了期待。“希望这个模型能全方位地超越SDXL,并更好地及时迭代。”“这是SD3?”
不过这个地球西红柿是什么鬼???
今日,他们的StableLM2 1.6B模型正式亮相,这款仅含有160亿参数的小型语言模型,历经了英语、西班牙语、德语、法语、葡萄牙语以及荷兰语等多语种的训练,从而在各个领域展现出卓越的性能。
几天前,他们刚发布新年以来第一个大语言模型Stable Code 3B。
如此频繁的进展,Stability AI莫不是真的要翻身了?
决战视频生成
在上一轮人工智能应用于生成图像的任务中,稳定的人工智能(Stability AI)确实引起了广泛的关注。其稳定扩散(Stable Diffusion)模型的成功,使它成为了全球范围内最受瞩目的创新人工智能公司之一。
随着Midjourney的亮相,以及包括OpenAI谷歌在内的科技巨头纷纷取得重要进展,公司内部也变得动荡不安。CEO被指控可能存在剽窃他人成果的行为,还有涉嫌挪用公款、公司商业模式模糊、未能按时支付员工工资等问题曝光,使得Stability AI陷入了严重的困境。
去年11月官宣进军视频生成赛道,彼时已经有runway和pika这样的热门玩家出现了。
SVD新版本的亮相引发了广泛关注,这不仅仅是因为该企业本身的发展动态,更是与当前视频生成领域的能量爆发紧密相连。
不少网友直言:真是一波又一波的卷,一家比一家更卷。
在过去的段时间里,我们看到了两种趋势的发展。一是版本的不断更新迭代,国内的大厂例如阿里巴巴和字节跳动等都在这个过程中频繁地推出新的进展。二是关于生成效果、清晰度和流畅性的追求,在这方面,Moonvalley的问世无疑是一个令人震撼的事件,其独特性和创新性让很多人都为之惊叹。
又或者在可控性等上面去卷……
这不就在前几天,runway的Gen-2再进化——
只需5个笔刷,对着一张图一顿刷刷刷刷刷,原本静止的小鸟们就各自运动了起来。
那么在视频生成这个赛道,你看好Stability AI吗?
参考链接:
[1]https://twitter.com/StabilityAI/status/1747352719487054105
[2]https://x.com/emostaque/status/1748405750907457548?s=46
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!