文章主题:关键词: OpenAI, Sora, AI视频生成, Runway

666AI工具大全,助力做AI时代先行者!

🔥【AI巨擘OpenAI引领潮流】🚀近期,创新翘楚OpenAI重磅发布Sora,颠覆性地重塑了AI文字转视频的领域,让眼球再次聚焦于这场科技盛宴!✨这款先进的文生视频模型,以其卓越的算法和人性化设计,将创意与技术无缝对接,为内容创作者带来了前所未有的创作自由。🌍无论你是想快速生成演示视频,还是想要打造引人入胜的教育素材,Sora都能轻松应对,满足你的多样化需求。📚OpenAI作为行业的领导者,始终致力于探索人工智能的新边界,让科技更好地服务于社会。🎉通过Sora,他们不仅展示了技术的实力,更传递了创新与合作的价值观。🤝欲体验未来视频制作的魅力,不妨深入了解Sora,开启你的AI创作新篇章!💻✨

🎉【AI视频新突破】🚀Sora的诞生震惊业界!一分钟时长突破,高清逼真演示让人眼前一亮。🔥尽管OpenAI尚未公布全面开放的具体日期,但其潜力已然引发强烈关注。🔍首先,Sora将作为内部安全测试工具,对产品进行全面风险评估,确保用户安全无虞。🛡️随后,它将以有限的访问权限向创意精英敞开大门——包括视觉艺术家、设计师和电影制作人,他们将有机会探索AI视频的新可能。💡对于那些渴望前沿科技与艺术结合的人来说,Sora的到来无疑是一次激动人心的探索之旅。待正式开放之日,让我们共同期待这一创新如何引领行业变革!🔥#Sora #AI视频 #未来探索

在Sora推出之前,已经出现了一些用户认可度较高的AI生成视频模型。为什么Sora能引发如此大的轰动?多家外媒对三款热门文生视频模型Runway、Pika Labs和Stable Video进行了分析,并比较了Sora和它们之间的技术差别。

时长:60秒 vs 16秒

在Sora横空出世之前,Runway一直被视为AI生成视频的默认选择,尤其是自去年11月推出第二代模型以来,Runway还被称为“AI视频界的MidJourney”。第二代模型Gen-2不仅解决了第一代AI生成视频中每帧之间连贯性过低的问题,在从图像生成视频的过程中也能给出很好的结果。

Runway能够生成已经很逼真的四秒短视频。来源:Runway

而在Sora发布后,Runway的CEO克里斯托瓦尔·巴伦苏埃拉(Cristóbal Valenzuela)便在X平台上发布了两个字:“Game On(比赛开始了)。”

Sora最震撼的技术突破之一在于其输出的视频时长。Runway能够生成4秒长的视频,用户可以将其最多延长至16秒,是AI生成视频在2023年所能达到的最长时长纪录。Stable Video也提供4秒的视频,Pika则提供3秒的视频。在这一方面,Sora以1分钟的时长向竞争对手们提出了挑战。

Sora传播度最高的时长60秒的视频之一,女子行走在东京街头。来源:Sora

Sora模型能够实现视频时长突破,主要功臣是其所采用的扩散Transformer架构,而Sora的创始者之一、现任OpenAI工程师的William Peebles刚在去年和别人一同发布了针对该架构的研究论文。

本质上,Sora和Pika、Runway采用了相似的底层模型,即Diffusion扩散模型。不同之处在于,Sora把其中的实现逻辑进行了变化,将U-Net架构替换成了Transformer架构。

不过目前,外界尚不清楚Sora提供了哪些功能以供用户定制输出视频,因此Runway仍可能是Sora的替代方案之一。今年1月,Runway刚宣布,用户将能够通过多头运动笔刷(Multi Motion Brush)功能实现对AI生成视频中多个元素的运动控制。此外,Runway也因其提供了集合多种AI工具的视频制作解决方案而备受推崇。

镜头语言:运动镜头 vs 静止视角

值得注意的是,X平台上的一些用户表示,在OpenAI推出Sora的2月15日晚上,AI视频生成初创公司Stability AI也在官网和X平台上发布了新动态,宣布了Stable Video Diffusion更新1.1版本。但是,几分钟后,这两条消息都迅速消失了。

被Stability删掉的文章截屏。来源:X平台

外界无从得知这究竟是由于操作失误,还是Stability观察到了两种AI生成视频之间的巨大质量差异,选择重新制作广告。Stable Video和前两款产品一样,都没能脱离现有文生视频的一般模式,即输出单一的、通常是静止视角的短视频片段。相比之下,Sora的宣传视频包括变换摄像机角度、电影式剪辑和场景变换,也就是人们常说的镜头语言的使用。

此外,许多分析都指出,Sora带有世界模型的特质。所谓世界模型便是对真实的物理世界进行建模,让机器能够像人类一样,对世界产生一个全面而准确的认知。这一特性使得AI视频生成更流畅、更符合逻辑,降低了视频模型的训练成本,提升了训练效率。

由Sora生成的“赛博朋克背景下机器人的生活故事”。来源:Sora

和Runway一样,Stability AI的CEO埃马德·莫斯塔克(Emad Mostaque)也在X平台上感慨“奥特曼(OpenAI的创始人兼CEO)真是一个魔术师”,并称Sora可以被视为AI视频的GPT3,将在未来几年内得到扩展、细化、调整和优化。

劣势:有无免费选项,能否开源

和前辈们相比,Sora也存在两个可能令其不会被用户青睐的问题:有无免费选项,以及能否开源。

作为AI视频领域的新晋竞争者,Pika Labs于去年11月推出了生成式AI视频工具Pika 1.0,也在推出时凭借精美的演示视频引起了轰动。Pika已于去年12月公开,与Runway具备相似的质量,并在短时间内建立了一个非常活跃的用户社区。

Pika生成的视频截图。来源:Pika

最重要的是,和其他竞争对手相比,Pika提供了更具吸引力的免费使用选项。Runway只会给用户125个不可续的免费积分,而Pika每天都会给用户发放30个积分,这使得它在短时间内拥有了一个庞大且活跃的用户社群。

Stability AI旗下的Stable Video Diffusion则是一款开源的视频生成模型。类似于图像版的Stable Diffusion,该模型可以根据用户自己的需求进行定制,并且可以在个人设备上进行本地安装,而Sora大概率永远不会提供这种功能。

目前,Stable Video Diffusion也仅供部分用户试用,在Stability的官网上可以加入等待列表。

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注