美国人工智能公司OpenAI,在中国新年期间(具体是在美国加利福尼亚州旧金山,2月15日)发布了具有划时代意义的文生视频大模型——Sora。自从去年OpenAI发布生成式对话模型ChatGPT之后,国内大一些大厂就开始跟进,比如百度的文心一言、阿里巴巴的通义千问。如今,此模型非彼模型,在复杂度、算力等方面都有了质的飞跃。对比现有的Pika、Runway、Stable Video Diffusion等文生视频模型,Sora更胜一筹!
OpenAI成立于2015年12月属于人工智能行业,员工数约为700人。其实,2023年底OpenAI还上演了一场“宫斗短剧”,CEO山姆·奥特曼被董事会解雇,聘任临时CEO,随后其他核心人员相继离职;随即山姆·奥特曼被邀请加入微软,接着OpenAI超500人员工以辞职威逼解散董事会,最后,山姆·奥特曼以及其他核心人员回归!目前看来,山姆·奥特曼的回归是值得的,因为Sora出现了。
||Sora大模型
Sora在日语中代表天空、自由等含义,这可能是OpenAI使用此名字的想表达未来人工智能有无限的潜力,上不封顶,没有任何限制。
Sora,简言之就是一个可以根据文本指令生成逼真、富有想象力的视频场景的人工智能模型。
相比ChatGPT复杂度要高出好几个维度,甚至被Sora包含。目前,Sora仅能生成60秒、多角度的视频。可以说Sora是真正的一个现实世界与虚拟世界的转换器。官方也给出了样片,比如淘金热期间加利福尼亚州的历史录像,两艘海盗船在一杯咖啡里航行时相互打斗的逼真特写视频,一个20多岁的年轻人坐在天空中的一片云上看书等。
Sora的技术原理主要依托于扩散模型、(提示词)Prompt、转换器(transforms)、重述技术(DALL·E 3)等。总而言之,视频的生成是多个大模型包含类似于ChatGPT的,结合超强算力实现的。
目前,Sora只有极少量的测试名额!
||Sora团队
任何一个技术的突破,都离不开人才,因为人才是创新的核心要素。根据官网消息,Sora团队的核心成员为13人,其中包含3名华人。此模型由加州大学伯克利分校两位博士带队,经过一年的“996”最终结出果实。
||Sora对我们有什么影响?
很明显Sora冲击最大的莫过于短视频行业,比如剪辑师、动画制作、广告宣传、视频剪辑工具。另外,电影、电视剧行业也会受到冲击。
更深一步,如果Sora生成的视频可以,以假乱真。那么,监控证据也就失去了它的意义。
||总结
总而言之,小编认为Sora的发布,让我们距离AGI(通用人工智能)又进一步了。那么,人工智能会不会带来一个全新的世界,拭目以待。文章的最后,大家如果有什么好的建议欢迎在评论区留言,小编会积极地回答,大家共同的成长与进步。
更多核心科技请关注两晨科技,读者朋友们,再会!
—END—
编辑 | 李小
审核 | 张附