作者 /王昊达
在如今快速的生活节奏中,短视频成为抓住闲散时间成为忙碌生活中缓解压力的主要方式之一,而在追求短平快的体验过程中,“短剧”也逐渐成为一种极欢迎的内容形式。
仅2023年,中国网络微短剧市场规模就已达到373.9亿元,同比增长267.65%。并且,抖音2024年公开数据显示,其微短剧的日去重用户数在1亿以上。小米董事长兼CEO雷军也在近日表示:“短剧好像打开了新世界,比爽文节奏更快、更刺激、更好看。”
而在短剧爆火的同时,一些创作者也在这个过程中发现了AI的价值。国内首部AIGC原创奇幻微短剧《山海奇镜》,自7月13日上线以来,迅速在各大视频平台迅速走红,在快手的观看次数已经超过千万。通过AI技术的巧妙运用《山海经》中描述的神话人物和奇异生物从文字转化为了银幕上的生动形象,以其逼真和流畅的表现力,成功打破了人们以往对AI视频制作效果的刻板印象。
此外,博纳影业AIGMS制作中心出品的《三星堆:未来启示录》一经上线也取得了显著的成绩和反响。博纳影业行政总裁蒋德富表示,博纳采用电影工业化流程,利用AI制作这部短剧,目的是利用自身成熟的电影经验,去提升AI短剧的技术含量,通过AI短剧赛道讲好中国故事。
可以说,AI短剧的“出圈”占尽了“天时地利人和”,从生产工具、到平台再到受众,完善的全生态链路为其创造的是一个滋润的发展土壤。
这些作品的成功不仅仅是技术上的突破,更是多模态大模型在艺术创作中应用的一个缩影。展示的不仅是AI在视觉和听觉上的处理能力,更通过深度学习和自然语言处理技术,实现了对文化元素的深刻理解和创新表达。
在一片欣欣向荣的景象下,不由得让人回忆起那位曾经的“概念神”——Sora。
作为OpenAI发布的全新生成式视频大模型,在其刚发布时确实引发了前所未有的轰动。当OpenAI在2月正式揭开Sora的神秘面纱时,全球互联网和社交媒体瞬间被其强大的功能所震撼,仿佛重现了GPT-3.5发布的辉煌时刻。
Sora一经发布,便以其三大核心优势迅速成为科技界的焦点。能够生成长达60秒的超长视频,以及突破以往AI视频生成模型的4秒连贯性瓶颈,让业界和公众都为之惊叹。其次,Sora不仅支持多角度镜头,还能实现一镜到底的流畅拍摄,生成的画面能够完美展现场景中的光影关系、物理遮挡与碰撞效果,使得视频内容更加生动逼真。
彼时,Sora还被OpenAI视为“世界模拟器”,不仅仅是一个视频生成模型,更是能够理解并模拟现实世界物理定律的智能工具。
在发布初期人们纷纷惊叹于Sora带来的技术革新和便捷性。许多专业人士预测,Sora将成为视频制作领域的一场革命,彻底改变传统的视频生产方式。
不过,时至今日,Sora还在为正式上线做准备,包括对抗性测试,通过各个领域专家组成的红队对其进行了严格的测试,以识别和减轻如错误信息、仇恨内容和偏见等潜在风险。
同时,OpenAI还允许视觉艺术家、设计师和电影制作人提前访问Sora,以收集反馈并改进模型,特别是针对创意专业人士的需求。为了提高透明度和安全性,OpenAI正在开发能够检测Sora生成的误导性内容的工具,并计划在模型中包含C2PA元数据。此外,公司还在与全球的政策制定者、教育工作者和艺术家合作,以了解他们的担忧并确定Sora的积极用例。这些活动导致了Sora的延迟发布。
随着时间的推移,Sora的落地应用却并未如预期般迅速推进。尽管OpenAI在技术上取得了巨大的突破,但始终未能将这一技术转化为实际可用的产品并推向市场。
对于广大使用者而言,这种反差无疑让人感到失望和焦虑。一面是Sora能够迅速改变视频制作的格局,降低创作门槛,让更多人能够轻松制作出高质量的视频内容的“丰满理想”;而另一面却是Sora的落地进程缓慢的“骨感现实”。
Sora的困境,不仅仅是技术实现上的延迟或不足,更深层次地反映出当前AI技术在商业化落地过程中面临的普遍挑战。从算法优化到数据处理,从用户习惯的培养到市场接受度的提升,每一步都需要精细的打磨和时间的沉淀。而在这个快节奏的时代,用户对即时满足的渴望与AI技术成熟曲线之间的不匹配,往往导致了期待与现实的巨大落差。
除了闭关修炼的Sora,GPT-4o mini的突然发布更是让舆论再次发酵,有网友戏称“GPT-3.5下岗了,GPT-5还会远吗?奥特曼:会的!”尽管GPT-5发布犹如镜花水月,多数人依然坚信OpenAI的技术实力。
不过,AI领域的竞争和变化也同样日益激烈。不仅有越来越多的企业和研究机构加入到AI技术的研发和应用中来,还有众多垂直领域的AI产品不断涌现,以更加精准的定位和更加个性化的服务,赢得了用户的青睐。
相比之下,OpenAI在行业中的吸引力似乎有所减弱,其“一统江湖”的局面也变得越来越难以维持。
如同OpenAI在本月9日正式停止了对华等地区提供API服务后,原以为是一次新的技术垄断,可却事与愿违,并没有在国内引发轩然大波。
面对Open AI的“断供”,这一次国内企业的反应可谓是相当积极。在消息爆出的第一时间,智谱AI、百度、阿里、腾讯等大模型企业便纷纷推出了对于API服务的“搬家计划”,通过降价、简化流程等方式开始吸收此前使用OpenAI API服务的客户。
对于缘何选择放弃中国市场,我们不必追寻答案,但国内大模型厂商的表现足以证明,从市场环境和大模型部署条件来看,国产大模型并非不能成为用户们的优先选择。
在所谓的“大模型元年”,我们谈论的是模型规模、模型能力,而技术的增速在短短一年间,已经开始让企业去思考如何落地及商业化的问题,近日以快手可灵、商汤Vimi等产品的集中爆发正是技术落地的缩影。持续创新已成为企业生存和发展的基石。
大模型之家认为,对于OpenAI来说,持续创新意味着不断探索人工智能的新领域,推动技术的边界,以及创造出真正能够解决现实问题的产品。GPT-5的推出,不应仅仅是对前一代产品的简单升级,而应是一次质的飞跃,才能维持住OpenAI在人工智能领域的领导地位。
AI短剧的爆火无疑是一个引人注目的现象,但也仅仅是国内多模态领域发展的冰山一角,这一现象远非技术进步的孤立展示,而是技术创新与本土文化深度融合、市场需求精准捕捉以及全产业链协同发展的综合体现。
我们把视线从AI短剧这一具体现象拉远,这种技术创新与本土文化、市场需求、产业生态的深度融合,正是我国在多模态人工智能领域的关键优势。无论是医疗健康领域的精准诊断、教育行业的智能化转型,还是智能制造与工业4.0的快速发展,多模态人工智能都在打造新质生产力的过程中扮演着至关重要的角色。
依托国内大模型厂商在市场响应方面的灵活性与创新性,推出符合潮流且高质量的内容产品,不仅巩固了企业在市场中的竞争优势,也为整个多模态领域的持续发展注入了强大动力。
多模态人工智能如同大模型角力的一个全新的起点。不仅将成为推动各行各业创新升级的核心驱动力,更将成为塑造全球经济新格局的关键因素。