工具&提示词设计生产力大提升

AIGC前沿驾驭AI

抓紧体验吧!咱们纯自研视频大模型Vidu已经开放使用,效果堪比Sora(附 Vidu 申请链接)

抓紧体验吧!咱们纯自研视频大模型Vidu已经开放使用,效果堪比Sora(附 Vidu 申请链接)

我是云杉,目前专注于AI写作与AI智能体,持续分享最新AI工具和AI资讯 点击👇关注云杉,一起 AI 破局, 一起 AI 创富 在2月的时候,Sora的亮相如春雷响彻,震撼了全球。面对质疑声,我们须保持清醒:国产大模型虽在某些领域略显逊色,但绝非全盘皆输。正如古人所云:“玉不琢,不成器”,国产AI大模型正待雕琢,其真正的潜能和实力,迟早会令世界刮目相看。 关闭 观看更多 更多 退出全屏 视频加载失败,请刷新页面再试 刷新 视频详情 于是乎,清华大学与生数科技共同发布了中国首个长时长、高一致性、高动态性的视频大模型——Vidu。 该模型是在中国最重要的科技创新活动之一——2024年中关村论坛年会的未来人工智能先锋论坛上正式亮相的。 根据现场演示,Vidu基本如sora一样,能够模拟真实物理世界,不仅能保持一致性,可以多镜头生成、还具备丰富的创意想象。 尽管Sora持续不断地推出视频更新,三个月的光阴流转却未见证其确切发布日期的揭晓。而Vidu的横空出世,无疑宣告了中国在视频大模型领域的崛起,至少已跻身世界前列。在近期的展示中,Vidu所呈现的视频效果与Sora相比,堪称并驾齐驱,展现了等同水准的性能。 这一突破不仅彰显了国内研发团队的实力,也预示着中国在人工智能领域,特别是视频技术这块疆土上,正稳步迈向领军地位。Vidu的问世,是对全球科技舞台的中国声音的再次响亮宣言,表明在智能视频技术的赛道上,与世界巨头们肩并肩。1采用技术 Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT。这种独特的结构设计使得Vidu在视频生成领域具有显著的技术优势。 2Vidu的能力 vidu能够模拟真实的物理世界,生成精细且遵循真实物理原则的场景,例如合理的光影效果、细腻的人物表情等。同时还具有丰富的想象力,能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容,例如“画室里的一艘船正在海浪中驶向镜头”这样的场景。 关闭 观看更多 更多 退出全屏 视频加载失败,请刷新页面再试 刷新 视频详情 不仅如此,Vidu还能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同 镜头的切换,包括能直接生成长镜头、追焦、转场等效果,给视频注入镜头语言。 比如下面的这两个有趣的视频制作例子,第一个是“在蒸汽朋克宇宙中,一艘带有小齿轮和蒸汽管的纸船在工业城市的金属河中漂浮。河道是由闪亮的黄铜和铜管组成的复杂网络,蒸汽从偶尔的泄漏中缓缓冒出。随着纸船在这片机械景观中航行,它与小机械生物微型机器人和自动装置互动。相机捕捉了船和周围环境的细节,强调了有机纸质和工业金属环境之间的对比。这一场景将维多利亚工业美学与幻想结合起来,突显了蒸汽朋克的创新精神” 关闭 观看更多 更多 退出全屏 视频加载失败,请刷新页面再试 刷新 视频详情 第二个是“美国动画风格,在一个灯光柔和的浴室里泰迪熊正在洗澡。它一部分沉浸在泡泡浴缸中,一只爪子拿着电话,另一只爪子在搓洗自己的身体。柔和的灯光营造出温暖和惬意的氛围,浴室的瓷砖是舒缓的粉彩色,增强了温馨和奇幻的氛围。泰迪熊的表情专注,表现出洗澡和打电话的同时进行。” 关闭 观看更多 更多 退出全屏 视频加载失败,请刷新页面再试 刷新...
突破!对标Sora,Vidu来了!

突破!对标Sora,Vidu来了!

天天财经独家,速关注AIGC领域再添一把火。4月27日,在2024年中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型Vidu。 该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。 Vidu生成的视频:戴珍珠耳环的猫  图片来源:Vidu虽然Sora能够根据文本指令生成60秒完整视频这一点仍然“遥遥领先”,但从视频生成效果来看,Vidu已经在对标Sora,因此也引发社交媒体广泛刷屏。Vidu背后团队生数科技成立于2023年,一年多时间已经完成多轮融资,股东包括启明创投、达泰资本、百度风投、蚂蚁集团等,也包括另一家明星AI大模型企业智谱AI。实现多项突破清华大学人工智能研究院副院长、生数科技首席科学家朱军在论坛上表示,Vidu实现了“全栈自主创新”“多维全面突破”,一共有6大特点:模拟真实物理世界、富有想象力、具有多镜头语言、出色的视频时长、时空一致性高、理解中国元素。此前Sora发布之后,OpenAI曾介绍,Sora能够深刻地理解运动中的物理世界,一个经典案例是,生成“一辆老式SUV行驶在山坡上”的画面,Sora能非常好地模拟轮胎扬起的灰尘、树林中的光影以及车行驶过程中的阴影变化。论坛现场将Vidu与Pika、Gen-2、Sora等其他文生视频大模型进行了对比,根据演示效果,在同样的提示词下,Vidu与Sora生成效果高度接近,一辆越野车行驶在森林中,阳光透过树叶的缝隙,在车身上形成光斑,车轮在颠簸的路段扬起灰尘……除了能够模拟真实的物理世界、生成细节复杂,Vidu还具有丰富的想象力。它能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容,例如“画室里的一艘船正在海浪中驶向镜头”。朱军表示:“作为中国自研视频大模型,Vidu还能理解中国元素,能够在视频中生成例如熊猫、龙等特有的中国元素。”值得一提的是,Vidu生成的短片是从头到尾连续生成,没有明显的插帧现象,这是Vidu背后“一步到位”的生成方式,从文本到视频的转换是直接且连续的,在底层算法实现上是基于单一模型完全端到端生成,不涉及中间的插帧和其他多步骤的处理。短短两月进展迅速朱军表示:“在今年2月,文生视频大模型Sora发布后,我们发现其刚好和我们的技术路线是高度一致的,这也让我们坚定地进一步推进了自己的研究。”Vidu的快速突破,源自团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构,完全由团队自主研发。Sora发布推出后,团队基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,在短短两个月进一步突破长视频表示与处理关键技术,研发推出Vidu视频大模型,显著提升了视频的连贯性与动态性。生数科技于2023年3月成立,由清华系AI公司瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化创立。一年时间,已经完成多轮融资。今年3月,生数科技宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI,以及老股东BV百度风投和卓源亚洲跟投。文生视频大模型正在加速应用渗透4月15日,全球多媒体巨头Adobe在官网宣布,将Sora、Pika、Runway等集成在视频剪辑软件Premiere Pro中(简称“PR”)。此外,Adobe已经在为Firefly开发视频模型,该模型将为PR中的视频和音频编辑工作流程提供动力;通过AI驱动的音频功能已普遍可用,可使音频的编辑更快、更轻松、更直观。据了解,Adobe存量用户规模达3300万,未来有望成为大模型的巨大市场。中信证券认为,文生视频有望推动视频创作者生产力革命,大幅降低生产成本、创作门槛,有望率先在短视频、动漫两大领域落地。建银国际认为,文生视频模型在各个行业都具有广泛的应用空间,包括但不限于营销广告、研发培训、电商零售、文娱游戏等。根据彭博行业研究的数据,在全球范围内,AIGC市场规模预计将从2023年的670亿美元跃升至2030年的8970亿美元,这意味着该领域复合年增长率高达45%。对于中国市场,艾瑞咨询预计其产业规模或从2023年的143亿元人民币增至2030年11441亿元人民币,复合年增长率将达87%。审读:任明杰编辑:张晶校对:张典阁监制:余喆签发:孙宏 推荐阅读 ➤刚刚!重磅数据发布➤密集发行!混合类理财产品成“新宠”?➤中国资产,全线爆发!➤【财经早报】吴清重磅发声!“五一”机票价格,降了!戳!
不只降本增效,AI变身游戏中的队友或对手!游戏大厂会玩儿

不只降本增效,AI变身游戏中的队友或对手!游戏大厂会玩儿

近期,在德国全球最大游戏展——科隆游戏展上,腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组,首次对外公布其全球首个语音指挥FPSAI队友,该AI队友能发起射击掩护玩家、原地隐蔽、带玩家撤离等战术动作,还能在游戏中识别出超10000个物体。 游戏行业一直是公认的AI技术最好的试验田,也是最早感知、适应AI冲击的前哨。目前AI除了走入游戏的研发、美术等环节实现降本增效,也正在与游戏结合产生更多新玩法,甚至可以缓解UGC内容输出难题。 腾讯推出AI赛博队友,能掩护玩家、带玩家撤离 腾讯魔方工作室方面告诉南都记者,作为全球第一个能听懂人类语言的FPSAI队友,目前F.A.C.U.L.应用了最先进的生成式AI技术,包括语音输入、大语言模型、实时语音合成和环境识别等。据悉,魔方AI技术团队正在为该技术申请10项专利。 在《暗区突围:无限》最新展示的AI技术视频中可以看到,当玩家通过自然语言向AI智能队友下指令时,AI智能队友能密切配合玩家发起射击掩护玩家、原地隐蔽、带玩家撤离等战术动作。 在全球首创的环境识别感知技术上,智能队友能够准确识别超10000个游戏内物体,如建筑物、汽车、可收藏物品等,能分辨颜色与材质,甚至能对天气情况进行报告,这一能力使玩家下达的“寻找一个绿色的箱子”“帮我找大金(战利品)”等指令也能被准确执行,大大提升了AI与玩家进行战术配合的空间。 除了环境识别,因为引入了语言交互能力,AI队友还能通过玩家的语音聊天进行更像人的实时反馈。比如当玩家询问“这一波打得爽不爽”时,智能队友会根据实际情况与玩家闲聊,而对于“你去舔包”“给我一把枪”等涉及游戏成果的指令,智能队友会结合目前形势灵活选择听从或拒绝。 据工作室负责人介绍,F.A.C.U.L.仍在内部训练测试阶段,目前只以技术demo方式呈现。 除了降本增效,AI还能解决UGC内容输出难题 随着AI走入游戏生产的更多流程,一些游戏公司利用AI实现降本增效,在研发、美术、文案、运营等多方面取得成效。比如在降本增效方面,腾讯就透露今年推出的自研AI引擎,让游戏场景制作、内容生成等领域的部分工作效率提升40倍以上。 谈及AI在游戏中的应用,游戏行业资深从业者、《unity3d网络游戏实战》的作者罗培羽告诉南都记者,目前在游戏行业内,AI在游戏美术方面的应用更加普遍且整体质量也更高了,同时在研发和运营中的应用也不少。 除此以外,罗培羽还提到,一些新的AI结合游戏案例也在出现,比如AI在游戏内实现贴图生成、自动场景搭建等。虽然目前AI对游戏玩法的影响其实还不算很革新,但起码已经是一个亮点,后续可以继续期待。 在用AI丰富游戏玩法方面,与腾讯推出的FPSAI队友相类似,巨人网络近期也在旗下游戏《太空杀》中推出了“AI残局挑战”玩法。在该玩法中,真人玩家将置身于一个充满挑战的多人在线互动推理场景中,与由多智能体大模型驱动的AI对手们进行智力较量。玩家会发现,每个AI玩家的发言和决策均由大模型实时生成,无需依赖人类预设内容。 除了推出AI NPC,AI正在游戏内扩充UGC内容板块。网易公司副总裁庞大智在今年的ChinaJoy高峰论坛上提及,网游是所有内容制作行业中,工业化程度、交互、实时性要求最高的,成本、质量与效率很难同时满足,但AI的出现为行业带来了新思路,目前网易通过把AI“开源”给玩家,让玩家融入游戏生态系统的同时扩充UGC内容板块,一定程度上解决内容输出难的问题。 目前,网易旗下游戏《蛋仔派对》中基于AIGC打造的乐园地图“万能生成器”,已被5300万玩家使用。玩家可以通过“万能生成器”输入简单的文字,生成各种各样的地图组件,打造好玩的地图。 采写:南都记者 林文琪返回搜狐,查看更多 责任编辑:
最强游戏AI应用上线:3分钟手搓“任何人”,真实度震惊网友

最强游戏AI应用上线:3分钟手搓“任何人”,真实度震惊网友

造一个AI代替人类干脏活累活,结果AI想干的第一件大事就是要毁灭人类。 这个听起来荒唐的段子,AI诞生多少年,人类就讲了多少年。 理论上来说,从数据而生,用耗材堆砌,AI生命的定位似乎和“量产”与“廉价”挂钩。但为了借AI歌颂人性的伟大。不管影视剧、文学还是游戏的编剧,都愿意从痛苦出发,让AI先体验人性恶,再反思人性美,最终真正成人。 这种思路影响下,几乎每个为我们熟知的AI形象,都离不开谋杀、枪击和痛苦的自我救赎。会思考的AI可能会被人噶,会照顾人的AI会被人噶。哪怕造出来专门噶人的AI,还会被人类驯服的AI噶。几乎每个AI的第一声哭泣,背景都染得像是小马哥那件风衣一样鲜红。 但AI真就那么吓人吗?创造一个AI,就注定要伴随着血与泪?在科技公司的努力下,日趋完善的AI系统总算让网民们不那么恐惧这些“赛博生命”的存在,创造一个AI的成本,也不用涉及长线的痛苦运算以及血与泪堆积的反思。只要有手,三分钟搓一个都不成问题。 过去几天,网易旗下的《逆水寒》手游上线了一个叫做【自捏江湖友人】的玩法。这个玩法基本可以理解成是打造了一个AI系统,让玩家自己根据要求捏一个AI NPC。这个NPC需要有名字,还需要有自己的背景故事和性格,也需要玩家自己设计外观和时装。 满足这些条件后。AI就能在对话时根据自己的性格给出不同的回答,根据自己的背景故事选择自己的态度。根据自己的爱好回应玩家的爱好。不管是宠玩家,还是怼玩家都更自然而且有依据。不会像说相声那样百依百顺,反而更招玩家宠爱了。 其实,很多AI主题的科幻作品,都是用AI的经历和记忆来搭建“人性”。直接在背景故事里写好经历了什么,让他愿意相信什么才是常态。可以说除了不能像人类一样生老病死,江湖友人已经接近真人的体验。而且因为是玩家自己亲手设计的,哪怕是跟玩家闹脾气,看了都会姨母笑,而不是想要噶AI。 更有趣的是,复杂的设计需求并没有提升门槛,而是让AI又一次展示了自己超强的效率。多数玩家只需要选择输入姓名,就能生成一个堪比真人的NPC。甚至输入了一些古典名著的角色,或者是大模型认定没有纠纷的姓名,生成一些大家熟悉的虚拟角色都不成问题。 自由度高而且门槛还底,再加上NPC平易近人,能提供成吨情绪价值,这些因素叠加,让这个玩法上线以后直接爆红。到什么地步呢?《逆水寒》手游官方表示,玩法上线了三天就突破500万受众。又因为游戏受众涵盖多个年龄段,于是当代顶流影星、虚构IP里的老朋友纷纷上阵。这更是引来了更多玩家关注,并且尝试入坑。 从这点也能看出,《逆水寒》手游费尽心思打造这样这个系统,就是为了维持游戏中庞大的受众群体。像是这种AI玩法面相的受众,多为喜欢恋爱互动,喜欢创造内容尝鲜的受众。他们平时可能不玩传统MMO,但这个玩法足够完善,能把他们吸引来。就像是游戏中的二创视频编辑器、游戏关卡编辑器吸引了很多时装爱好者、小游戏爱好者那样。 对于一款长线运营的网游来说,自然是人越多越好运营啦。也难怪《逆水寒》手游经常在畅销榜前排驻足了。 据说游戏上线之初,就已经缝合了海量的3A玩法,后续也是强调“不肝不氪”的模式。把氪金大佬和普通玩家的差距拉低,注重技能搭配和实战操作,尤其官方把养成玩法、日常任务的产出保持一致。不管玩家喜欢玩什么,有多“偏科”,都不用被迫玩不喜欢的内容,官方对待问题的态度也非常积极,经常做出符合玩家心意的修复。 说白了,再先进的AI也都是服务人类需求才能有机会诞生的。我们也大可不必担心它尝试毁灭我们的一天——除非我们造它们出来的目的就是这个。不知道大家的意见如何?评论区聊聊看?