工具&提示词设计生产力大提升

AIGC前沿驾驭AI

原创
            最强游戏AI应用上线:3分钟手搓“任何人”,真实度震惊网友

原创 最强游戏AI应用上线:3分钟手搓“任何人”,真实度震惊网友

造一个AI代替人类干脏活累活,结果AI想干的第一件大事就是要毁灭人类。 这个听起来荒唐的段子,AI诞生多少年,人类就讲了多少年。 理论上来说,从数据而生,用耗材堆砌,AI生命的定位似乎和“量产”与“廉价”挂钩。但为了借AI歌颂人性的伟大。不管影视剧、文学还是游戏的编剧,都愿意从痛苦出发,让AI先体验人性恶,再反思人性美,最终真正成人。 这种思路影响下,几乎每个为我们熟知的AI形象,都离不开谋杀、枪击和痛苦的自我救赎。会思考的AI可能会被人噶,会照顾人的AI会被人噶。哪怕造出来专门噶人的AI,还会被人类驯服的AI噶。几乎每个AI的第一声哭泣,背景都染得像是小马哥那件风衣一样鲜红。 但AI真就那么吓人吗?创造一个AI,就注定要伴随着血与泪?在科技公司的努力下,日趋完善的AI系统总算让网民们不那么恐惧这些“赛博生命”的存在,创造一个AI的成本,也不用涉及长线的痛苦运算以及血与泪堆积的反思。只要有手,三分钟搓一个都不成问题。 过去几天,网易旗下的《逆水寒》手游上线了一个叫做【自捏江湖友人】的玩法。这个玩法基本可以理解成是打造了一个AI系统,让玩家自己根据要求捏一个AI NPC。这个NPC需要有名字,还需要有自己的背景故事和性格,也需要玩家自己设计外观和时装。 满足这些条件后。AI就能在对话时根据自己的性格给出不同的回答,根据自己的背景故事选择自己的态度。根据自己的爱好回应玩家的爱好。不管是宠玩家,还是怼玩家都更自然而且有依据。不会像说相声那样百依百顺,反而更招玩家宠爱了。 其实,很多AI主题的科幻作品,都是用AI的经历和记忆来搭建“人性”。直接在背景故事里写好经历了什么,让他愿意相信什么才是常态。可以说除了不能像人类一样生老病死,江湖友人已经接近真人的体验。而且因为是玩家自己亲手设计的,哪怕是跟玩家闹脾气,看了都会姨母笑,而不是想要噶AI。 更有趣的是,复杂的设计需求并没有提升门槛,而是让AI又一次展示了自己超强的效率。多数玩家只需要选择输入姓名,就能生成一个堪比真人的NPC。甚至输入了一些古典名著的角色,或者是大模型认定没有纠纷的姓名,生成一些大家熟悉的虚拟角色都不成问题。 自由度高而且门槛还底,再加上NPC平易近人,能提供成吨情绪价值,这些因素叠加,让这个玩法上线以后直接爆红。到什么地步呢?《逆水寒》手游官方表示,玩法上线了三天就突破500万受众。又因为游戏受众涵盖多个年龄段,于是当代顶流影星、虚构IP里的老朋友纷纷上阵。这更是引来了更多玩家关注,并且尝试入坑。 从这点也能看出,《逆水寒》手游费尽心思打造这样这个系统,就是为了维持游戏中庞大的受众群体。像是这种AI玩法面相的受众,多为喜欢恋爱互动,喜欢创造内容尝鲜的受众。他们平时可能不玩传统MMO,但这个玩法足够完善,能把他们吸引来。就像是游戏中的二创视频编辑器、游戏关卡编辑器吸引了很多时装爱好者、小游戏爱好者那样。 对于一款长线运营的网游来说,自然是人越多越好运营啦。也难怪《逆水寒》手游经常在畅销榜前排驻足了。 据说游戏上线之初,就已经缝合了海量的3A玩法,后续也是强调“不肝不氪”的模式。把氪金大佬和普通玩家的差距拉低,注重技能搭配和实战操作,尤其官方把养成玩法、日常任务的产出保持一致。不管玩家喜欢玩什么,有多“偏科”,都不用被迫玩不喜欢的内容,官方对待问题的态度也非常积极,经常做出符合玩家心意的修复。 说白了,再先进的AI也都是服务人类需求才能有机会诞生的。我们也大可不必担心它尝试毁灭我们的一天——除非我们造它们出来的目的就是这个。不知道大家的意见如何?评论区聊聊看?返回搜狐,查看更多 责任编辑:
首个AI游戏引擎GameNGen问世,AI游戏进化到3D游戏开荒纪元

首个AI游戏引擎GameNGen问世,AI游戏进化到3D游戏开荒纪元

最近,一款由游戏科学工作室打造的国产单机游戏《黑神话:悟空》问世,借助中国传统文化的魅力和基于虚幻引擎的现代游戏技术,游戏一经发布就吸引了国内外玩家的广泛关注。精美的画面、宏大的场景、酷炫的打斗为玩家带来了影视级的游戏体验,这款游戏可代表当今传统游戏的顶级水准。经过70多年的发展,计算机游戏从画质和体验已发生了翻天覆地的变化。 首个AI游戏引擎GameNGen 近日,Google发布了首个AI游戏引擎GameNGen,它是一个由神经网络驱动的游戏引擎,能够实时模拟复杂游戏环境。 下面的动画片段展示的是玩家在实时地玩《DOOM》游戏画面,与传统游戏开发相比,它是通过学习游戏动态和视频表现,完全由神经网络模型实时生成游戏场景,而不是采用传统的编码方式实现的。最关键的是它不仅仅生成游戏画面,还可以处理玩家生命和弹药数量状态更新、攻击敌人、损坏物体、开门等,也就说它具有与游戏环境交互的能力,目前GameNGen可以做到在一个TPU上以20帧的速度稳定实时生成游戏画面。 GameNGen的实现原理主要包括两个阶段: 1 数据收集 神经网络模型训练离不开数据,而且是大量的数据,GameNGen通过训练一个强化学习智能体来玩《DOOM》游戏,收集智能体的游戏轨迹,包括动作和观察结果等数据。简单来说,就是让程序自己不停地玩这款游戏,然后记录游戏过程数据,其中包含判断程序玩家水平的评价标准及改进策略,使得程序能够在不断地玩游戏过程中提升游戏水平,这就是强化学习的逻辑。 2 生成模型训练使用一个预训练的扩散模型,它是一个文本生成图像的生成模型,事先已经进行过训练,能够根据文本生成匹配文本意义的图像。该模型使用前面步骤智能体获取的游戏数据进行进一步的训练,使得模型可以根据游戏的状态和智能体的动作来预测下一帧的图像,也就是说预训练的扩散模型通过智能体自己玩游戏得到的经验数据学习到了应该生成什么样的图像来匹配玩家的动作,比如玩家攻击敌人应该得到产生火花、流血效果的画面。 抛开技术本身,这款游戏的画面实在有点寒碜,但是《DOOM》(毁灭战士)可是一款具有里程碑意义的游戏,它可以说是第一款3D游戏,是由传奇程序员约翰·卡马克(John Carmack)开发的,于1993年首发。那时游戏行业已经发展了40多年,而AI游戏引擎一经出世就将AI游戏带进传统游戏领域的3D开荒纪元,未来潜力是不容小觑的,关键是它根本不需要编写代码来生产游戏,不知道AI游戏进化到《黑神话:悟空》这类水准还需要多久呢? 空间智能,下一个AI前沿 “AI教母”李飞飞创立了World Labs,研究方向开始转向空间智能,大语言模型(OpenAI、文心一言、通义千问都属于此类)无法实现有知觉的人工智能,再大的语言模型也达不到这一目标,而空间智能是实现人工智能的关键拼图。 空间智能聚焦于理解三维物理世界的模型,本质上是对物体的物理特性、空间位置和功能的理解和模拟。AI游戏引擎需要的正是这种空间智能,当空间智能这一领域被突破之后,相信AI游戏一定会革新整个游戏行业,当然被改变的绝不仅仅是游戏。 参考文献 [1] GameNGen论文( https://arxiv.org/pdf/2408.14837)
10 分钟速成!Midjourney 网页版保姆级手册,全员免费体验
Midjourney

10 分钟速成!Midjourney 网页版保姆级手册,全员免费体验

Midjourney 官方在 8 月 22 日的凌晨,发布了网页版向所有人开放的新闻。并且临时开放了免费试用。 官方之前已经迫于用户的呼声,开放了网页版。但是需要在 Discord 上生成图片到一定数量才能使用。而生成图片都是收费的,所以一般用户根本没有机会体验。 这次开放了限时免费,而且还是网页版,还不抓紧时间薅起来! 速成教程 一、登录 地址: https://www.midjourney.com/ 右下角有「注册」、「登录」按钮 可以选择 Discord 或者 Google,一般推荐用 Google 邮箱注册,适用范围更广。 授权登录后就来到了主界面,具体的模块如下。 二、社区探索 和之前功能差不多,右上角可以根据关键字搜索,相当于是一个图库。 随机刷图,查看最热门的图片,也可以分别选择本天 / 本周和本月的 Top 图,方便我们去寻找优质的图片。 点开单张图片,会展示用于生成该图片的提示词,还有一些快捷操作按钮。 右上角的 1 标志处,可以以图搜图,非常强大,同类型的图片一网打尽。2 标志处是加入收藏夹,方便查看。 Use 按钮处可以一键将图片、风格和 Prompt 加入到输入框,想要模仿图片出图时非常方便。 三、生成图片 基本操作 关键词输入在下图标志 1 区域,文字信息直接输入在框里。 点击右边标志 2 区域的小图标,可以看到...
Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放

Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放

近日,YouTube 频道 WVFRM Podcast 在其节目中,邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。 IT之家注:三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均为 Sora 项目负责人。 这三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,“还不是一个产品,短期之内不会向公众开放。” 对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但我们应该如何改进它是一个悬而未决的问题。 谈及 Sora 的原理时,负责人表示,其工作原理是分析大量视频数据、学习生成逼真的视频,工作方法融合了 GPT 等大语言模型及 DALL-E 等扩散模型的技术,架构类似于“介于两者之间”—— 架构上更像 GPT,训练方式类似于 DALL-E。 而对于 Sora 的训练数据来源问题,负责人则称不能透露太多细节,仅表示是基于公开可用的数据、OpenAI 授权数据的组合进行训练的。 据IT之家此前报道,Sora 能够根据文本快速生成相对高质量的视频,但业内人士认为,目前这类 AI 工具仍存在局限性,无法完全取代人类创作者的工作。 “很多人说好莱坞完了,” 电影概念艺术家和插画师 Reid Southen...