文章主题:AIGC, AI Generated Content, Synthetic media, Generative AI

666AI工具大全,助力做AI时代先行者!

0
本文尝试围绕AIGC在游戏领域的应用这一话题,为读者提供“走马观花”式的阅读体验,分享行业见闻而非着重介绍晦涩技术概念、细节,抛砖引玉,启发思考,将针对以下四个主题进行分享:

一、AIGC在游戏领域的基础应用
提取作者了解到的AIGC 游戏基础应用,从游戏工业的不同侧面梳理AIGC带来的生产力革命、创新可能性
二、AIGC在游戏领域的上层引用
以具体案例简要探索AIGC在游戏领域的上层应用,如AI NPC、虚拟人、数字人社群,聚焦综合解决方案
三、AIGC热点话题
探讨AIGC在游戏领域的技术瓶颈、法律风险、伦理争议等,帮助读者补全相关视野
四、“全要素生成”——AIGC 游戏未来展望
从作者个人视角探讨AIGC引发游戏形态革命的可能性,畅想科幻电影中的情境何时照进现实

作者介绍:张昊阳,国民手游游戏技术策划、前AI赛道创业者,5年AI领域从业经验,7年游戏开发经验,AIGC 游戏探索和布道者。

🌟了解了!AIGeneratedContent(简称AIGC),是AI世界中的创新产物,代表人工智能生成内容的前沿力量。🔍通过GAN和大模型等技术,它从海量数据中挖掘模式,巧妙地创造出新颖的内容。🎨Synthetic media与此相呼应,AI驱动的文字、图像和音频,丰富了我们的数字世界。而在Gartner的视角里,Generative AI虽与AIGC有交集,但它的定义更侧重于生成类似原始数据的过程,相对更为具体。💡相较于量子位智库广义的定义,这一概念聚焦在内容生成的核心技术上,有助于搜索引擎优化和提升用户体验。🏆让我们期待AI Content产业的无限可能,它将如何引领未来创意与信息的流动呢?

🎨💻🚀 #AIGC革命:AI赋能内容创作新高度🔍 高通量、低门槛的AI生成技术,引领了一场内容产业的创新风暴,它不仅仅颠覆了PGC与UGC的传统模式,更以无限可能重塑价值创造。🌍📈 在游戏世界中,ChatGPT的API犹如魔法,赋予NPC更为生动的对话,让玩家沉浸于超现实的互动体验,《骑马与砍杀》的世界因此更加鲜活。🎮🌐 《AI Dungeon 2D》则将故事叙述与视觉艺术无缝融合,AI生成的故事文本与图像交织,为玩家带来前所未有的娱乐盛宴。🌟🎨 CG设计师在Wonder Studio中,只需一键,就能让视频跃动生命,转化为细腻的CG画面,甚至在游戏中实现动作的二次创作。🎬📈 这个快速崛起的赛道,犹如一颗璀璨明珠,在过去的几年里经历了爆炸式增长,AI的力量正在超越人类的边界,为未来内容产业开辟崭新道路。🌟别忘了,探索AIGC的无限可能,一起见证这场技术与艺术的交融盛宴!🌍—原文已根据要求进行了改写和优化,保留了主要信息,并使用了SEO关键词、表情符号和段落间适当的连接,同时避免了直接复制原内容。

图:目前AI在部分领域表现已经达到人类标准 来源:Our World in Data,中泰证券研究所

🌟2022年,AI生成内容(AIGC)领域的现象级产品引领潮流,从Midjourney到Stable Diffusion再到ChatGPT,一众创新公司犹如春天的繁花般涌现,为行业注入强劲活力。🔍数据显示,过去三年,AIGC领域的人才需求呈爆炸性增长,人才供需比持续攀升。随着技术的进步和市场需求的推动,AI生成内容正以前所未有的速度改变着各行各业,催生出众多热门岗位,如AI内容创作者、算法工程师等。💼无论是大型科技公司还是初创团队,都在积极布局AIGC,寻求在这个新兴领域的竞争优势。脉脉平台的数据背后,反映出这个领域对人才的渴求,吸引了大批专业人士投身其中,他们用智慧和创意推动着技术的进步。🎓教育背景的多元化和技能的提升,使得AIGC领域的人才储备更加丰富。SEO优化提示:使用行业关键词如”AIGC趋势”、”AI内容创新”、”人才需求增长”等,增加emoji符号以提升可读性和吸引力,保持信息的新鲜度和相关性。

图:AIGC相关公司Landscape 来源:2023 data, ML and AI landscape: ChatGPT, generative AI and more

图:AIGC行业相关岗位增长势猛 来源:脉脉高级人才智库

一、AIGC在游戏领域的基础应用

🎨🚀探索游戏新纪元:AIGC的六维魔力🔥🔍从文本、图像到音频、视频,乃至三维空间的沉浸体验,AIGC(人工智能生成内容)正以创新的方式引领游戏领域变革。💡🌈每个模态都藏着无限可能,它们交织融合,创造出前所未有的互动乐趣。💻🎨想象一下,智能自动生成的角色与玩家无缝对接,动态音效为冒险增添震撼,甚至三维立体的虚拟世界让触觉也跃动起来。未来,跨模态技术将成为游戏业的引擎,推动内容创作和用户体验的飞跃。🔥🔍让我们期待这一颠覆性的发展如何重塑游戏世界,开启一个充满惊喜与创新的新篇章!🏆🌐

🌟文本与图像齐飞,22年引领创新风暴🔥——ChatGPT、MidJourney和Stable Diffusion等里程碑式产品横空出世,不仅引发了全球范围内对AI技术的热情狂潮,也推动了相关领域的发展,研发投入显著增长。\📈在语言模型的璀璨篇章中,ChatGPT的成功点燃了新一波热潮,诸如Newbing、Claude、Meta LLaMA、斯坦福Alpaca等一众明星产品应运而生,它们如同璀璨星辰,照亮了技术进步的道路。国内智慧之光也不甘示弱,清华大学旗下的智谱科技和复旦大学的MOSS,以及百度的文心一言和阿里巴巴的通义千问,纷纷加入这场创新竞赛,各显神通。\📝这些技术创新不仅改变了我们的交流方式,更预示着未来无限可能。SEO优化提示:ChatGPT、AI技术、语言模型、技术创新、未来发展

文本生成并不是只有大众熟知的GPT,也就是生成式预训练Transformer模型一种解决方案,此前谷歌的BERT(Bidirectional Encoder Representation from Transformers,什么是BERT?),LaMDA和它对应的产品Bard,以及其他的NLP技术已有多年积累,GPT则是迄今为止效果最好的一种解决方案,关于这一点IDEA张家兴博士有个圈内知名度较高的调侃——“ChatGPT爆火后,NLP技术不存在了”

笔者将文本生成在游戏中的应用分为通用文本、文案、代码、对话等四个子类。

文本生成

🌟文章写作大师在此!🚀专攻通用文本编写,让每个角落都闪耀应用与泛文之光✨从游戏策划的金点子到细腻设计图纸,再到数据报告的精准呈现,无所不包💡无论是表格布局还是本地化内容,我都能为你打造专业而实用的文本大厦📚隐去个人信息,只留下文字的魅力和价值🔍SEO优化大师在此,让搜索引擎找到你的关键词,提升可见度🌈别再为通用文本烦恼,交给我,让你的文章如磁铁般吸引眼球🔥

图:ChatGPT输出卡牌游戏策划案

图:ChatGPT输出战争类游戏伤害公式

图:ChatGPT输出角色属性值表格

文案方面,游戏里的故事文本、对话数据(这里指预设好的对话,而不是交互式生成的对话文本)等均可以通过NovelAI、NotionAI、彩云小梦等工具生成,乃至产生新玩法,如AI Dungeon,它可以动态生成故事,且能够根据玩家的输入做出反应,生成不可预测的动态游戏体验。最新的GPT技术撰写的文案在某些情况下能超越人类水平,尤其是在一些限定的规则下,如只使用某些特定的字母、Emoji,或是编写藏头诗等等。

图:ChatGPT补全故事

图:ChatGPT使用Emoji表达指定的内容

图:ChatGPT写诗称赞嘉然

代码方面,在游戏制作过程中可以用Copilot、Cursor这类IDE工具或者插件辅助游戏开发,代码审查则有Metabob提供能力支持,也可以通过将GPT接入游戏引擎,接管关卡内容创建逻辑(跨模态),乃至游戏运行时生成游戏代码和游戏内容。笔者也测试过使用ChatGPT生成Unreal Engine引擎里的简单交互逻辑,及NewBing生成和平精英绿洲启元的代码等,认为具备一定的可行性和想象空间。

图:Cursor.So软件,它可以帮助你生成和调试代码

图:Mapping AI in the software development life cycle – 软件开发领域的AI工具Landscape

0

交互式文本生成(对话生成)方面,早年即有相关应用,如微软小冰,但受限于以往NLP技术的生成,没有大量应用在游戏中用作角色扮演,GPT的出现改变了这一局面,如前文介绍到的《骑马与砍杀》ChatGPT NPC,Glow软件里的虚拟人沈思前、日本小程序赛博佛祖,都是让GPT驱动的AI扮演一个特定角色。新的玩法也在产生:如侦探游戏《ドキドキAI尋問ゲーム》让玩家扮演侦探审问犯人,审问的“犯人”接驳ChatGPT,玩家需要在7次对话内让AI犯人说出“我是犯人”来通关游戏,思路让人眼前一亮。

图:《骑马与砍杀》ChatGPT NPC

图:侦探游戏《ドキドキAI尋問ゲーム》需要玩家在7次对话内让AI犯人说出“我是犯人”

图像生成

在图像生成领域,MidJourney、Stable Diffusion、DALL·E 2等工具已让大众耳熟能详且成为了这一领域的鼻祖,现如今则发展成了MidJourney和Stable Diffusion二分天下的局面:艺术家/设计师更偏爱MidJourney,因为它生成的内容质量足够高且相对易用,工程师/技术美术和大厂则更偏爱Stable Diffusion,因为它可以输入复杂的参数来进行精细化控制且代码开源。

图:Midjourney AI vs Stable Diffusion – Which generate BETTER Images?

与Stable Diffusion相关的最著名开源项目便是由AUTOMATIC1111开发的Stable Diffusion web UI,几乎一半以上的Stable Diffusion使用者都在使用此工具或是为其开发新的开源能力,使其愈发强大。伴随着生态的发展,Dreambooth、LoRA、LoCon、LoHA等Diffusion Model微调方案相继出现,ControlNet则将用户对生成图像的控制力提升到了一个新的高度。基于Stable Diffusion的商业工具如NovelAI Image Generator、Leonardo.AI、Scenario.gg也开始出现,并应用在游戏原画、场景、图标设计等领域。值得一提的是,著名数字艺术工具公司Adobe也加入了战斗,推出了自己的AI生图工具Firefly。

图:NovelAI Image Generator的推出将AI绘画的发展推向了一个新的高潮

图:Leonardo.AI集成了Stable Diffusion的各种能力,简化了使用繁琐度

AI生成图像对游戏原画领域的提效和冲击无疑是巨大的,一个比较经典的案例是《猴子都能学会的AI角色设计》(2022年Q3),作者演示了如何使用AI绘画工具将一个大头涂鸦一步步转化成完整的角色设定。事实上,AI绘画被大量一线游戏大厂的许多项目组普遍采用来提升沟通和创作效率已经是一件众所周知的事。

组图:猴子都能学会的AI角色设计

不单单是原画领域,在游戏贴图生成与处理、游戏实时画面增强/风格化、浮雕/卡雕效果乃至全景图到3D场景的生成方面,AIGC的运用也已屡见不鲜。如Text2Text使用Diffusion算法提供了从白模生成贴图的解决方案、Poly可以用自然语言prompt生成PBR材质球,Nvidia的Real-Time Neural Appearance模型甚至可以实时生成效果极惊艳的电影级别的写实外观材质。在游戏《Tales of Syn》中,作者用了Stable Diffusion的深度图生成能力,结合游戏引擎的曲面细分能力制作了3D卡雕效果、笔者也曾尝试使用ControlNet与UE5引擎结合,对UE5渲染的图像进行实时风格化处理。而AI的超强**参数化生成**能力,让一些此前不可能实现的玩法变得可能,如使用LoRA模型固定风格和角色的方法,在游戏运行时提供批量生成指定形象的能力,实现“千人千女”或是“千人千宠”。

图:Text2Tex提供了从白模生成贴图的解决方案

图:Poly可以用自然语言prompt生成PBR材质

图:nVidia提出可达电影级别的,实时神经外观生成模型,支持各向异性采样和LoD渲染,shader速度相比之前快一个级别,效果极惊艳

图:Tales of Syn使用Stable Diffusion的能力制作卡雕效果

图:作者本人制作的ControlNet UE5实时风格化渲染案例

除此以外,交互式生成也是一个值得游戏从业者关注的生成方式,NVIDIA推出的Canvas应用可以让使用者通过涂鸦的方式实时生成指定风格和内容的图像,在一款名叫Unstable Journey的开源应用中也提供了类似的交互形式,这不禁让人联想,是否可以用AIGC的方式制作一款升级版的“你画我猜”。

图: Nvidia Canvas应用程序

图:Unstable Journey应用

由此我们可以推断,AI生图能力在未来将更多地集成在游戏程序中,成为玩法不可分割的一部分。而在图像处理方面,AI也表现了超乎想象的惊人实力,无论是超分辨率还是语义分割,相关领域已发展多年,在近期又迎来了新的突破,在最新的一篇论文《Segment Anything》中,Meta发布的语义分割模型SAM让不少人惊呼“CV(计算机视觉)不存在了!”无独有偶,前不久Meta更是推出了其多模态模型《ImageBind》,这是一个能够同时绑定六种模态数据的AI模型,使得机器能够更好地分析多种不同形式的信息。类似的应用也被运用在了游戏生产管线中,例如UnrealCV就提供了一种在Unreal游戏引擎中识别3D物体并生成深度、法线等信息的解决方案。

图:Meta发布的语义分割模型Segement Anything(SAM)

图:UnrealCV提供游戏引擎内的计算机视觉能力

音频生成

音频和视频内容生成也是游戏内容生成中不可忽视的一部分。从AI作曲到声音克隆,AI生成的音频已然出现在许多游戏作品和游戏二创内容中。早在2016年,一款名为AIVA的AI作曲工具就曾掀起过一波浪潮,此后的AI作曲工具层出不穷,如Mubert、Jukebox、Melodrive等,虽然AI作曲的质量与人类艺术家的作品仍有一定差距,但在一些低成本、小制作的游戏中,这类“罐头音乐”内容能够以低成本、高效率的优势取代人工作曲,完成配乐需求。

0
0

声音克隆(又称音色迁移)则是近年非常流行的一种语音合成技术。相较于传统语音合成中生硬的机械音,声音克隆一经推出便以其媲美真人的音色全面占领市场。在声音克隆中,主要有两类突出的应用:歌声合成、人声合成。歌声合成技术目前已经趋于成熟,下面的案例展示了在up主的“调教”下,将周杰伦的音色迁移到日本歌手Aimer的名曲《カタオモイ(单相思)》中,不但还原了天王巨星的音色,连吐词不清的慵懒感也一并迁移,十分震撼。

0

人声合成方面,技术尚不如歌声合成成熟但仍值得期待。如在下面的视频中,up主展示一个了用Vits的开源解决方案,将原神派蒙的语音作为语料进行训练合成的“AI派蒙”,不难感受到,尽管真人配音在情绪表达方面完胜AI合成音,AI依然能把语气、抑扬顿挫等人类特点学习并复现出来,在一些独立游戏中,这类合成音或许能在让玩家接纳的前提下节约成本、提高配音效率。在一些游戏二创内容中,此类应用也已屡见不鲜,遑论铺天盖地般使用AI合成音配音的各类短视频。

0
0

视频生成

在图像生成技术蓬勃发展并成功破圈后,视频生成的能力也接踵而来,引发诸多关注。视频生成有几种不同的形态,如从文本生成、从给定的图像生成、从视频生成等,虚拟人生成由于其独特的应用场景和技术路线,笔者将单独拆分出一类进行介绍。

从文生成的经典案例和应用有Runway Gen-2和NVIDIA VideoLDM,它们均可以用给定的一串描述文本生成一系列画面并组成序列帧。

0

从图生成的案例比较出名的则是今年早些时候由著名影视制作团队Corridor Crew团队发布的视频《石头剪刀布(VFX Reveal Before

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注