文章主题:Datawhale, 叶鑫, 伦敦大学, AI

666AI工具大全,助力做AI时代先行者!

-Datawhale干货-

作者:叶鑫,伦敦大学,Datawhale成员

人工智能(AI)在当下计算机算法中表现出色,其应用范围涉及诸如计算机视觉(CV)、自然语言处理(NLP)、语音识别以及机器人等多个领域。然而,在游戏产业中,AI的运用常常被误解为仅仅是对游戏角色的人性化处理,而其第一印象往往是强化学习算法。但实际上,AI在游戏行业中的应用远不止这些。接下来,我们将详细探讨游戏领域的AI应用与算法。

首先摆在我们面前的是,为什么要研究游戏AI呢?

可以将游戏视为现实生活的镜像,对其进行研究可以为解决实际问题提供有价值的参考。此外,游戏的算法不会局限于少数几种方法,各种AI技术可以在不同游戏中灵活运用或组合。然而,最重要的是游戏本身具有极高的趣味性,让人乐在其中。

引用《AI与游戏》 中的话:

自人工智能理念诞生之始,游戏一直是推动其研究进程的重要力量。游戏不仅为AI提供了充满趣味性和复杂性的问题,使得AI能从中精湛地应对各种游戏挑战,而且为人类及机器人用户提供了一个展现创新思维和情感表达的广阔舞台。因此,我们不妨将游戏视为一种罕见的存在,它是科学 problem-solving能力与艺术相融汇、相互作用的结果,这一特性使得游戏成为了AI研究的独特且理想环境。然而,不仅仅是AI在游戏中得到提升,游戏本身也在AI研究领域实现了进步。

——《Artificial Intelligence and Games》

01 从游戏环节看AI应用

在游戏行业中,人工智能的应用远不止于人们所熟知的玩家型战斗AI。实际上,当传统游戏制作方法与AI技术相结合时,会在游戏的各个层面催生出对应的应用和算法。若深入剖析一款游戏的全局架构,将这些AI应用逐一列举出来,便会发现其广泛且實用的性。

1.1 游戏画面

在游戏开发过程中,为了满足用户在游戏内的视觉体验,开发者需创建相应的角色动画模型。传统游戏制作依赖专业的游戏原画师来完成这些任务,但在关注角色表情和动作等细节时,动画设计往往变得复杂而不易达到理想效果。幸运的是,视觉人工智能技术能够将人类的动作投射到角色上,生成逼真的动作表情。同样地,在环境设计方面,AI也能产生类似的效果,通过输入现实图片来生成游戏画面。在这一领域,计算机视觉领域的机器学习方法如姿态识别、表情识别和生成对抗网络(GAN)等发挥了关键性作用。以下几个实例将帮助你了解AI如何创造游戏画面。

1709968386222.jpg

▲ 动作识别

1709968386503.jpg

▲ 表情识别

1709968386736.jpg

▲ 深度强化学习

1709968386994.jpg

▲ AlphaGo中基于蒙特卡洛搜索树的深度强化学习

1709968387181.jpg

▲ 演化算法

1.2 玩家型AI

这种类型的游戏AI是大众最熟悉的,2017年,AlphaGo战胜了世界围棋冠军李世石,2019年,OpenAI Five击败了DOTA2世界冠军OG,这两的事件都证明了AI在游戏中的表现可以超越人类。从本质上讲,这类AI问题实际上是路径规划问题,也就是根据当前游戏状态,生成相应的动作序列。以强化学习和深度强化学习为代表的一些游戏AI技术,在我国的游戏产业中已经得到了广泛的研究。在一些游戏类型,如棋牌类、回合制策略游戏中, Monte Carlo 搜索树(行为树)、演化算法、A*等在线学习算法也展现出了优势。

1.3 游戏内容

在这一方面的AI应用常常不为人所知,通常被称为Procedural Content Generation(PCG)。在游戏内容(地图)的产出上,以魔兽争霸3为例,一方面依赖于游戏本体制作时开发者制作的地图;另一方面依赖于社区玩家的自定义地图,而社区玩家内容又更是由玩家数量所决定,丰富且可行的游戏内容是吸引玩家入坑的重要保障。利用AI去生成可行的游戏内容是非常值得研究的方向。目前该方向的主流算法包括演化算法、GAN等。

1709968387369.jpg

▲ AI生成游戏内容

1709968387466.jpg

▲ GAN的应用

1.4 游戏初始化平衡

目前在卡牌类游戏中,为了初始化得到的卡牌或是环境相对平衡,在PVE游戏中体现为玩家可以战胜Bot,PVP游戏例如炉石传说、自走棋,防止出现双方卡牌差距过大导致输掉,可以利用AI来设计发牌的策略。该方向的主要算法为演化算法。

1709968387613.jpg

▲ 炉石中的演化算法平衡牌组

1.5 游戏测试

在游戏制作完成后,开发者们需要测试游戏内存在的bug,这毫无疑问是重要的,如果一款游戏存在大量的bug,对该游戏的评价和收益都会造成巨大的影响。而测试游戏需要大量的时间,在这一方面,测试专用的agent可以被设计来面对这一挑战,目前这一块的算法主要为蒙特卡洛搜索树、强化学习、深度强化学习等。

1709968387870.jpg

▲ 深度强化学习自动测试agent

1.6 用户画像

在游戏的运营过程中,玩家在游戏内的行为会产生丰富且复杂的数据,这些数据内折射了玩家的行为,分析并合理利用这些数据可以提炼出有价值的信息,这些信息可以用作促进游戏更新更多玩家喜欢的内容,预测玩家的行为和喜好,检测作弊外挂等。这一种游戏中的数据分析问题被称为用户画像问题,利用合理的机器学习算法可以极大提升玩家的游戏体验。

1709968388139.jpg

▲ 用户画像分析

02 AI应用在游戏中的详细分类

【硬核预警】下面将参考开篇提到的的《Artificial Intelligence and Games》,对游戏领域的AI从应用和方法两方面做汇总介绍,在方法部分会涉及大量AI技术。

1709968388379.jpg

根据上图,AI在游戏中的具体应用可以大致划分为三个方向:

利用AI玩游戏利用AI为玩家建模利用AI生成游戏内容

2.1 利用AI玩游戏

在游戏中建立bot。

(1)应用为导向

a.与玩家对抗/协作

依据数据和预算产生不同水平的agent,可以与玩家共同匹配或作为PVE的NPC等提高玩家体验水平,由此引申的功能可以有动态难度调节,游戏自动平衡。

b.游戏bug测试

在投入运行前,可以通过投入大量的有测试行为的agent进入游戏,根据其行动期间的log异常来得到一些bug,或是通过bot间的对战,依据一定的判定方法来得到版本数值平衡性分析。

c.合成数据收集

在游戏投入运行得到一定的玩家数据前,可以使用agent的行动来得到仿真的玩家数据,例如阵型识别,胜率预测等数据。

d.产生更强力的agent

根据共同演化的方法,一系列基础的agent可以通过参数演化或者agent间对抗性的方法来催生性能更好的agent。

e.寻路(Pathfinding)

寻路规划可以被视为AI动作序列输出的一种特例。在某些游戏例如马里奥中,寻路算法本身就构成了AI player。

(2)方法为导向

根据是否使用了游戏提供的仿真模型(即可根据目前的游戏状态以及可执行动作得到后续的帧的游戏状态可以将其分为Model-based与Model-free的agent。

a.Model Based(基于模型的agent)

Planning-based:最佳优先搜索(例如 ),蒙特卡洛树搜索,演化规划基于模型的强化学习

b.Model Free(无模型方法)

静态类方法:状态机,行为树,基于效用(启发式)函数的AI方法planning-based:STRIPS(符号化表示规划)

c.学习类方法

强化学习:需要高度表格化表示。深度强化学习:基于游戏图像,不需要标记数据,但需要有游戏实时的奖励设置。演化算法:通过演化算法来更新神经网络结构和权重来达到最优化。模仿学习:根据玩家的数据来学习游戏的策略,基于游戏图像,需要玩家数据。逆强化学习:根据策略来学习游戏中的奖励分布。

2.2 利用AI生成游戏内容

就是PCG(Procedural content generation),利用AI的方法去协助设计游戏系统,前置要求是需要比较好的数据(包括数据的质量,数据的代表方式,数据的数量)和有代表性的评估方法(包括美学,可玩性,新奇性)。具体的应用方法需要进一步查阅资料。

(1)应用为导向

a.(辅助)生成游戏中的内容(影响规则):关卡、地图、物品、武器、任务、人物、规则等。

b.(辅助)生成游戏中的外观(不影响规则):人物外观,表情,武器外观,音效等。

c.辅助设计

d.修复地图bug:对无法抵达的死角做检测与替换等。

e.数据压缩:将游戏数据压缩到更小的尺寸。

(2)方法为导向

a.元胞自动机

使用领域规则根据随机初始状态生成大量不规则图形,可用于热量、雨水、液体流动、压力爆炸等环境系统建模,也可以生成洞窟等小型地图,但无法保证可控性。

b.基于文法方法

定义一系列文法规则来生成内容。

c.基于搜索方法(通常为Evolutionary Algorithms,EA):

相较于机器学习的方法,搜索方法可以大大减少所需求的数据量,关键问题有例如需要确定较好的内容表示形式,需要有一种较好的评估手段。有以下几种分类:EA类算法:遗传算法,演化策略,演化编程EA like 算法:粒子群演算法,差分进化算法content representation评估方法直接评估是通过某种函数去约束评估生成的内容,包括Theory-driven和Data-driven,区别在于评估函数是基于理论还是经验模型的。基于仿真是利用bot AI去进行游戏来评估游戏的内容。包括静态评估和动态评估,区别是评估函数是否会随着时间改变。互动评估属于实时评估,通过人类玩家的体验进行评价。包括隐式评估-通过玩家玩游戏产生的数据来分析内容好坏,以及显式评估- 玩家直接评分

d.机器学习方法

PCG研究的一个新方向是在现有内容上训练生成器,以便能够产生更多相同类型和风格的内容。这是受最近的深度神经网络研究结果的启发,其中生成式对抗网络和变异自动编码器等网络架构在学习生成卧室、猫或人脸等图像方面取得了很好的效果,同时也受到了早期研究结果的启发,其中较简单的学习机制如马尔科夫链和较复杂的架构如递归神经网络都在一些语料库的训练后学习生成文本和音乐。

神经网络,包括GAN,AutoEncoder和NeuroEvolution等等。概率模型,包括决策树等大致的PCGML数据代表方式与训练方法总结如下:

1.数据representation:

– Sqquences: 利用顺序的向量来作为输入(输出)数据

– Grid: 使用2D的网格结构来作为输入(输出)数据

– Graph:使用原始图像作为输入(输出)数据

2.PCGML训练方法:

– Backpropagation: 利用反向传播作为训练NN的方法来

– Evolution: 使用演化计算方法来训练NN或是直接生成结果

– Frequency Count:使用统计学与马尔科夫链变种来计算概率

– Expectation Maximization: 利用EA算法来训练无监督学习模型

– Matrix Factorization:矩阵因子化是一种数学方法来将输入的矩阵分解到更低维度的方法

e.将游戏生成内容与玩家体验结合(EDPCG,Expierience-driven PCG),它包括了三个核心方面: 情绪激发、情绪检测和情绪表达。

情绪激发: 游戏为激发情感提供了出色的背景构件,因为刺激是变化的,来自不同的来源,如图像、声音、故事等等。情绪检测: 游戏用户(玩家)通常更愿意提供更多的多模态性质的输入(通过传感器),只要这将导致体验的增强。从某种意义上说,玩家是情感计算和多模态交互研究的最佳用户。情绪表达: 用户在游戏中自愿经历一系列的体验:这些体验从非常积极的到非常消极的都有。同时,游戏中的情感体验是受玩家影响的! 因此,玩家习惯于并在很大程度上对基于情感的表达持开放态度!

2.3 利用AI为玩家建模

利用游戏产生的数据来为玩家建立体验或行为模型(包括其消费预测,游戏性行为预测,体验感预测)或是进一步利用该数据来更新与描述游戏(例如平衡性分析,游戏流派,提供给Agent更多的训练数据)

以潜行恐怖游戏《Hello Neighbor》中的玩家建模例子。在这款游戏中,AI打造的领居会一直跟踪玩家,并从过去的错误中吸取教训,致力于打败玩家。

(1)应用为导向

a.理解玩家在游戏中的体验。AI可以根据玩家的体验感来评测游戏各个组件与系统; 辅助更新新的游戏活动; 辅助更新前两个AI系统。

b.理解玩家在游戏中的行为。AI辅助分析游戏行为,例如发掘一些新的游戏玩法;可以根据异常数据来判定外挂等作弊系统;形成可观的游戏数据来支持新的游戏AI迭代;辅助设计更具有公平性的匹配系统;预测玩家的行为;对玩家社交群体分类;分析玩家的性格。

(2)方法为导向

a.经验VS行为(Experience vs Behavior)

Experience: 玩家在游戏过程中的感受,包括:一系列(合成的)感受、认知、行为状态,或是其他的用户状态,情绪和认知等Behavior:玩家在游戏过程中的行为。

b.高级概念分类

model-based(理论驱动):从一些列玩家心理学、认知学的研究中得到一些玩家对应游戏的模型,来自上而下的设计游戏model-free(数据驱动):不利用之前的学科研究来对玩家进行自下而上的建模,其中包括可视化,例如热力图来衡量玩家的活动频率。

c.监督学习

玩家建模包括寻找一个函数,将玩家的一组可测量的属性映射到特定的玩家状态。按照监督学习的方法,这是通过机器学习或自动调整模型的参数来实现的,以适应包含一组输入样本的数据集,每个样本与目标输出配对。输入样本对应于可测量的属性(或特征)列表,而目标输出对应于我们有兴趣学习预测的每个输入样本的玩家状态的注释。如前所述,注释可以从行为特征,如关卡或玩家原型的完成时间,到玩家经验的估计,如玩家的挫折感等。

d.无监督学习

很多时候,我们面临的数据集是没有关于玩家行为或经验状态的目标输出。在这种情况下,玩家的建模必须依靠无监督学习。无监督学习的重点是通过发现输入的关联,在没有获得目标输出的情况下,将模型与观察结果相匹配。输入通常被视为一组随机变量,通过观察输入向量之间的关联来建立模型。应用于玩家建模的无监督学习包括聚类和关联挖掘等任务。

参考

[1]Georgios N. Yannakakis and Julian Togelius. Lecture. Slide 3. Playing Games. [Online].http://gameaibook.org/lectures/

[2]Georgios N. Yannakakis and Julian Togelius. Lecture. Slide 4. Generating Content. [Online].http://gameaibook.org/lectures/

[3]Summerville, Adam, Sam Snodgrass, Matthew Guzdial, Christoffer Holmgård, Amy K. Hoover, Aaron Isaksen, Andy Nealen, and Julian Togelius. “Procedural content generation via machine learning (PCGML).” IEEE Transactions on Games 10, no. 3 (2018): 257-270. [pdf]

[4]Georgios N. Yannakakis and Julian Togelius. Lecture. Slide 5. Modeling Players. [Online].http://gameaibook.org/lectures/

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *