即时战略游戏可用于军事指挥训练兴发平台游戏:,打造更强更快通用人工智能技术

兴发平台游戏 1

10月19日,Nature官网刊发谷歌DeepMind关于阿尔法狗的最新论文,引起热议。近几年,以深度学习、强化学习为代表的人工智能理论和技术,已经在许多博弈对抗领域获得成功。2016~2017年,谷歌公司的阿尔法狗击败世界围棋顶级选手;2017年,加拿大阿尔伯特大学开发的DeepStack和美国卡内基梅隆大学开发的人工智能系统Libratus在德州扑克中击败人类顶级玩家;2017年OpenAI公司的人工智能程序在《Dota2》游戏中击败人类顶级玩家。

谷歌子公司DeepMind生产的“阿尔法狗”战胜围棋大师李世石后,“即时战略游戏”就成为许多人工智能专家眼中的下一个目标。DeepMind宣布将为研究人员提供一个用《星际争霸Ⅱ》测试人工智能的新算法,阿里巴巴也曾开发过一款《星际争霸》的增强学习框架。

这些人机对抗技术也在兵棋推演中获得应用。在中国科学院自动化研究所的智能化大厦里,有一支由青年科研骨干组成的团队——智能人机对抗团队,他们在智能人机对抗领域已经多次小试牛刀,并取得了不错的成绩。

可能很多人只关注到人工智能挑战“即时战略游戏”事件本身,而忽略了其在军事方面的重大意义。大多数“即时战略游戏”其实就是一款军事作战指挥模拟软件,比如一些二战系列的游戏,玩家可以通过扮演某个国家的将领,充分体验各军兵种在战争中所发挥的独特作用,犹如亲身亲历那些经典战役。还有一些策略性非常强的游戏,更偏重于对整体战略和局部战术的运用,玩家可以像在沙盘上一样运筹帷幄,指挥调配自己的各种军事力量,运用各种战略战术攻击对方。虽然战斗过程被大大简化,但其对实战分析的模拟程度却相当高。因此,“即时战略游戏”本身对提升军事指挥训练水平有很大助益。

兵棋推演系统获胜

战争是你死我活的对抗,一款真正的军事游戏必须具备高度对抗性。实战对抗游戏的乐趣来自于旗鼓相当的“对手”,因为水平差异所产生的“实力碾压”会破坏游戏本身对抗的乐趣。目前,游戏中自带的人工智能还比较原始,是基于预编程序的规则,没有学习能力,也无法进行训练,一旦被人类对手找到弱点后就很难再取胜。

在9月27日举行的2017全国首届兵棋推演大赛上,自动化所研制的人工智能程序“CASIA-先知V1.0”,在“赛诸葛”兵棋推演人机大战中与全国决赛阶段军队个人赛4强和地方个人赛4强的8名选手激烈交锋,以7:1的战绩大胜。

兴发平台游戏 ,原始人工智能的另一种情形,是快速从游戏代码中获取信息,同时对屏幕内外所有单位下达指令,“手速”远超人类,可以一直“碾压”人类对手。这种情况下,人类与原始人工智能“对战”很快就会失去兴趣,进步也不快。提高水平的最好办法,就是找到一个旗鼓相当的人类对手,但不同的选手之间水平差别比较大,很难找到一个水平层次相当的对手,更何况是一直陪伴自己共同提高的“伙伴”。

自动化所智能人机对抗成员范国梁研究员告诉《中国科学报》记者:“该程序展示了人工智能技术在博弈对抗领域的强大实力,
有望推动我国博弈对抗技术的深入发展。”兵棋推演,被誉为导演战争的“魔术师”,主要采取以计算机为载体的电子兵棋系统,推演者可运用统计学、概率论、博弈论等科学方法,对战争全过程进行仿真、模拟与推演,并按照兵棋规则研究和掌控战争局势,增加军队在未来战争中获胜的几率。

当拥有增强学习能力的人工智能开始挑战“即时战略游戏”时,我们看到了解决上述问题的曙光。人工智能通过成千上万次高强度的训练和比赛,不断积累经验,提升自身水平,找到各种复杂局面下的最优方案。相信用不了几年,人工智能就能轻松击败《星际争霸》游戏中的一般选手。随着DeepMind的强势介入,击败顶级选手将指日可待。

此次“赛诸葛”兵棋推演人机大战采用连级规模城镇居民地遭遇战的对抗想定,人工智能程序和人类选手在完全相同的场景和对等条件下进行指挥对抗。

之后,人工智能就可以向军事指挥训练方面拓展。利用情报系统提供的素材和仿真实验得到的大数据,将各类军事作战想定、规则和参数移植到“即时战略游戏”,较为逼真地建立起“蓝军”模拟系统。对抗的一方是真实的指挥员,另一方则是人工智能系统。人工智能通过强化学习将自己打造成为指挥员的“私人教练”,成为一个旗鼓相当的对手,并对指挥员开展个性化培训,让其在每局对战中都能发现自己值得改进的地方。随着指挥员水平的不断提升,人工智能还会自动调整自己的水平,让指挥员一直感受到对抗的乐趣和挑战。

同样来自自动化所的智能人机对抗成员兴军亮研究员介绍道,相比人类选手,人工智能程序“CASIA-先知V1.0”能更加快速准确地进行态势判断和策略决策,很少犯低级错误,进而战胜经验丰富的人类高手。

据悉,“CASIA-先知V1.0”采用知识和数据混合驱动的体系架构,构建了人工智能指挥员模型。目前在态势感知和作战决策的主要模块上采用知识规则+不确定推理的方式,第一步实现了知识驱动的人机对抗和机机对抗系统。

星际争霸:AI大赛历练

10月初的一个周末,由美国人工智能协会所赞助的星际争霸
AI大赛落下帷幕,自动化所智能人机对抗的一支参赛团队获得第四名。

星际争霸AI大赛是加拿大纽芬兰纪念大学David
Churchill组织的年度活动,今年是第八届比赛,比赛的目的是评估即时战略游戏对人工智能的意义。

自动化所有3个AI
Bot参赛。其中,以独立队伍身份参赛的CPAC由张俊格、兴军亮等人完成,其研发的软件采用了知识+数据驱动的模式。另外两个AI
Bot由朱圆恒、唐振韬、邵坤、李楠楠和赵冬斌完成,代号分别为Juno和KillAll。其中,CPAC以71.01%的胜率排名第四。

相关文章