欢迎来到智能系统与工程研究中心
关注微信
菜单
新闻中心 News Center
头条新闻 Headline news

管窥临机应变之道——2021“庙算杯”人机对抗测试赛解说回顾

发布时间: 2021-08-31
浏览次数: 35

管窥临机应变之道——2021“庙算杯”人机对抗测试赛解说回顾


作者:李剑章  2021年8月6日


 
2021年7月10日-8月1日,“庙算杯”人机对抗测试赛由中国科学院人工智能创新研究院、中国科学院自动化研究所主办。“庙算”一词取自《孙子兵法》当中“夫未战而庙算胜者,得算多也;未战而庙算不胜者,得算少也”这句话。比赛以“临机应变”为主题,旨在通过和高水平人类选手对抗,测试评估智能体在临机环境下的决策应变能力。我有幸作为解说员参与“庙算杯”决赛的现场解说工作。
7月19日-7月29日期间查阅各种资料,通过人机对抗练习增进对任务的了解,拟定解说词。7月30日-8月1日,“庙算杯”决赛在中科院自动化所举行。8月1日上午,我和赵美静老师在自动化所报告厅解说图灵赛最后2场。网上对解说现场进行了同步直播。
现在,比赛已经告一段落,选手和工作人员都已回到原来的生活当中。这篇文章聊以记录解说活动的所见所闻、所思所感。
管窥临机应变之道——2021“庙算杯”人机对抗测试赛解说回顾
 
人机对抗
在本次活动之前,我也曾经参与过其他一些兵棋赛事的解说工作,包括2017年首届全国兵棋推演大赛北京赛区总决赛、2018年第二届全国兵棋推演大赛全国总决赛。这些比赛采取的都是人人对抗的形式。解说人机对抗兵棋推演比赛,是从未有过的全新经历。特别是听说本次解说还将在网络上进行直播,对我而言更是一种前所未有的挑战。
作为中文系的学生,我对智能博弈领域的相关知识并不熟悉。幸好通过向赵老师请教,让各种困惑得以解决。例如,AI主要分为知识型的“白箱”和学习型的“黑箱”这两种类型。在实际应用中,往往是两者互相配合,以知识型的“白箱”为主,辅以学习型的“黑箱”。我还了解到了兵棋推演当中策略的非传递性:A策略能战胜B策略,B策略能战胜C策略,不代表A策略能战胜C策略。就好比在“剪刀石头布”的游戏当中,剪刀能战胜布,布能战胜石头,不代表剪刀能战胜石头。而要想判断对方出的是剪刀、石头还是布,就需要通过侦察来实现意图识别,并且准备好相应的战术。从而制定合理的方案,定下作战决心。
这次的解说,也让我管窥到“人”和“机”的不同之处。首先在心态方面,AI稳如泰山,从来不会被战局所影响。而人类选手一旦战局不利,就难免陷入慌乱与焦虑当中。尤其是,当人类选手初次面对AI选手,之前听说了AlphaGo横扫人类选手的故事,面对未知力量,难免滋生出些许恐惧的心理。但也不排除在少数情况下,人类选手在面临不利条件时,反而“小宇宙爆发”,激发出强大的精神力量,沉着冷静,从容应对,于是反败为胜,力挽狂澜。另外也想到,不知若干年后,AI会不会拥有人类的情绪?这是不少影视文艺作品所热衷的题材。也许当AI技术发展到一定程度,这一设定将会被实现。
人类与AI在精力方面也存在着非常明显的差别。由于兵棋比赛需要选手们高度集中注意力,在许多轮高强度的兵棋对抗之后,身心状态到了强弩之末,往往难以发挥出一贯的优势。而AI选手只要电源充足,可以不眠不休。当然,据说学习型的AI在学习的过程中需要耗费难以想象的电量,相比之下,人类则堪称低碳环保。
在智能博弈等方面对AI的运用,并不意味着AI会完全取代人类。人类未必放心把决策的权力交给算法,让AI信马由缰地带领人类。AI未必是每次都可以托付的“军师”,但可以是很好的“蓝军”,发挥“磨刀石”的作用,让人类能够通过与AI的对练,获得更强大的实力。AI与人类配合,取长补短,能够发挥出前所未有的效果。
 
图灵赛制
作为文科生,我对“图灵测试”的印象主要来自于夏笳的科幻小说《晚安忧郁》。“庙算杯”人机对抗测试赛改“人机对话”为“人机对抗”,让人类选手根据对方战术风格留给自己的印象,来判断对方选手是人类还是AI。人类选手在每场比赛结束之后会收到一张问卷,需要在问卷中填写出对另一方的印象。例如判断对方是否是AI,并且给对方在对抗风格、战术设计新颖性、态势感知判断、临机应变反应等方面的特征进行打分。我和赵老师在解说过程中,也经常试图猜测双方选手“谁是人、谁是机”,这一过程可谓妙趣横生。一开始时,双方选手的战术风格尚未充分呈现,可能暂时人机莫辨。随着战局展开,双方由开进转为短兵相接,届时基本上就能猜个八九不离十。
经过若干次的观摩与解说之后,我们能够总结出一些AI选手的共同特征。例如,AI的集火射击的能力简直让人叹为观止,来自坦克、步战车、步兵的集火射击,几乎任何算子都难以承受。此外,即使敌方已经被全歼,AI一方还是会不停地机动,直到这局比赛彻底结束的时刻。换作人类选手,恐怕会用这几分钟的时间休息一下,为下一局养精蓄锐,而不会像AI那样充满“闲情逸致”。另外,让人啼笑皆非的是,AI操控下的步兵单位经常被自己的间瞄火力击中,以致遭受伤亡。西方那句军事谚语“比敌军炮火更准确的是友军的炮火”,看来所言非虚。若是由人类选手操作,肯定会操控步兵单位及时机动,避开敌方的间瞄火力,更不用说避开己方的。以上特征,往往被用来区别人类选手与AI选手。除非有哪位人类选手故意模仿AI,不然恐怕概莫能外。
当然,高水平的AI选手,会在一定程度上像人类;高水平的人类选手,会在一定程度上像AI。前者意味着,AI选手具有像人类选手一样的战术灵活性,思路也更加开阔。后者意味着,人类选手在大量刻意练习之下能够具备几乎堪比AI的手速,以及沉着冷静的心理素质等。AI在向人类学习,人类也在向AI学习。据说AI目前能做到“线下学习”,把上一场比赛当中学到的经验直接用到下一场比赛当中是AI下一步要实现的功能。
 
临机应变想定
临机应变想定也是本次“庙算杯”人机对抗测试赛的特色之一。在我之前所参与过、解说过的各场兵棋比赛当中,想定里的各种要素往往是固定的。这次则增加了各种临机要素,对人类选手、AI选手来说意味着不同程度的考验。
首先是出发点位置的变化,需要双方在部署时间内快速应对。对人类选手来说,这意味着之前的很多准备可能归于无效,例如在多次操作之后轻车熟路的开进路线,选定的要地之类,都将不再适用。在这种情况下如果生搬硬套具体的操作步骤,无异于刻舟求剑。恐怕只能通过抽象总结出来的若干战术原则,再加上大脑飞速运转,果断在短暂的部署时间之内制定出计划并给算子下达命令,才能够制定出一个相对合理的方案。对AI选手来说,或许也意味着程序设计得不能够过于死板。夺控点位置的变化,也能起到类似的效果,幸而相比出发点位置的变化而言,夺控点位置的变化幅度还不是那么大,对人类和AI而言都是相对友好的。
“临机应变”的要素还体现在路障的设置上。路障虽然不影响通视,但无法通过。临机出现的路障有的布设在公路上,有的布设在主、次要夺控点的中间。顺便一提,在我完成本次比赛的解说,回到北京大学之时,就发现校园里因为暑期施工,多出了很多“临机路障”。这对人类来说是非常简单的问题,直接绕过就可以解决。对AI来说,却未必像人类那样能够轻松应对,除非相应的算法编写到位,否则算子恐怕会一直卡在路障那里,一次次试图通过,却徒劳无功。
此外,增援部队的规模也是临机的,比如:一种情况是,双方各自增援一枚炮兵算子和一枚坦克算子;另一种情况是,双方各自仅增援一枚炮兵算子。如果指望有坦克算子和炮兵算子一起来增援,等来的却只有一枚炮兵算子,那么就意味着之前的期待落空,后续的作战效果也会大打折扣。必须把这两种增援情况都考虑到,据此制定出相应的策略,才能在各种情况下尽量立于不败之地。
上述这些临机要素对AI的通用性提出了考验。目前,AI还只能够用来完成专项任务,或许随着技术的发展,在将来会诞生出通用性更强的兵棋AI,无论是面对水网稻田地形、高原通道地形、城市居民地形的兵棋推演任务,都能够胜任。甚至,既能够用于“庙算”平台,也能够用于其他推演平台,这才是“成精了”。更进一步,则是既能够推演兵棋,又能像小说《诗云》提到的那样,完成诸如诗歌创作等领域的任务。
 
关于平台
本次“庙算杯”所采用的兵棋推演平台,从2017年到2021年,出现了很多让人欣喜的改进。其中较为重要的,是由之前的回合制变为如今的实时制,这直接导致战术方面出现了翻天覆地的变化,包括让坦克的机动范围大大提高,有条件实行大踏步的进退、远距离的迂回;步兵也有条件采用冲锋的方式,步步为营,推进更远的距离。此外,算子单位方面,增加了诸如巡飞弹、无人战车等高科技装备;规则上,增加了包括冲锋状态、引导射击等内容;操作方面,增加了各种快捷键、计划指令、复盘系统等内容。相信在不久的将来,庙算人机对抗平台系统会有更多变化。在此提出一些脑洞与畅想。
目前,庙算人机对抗平台的地图所覆盖的区域还相对有限,红蓝双方算子数量也不是很多。即使步兵下车、步战车放下巡飞弹,场上的算子也还是屈指可数。或许将来能够使用更大规模的地图,容纳成百上千的算子。这意味着智能体需要更为强大,能够判别更复杂的态势、驾驭更多的算子。此外,庙算人机对抗平台目前还是以陆战为主,将来说不定会加入海战、空战、电子战等元素。此外,也期待庙算平台可以增加一些更加硬核、更加细致、拟真度更高的规则,诸如车辆可以释放烟幕(当然,“释放烟幕”的效果可能已经被纳入到裁决表当中了)、炮兵不同弹药类型的选择、工程兵“逢山开路,遇水搭桥”、空降行动等。并且可以模拟更加复杂的战场环境,比如加入天气变化等因素。
目前,在图灵网上能够找到庙算平台视频教程、规则书等。然而,能够操作,与能够运用战术,毕竟不完全是同一回事。期待将来能够从官网上面找到诸如兵棋战术教材、优秀战例集锦之类。也许可以借助网页、电子书、短视频的形式,让新手小白可以轻松掌握。图灵网上还可以找到兵棋AI开发指南,已经非常详细。希望将来能够提供一些更为深入的知识,让更多对此感兴趣的人能够从入门走向进阶。
庙算平台的3D视图让人觉得非常惊艳。卫星地图生动还原了地形地貌,单位的模型也相当逼真。坦克、装甲车穿越高山深谷、大街小巷,把火力倾泻向对方的算子。如果相关功能能继续完善,包括引入更多装备的模型贴图,以及火力打击效果动画之类,说不定可以被作为军事题材动画电影的制作平台,在这一方面与《武装突袭》、DCS World一较高下。
 
结语
这一次的解说任务,让我收获满满。半个月的时间,往返于北京大学和自动化所,经过反复练习,对解说内容进行多次改进。很多时候,不经意间就闪现出灵感的火花,一些较为随意的问答也被采纳作为解说词当中的正式内容。另外,不仅AI选手和人类选手的推演竞赛是“临机应变”,其实解说也是“临机应变”,毕竟推演局面无法预知。这就意味着,需要事先的充分准备,以及现场的灵活应对。在中科院自动化所各位老师的指导之下,我对人机对抗兵棋推演的解说得以稍微初窥门径。
参与这次解说,也让我加深了对兵棋战术的理解,让思路得以拓宽。之前对解说的不断演练,让我有机会在这一过程中观摩人类选手与AI选手的精彩对决。尤其是最后三天,战局更是峰回路转,扣人心弦。期间,目睹过有选手巧妙运用“功勋坦克排”,以一敌众,所向披靡;目睹过有选手以弱胜强,绝地反击;目睹过有选手通过巧妙的布置,在一开始就奠定胜局。高明的选手,往往知彼知己,扬长避短,避实击虚,攻其不备,出其不意。这次解说工作,让我在战术方面获得的启发在于,兵棋推演要勇于“不走寻常路”,打破各种思维定势,开创出新的战术战法。
这次解说也让我得以目睹自动化研究所AI开发团队的“庐山真面目”。虽然仅仅是一些浮光掠影的片段,但团队成员勤奋、聪慧、严谨、热忱的品质,足以给人留下深刻印象。队伍群英荟萃,成员不仅精通技术,也懂得战术,能够把诸如步坦协同、迂回穿插等战术,运用得炉火纯青、出神入化。也正是基于对战术的深刻理解,才能够开发出如此强大的AI。其他参加本次比赛的高等院校、科研院所,相信也同样优秀。可惜没有机会面对面交流,只能从他们提交的AI或威武霸气、或幽默风趣的命名当中对这一方面管窥一二。
本次比赛也让我得以结识来自全国各地的高水平人类选手。他们不仅在兵棋推演当中展现出了超强的实力,在生活中也颇具风采。人类选手们来自各个行业,所学的专业各不相同,除了无一例外地精通兵棋推演之外,对待本职工作也非常用心。有人致力于悬壶济世救死扶伤,有人致力于自然科学的研究,有人致力于社科理论的探索,有人致力于“基建狂魔”技术的学习。“独学而无友,则孤陋而寡闻”,高水平选手们精湛的技艺,认真的人生态度,以及家国情怀、赤子之心,都值得钦佩、值得学习。希望将来能有机会与他们互相砥砺,共同进步。



关注公众号

电话:010-82544577
邮编:100190 
传真:010-82544577
地址:北京市海淀区中关村东路95号
Copyright ©2018 - 2021 中国科学院自动化研究所
犀牛云提供企业云服务