在《星际争霸2》游戏中,人工智能成为了大师级玩家

上图《星际争霸2》是一款颇受欢迎的电脑游戏,玩家可以在游戏中看到对手建造文明,并与外星邻居作战。摄影:DeepMind /自然。

人工智能系统已达到星际争霸2 (StarCraft II)的最高级别,这是该领域的里程碑式成就。星际争霸2是一款极其复杂、广受欢迎的电脑游戏。

在这款游戏中,DeepMindAlphaStar比99.8%的注册人类玩家表现得更好,达到了大师级的水平。

经过44天的训练,人工智能系统掌握了这款游戏。训练包括从最优秀人类玩家的游戏记录中学习,然后与系统自己进行对抗,并且和前一系统版本进行对比迭代。

DeepMind研究员大卫•西尔弗(David Silver)表示:“AlphaStar已成为首个在任何职业电子竞技比赛中、在完全不受限制的情况下、在职业许可的条件下,达到了人类最高水平的人工智能系统。”

自从《星际争霸2》在2010年发布以来,已经有超过3100万美元的奖金从数以千计的电子竞技比赛中发放出来。玩家从少量的工人单位开始,他们可以收集资源,建造建筑,开发新的单位和技术,并执行侦察任务来获取对手的情报。顶级玩家需要短期和长期的战略来发展和保卫他们的基地,同时也要摧毁对手。更复杂的是,玩家无法看到整个游戏的“地图”,所以只能根据部分信息做出决定。

“自从电脑破解了围棋、国际象棋和扑克,星际争霸游戏成为人工智能的下一个重大挑战,”西尔弗说。“它被认为是人类能力极限的游戏。”

DeepMind创造了AlphaStar这个“代理人”,AlphaStar可以扮演游戏中的每个种族,即神族、人族和虫族。每个种族都有不同的能力和技术,这有利于不同的防御和进攻战略。AlphaStar最初是通过观察顶级人类玩家的游戏来学习基础知识的。然后,它进入“阿尔法之星联盟”(AlphaStar league),在那里,它不仅与自己对弈,还会扮演探索者,与自己较弱的人工智能版本对弈。训练确保了AlphaStar成为一个强大的对手,对抗所有三个种族和每一种战略。

DeepMind团队限制了AlphaStar的能力,比如确保它不能以超人的速度移动。事实证明,这对人工智能的成功至关重要,因为它不仅要通过速度打败人类,还必须学会玩游戏的长期战略。该项目的首席研究员奥里奥尔·维尼亚尔斯(Oriol Vinyals)表示,像AlphaStar这样的人工智能有可能被用于改进个人助理、自动驾驶汽车、天气预报和气候模型。这项研究发表在《自然》科学杂志上。

加州大学伯克利分校的计算机科学教授丹·克莱因(Dan Klein)没有参与这项研究,但他表示,这是一项由关键技术推动的令人兴奋的成就。他说:“《星际争霸》作为人工智能测试平台的伟大之处在于,它所有的复杂性同时发生。”

谢菲尔德大学人工智能和机器人技术荣誉教授诺尔•夏基(Noel Sharkey)表示,尽管DeepMind表示,它将永远不会参与军事工作,而星际争霸2也不是一个现实的战争模拟,但军方肯定会对研究结果感兴趣。今年3月,美国政府的一份报告描述了人工智能如何丰富了战场模拟,并允许战争玩家评估不同战术的潜在结果。

军事分析人士肯定会把成功的AlphaStar实时战略视为人工智能在战场规划方面优势的一个明显例子。但这是一个极其危险的想法,有可能造成人道主义灾难。AlphaStar在一个特定的环境中从大数据中学习策略。来自叙利亚和也门等冲突的数据太少,没有用处。

正如DeepMind在最近的一次联合国活动中所解释的那样,这种方法对武器控制来说将是非常危险的,因为这些行动是不可预测的,而且可能以意想不到的方式发挥作用。这显然违反了有关武装冲突的法律。”

打开APP阅读更多精彩内容