AI又赢了!人工智能战胜世界顶尖德州扑克选手

日前,美国卡内基-梅隆大学宣布,该校和脸书公司合作开发的人工智能Pluribus在六人桌德州扑克比赛

日前,美国卡内基-梅隆大学宣布,该校和脸书公司合作开发的人工智能Pluribus在六人桌德州扑克比赛中击败多名世界顶尖选手,成为机器在多人游戏中战胜人类的一个里程碑。

机器人获胜

美国《科学》杂志11日在线发表的相关论文显示,Pluribus与13名德州扑克高手进行了1万手不限注对局的六人桌比赛,每次比赛中由机器对5名人类选手,结果机器取得胜利。

在另外一种形式的六人桌比赛中,由5个Pluribus与1名人类选手对局,结果机器分别在5000手对局中先后击败了德州扑克世界冠军达伦⋅伊莱亚斯和克里斯⋅弗格森。

获胜的原因

在比赛中,Pluribus会让自己变得难以预测。例如常规打法是在牌最好的时候押注,但这很快会被对手识破,因此它会“耍点心眼”,不按常理出牌。分析显示,它会做出一些多数人类玩家都认为不好的决策,这在客观上也迷惑了对手。

据介绍,在二人游戏中,机器的策略是实现博弈论中的“纳什均衡”,即确保结果至少是平局,而只要对手犯错打破均衡,机器就能获胜。但这一策略不适用于多人游戏,因此机器不能保平,必须不断争取先手才能最终获胜。研究人员为此设计了一种新的“有限前瞻搜索”算法,让机器能做出一个平衡的整体决策。

这意味着什么

研究人员指出,与让机器下国际象棋和围棋相比,德州扑克的挑战更大。德州扑克比赛中每方都不知道对手的牌,对手还可能在押注时虚张声势,因此决策只能基于不完全信息,这与真实世界中的问题更接近。

卡内基-梅隆大学教授图奥马斯⋅桑德霍尔姆说,此前人工智能在“战略性推理”方面取得的成就仅限于二人游戏,此次在复杂游戏中战胜5名人类选手,将为人工智能解决真实世界问题提供新的可能性。

据了解,此次采用的摆脱纳什均衡战略推理技术,未来有望在多个领域“大显身手”,从扑克、视频游戏到投资银行的战略优化、政治运动等不一而足,还可以引导进化和生物学适应——例如医疗计划和合成生物学等。此外,该技术还可用于电子战、安全领域等。

来源:新华社、科技日报综合

审核:侯 萌

编辑:孟庆飞

打开APP阅读更多精彩内容