大胜星际2职业选手再次证明AI发展潜力

null

刚刚听中国一些媒体危言耸听地说,2019年是人工智能崩盘年。如果说是中国的话,我有点相信。什么叫做崩盘呢?就是投资泛起巨大泡沫后,泡沫烟飞灰灭后就叫做崩盘。前提是投机炒作严重,而不是一心一意搞真正的投资,不炒作不投机就不会有泡沫,也不会崩盘。因此,AI崩盘在中国发生的可能性很大。中国不仅AI而且所有创新科技项目都存在投机炒作情况。

在中国担忧2019年AI崩盘时,美国又传来AI实验的重大突破。DeepMind开发的全新AI程序AlphaStar,在美国时间24日晚间的《星际争霸2》人机大战直播节目中,轻松战胜2018 WCS Circuit排名13、神族最强10人之一的MaNa。实际上,AlphaStar以10-1的战绩,全面击溃了人类职业高手。战败的不止MaNa,还有另一位高手TLO。

人工智能在《星际争霸2》上的进步速度,远远超过了此前外界的预期。毕竟与下围棋这件事相比,星际2要难得多。

在围棋世界,动作空间只有361种,而星际2大约是1026。

与围棋不同,星际玩家面对的是不完美信息博弈。“战争迷雾”意味着玩家的规划、决策、行动,要一段时间后才能看到结果。

对于AI而言,这类游戏比国际象棋、围棋等棋盘类游戏来得更难,不仅因为没有最佳策略,也是因为人工智能无法通过观察前一块棋子的移动来计算下一步棋,而必须实时作出反应。

时至今日,AI仍在挣扎应对《星际争霸2》的复杂性,鲜有系统能与职业选手的技术相媲美。

不过,AlphaStar与普通AI不太一样,它所使用的深度神经网络是通过监督学习(supervised learning)和强化学习(reinforcement learning)直接从原始游戏数据当中训练出来的。也就是说,它成长的每一步都是一场完整的比赛。

这意味着,AI需要学到长远的布局谋篇的策略能力。

对于我这个不懂技术的人隐约感到,AlphaStar与第一次对阵韩国棋手李世石的AlphaGo不一样在于,AlphaGo是完全通过大数据、云计算,利用历史数据计算出应对李世石的棋步。正如韩国一个专家赛后大呼上当受骗说:是几十个甚至几百个棋手在与李世石对弈。

而AlphaStar不同的是,不仅利用大数据和云计算,而主要利用深度神经网络是通过监督学习(supervised learning)和强化学习,掌握技巧后开始对弈。边战边学习边提高。这个就厉害多了。

这是继AlphaGo在围棋界战无不胜之后,人工智能又向游戏与电竞行业进军了。标志着人工智能继续大踏步向深度挺进。

与AlphaGo在打败中国棋手柯洁后,柯洁的感想一样。MaNa赛后说,我从AI身上学到了很多。TLO的说法跟李世石输给AlphaGo后很像。他说:相信我,和AlphaStar比赛很难。不像和人在打,有种手足无措的感觉。他还说,每局比赛都是完全不一样的套路。

围棋与游戏是两个需要深度动脑的领域,是真正的人工智能用武之地。这两个领域突破后,人工智能在金融市场分析判断等经济生产力领域应用还会远吗?

人工智能是未来几年最重要的科技创新领域,最能取得突破,市场前景最大的行业是毋庸置疑的。崩盘的或许是中国,而世界人工智能绝对会一路高歌猛进!

打开APP阅读更多精彩内容