“这款游戏是一座通往现实世界的桥梁。”DeepMind研究员Oriol Vinyals说。
在DeepMind发布的消息中,公司也解释了自己为何要挑战星际争霸的原因:星际争霸拥有丰富多彩的游戏环境和战术体系,这是研究人工智能的理想环境。
此外,星际争霸II拥有大量每天都在网上进行游戏的玩家。这可以确保研究者们可以得到大量的回放数据以供学习,也可以为人工智能提供大量极具天赋的对手。
在挑战星际争霸之前,DeepMind已经挑战过一些游戏项目,比如雅达利游戏。只是,星际争霸II的玩家在同一时间可能有300多种基本行动可以选择,因此策略集及策略选择也对人工智能构成巨大的挑战。而雅达利游戏,大概只有10种选择。星际争霸中的很多操作是分级的,可以进行修改和扩充,其中很多都需要操作屏幕上的一个点进行。即使一个小84×84的屏幕也会产生大约1亿种可能的行动选择。
星际争霸游戏的特殊性,除了吸引到DeepMind公司外,还有其他团队也在挑战,例如Facebook和阿里巴巴。
此前,哥本哈根信息技术大学(IT University of Copenhagen)的两位研究人员已经开始将AlphaGo应用于“星际争霸”。到目前为止,他们已经从有世界上最好的人类星际争霸玩家参与的超过2000场比赛中提取了大约63万场录像,训练了他们的人工智能程序,让它慢慢地学会预测一个顶级的人类玩家在某些特定的游戏状态下会做什么,这样当面对类似的选择时,它可以做出顶级玩家会做的判断。不过他们的成果目前还没能战胜人类玩家。