资料图
作者:Denny Britz,前谷歌大脑团队成员
问耕 编译整理
量子位 出品 公众号 QbitAI
△工作人员手里举着一个U盘,装在里面的就是击败了人类DotA 2顶级玩家的人工智能程序
当我昨天看到OpenAI的人工智能,在一项奖金2400万美元的电子竞技赛事上,击败DotA2人类顶级高手时,整个人感觉超兴奋。
这是因为,一方面我是一个电子竞技的粉丝。尽管没玩过DotA 2,但我经常在Twitch上观看其他其他电竞赛事,高中时我还当过一阵半职业选手。
更重要是的,像DotA这类多人在线战术竞技游戏(MOBA),以及星际2这类实时策略游戏(RTS),通常被认为远超目前人工智能的驾驭能力。因为这两类游戏需要长期战略决策、多人合作,比国际象棋、围棋有着更复杂的状态和动作空间。
DeepMind已经在星际2上研究了一段时间,前不久刚刚发布了新的进展,但目前为止,相关研究还没有取得重大突破。大家普遍认为,距离人工智能在星际2上吊打人类顶级玩家,至少还有一两年的时间。
这就是OpenAI这个成果如此令人震惊的原因。这是怎么回事?最有有什么人工智能方面的突破是我没有注意到的么?于是我开始研究这个DotA 2人工智能到底干了什么,它是如何训练的,以及在什么样的游戏环境中运行。
我的结论是:这是一个令人印象深刻的成就。但不是一次AI上的突破。
通过这篇文章,我想提供一个关于此事的清醒解释。实际上,过度炒作人工智能的进步才是真正危险的事情。例如,下面这位在推特上的发言,才是真正的误导。
这是伊隆·马斯克的推特,这位硅谷钢铁侠不单创办了特斯拉,而且创办了OpenAI。上面这篇推特中,马斯克大意是说:OpenAI搞出了史上首个击败电子竞技顶级玩家的人工智能。这比搞国际象棋和围棋什么的复杂多了。
在第二条推特中,马斯克再次发表曾被AI届猛轰的观点:没人喜欢被管制,但对公众构成危险的一切(汽车、飞机、食品、药物等)都应该受到管制。AI也是一样。
(插播:当然,马斯克还发了一条,量子位就不翻译了,贴图如下)
首先要声明的是,我今天要谈及的炒作或者误导,并不是OpenAI研究人员的错误。OpenAI一直在研究方面都有诸多贡献。目前,OpenAI还没有公布他们解决方案的细节,所以外界很容易就会得出错误的结论。
现在开始切入正题。我们先来看看DotA 2的人工智能程序,到底解决了一个多困难的问题?尤其是与AlphaGo相比。
△DotA 2中的影魔
再次重申我的结论:这次AI击败DotA玩家,比在围棋中击败人类冠军要容易得多。人类没有在AI领域突然取得突破。
这次在DotA对抗中之所以AI获胜,是因为研究人员聪明的设置了问题,使得AI可以绕过目前人工智能的技术限制。
据说这个OpenAI训练这个AI打DotA花了2周。与之相比,AlphaGo在Google的GPU集群上进行了数月的分布式大规模训练。两个程序之间的计算要求有着数量级的区别。
好吧,最后夸夸这个会玩DotA的AI,到底有何精彩之处?
不管怎样,非常期待看到OpenAI关于这次比赛的技术报告。
—— 完 ——