首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

马斯克的AI机器人击败人类顶级电竞玩家

第一财经APP 2017-08-16 22:41:00

作者:邱智丽    责编:彭海斌

人工智能攻陷电竞界还需时日

在世界规模最大电子竞技赛事之一Dota2国际邀请赛上,埃隆·马斯克的非营利人工智能公司Open AI机器人在Dota2一对一比赛中压倒性击败了人类顶级职业玩家Dendi。

对于这一战果埃隆·马斯克也表现得颇为自信,第一时间在个人社交平台上表示,“Open AI第一次打败了世界上顶级电竞选手,这比围棋难多了。”的确在两者的交锋过程中,Open AI机器人只用了不到10分钟就将人类顶级玩家打败,拿下第一局,如此强势的技术使得Dendi在第二局对战中退出并拒绝再战第三局。

一时间AI攻陷电竞言论四起,Open AI也被神化得不可一世。“这是一个令人印象深刻的成就,但并不是一次AI上的突破。”谷歌大脑团队前成员Denny Britz发表评论回应这一事件,“事实上,过度炒作人工智能的进步才是真正危险的事情。”

AI还不能统治电竞界

一方面从比赛形式来看,Open AI参与的是更加简单的1V1模式,在这种模式下没有配合一说,且大部分情况下都是正面对抗了解对手的状态。“非完美博弈问题在其中并不严重,1V1的执行路径和状态空间也小了很多。”第四范式资深机器学习架构师涂威威指出。

Facebook人工智能组研究员田渊栋在知乎上也表示,一对一相对容易,真实的Dota2 5V5的游戏是一个更有挑战性的问题。5V5是一个多智能体的问题,需要通过智能体之间的配合才能获取胜利,是一个非完美信息博弈的问题,由于游戏里面的“战争迷雾”,玩家不能知道游戏的全部信息,有非常庞大的状态空间,需要非常长的执行路径才能获得游戏结果。

事实上,Open AI也希望在明年《Dota2》赛期,可以用 5V5 的方式再次上台挑战,但5V5状态AI战胜人类的难度远远大于1V1,也大于围棋难度。与马斯克观点不同,涂威威认为,Open AI击败电竞和围棋人机大战是不可比的,这是两种不一样的任务。

目前AI技术很难在两个或两个以上的任务上工作得很好,AlphaGo是为19×19的围棋任务设计的,同样版本的AlphaGo目前甚至不能同时在19*19和20*20的棋盘上很好地工作。目前AlphaGo和Open AI 也不能交换彼此的任务,也就是说这些人工智能技术目前不具备迁移能力。

涂威威认为,Dota2 5V5游戏难度要远远大于围棋的难度。“ Dota2 5V5是多智能体的协作游戏,而围棋只是1V1的游戏;前者的状态数远远大于围棋的状态数,且是非完美信息博弈,而围棋是完美信息博弈。Dota2 5V5需要更长期的策略,往往要在成千上万次操作之后才能获得成果。在技术贡献和社会意义上,目前Open AI的机器人还不能和AlphaGo相提并论。”

同时在英雄选择上Open AI选择了影魔,该英雄本身没有控制技能,更多需要的是选手对距离细节等精准判断和细微操作。涂威威表示:“这恰恰是人类不擅长,机器擅长的,人类选手solo惯用影魔英雄是因为人类不擅长这样的事情,这样的英雄solo玩好了才能更容易地体现与其他玩家的差距。所以即便Open AI在1V1上赢得了人类,离解决5V5的问题也很遥远。”

Open AI 的“不成熟”也在随后被验证,比赛结束后已经有50多名玩家击败了这个被神化的AI,例如一些玩家通过勾引地方小兵背离正常路线,让对方的AI陷入判断追杀你还是守塔的犹豫状态,进而赢得比赛。“Dota中的AI缺乏战略层面的东西,攻击、侦查、协助等决策。”竹间智能机器学习科学家王璈说道。

盯上电竞的AI巨头

事实上对电竞感兴趣的并非Open AI一家,在乌镇围棋峰会上,DeepMind CEO哈萨比斯就表示,星际争霸将成为AI进步的下一个大考验。随后DeepMind与暴雪在《星际争霸2》上展开研究实验,并于近日开源了该训练平台,同时这款游戏也吸引了Facebook和阿里巴巴的人工智能团队加入。

这款即时战略游戏环境复杂多变,考验AI对大量环境信息空间、时间和数据变化的理解能力。同时又考验协作性,即混战下对多个单位、建筑、编队的协同运作能力,需要玩家做出高级战略决策,这也是这些巨头将《星际争霸2》作为训练目标的原因。

虽然目前已经提取了上千场比赛近百万的比赛录像训练AI程序,但暴雪方面表示,该AI尚处于初级阶段,一些预判战术和协作能力只能在小地图中完成,且花费大量的运算时间才能进行下一步。

对当下的电竞产业而言,AI更为直接且现实的意义则为“代练”功能。弗若斯特沙利文全球合伙人兼大中华区总裁王昕认为:“一方面AI可以学习他人的比赛经验,培养新手玩家,另一方面电竞教学也需要大量实战,AI与人类玩家相比,不会受情绪、时间影响,反应速度也更快。”在比赛结束后,Dendi表示在看回放的过程中学到了一些内容。

但巨头开发人工智能的意义远不是下棋或者打游戏,而是为了更好地将AI应用到现实决策。在不完美且复杂信息情况下,如何做出预测和判断,将决策所带来的价值最大化,是AI发展的关键。

在此前德扑人机大战中,创新工场创始人李开复也曾向第一财经阐述“不完整信息”下人工智能的现实意义,“世界上大部分信息还不是公开的,面临不完全或者误导信息时的推理能力,未来能够解决在决策、外交、商务合作、谈判方面的不确定性,成为人类的‘参谋’。”

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

一财最热
点击关闭