首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

能赢AlphaGo的只有它自己 柯洁回应新版问世:人类太多余了

第一财经APP 2017-10-19 15:01:40

责编:张瑜

柯洁回应称:“一个纯净、纯粹自我学习的alphago是最强的...对于alphago的自我进步来讲...人类太多余了。”

谷歌人工智能团队DeepMind团队在国际学术期刊《自然》(Nature)上发表论文,宣布新版AlphaGo——AlphaGo Zero可以在没有人类指导的情况下学习,其水平超过此前所有AlphaGo(阿尔法狗)。

对此,柯洁回应称:“一个纯净、纯粹自我学习的alphago是最强的...对于alphago的自我进步来讲...人类太多余了。”

2016 年在 AlphaGo 和李世石的对战后,人工智能进入大众的视野,今年5月27日,中国棋手柯洁与人工智能“阿尔法围棋”(AlphaGo)展开三番棋比赛的终局对决。在历经约3个半小时的对弈后,柯洁投子认输,执黑的“阿尔法围棋”(AlphaGo)中盘获胜。柯洁在与“阿尔法围棋” (AlphaGo)的三番棋较量中,连输三局完败。

本周Deepmind在《自然》发表的一篇论文《Mastering the game of Go withouthuman knowledge》,一款新版的AlphaGo计算机程序能够从空白状态起,在不需要任何人类输入的条件下,迅速自学围棋。这款新程序名叫AlphaGo Zero,以100比0的战绩打败了击败了上一版本的 AlphaGo,而上一版本的 AlphaGo 击败了曾18次获得围棋世界冠军的韩国九段棋士李世石。

人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。为了打败人类围棋世界冠军,科学家在训练上一款AlphaGo时,同时用到了监督式学习和基于自我对弈的强化学习。那款AlphaGo的训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。

论文介绍,AlphaGo Zero的学习从零开始,且单纯基于与自己的对弈。人类的输入仅限于棋盘和棋子,没有任何人类数据。AlphaGo Zero仅用到一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的赢家,在每次自我对弈中进步。新程序只使用一台机器和4个TPU。

通过几天的训练——包括近500万局自我对弈——AlphaGo Zero便能够超越人类并打败所有之前的AlphaGo版本。随着程序训练的进行,它独立发现了人类用几千年才总结出来的围棋规则,还建立了新的战略,为这个古老的游戏带来新见解。

举报
一财最热
点击关闭