首页 > 新闻 > 商业人文

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

AlphaGo与李世石对战赢在心理 不骄不躁

第一财经APP 2016-03-10 10:36:00

责编:罗嵛月

周志华对记者表示:“机器如果真能达到人类顶尖棋手的水平,而不是靠心理战获胜,这才是真正实质性的突破。”

AlphaGo昨天战胜世界一号围棋种子选手李世石,标志着人工智能取得了历史性的突破。不过如果仅仅把AlphaGo当作机器人围棋小子,就太小看他了。专家指出,AlphaGo是深度学习在围棋领域的一个应用,但他本身是基于多种机器学习技术构建出来的一个系统,机理完全可以用到执行其他任务中,比如解决对抗性问题,或者应用到商业、战争或者金融交易等受策略影响较大的领域。

一场人机心理战

电气和电子工程师协会(IEEE)会士,美国人工智能协会会士、南京大学机器学习与数据挖掘研究所所长周志华对第一财经记者表示:“机器人做决策的好处是,他不受情绪干扰,不知疲倦。这一点在昨天和李世石的这盘棋上显得尤为明显。”周志华对比赛的细节进行了分析,他说:“前半盘明显是人类棋手占优势,但是之后利用‘优势意识’的走法对于机器来说完全没有用,机器是不会感受到劣势的暗示的。而人类棋手则很难始终保持平静的心理状态。”

昨天亲临人机大战现场的BBC首尔记者就形容李世石“表现出紧张”,“不断地叹气和摇头”。比赛后,李世石自己也说:“面对一个非人类的棋手,我还是感觉有很大的不同。和人类比赛,你可以通过他的表情,呼吸或者肢体语言揣测出他下一步可能采取的行动,但是机器不会传递这样的信息,你也无法给他你想要的暗示。”因此,昨天的这场人机大战更大程度上较量的是心理而非棋艺的高低。周志华对记者表示:“机器如果真能达到人类顶尖棋手的水平,而不是靠心理战获胜,这才是真正实质性的突破,但这仅靠一次比赛是很难判断的,尤其是李世石是机器比较喜欢的对手类型。”周志华建议通过让不同类型的全球顶尖的职业围棋选手都去和AlphaGo下棋感受一下,“如果选手们普遍认为机器的水平确实达到了顶尖水准,这个意义才是真正具有突破性的。”

不过,周志华认为昨天比赛的重大意义在于向大众传递了两个关键的信息:其一,人工智能中的机器学习技术在过去几年中取得了巨大进展;其二,对于很多具体任务,只要能够收集到足够多的高质量数据,就能利用机器学习技术构建出达到或者接近人类顶级专家水准的系统。

从错误中学习

AlphaGo的电脑程序最初是从学习通用模板开始的,让计算机不断从过去重复的比赛中学习。当学会基本技能后,他开始通过看专业级的比赛来掌握合理的规则和标准套路。然后他开始自己下棋,进行“强化学习”,这个阶段可以视作千千万万次不断试错的过程。开发AlphaGo系统的DeepMind公司CEO哈萨比斯(Demis Hassabis)说:“他通过和无数个版本的自己下棋,不断纠正错误,每一次水平都有非常轻微然而螺旋式的提升。这也意味着机器在不断战胜自我。”

对于这种“强化学习”策略是否会面临上限,而使得学习面临一个上限无法继续进行下去,专家也有不同的观点。周志华认为:“从技术上来看,实际上自我对弈是让两个学习模型相互提供伪标记样本来提高性能,但必须保证两个模型有足够大的差异,而随着模型性能提升到一定程度,这种差异性会逐渐趋同,必然会使性能到一定时候无法继续通过这种机制提升。这实际上也取决于样本的数量。”但也有专家认为“强化学习”技巧已经被证实优于许多领域正在应用的机器学习技术。

“棋道”即“商道”

围棋早在3000年前就被中国人发明,也被认为是比国际象棋复杂得多的棋类,因为它有无数种走法。如果说国际象棋一直被认为是“代表着智力挑战的最高水平”,那么围棋对于“谋略”的要求则要更胜无数筹。DeepMind公司CEO哈萨比斯称之为“人类迄今发明出来的最优雅的比赛”。他说:“它规则简单,却又无尽复杂,AlphaGo的走法要比宇宙中原子的个数还要多。”

简单至极却又复杂至极,这也是中国人用“棋道”来比喻“商道”的原因。围棋的精髓不像象棋以杀伐为目的,而是以占领制胜。企业之间的竞争和博弈,合作共赢大于互相厮杀。“靠占据一方和求活的技术制胜”,这需要长期的策略。李世石在输了比赛后说:“AlphaGo从第一步就赢了,而我则为第一步输到了最后。”围棋最讲究布局,每一着棋、每一个动作都是为后面通盘考虑,发挥长期的作用,与商业决策有着太多的相似之处。每一个商业决策所动用的每一项资源都是为企业的整体发展埋下的伏笔,作出的铺垫。围棋耗时较长,手法复杂,布局要有长远的观战和全盘的意识方能取胜。围棋讲究“做活”,一面要想办法突围联合别的“眼”,一面也要留心比对手多留一口“气”。这就像企业既要与对手寻求某些方面的合作,又不能全盘托出让自己没有后路。这些都是围棋带给人们的启示。而如果有一天,AlphaGo不再下围棋了,那么他同样能转而为企业作重大的商业决策。他可以通过处理大量的数据,来对交易进行分析,从而作出使得企业利益最大化的决策。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com
一财最热
点击关闭