首页 > 新闻 > 基因空间

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

在智商比拼的某些方面,机器可以击败人类?

第一财经 2017-02-24 11:12:00

责编:王艺

除了在游戏项目上,基于机器学习的应用可以在很多方面击败人类。

说起机器学习,就不得不讲到亚瑟·李·塞缪尔(Arthur Lee Samuel;1901年12月 –1990年7月),机器学习之父。塞缪尔是个工程师,也是个西洋跳棋(又称checkers或draughts)玩家。1952年,在IBM工作的塞缪尔想编写一个电脑跳棋程序。西洋跳棋使用与国际象棋类似的两色相间棋盘,但棋子只有两色。不同地区流行的棋盘大小不同,如波兰版本的10×10和英国的8×8。依据跳棋的规则,英国跳棋共有约5万 亿亿种(即5×1020)可能性棋法,所以不可能用死记硬背的方式让电脑记下所有的可能性,更别说在电脑石器时代的1952年。因此,塞缪尔设计了一套打分方法,可以根据当前双方棋子的位置计算赢的可能,并以此计算如何移动下一个棋子来提高获胜几率。为完善这一程序,他还采纳专业选手的意见进行改进,更通过程序自身的对抗来进行学习。1956年2月24日,他的程序在一起电视公开对抗中打败了康涅狄格州的西洋跳棋冠军,并因此被称为“机器学习之父”,也被认为是计算机游戏的先驱。

到了50多年后的2007年,来自加拿大的科学家Jonathan Schaeffer设计了一套基于人工智能的程序,使得计算机能在西洋跳棋项目上与人对战时立于不败之地;而当两个程序对战时,则会打成平手。值得一提的是,这个结果发表在了《Science》杂志(玩游戏都可以发Science,真是人生赢家啊)。

以上的故事提示了机器学习的两个事实:第一,可以用来解决穷举法无法胜任的任务;第二,在智商比拼的某些方面,机器可以胜过人。

事实上,除了在游戏项目上,基于机器学习的应用可以在很多方面击败人类。比如对交通标识的识别:在2011年的神经网络国际联合会议(International Joint Conference on Neural Networks)上,官方设置了一项挑战,用电脑去辨认40大类约5万张德国道路标识。来自瑞士达勒莫尔人工智能研究院(SUPSI )的一个小组以99.46%的准确率登顶,高于人的平均值(98.84%)以及32位与会者(99.22%)。

再者,电脑在看图作文方面也很有一套。斯坦福大学的一个研究组开发了一个算法,使之能够用一句话描述一副图片。如下图所示,电脑的写作水平达到令人咂舌的地步:四分之一的观众在对比了人与电脑的写作后,表示更青睐电脑的作品。

谷歌是机器学习最大的商业用户之一,机器学习几乎出现在其每一个产品中。比如搜索、无人汽车、地图、街景服务等等。对于无人汽车来讲,区别行人、汽车和一棵树是非常重要的;其它如搜索行车路线、判断红绿灯、转向决定等等无一不需要人工智能。有人会觉得判断红绿灯会很容易,但现实却是,红绿灯的位置、与地面的高度、阳光的强度、周围树木的遮挡等等都会影响电脑的判断。机器学习在地图和街景服务中的应用则包括根据航空照片对道路和道路交叉进行初始识别,根据街景照片识别门牌号码、限行标识以及街边商店的商标等等。2013年谷歌宣布, 通过深度学习算法辨认街道号,他们可以在两小时内把法国的每一个地点汇成地图;但毫无疑问,在之前这件事要花费非常多的人力和物力(另:对“谷歌地图是如何炼成的”感兴趣的同学,可以搜索一下Google Ground Truth Project,相信会给你很多惊喜)。此外,早在 2012年,谷歌尝试让一个深度学习的算法观看YouTube视频,在用1万6千台电脑学习一个月后,电脑便能通过观看视频独立区别人和猫了。

苹果和微软也是机器学习的用户,语言助手Siri和Cortana的语言识别功能都是基于机器学习开发的。最近,微软还在Skype上推出了语音实时翻译服务,实现了实时语言翻译的目的——这对于向往外国妹子又不愿学习外语的屌丝们真是一大福音啊。据说雷总和Hugo Barra更是从此沟通无下限,happily ever after呢。

百度在机器学习上的造诣也不浅。比如百度提供一个图片搜索服务(百度识图),用户上传一张照片,该服务就能为你找到类似的图片:同样的背景,同样的角度,同样的动物甚至人。

除了听说读写看作之外,机器学习在科研上也是一把好手。2012年,美国制药公司默克(Merck)在Kaggle上发布了一项为期60天的挑战赛,由参赛者通过15种药物的各种数据预测它们的生物活性,如药物的靶点和非预期靶点(off-target)等等。结果,一个来自加拿大多伦多大学的5人团队gggg获得了第一。这个团队采用了在GPU上运行的、基于神经网络的深度学习算法。更加值得一提的是,这个团队里清一色的计算机学家,却没有任何人有生物或化学背景。前篇提到的Geoffrey Hinton是这个团队的带队导师。关于这个挑战赛的具体技术细节可以参见Kaggle的访谈博客,有意思的是,这篇访谈将Geoffrey Hinton称为现代深度学习之父,说他在2006年发力使得深度学习再现活力,不知是否会有人反驳这一观点。(注:简单介绍一下Kaggle。根据维基百科,Kaggle是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。这一众包模式依赖于这一事实,即有众多策略可以用于解决几乎所有预测建模的问题,而研究者不可能在一开始就了解什么方法对于特定问题是最为有效的。Kaggle的目标则是试图通过众包的形式来解决这一难题,进而使数据科学成为一场运动。目前,Kaggle声明已经有35万数据分析人员在上面注册。)

类似的深度学习专家在生物医学领域成功的例子也有很多。比如,一个来自波士顿Dana-Farber 癌症研究所的团队宣布,他们发现了和肿瘤相关的几十种临床表现特征,能帮助医生进行癌症诊断。其文章发表在Nature Communications。

此外,一个斯坦福大学医学院的团队开发了一个基于机器学习的系统,由电脑通过放大镜观察病人组织切片,可以比病理学家更有效地预测癌症患者的幸存率。该成果发表在Science Translational Medicine[16]。尽管这两个案例中的系统都是由医学专家和机器学习专家共同开发的,但机器学习专家在此类研究中的作用要远远大于医学专家。

从这里我们也可以得出一个结论,即我们开篇提到王俊要用机器学习研究人类疾病是有可能成功的,因为从事相关的研究并不需要医学甚至生物背景,只要机器学习的功底够深即可。

举报
一财最热
点击关闭