首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

谷歌开放语音识别API 发布机器学习云平台

TechCrunch 2016-03-24 15:30:00

责编:陈姗姗

外界认为,谷歌此举会给苹果公司重重一击,因为相较之下,苹果Siri的语音识别能力略显苍白。语音识别API的共享也会使一些开发商的应用软件拥有可取代Siri的功能。

3月24日,谷歌在Next云计算平台用户大会上,宣布推出了一个面向开发者的新的机器学习平台。谷歌母公司Alphabet董事长Eric Schmidt在发言中强调,谷歌相信机器学习将会是下一步,新的平台将会使开发者更加容易地使用一些谷歌目前已经投入使用的智能机器学习技术,从而加快开发各种商业应用。

“谷歌目前主要的应用软件都应用了机器学习云技术,比如Google Photos的无限存储与搜索、Google app的语音搜索、翻译以及Inbox的智能回复等功能。我们的机器学习云平台将为开发者提供前所未有的规模与速度,助力商业软件的开发。”谷歌方面称。

据了解,谷歌的机器学习云平台包括两个主要的方面:其一是帮助开发者基于他们自己的数据建立机器学习模型,其二是为开发者提供一个训练模型。借助谷歌的云服务工具,诸如谷歌云数据流、谷歌云存储、谷歌云数据库等等,开发者可以获得所需的数据,以此训练自己的机器学习模型。

“机器学习云技术能够兼顾从全面摄取数据到进行预测过程中的方方面面,”谷歌方面称:“最终的结果就是所有的应用软件都能够从支持谷歌云服务的深度学习技术中获益。”

云平台提供的训练模型中包含两个现存的API(应用程序编程接口):谷歌翻译API和云视觉API。此外还开放了的语音识别API(Cloud Speech API),语音识别API一直以来都为谷歌语音搜索相关应用软件提供技术支持,具有涵盖超过80种语言的语音文本转换功能。

据介绍,语音识别API能够以实时流或者批量处理模式用于任何应用软件。谷歌此次提供了包括“听、看、翻译”全套流程的API。谷歌方面称,此次推出的语音识别API以Google app语音搜索和谷歌键盘语音输入功能背后的神经网络技术为基础。此外,这个API还具有其他一些有趣的功能,比如说可以在嘈杂的环境中工作,或是进行实时工作。

毫无疑问,谷歌公司的此次举动将会给整个产业带来极大的影响,其中受冲击最大的大概是Nuance公司。据了解,Nuance被认为是规模最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。谷歌机器学习云平台的推出或许会导致很多Nuance的客户包括一些初创公司离开Nuance平台,转而投入谷歌的“怀抱”,因为机器学习云平台不仅能够提供更好的用户体验,成本也颇为低廉。

为了引起开发者的兴趣,API在开放之初可以免费使用。过后会采用价格较低的付费试用方式,当成为行业的主流时,谷歌也许会在这个基础上提高定价。

虽然类似Nuance这样的公司会遭受影响,但外界仍然认为谷歌此举会给苹果公司重重一击,因为相较之下,苹果公司的虚拟助手Siri的语音识别能力略显苍白。语音识别API的共享也会使一些开发商的应用软件拥有能够取代Siri的功能。

谷歌强调推出机器学习云平台的初衷是将内部研发成果惠及开发商,使他们能够尽可能方便地应用这个技术。同时,谷歌公司也开放了第二代人工智能学习系统Tensor Flow的资源,谷歌希望通过此举使公司内部的一些技术能够惠及全社会,并且在大规模的应用过程中,相关技术也可以得到进一步完善。

其实谷歌“进击”语音识别技术在今年二月份的时候就初露端倪,当时,谷歌宣布Google Docs用户可以通过语音生成或编辑文本。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com
一财最热
点击关闭