首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

云端推理迎来爆发,快手投资的瀚博半导体发布云端推理AI芯片

第一财经 2021-07-11 20:14:14

作者:来莎莎    责编:宁佳彦

随着AI进入应用期,数据中心推理算力需求的复合增长率是训练侧的2倍以上。

近年来,云端AI芯片厂商不断涌现,2021年首批初创企业逐步商业化。今年世界人工智能大会期间,燧原科技、天数智芯、瀚博半导体等多家云端AI芯片厂商纷纷携带最新产品,在这一场人工智能盛会上亮相。

随着技术演进,算法模型精度、性能等关键指标在众多领域不断取得进展,人工智能已进入算法规模化应用落地阶段。

“随着我们的模型训练逐渐成熟,AI应用逐渐落地,推理的市场已经逐渐超过了训练的市场。”瀚博半导体创始人兼CEO钱军在接受第一财经等采访时表示,正是看到了这一市场,瀚博半导体设计了推理专用的云端芯片。

《2020-2021中国人工智能计算力发展评估报告》预测,2021年中国市场AI服务器的推理负载有望超过训练负载。随着AI进入应用期,数据中心推理算力需求的复合增长率是训练侧的2倍以上。

研究机构赛迪顾问报告显示,从2019年到2021年三年中国AI芯片市场规模仍将保持50%以上的增长速度,到2021年,市场规模将达到305.7亿元。其中,随着大规模地方性数据中心的建设陆续完成,云端训练芯片增长速度放缓;而随着各领域市场需求的释放,云端推断芯片、终端推断芯片市场增长速度将持续呈上升趋势。

钱军表示,对推理算力的需求在快速增长,下游客户多样化的算力应用场景催生了多样化的AI计算加速芯片需求,但是目前市面上却鲜有主流GPU厂商外其他更优解决方案。“GPU在推理侧不是最好的架构方案,性能远不如DSA(专用领域处理器架构)。”

此外,他认为,与云端训练侧相比,推理侧的生态更容易被突破。通过强大的配套基础设施平台CUDA,英伟达在AI训练侧基本处于垄断地位。

在此次大会期间,瀚博半导体发布了首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,预计将于今年四季度量产上市。

瀚博半导体成立于2018年,A轮融资由快手、红点创投中国基金、五源资本联合领投;今年4月完成了5亿元人民币A+轮融资,由经纬中国和中国互联网投资基金联合领投。该公司专主要研发高性能通用加速芯片,针对多种深度学习推理负载而优化,应用场景为计算机视觉、智能视频处理、自然语言处理等。

对于商业落地问题,钱军表示,和投资方快手合作非常紧密,“占据过半中国AI应用市场的计算机视觉应用需要高密度的视频解码算力配合AI算力实现端到端的计算加速。要解决好视频,AI要为视频做好优化,我们要匹配我们的芯片。”

除了快手,钱军称,正在与国内外多家头部互联网公司合作,“很多公司和我们的合作已经有一段时间了,等着测试我们的产品。”

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

一财最热
点击关闭