首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

GPU四小龙,春节不打盹儿 | 海斌访谈

第一财经 2026-02-14 18:09:25 听新闻

作者:彭海斌    责编:刘佳

这个春节前后没有行动的大模型和国产芯片企业,可能就已经在AI浪潮里掉队了。

国产GPU与国产模型配合越来越好了。

春节前后是国产大模型发布的密集期。近日,字节跳动推出了视频生成模型Seedance2.0,智谱发布大模型GLM-5,MiniMax推出了MiniMax-M2.5。智谱新模型正式上线当天,国内GPU企业摩尔线程、沐曦股份和天数智芯就完成了对模型的适配。

第一财经记者采访了国产GPU四小龙(摩尔线程、沐曦股份、天数智芯及壁仞科技)的数位技术负责人。他们及带领的团队,在春节期间休假和工作难有清晰的界限,而是处于随时待命状态。一旦类似蛇年春节DeepSeek大模型这样重磅的产品发布,就要组织团队第一时间做好适配。人工智能的技术日新月异,在这个春节前后没有行动的大模型和国产芯片企业,可能就已经在AI浪潮里掉队了。

随时待命”

摩尔线程是在MTTS5000上完成对智谱新模型适配的。

摩尔线程是一家以全功能GPU为核心定位的芯片企业,MTTS5000是其2024年推出的AI训练和推理一体产品;同一天,沐曦股份也宣布,基于其曦云 C系列完成了对智谱新一代大模型的适配工作;天数智芯是通用GPU芯片及AI算力服务企业,它依托天垓系列芯片完成GLM-5新一代大模型的适配。

对于芯片企业,所谓适配就是让大模型在自家芯片上跑起来,而且达到预期性能。正常情况下,很多模型不做专门适配可能会运转,但如果开箱性能是50%,要把它调到80%-90%,需要花一定的时间。

“对于GPU这种通用架构来说,这个时间会很短。因为一般这些模型公司都是基于GPU去开发新一代模型。”摩尔线程首席技术官张钰勃对第一财经记者表示。“如果是在一些专用架构,比如说NPU架构,就需要花费更多的人力或者时间。基于GPU架构,一个人几个小时能干完的工作量,NPU可能需要几十个人几天。”

在马年春节的窗口期,智谱只是中国密集发布大模型的企业之一。

字节跳动旗下火山引擎近日发布的视频生成大模型Seedance 2.0在全球刷屏。这款大模型生成的视频,几乎可以模糊真实与虚拟的边界,可能为国内AI漫剧、AI短剧等规模化落地奠定技术基础。

阿里巴巴也在近期发布了新一代图像生成及编辑模型Qwen-Image-2.0。在部分文生图的基准测试中,这款模型的能力仅次于谷歌和OpenAI旗下的大模型。

MiniMax在2月12日发布了MiniMax-M2.5。这款模型在编程、工具调用和搜索、办公等生产力场景达到行业头部水平。该公司称,M2.5是第一个不需要考虑使用成本可以无限使用的模型,在每秒输出100 token情况下,模型连续工作一小时只需花费1美元。

中国本土芯片企业紧密地跟踪着DeepSeek、阿里千问、以及智谱等几家大模型企业进展,不少准备工作在模型正式发布之前就开始了。考虑到大模型体量大,而网络传输速度有限,国产芯片企业为了抢夺适配时间,有时候干脆采取人肉递送模式,而不是等对方上线后再下载。

“他们发模型之前就会派个人过去,拿个硬盘直接拷回来更加高效。公司内部参与这个项目的所有人都要签保密协议。”沐曦股份联合创始人、CTO兼首席软件架构师杨建对第一财经记者说。当然,这只适用于合作关系紧密的芯片和大模型企业之间。

去年春节的DeepSeek模型震动世界。今年春节前后,国产芯片企业对于DeepSeek的新模型也有所期待。

“DeepSeek 的下一个模型的发布不知道在春节前,还是春节后。目前看春节后的可能性比较大。DeepSeek 的能力我们是期望比较高的,希望它的能力能上一个台阶。”杨建说,春节期间沐曦股份有团队在待命,比如为模型做适配,为搭载DeepSeek的一体机做准备。“我们时刻要等着。”

张钰勃与杨建的状态相似。

“我们的任何人都随时准备着,处在只要有事就能够立刻响应的状态,大家都是随时待命的。公司里的研发团队,只要有任务,即便是在春节期间也会很快进行响应。”张钰勃表示。

两个春节间的巨变

蛇年春节和马年春节之间,一年内中国AI价值被重估。

“2025年中国以DeepSeek和千问为代表的开源模型,真的是异常出彩。”天数智芯副总裁石加圣对第一财经记者说,DeepSeek出来后,提醒了人工智能业界在工程层面还有很多事情是可以做的。

据石加圣观察,在DeepSeek之前,不少国内企业对于大模型效果并不满意,也不敢在企业内部部署模型。DeepSeek-R1作为第一个打破OpenAI推理垄断的开源模型,“一下子把整个推理市场给引爆了”。

石加圣认为,一方面开源模型性能接近OpenAI,让市场对大模型推理的应用信心大幅提升,带动了推理相关产品的出货与销售额增长;另一方面,它扭转了行业“大力出奇迹、单纯堆算力”的发展模式,提醒行业重视软件工程的算力效率提升,让市场重新审视国产算力的利用空间,也为芯片企业与客户的深度技术合作提供了更多机会。

大模型企业在训练环节使用国产芯片,最初顾虑重重。对于这些公司而言,训练模型投入的成本不菲,时间成本更是昂贵。如果训练了三个月发现模型训练不出来,对初创型企业来说可能就是灭顶之灾,所以他们现在更在意的是稳定性,更倾向于用英伟达的产品做训练。

“国产卡不像英伟达,因为用的人多,所以它很多东西积累下来了。国产卡操作手册有待在实践中完善,坑还是要踩一些的,比如一些部署的失败,或者性能跑不上去。”优刻得研发总监王晓慧对第一财经记者表示。在DeepSeek之后,云计算厂商优刻得也在一体机和云端获益。不过它目前部署的主要还是国际厂商的芯片。

大模型的推理环节对算力的需求不像训练环节那么苛刻,这是中国GPU企业的机会。尤其是,英伟达获准进入中国的芯片功能做了阉割。沐曦股份、摩尔线程以及天数智芯等的产品都可以在推理环节对英伟达形成替代。

“当推理业务可以达到用户满意的效果时,推理市场需要的算力规模会超过训练需求。同时长时间的线上业务运行也能验证国产芯片的稳定性,进一步打消模型厂商对稳定性风险的顾虑。”石加圣说。

杨建认为,沐曦股份过去一年最核心的是突破了自己的心理极限和技术天花板。国产芯片至少可以在特定使用场景,敢于设定比国外企业更高的标杆。

“2024年之前,我们芯片的开箱性能表现忽高忽低,2025年之后软件栈的性能泛化性得到了很大的提高。”杨建说。在一些特定作业场景,比如搜推广、自动驾驶、AI4S以及图生视频等领域,国产芯片逐渐可以和国外厂商掰手腕。“具体的技术上突破,需要一点点抠细节,需要软件优化配合GPU体系结构的创新。”

国产芯片企业也在尝试攻破英伟达在大模型训练环节的壁垒。

“我觉得过去的一年,一些头部模型进步都非常大,跟硅谷的差距在迅速缩小,很多都达到了差不多的水准,甚至在一些项目上是超越的状态。所有的算力基础设施最终都是为了应用服务的,而模型的突破意味着应用上的突破。比如AI生成短视频和AI写代码都非常火,而且形成了真实需求,真实需求就会创造更多的业务机会。对于GPU厂商来说,就是一件好事,相当于做的东西有了更多用武之地。”张钰勃表示。

去年,摩尔线程把万卡规模以上的集群,数千亿参数规模的模型训练实现了端到端落地。在万卡集群上训练出有意义的大模型,这被张钰勃认为是摩尔线程过去一年最大的突破。

新一年,会怎样

“我觉得国产大模型和国产算力的配合已经渐入佳境了。”杨建表示。

本土芯片企业与模型企业合作更紧密。比如沐曦股份和百度、腾讯、智谱、阶跃星辰等签署了战略合作协议。“国产模型和国产芯片的Day 0适配基本上已经成为一个常规状态了。”

DeepSeek去年发布之后,带动了一轮私有化部署的浪潮。这带动了沐曦股份等国产芯片在一体机上的推广,优刻得等云计算企业也获益匪浅。

虽然不能确切知道DeepSeek什么时候发布新一代大模型,但杨建和他的团队对它充满期待。DeepSeek如果再度大幅提升模型能力,很可能刺激央企国企加大部署力度。杨建尤其看重这些大企业在业务一线部署大模型,比如在中国成百上千的县城,在每一个营业厅部署一体机,这会在2026年给沐曦股份、摩尔线程、天数智芯等国产GPU带来更广阔的市场。

中国市场有比美国更广阔的人工智能落地场景,比如中国有布局最完善的工业体系,也有最大的手机使用群体。再加上大模型企业日益紧密的配合,国产芯片迭代速度在加快。

“我们的产品特点是迭代很快,每年雷打不动的会有一代新架构,以及超过一款的芯片产品面市,可以很快响应市场的变化。”张钰勃表示。

2025年12月的MUSA开发者大会,摩尔线程发布了未来架构和产品的路线图。对于2026年,张钰勃表示希望摩尔线程在技术上实现新的突破。

“我们会在整体的产品竞争力上不断提升,而且并不是那种百分之几十的,而是数量级上的能力提升。”张钰勃说,这个提升也是新架构带来的。2026年,摩尔线程基于下一代花港架构的两颗芯片就会面世。

沐曦股份近年来芯片迭代已经提速,从而抓住这一轮人工智能浪潮带来的机会,现在基本做到每两年至少推出两颗芯片的速度。

“现在人工智能对于算力的需求太渴望了,所以我们的迭代速度其实是在加快。”杨建表示。

优刻得此前帮沐曦股份搭建并运维了基于曦云芯片的千卡集群。王晓慧表示,云计算客户在算力卡选型方面具有主动权,他们通常会决定在云计算层面选用哪家企业的芯片。优刻得自身很难主动把特定算力卡推销给用户。她观察到,过去这一年,国产的芯片在大模型领域逐步落地,现在也有一些国企大客户,开始指定在优刻得的服务中选用部分国产芯片。

2026年1月26日,天数智芯发布四代架构路线图,2026年计划推出两代架构。随着架构迭代,天数智芯将陆续推出多款产品。石加圣表示,大量商业客户落地反馈,将为架构研发和产品迭代提供实践支撑。

至今,全球绝大多数大模型都是在英伟达的产品上做训练和推理,

英伟达每一代架构的创新背后有大量的客户应用验证和数据支撑。中国企业的产品从缝隙中寻找出路,并有望打开一片天地。

“一定程度上,我觉得国内这些厂商现在还是站在巨人肩膀上,但是我们总有一天要从跟随到并肩跑。”石加圣表示。国内芯片企业现在更多是在实际落地的效果和性能等方面与英伟达开始实现差异化竞争。

国内GPU企业产品在制程层面尚待突破,但国内产业链正在弥补短板。石加圣比较乐观地认为,“凡是工程学的事情,中国人最后都能攻克,无非是个时间问题。”

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com

文章作者

一财最热
点击关闭