首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

智谱AI CEO张鹏:大模型赛道拥挤、内耗,最大压力还是算力

第一财经 2024-01-16 19:34:18 听新闻

作者:吕倩    责编:刘佳

国内大模型赛道过于拥挤以至内耗,创业生态在分层方面较略慢。

 

 追赶GPT4,卷行业卷应用成为国产大模型领域的几个关键词。

1月16日的首届技术开放日上,智谱AI团队展示了其三年多来积累的技术成果,并发布了新一代基座大模型GLM-4。

智谱方面称,最新的基座大模型的性能相比上一代全面提升,支持更长上下文、更强的多模态(包括更高精度的文生图性能和更丰富语义的图片理解)。GLM-4-All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用WebGLM搜索增强、Code Interpreter代码解释器和多模态生成能力以完成复杂任务。另外,GLMs个性化智能体定制能力上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。

成立于2019年的智谱,是国内最早研发大模型的企业之一,由清华大学知识工程实验室(KEG)技术成果转化而来。截至目前,智谱AI已进行八轮融资,累计获得超25亿人民币,投资方包括社保基金、清华控股、君联资本、启明创投、美团战略投资部等机构。

2020年,智谱AI开始了GLM预训练架构的研发,训练了百亿参数模型GLM-10B。2021年,公司利用MoE架构训练出万亿稀疏模型。2022年合作研发了双语千亿级超大规模预训练模型GLM-130B,并基于此千亿基座模型开始打造大模型平台及产品矩阵。2023年,智谱AI推出了千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B。

 在接受第一财经记者专访时,智谱CEO张鹏透露目前智谱AI合作的客户涉及领域包括金融、能源、制造业。

智谱AI聚焦于基座模型的研发投入,落地方向以TO B赛道为主,以TO C赛道为辅。谈及国内的大模型赛道,张鹏对记者表示,国内大模型赛道过于拥挤以至内耗,更符合商业规律的模式应走向分层——先基座大模型,再行业侧模型,再面向更加细分场景的推理模型。国内创业生态在分层方面较美国略慢,而美国在多样性方面选项会更多。

同时智谱但也参与行业模型的建设,在张鹏看来,此举不是为了“吃蛋糕”,而是为了“走出一条路”。因为做出基座模型与用户端应用落地之间的鸿沟需要有人来填补,理想状态下是有足够多的生态伙伴一起来建设,但在行业早期,鸿沟里存在一条“时间差”,目前智谱决定自己先来填,蹚出一条明确路径之后,再分享给产业伙伴这套方法论,而智谱继续深挖基座建设。

商业化落地成为国产大模型行业竞争的关健一步。曾在清华大学计算机系知识工程实验室做科研的张鹏谈及从科研圈跨入创业圈的最大区别,就是“算账”。他对记者表示,在学校做科研的时候,更多时候凭科研兴趣与热情去做一些事,意义、价值、创新性是他更多考虑的问题,很少去看钱。但到了公司之后,学会了精打细算,所有成本的投入转化成收益的账也要算清楚,这是目前最大的不同点。

张鹏对记者透露,2023年下半年智谱签单客户约有几百家,2023年整体有亿级签单额。张鹏称,行业对大模型的期待自然很高,但对其落地过程,绝大部分人持有着较高的耐心与期待。

至于投入与产出比的计算,以及目前成本最大占比,张鹏表示,算法、算力、数据三大支柱中,压力最大的还是算力,“太贵”的成本问题目前无法避免。数据问题目前靠深度学习技术解决掉一部分上一代AI里存在的高质量标注数据获取难的问题,但数据中目前又新添了SFT(Supervised Fine-Tun-ing监督微调)监督数据,虽然又成为新门槛,但好在大部分是通用的,成本平摊下来也能接受。

至于算法是更长期的挑战,在张鹏看来,本质而言,算力成本、数据开销,核心来源于大模型算法的设计,芯片是为了去匹配算法需要多少算力而被选择。 

 对于产品层面,他认为国外创业市场存在新技术、商业化、资本市场买单孵化的循环更替过程,进而去催熟市场与技术。而国内,更多是“观望”态度,通过观察与等待寻找一个合适的时机,再密集涌入,但资本买单试错的空间并不大。

本轮AI浪潮中,张鹏认为对大模型或AGI的认知可能是决定这件事能走多远、影响多大的关键点,本轮AI也是认知革命引发技术革命、进而引发了整个应用和市场革命的逻辑。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

一财最热
点击关闭