首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

“一切都那么难”,上市后智谱创立发起人披露失误过程与发展目标

第一财经 2026-01-08 11:40:26 听新闻

作者:吕倩    责编:宁佳彦

真正决定下一阶段格局的是更底层的两件事——模型架构与学习范式。

1月8日,北京智谱华章科技股份有限公司(02513.HK)(简称“智谱”)赴港上市。

今日,据智谱官方披露,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,讲述智谱创立以来的迭代过程,并宣布很快将推出新一代模型GLM-5。

唐杰称,2020年,智谱推出自研大模型算法架构GLM,尝试训练100亿参数基座模型,得到包括美团在内的很多企业试用。但当时的成功距离梦想中的AGI还遥不可及,部分原因是模型的知识量还不够大,而另一部分原因是模型还不会像人一样推理思考。

2021到2022年,大模型发展并不顺利,大多数人并不接受“让机器像人一样思考”这种类似登月一样的疯狂计划,也不认为这可能是个非常大的技术变革机会,或害怕失败。团队还是决定赌一把,用更多数据训练1300亿参数大模型。

唐杰称,这个决策很难,因为不能影响公司总体发展节奏,为此成立两个专门的小型创新团队,一个负责模型训练,即后来的GLM三剑客;另一个独立负责MaaS平台建设。

2022年中,GLM-130B诞生,MaaS平台上线,公司有了第一批真正的API用户。随后,团队正式成立AI院,专注下一代大模型研发;成立MaaS平台部,负责对外提供大模型API服务。

2023年,唐杰意识到AI将颠覆搜索与浏览器,会给每个人带来一个全新的AI助手,这些变革将彻底重塑计算机底层逻辑。2023至2024年,全球大模型爆发,大厂纷纷“All-in”大模型,国内也掀起创业高潮,百模大战、各种AI助手层出不穷。唐杰复盘称,当时团队也有失误,包括技术层面与商业层面,原因在于追逐AGI路上被眼前的短期收益与热闹所迷惑。

所幸,DeepSeek的出现令团队警醒。当然,也带来挑战。唐杰称,2025年年初,“一切都那么难,模型效果达不到预期,全国上下价格战,杀出重围需要找到一个精准的突破口。”所幸,团队确定Coding方向,从4月GLM-4.1的试探性发布,到7月底GLM-4.5的“决战”,所有技术、平台、业务团队捏一把汗。最终全球184个国家的15万开发者使用GLM Coding Plan,GLM-4.7发布后MaaS平台ARR年化收入超过5亿(其中海外收入超过2亿),从2000万到5亿(25倍)仅用了10个月。

过去一年行业讨论大模型主要聚焦应用与生态,但唐杰认为,真正决定下一阶段格局的是更底层的两件事——模型架构与学习范式。同时,应用侧可能会出现一个清晰的方向:AI替代不同工种/任务的爆发年。

基于此,唐杰强调,2026年公司将聚焦于GLM-5基座大模型、全新的模型架构设计、具有更强泛化能力的RL(强化学习),并对下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)进行前瞻性布局。

对于人才的引进与前沿技术的探索,智谱也启动建设,设立全新部门X-Lab,致力于用开放的方式把更多年轻人聚集,做前沿性探索,包括模型架构、认知范式,并孵化新项目,不局限于软件或硬件。同时扩大对外投资,让行业贯通起来。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com

文章作者

一财最热
点击关闭