首页 > 新闻 > 科技

分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

“一切都那么难”，上市后智谱创立发起人披露失误过程与发展目标

第一财经 2026-01-08 11:40:26 听新闻

作者：吕倩责编：宁佳彦

真正决定下一阶段格局的是更底层的两件事——模型架构与学习范式。

1月8日，北京智谱华章科技股份有限公司（02513.HK）（简称“智谱”）赴港上市。

今日，据智谱官方披露，清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信，讲述智谱创立以来的迭代过程，并宣布很快将推出新一代模型GLM-5。

唐杰称，2020年，智谱推出自研大模型算法架构GLM，尝试训练100亿参数基座模型，得到包括美团在内的很多企业试用。但当时的成功距离梦想中的AGI还遥不可及，部分原因是模型的知识量还不够大，而另一部分原因是模型还不会像人一样推理思考。

2021到2022年，大模型发展并不顺利，大多数人并不接受“让机器像人一样思考”这种类似登月一样的疯狂计划，也不认为这可能是个非常大的技术变革机会，或害怕失败。团队还是决定赌一把，用更多数据训练1300亿参数大模型。

唐杰称，这个决策很难，因为不能影响公司总体发展节奏，为此成立两个专门的小型创新团队，一个负责模型训练，即后来的GLM三剑客；另一个独立负责MaaS平台建设。

2022年中，GLM-130B诞生，MaaS平台上线，公司有了第一批真正的API用户。随后，团队正式成立AI院，专注下一代大模型研发；成立MaaS平台部，负责对外提供大模型API服务。

2023年，唐杰意识到AI将颠覆搜索与浏览器，会给每个人带来一个全新的AI助手，这些变革将彻底重塑计算机底层逻辑。2023至2024年，全球大模型爆发，大厂纷纷“All-in”大模型，国内也掀起创业高潮，百模大战、各种AI助手层出不穷。唐杰复盘称，当时团队也有失误，包括技术层面与商业层面，原因在于追逐AGI路上被眼前的短期收益与热闹所迷惑。

所幸，DeepSeek的出现令团队警醒。当然，也带来挑战。唐杰称，2025年年初，“一切都那么难，模型效果达不到预期，全国上下价格战，杀出重围需要找到一个精准的突破口。”所幸，团队确定Coding方向，从4月GLM-4.1的试探性发布，到7月底GLM-4.5的“决战”，所有技术、平台、业务团队捏一把汗。最终全球184个国家的15万开发者使用GLM Coding Plan，GLM-4.7发布后MaaS平台ARR年化收入超过5亿（其中海外收入超过2亿），从2000万到5亿（25倍）仅用了10个月。

过去一年行业讨论大模型主要聚焦应用与生态，但唐杰认为，真正决定下一阶段格局的是更底层的两件事——模型架构与学习范式。同时，应用侧可能会出现一个清晰的方向：AI替代不同工种/任务的爆发年。

基于此，唐杰强调，2026年公司将聚焦于GLM-5基座大模型、全新的模型架构设计、具有更强泛化能力的RL（强化学习），并对下一代学习范式——在线学习（Online Learning）或持续学习（Continual Learning）进行前瞻性布局。

对于人才的引进与前沿技术的探索，智谱也启动建设，设立全新部门X-Lab，致力于用开放的方式把更多年轻人聚集，做前沿性探索，包括模型架构、认知范式，并孵化新项目，不局限于软件或硬件。同时扩大对外投资，让行业贯通起来。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com