首页 > 视听 > 中国财经60分

分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

AI热潮带来token刚需

第一财经2026-04-03 18:44:24

责编：张铭

随着人工智能从“尝鲜”走向“刚需”，一个曾被忽视的细节正悄然成为企业和个人用户的新痛点——Token也就是词元消耗带来的使用成本。作为大模型处理信息的最小单元，每一次提问、每一次生成、每一次交互，都在无声中消耗着数量庞大的Token。特别是，今年以来，“龙虾”等智能体的爆发，带动词元的消耗量呈指数级增长，其背后的经济账，正引发行业深度反思。

记者调查发现，对于普通用户而言，日常轻度使用AI工具时，Token成本几乎感知不到。但一旦进入深度应用——如撰写长篇报告、生成多轮对话的智能客服、绘制复杂工程图纸或进行数据建模，Token消耗便会急剧攀升。用户秦先生坦言，

【稍微多用一点成本就上来了，消耗Token数量会随着任务难度指数性上涨，使用成本确实有点超预期。】

这种感受在一些已经实现规模化部署并将AI真正应用到生产一线的企业更为剧烈。中交AI中心首席科学家王晶透露，

【从设计、施工、养护到运营，已经开发了数千个智能体都会对大模型进行调用，日均Token消耗已经达到上百亿，相当于十万元左右的成本。】

持续增长的Token消耗，也给算力系统带来不小压力。MiniMax稀宇科技副总裁严奕骏表示，

【每个礼拜都要进行算力扩容，算力相对来说是“紧平衡”的状态。】

中国电信北京公司AI技术负责人陈哲诗也指出，客户对成本的担忧日益加剧，算力租赁需求激增，但如何提升单位算力的产出效率，成为云服务商的核心课题。

【随着大模型技术的演进，对应用层的需求拉动非常大，算力租赁量也非常大。客户对成本的担忧目前还是存在的，我们也需要去优化基础设施效率，降低Token的成本。】

为何Token成本如此“不友好”？很多人习惯把Token和手机流量放在一起比较，其实两者的计费逻辑并不一样。手机流量主要用于数据传输，购买后按使用量扣除，缓存内容还能重复使用，消耗相对清晰可控。而Token是AI模型在处理任务时所动用的计算资源总和。用户不仅需要占用模型空间、选择服务套餐，每执行一条指令、完成一项任务，都会实时产生消耗。如果需要扩展功能、开放更多权限，还会带来额外支出。

中国信息通信研究院云计算与数字化研究所云计算部主任马飞称，Token成本具备下降空间，也必然会逐步下降。当前成本偏高，主要是行业仍处在发展初期，高端算力硬件成本较高、资源利用不充分等多重因素叠加。

【随着算力技术越来越成熟，单位Token成本会越来越低，需求爆发也会倒逼产业加速技术迭代、扩大供给、提升使用效率。】

面对这一现实，行业已启动多维度降本行动。技术层面，企业正从模型架构入手。月之暗面Kimi企业业务负责人黄震昕表示：

【努力把我们的模型效率做提升，通过底层模型架构的创新，来达到Token成本下降。】

阶跃星辰则提出“智价比”概念，首席技术官朱亦博介绍，

【我们现在对模型关注的一个指标叫“智价比”，也就是说模型达到一定智力，成本越低越好。】

云服务商也在发力。天翼云智算平台事业部产品专家王曼表示：

【结合我们的算电协同、算网融合调度优势，我们在持续降低Token的成本。】

更深层的变革来自国家战略层面。针对Token经济，相关专家组已启动多个专题研究。中国信息通信研究院云计算与数字化研究所副所长栗蔚指出，

【Token已经成为AI产业的重要度量衡，Token的消耗总量体现了智能体等创新AI应用的运用深度和广度，Token成本则体现了算法算力的效率。】

今年政府工作报告首次将“算电协同”纳入国家新基建，多地已启动算力券发放、算力枢纽建设、区域节点互联互通等工程。截至2025年底，我国智能算力总规模稳居全球第二，但高端芯片与核心算法仍存在对外依赖。

为破解这一瓶颈，国家正加速推进全国一体化算力网络建设，目标是构建一张“智能感知、实时发现、随需获取”的算力互联大网。与此同时，轻量化、低功耗、高性价比的国产大模型研发也在提速，旨在让AI服务真正触达中小企业与普通用户。