
{{aisd}}
AI生成 免责声明
随着人工智能从“尝鲜”走向“刚需”,一个曾被忽视的细节正悄然成为企业和个人用户的新痛点——Token也就是词元消耗带来的使用成本。作为大模型处理信息的最小单元,每一次提问、每一次生成、每一次交互,都在无声中消耗着数量庞大的Token。特别是,今年以来,“龙虾”等智能体的爆发,带动词元的消耗量呈指数级增长,其背后的经济账,正引发行业深度反思。
记者调查发现,对于普通用户而言,日常轻度使用AI工具时,Token成本几乎感知不到。但一旦进入深度应用——如撰写长篇报告、生成多轮对话的智能客服、绘制复杂工程图纸或进行数据建模,Token消耗便会急剧攀升。用户 秦先生坦言,
【稍微多用一点成本就上来了,消耗Token数量会随着任务难度指数性上涨,使用成本确实有点超预期。】
这种感受在一些已经实现规模化部署并将AI真正应用到生产一线的企业更为剧烈。中交AI中心首席科学家王晶透露,
【从设计、施工、养护到运营,已经开发了数千个智能体都会对大模型进行调用,日均Token消耗已经达到上百亿,相当于十万元左右的成本。】
持续增长的Token消耗,也给算力系统带来不小压力。MiniMax稀宇科技副总裁严奕骏表示,
【每个礼拜都要进行算力扩容,算力相对来说是“紧平衡”的状态。】
中国电信北京公司AI技术负责人陈哲诗也指出,客户对成本的担忧日益加剧,算力租赁需求激增,但如何提升单位算力的产出效率,成为云服务商的核心课题。
【随着大模型技术的演进,对应用层的需求拉动非常大,算力租赁量也非常大。客户对成本的担忧目前还是存在的,我们也需要去优化基础设施效率,降低Token的成本。】
为何Token成本如此“不友好”?很多人习惯把Token和手机流量放在一起比较,其实两者的计费逻辑并不一样。手机流量主要用于数据传输,购买后按使用量扣除,缓存内容还能重复使用,消耗相对清晰可控。而Token是AI模型在处理任务时所动用的计算资源总和。用户不仅需要占用模型空间、选择服务套餐,每执行一条指令、完成一项任务,都会实时产生消耗。如果需要扩展功能、开放更多权限,还会带来额外支出。
中国信息通信研究院云计算与数字化研究所云计算部主任 马飞称,Token成本具备下降空间,也必然会逐步下降。当前成本偏高,主要是行业仍处在发展初期,高端算力硬件成本较高、资源利用不充分等多重因素叠加。
【随着算力技术越来越成熟,单位Token成本会越来越低,需求爆发也会倒逼产业加速技术迭代、扩大供给、提升使用效率。】
面对这一现实,行业已启动多维度降本行动。技术层面,企业正从模型架构入手。月之暗面Kimi企业业务负责人 黄震昕表示:
【努力把我们的模型效率做提升,通过底层模型架构的创新,来达到Token成本下降。】
阶跃星辰则提出“智价比”概念,首席技术官朱亦博介绍,
【我们现在对模型关注的一个指标叫“智价比”,也就是说模型达到一定智力,成本越低越好。】
云服务商也在发力。天翼云智算平台事业部产品专家 王曼表示:
【结合我们的算电协同、算网融合调度优势,我们在持续降低Token的成本。】
更深层的变革来自国家战略层面。针对Token经济,相关专家组已启动多个专题研究。中国信息通信研究院云计算与数字化研究所副所长栗蔚指出,
【Token已经成为AI产业的重要度量衡,Token的消耗总量体现了智能体等创新AI应用的运用深度和广度,Token成本则体现了算法算力的效率。】
今年政府工作报告首次将“算电协同”纳入国家新基建,多地已启动算力券发放、算力枢纽建设、区域节点互联互通等工程。截至2025年底,我国智能算力总规模稳居全球第二,但高端芯片与核心算法仍存在对外依赖。
为破解这一瓶颈,国家正加速推进全国一体化算力网络建设,目标是构建一张“智能感知、实时发现、随需获取”的算力互联大网。与此同时,轻量化、低功耗、高性价比的国产大模型研发也在提速,旨在让AI服务真正触达中小企业与普通用户。
【要想让Token成为普惠公共服务,要构建优质高效的算法,持续推进模型优化,降低单Token算力消耗,搭建随时随地、随需接入的算力节点,让AI服务触达更多用户。】
AI好用,但不能贵得让人不敢用。当技术迭代遇上政策托底,当企业精打细算对接国家算力布局,Token成本的下降路径已逐渐清晰。未来的竞争,不再只是模型参数的比拼,更是“智价比”的较量。唯有让AI用得起、用得久、用得安心,它才能真正从实验室走向千家万户,成为社会运行的底层基础设施。
以上由第一财经AI数字人播报