
{{aisd}}
AI生成 免责声明
随着数据生产、存储规模的高速增长,我国活跃数据量明显提升,数据生产、存储和开发利用的“剪刀差”开始缩窄。
国家数据局最近发布的《全国数据资源调查报告(2025年)》(下称“报告”)显示,2025年全国年度数据生产总量达52.26泽字节(ZB),同比增长27.28%;高质量数据集数量突破11万个,词元(Token)调用量指数级增长,2025年全国日均调用量从年初的超万亿增长至年末的100万亿,全年累计约21100万亿;购买数据企业比例提升至11.65%,为高质量数据付费的市场共识正在形成。
词元调用量指数级增长
随着全社会人工智能应用程度普遍提高、高质量数据集供给规模显著增大,数据资源支撑人工智能跃迁式发展,词元(Token)调用量呈现指数级增长。
报告显示,2025年数据生产总量增速较上年提升2.28个百分点。我国数据生产总量占全球约27.44%。人均数据生产量约为39.94太字节(TB),同比增长27.56%。截至2025年底,全国智能算力规模159万PFLOPS(FP16),通用算力向智能算力的代际更替加速,成为支撑人工智能发展的关键基础设施。
从结构看,数据生产正由感知驱动向计算驱动转变,系统软件、人工智能产生的数据量为26.92泽字节,首次超过摄像头、传感器等物联感知数据量25.34泽字节(ZB),用于人工智能训练、开发和应用的数据增长显著。
从空间布局看,智算资源集聚优势逐步显现,八大国家算力枢纽(含十大集群)智算规模占全国智能算力的80%以上。贵州、内蒙古和河北加快打造算力高地,占全国智算规模超六成,全国一体化算力网建设加快。
新指标的纳入也是今年报告的一个特点。
报告显示,2025年,全国高质量数据集数量超11万个,同比增长61.13%。高质量数据集数据量超908拍字节(PB),同比增长142.58%。词元调用量指数级增长。2025年,全国日均词元调用量从年初的超万亿增长到年末的100万亿,智能经济的活力加速释放。至今年3月,日均词元调用量突破140万亿。与2024年初日均词元调用量1000亿相比,两年增长超千倍。
与此同时,2025年,用于人工智能训练和推理的数据总量为199.48艾字节(EB),同比增长42.86%,推理数据量达101.34艾字节,首超训练数据量,人工智能加速规模化落地应用。
中国科学院大学经济与管理学院教授孙毅解读报告说,今年的报告调查内容紧跟产业发展前沿,实现了动态拓展。在人工智能领域,新增了词元调用量统计,构建了衡量智能经济发展活力的新坐标。高质量数据集的数量、规模及增长率也被纳入重点监测,回应了人工智能发展对数据资源提出的新需求。

国家数据局局长刘烈宏此前在国新办发布会上介绍,词元是大模型处理信息的最小信息单元,具有智能时代可计量、可定价、可交易的特征。当下,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业商业化的重要路径。
刘烈宏表示,日均Token调用量的大量增加,充分表明中国人工智能发展进入了快速增长阶段,产业竞争力显著增强。这也标志着数据集的供给大量增加,数据要素的价值不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。
国家数据专家咨询委员会委员、北京交通大学教授张向宏分析报告称,人工智能应用到了奇点时刻。2024年企业用于人工智能的数据量占数据存储量约为7%,高质量数据集增速达27.4%;到2025年,企业用于人工智能的数据增长率达42.86%,高质量数据集数量及其数据量分别增长61.13%和142.58%,特别是推理数据量达101.34EB,首次超过训练数据量。这表明我国人工智能发展迅猛,也标志着我国人工智能正在跨越从技术突破到规模应用的奇点,人工智能在各行各业的应用正在大规模展开。

企业成数据生产主力
今年政府工作报告提出,打造智能经济新形态,深化拓展“人工智能+”。深化数据资源开发利用,健全数据要素基础制度,建设高质量数据集。数据要素也在加速赋能各行各业。
作为数据要素价值释放的重要场景,工业供数用数动力逐渐提升。特别是随着智能制造、数字化转型、工业互联网创新发展等工程深入推进,制造业“智改数转网联”成效显著。
报告显示,2025年,工业数据生产量为8.53ZB,占企业数据生产总量的25.43%。工业设备数据占工业数据比例超三成,机器人、电力设备、电子设备、化工设备等数据生产量占比较高,机器人、无人机等数据生产量同比分别增长51%、75%。在数据开发利用方面,制造业数据开发率为32.21%,领先全国平均水平3.75个百分点,数据利用效率优势明显。
今年3月,工信部启动工业数据筑基行动,开展面向人工智能赋能的高质量行业数据集建设先行先试,旨在突破工业数据“采”“集”“用”瓶颈。
报告显示,企业成为数据生产的主力。2025年,企业数据生产总量为33.54ZB,占数据生产总量比重从58.30%提升到64.18%,贡献九成数据生产增量,产业数智化转型成效明显。
张向宏分析称,相较于2024年41.06ZB的全国数据生产总量,2025年增长了11.2ZB,其中,企业数据生产量增长近10ZB。这表明企业已成为数据生产的主力。“企业大规模生产数据的背后,是过去一年来我国数据赋能千行百业和企业数智化转型取得重大进展的必然结果。”
服务业、工业和农业的数据生产量分别为22.85ZB、8.53ZB和1.49ZB,占企业数据生产总量比例分别为68.13%、25.43%和4.44%。这也表明数智化转型已在各行各业全面展开并加速推进。
报告还认为,人工智能将变革数据生产利用方式。预计2026年,全国年度数据生产总量将超过67ZB。以智能体(Agent)为代表的代理型人工智能快速发展,促进智能体互联网加速形成,海量智能体之间的协同交互将产生大规模机器间数据。同时,以具身智能为代表的物理AI加速发展,感知数据、控制数据与环境反馈数据将形成循环,推动数据从虚拟空间走向物理世界交互闭环,现实世界数据规模将出现新一轮跃升。 制图/蒋皓明
高质量数据集就像经过精炼加工的“高标号燃油”,在很大程度上,决定着人工智能技术在制造业应用中能否跑得稳、跑得远、跑出效益。
AI进化速递丨国家发展改革委主任郑栅洁赴上海人工智能实验室调研
人工智能快速发展,高质量、高安全的数据供给成为关键要素。
鼓励国家高新区常态化发布人工智能场景清单,促进人工智能新技术新产品规模化应用。
随着对AI驱动的数据中心狂热的反对声日益高涨,数据中心建设的话题很可能会成为今年中期选举中的热点。