
{{aisd}}
AI生成 免责声明
行业高质量数据集是推动“人工智能+”赋能千行百业,实现产业落地的基础性、关键性资源。
工业和信息化部近日在重庆市召开高质量行业数据集建设工作座谈会。会议部署下一阶段重点工作,动员各地方、各行业全面推动工业数据开发利用,助力制造业数字化智能化转型。
聚焦工业数据“采、集、用”难点,会议从构建数据流通激励机制、加强技术攻关和标准体系建设、支持数据服务企业发展、推动产业集群等载体数据共享和价值共创等多个方面作出部署。
工信部信息技术发展司司长王彦青日前在国新办发布会上表示,当前以人工智能为代表的新一代信息技术快速发展,正在深度融入制造业的全过程各环节,和算力算法一样,数据日益成为工业的重要生产要素和宝贵的战略资源,如何实现数据的高效采集、大规模汇聚以及深层次的应用,成为制造业数字化智能化发展的一个必答题。
打造工业领域高质量数据集
今年政府工作报告首次点名“建设高质量数据集”。高质量数据集是人工智能发展的基石,指经过采集、清洗、标注等一系列加工处理,可直接用于开发和训练人工智能模型,并能有效提升模型性能的高质量数据集合。
国家数据局局长刘烈宏此前公开表示,高质量数据集成为数智化转型的“新型燃料”,就像经过精炼加工的“高标号燃油”,在很大程度上,决定着人工智能技术在制造业应用中能否跑得稳、跑得远、跑出效益。
工业数据开发利用是推动人工智能技术变革、加快培育新质生产力、推进制造业数智化转型的重要抓手。我国工业数据资源丰富、产业体系完备、应用场景广阔,工业数据资源开发利用潜力巨大。
在此次高质量行业数据集建设工作座谈会上,工信部明确,要聚焦工业数据“采、集、用”难点,深化路径探索,构建数据流通激励机制,加快高质量行业数据集建设。要夯实工业数据基础设施,加强技术攻关和标准体系建设,筑牢发展根基。要支持数据服务企业发展,构建数据合作联合体等新型合作模式,培育协同创新的工业数据产业生态。要分类引导大中小企业开展数据开发利用,分业推进行业数智化转型,推动产业集群等载体数据共享和价值共创。
工信部赛迪研究院发布的报告称,我国工业数据存量丰富,但数据资产化程度较低,未能形成从采集、治理到流通、复用的完整价值链条。工业设备产生的数据多具有低信噪比、强时序性、多源异构的特点,大量原始数据混杂噪声和冗余,真正蕴含业务价值的有效数据占比较低。同时,多数企业缺乏系统化的数据治理能力,数据清洗、标注、分类等环节标准缺失,进一步加剧了“数据海量、信息稀缺”的矛盾。
此外,数据“孤而不通”,数据烟囱问题突出。OT与IT之间、不同厂商设备与软件之间、产业链上下游企业间数据壁垒尚未打破,跨企业数据流通缺乏可信机制和利益分配模式,导致分散在单个企业的有效数据无法汇聚成规模化数据集,制约人工智能技术整体落地见效。
中国工业互联网研究院副院长问斌认为,打造工业领域高质量数据集仍面临一些核心挑战。应从数据基础设施建设、关键技术攻关、标准制度研制三方面重点发力。由行业龙头或产业联盟牵头,联合行业上下游企业、数据服务商、人工智能模型厂商等,共建共用面向行业的数据处理平台、可信数据互联平台等基础设施,通过先行先试、成本分摊、服务订阅等机制,降低工业企业数据集建设成本。
相关部署已密集展开
去年年底,《工业互联网和人工智能融合赋能行动方案》提出,到2028年工业数据汇聚、治理、流通、共享体系不断完善,在20个重点行业打造一批高质量数据集。《推动工业互联网平台高质量发展行动方案(2026—2028年)》也对释放工业数据要素价值作出部署。
为解决工业数据“采、集、用”难点,今年3月工信部启动了工业数据筑基行动,提出到2026年底,培育一批行业数据合作联合体,建设重点行业数据可信互联平台,汇聚一批行业数据资源,攻关一批数据关键技术,研制一批工业数据标准,打造一批高质量、标准化、可流通的行业数据集,赋能一批行业大模型、工业智能体等应用落地。
行动聚焦数字化转型基础好、数据价值挖掘潜力大的制造业重点行业,依托重点行业企业、平台机构、先进制造业集群、中小企业数字化转型城市试点四类主体,推动成立一批联合体开展先行先试。
4月,工信部公布面向人工智能赋能的高质量行业数据集建设先行先试联合体名单,全国有14个单位上榜。工信部提出,鼓励各地区因地制宜启动地方工业数据筑基行动,推动本地区高质量行业数据集建设,探索工业数据开发利用模式与路径。
工信部还发布了《工业场景数据要素应用参考指引》引导企业以场景应用为牵引,探索工业数据“采”“集”“用”有效路径,加快推进工业数据开发利用,促进数据要素赋能新型工业化。
4月底,工信部、国家数据局正式启动国家级“模数共振”行动。“模数共振”的本质是打破数据孤岛与模型壁垒,实现工业数据资源与通用大模型的双向赋能,数据作为生产要素释放价值需要模型作为转化载体;而模型的迭代优化又依赖真实工业场景的数据持续反哺,这种协同进化机制,为解决工业数字化转型中“数据不会用、模型不适用”的痛点提供了系统性解决方案。
第一财经记者注意到,各地也在积极开展高质量数据集建设先行先试工作。江苏省近日发布通知组织开展工业和信息化领域行业高质量数据集建设先行先试工作,总体目标是,围绕“1650”产业体系,以典型场景需求为牵引,重点培育一批行业高质量数据集建设联合体,赋能一批行业模型、智能体等应用落地。
山东省行业高质量数据集建设专项行动方案提出,到2026年年底,在工业制造、交通运输等16个重点行业领域分别建成2个左右专业化数据集;到2027年年底,累计建成50个高质量数据集。
中央财经大学数字经济融合创新发展中心主任陈端表示,对于地方政府,参与先行先试是推动本地产业能级跃迁的宝贵战略机遇。这不仅能集聚产业链上的龙头企业、平台企业、数据服务商、大模型厂商,还能带动数据标注、治理、咨询等新兴生产性服务业的发展。此外,工业数据价值的释放,将催生数据租赁、数据信贷、数据保险等全新的金融与服务模式。地方政府通过先行先试,可以提前布局这些未来产业,培育新的经济增长点,在区域经济竞争中占据主动。