首页 > 新闻 > 一财号

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

数据训练基建:驱动我国人工智能产业升级

第一财经 2024-04-02 15:37:11

作者:王鹏    责编:张健

2024年3月30日,2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经开区举办,会上,人工智能公共算力平台3000P智能算力投入使用,北京人工智能数据训练基地启用,发布100个人工智能大模型高质量数据集,数据总量逾150PB,覆盖多模态语料,涉及20个领域应用场景

(本文作者王鹏,北京市社会科学院研究员,数据资产化研究院执行院长)

2024年3月30日,2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经开区举办,会上,人工智能公共算力平台3000P智能算力投入使用,北京人工智能数据训练基地启用,发布100个人工智能大模型高质量数据集,数据总量逾150PB,覆盖多模态语料,涉及20个领域应用场景。同时,《北京经济技术开发区关于加快打造AI原生产业创新高地的若干政策》提出14条具体措施,包括推动算力赋能产业发展、构建高效协同创新体系等,发布了多个创新平台和重点项目。

作为国内首家投入运营的人工智能数据训练基地,北京亦庄人工智能公共算力平台是北京最大规模的高性能人工智能计算集群,旨在帮助企业推动开展大模型训练,推广行业应用。北京亦庄人工智能公共算力平台提供的3000P算力,超过了百万台电脑的算力,能为大模型训练提供稳定的算力支持,大幅提高训练效率,并面向算法企业等提供公共运算平台,推动企业开展大模型训练,推进我国大模型技术进步。到2026年,亦庄人工智能数据训练基地将培育性能达到国际先进水平的通用大模型,打造人工智能标杆应用场景10个,集聚人工智能产业链企业100家,实现园区营业收入1000亿元,建成人工智能算力10000P。

在人工智能和大模型的发展中,数据、算法和算力被视为三大核心要素。这三者相互依赖,共同推动着人工智能技术的进步。在这个框架下,如何构建要素使用组合和框架成为我国人工智能行业发展的一个重要课题。我国在数据开发领域拥有丰富的资源,包括优秀的科研机构、人才和企业,这为算法的开发提供了坚实的基础。

然而,要充分挖掘这些数据的潜力,需要强大的算力来支持复杂算法的运行和实验测试。因此,建立一个能够提供巨大算力的平台变得尤为关键。本次人工智能训练场的设立有助于加速这一过程,提供一个集中的、稳定的、高效的平台,使得科研机构和企业能够更高效地访问和利用所需的算力资源。训练场不仅提供了必要的硬件支持,还可能提供软件和工具的支持,进一步简化了模型训练和测试的过程。

北京通过本次数据训练场的试点,带头解决了数据的运输安全问题,跨行业、跨领域、跨区域、跨层级形成了更多高质量的数据集,帮助人工智能大模型进行训练。这一举措不仅促进了数据资源的共享和利用,还为人工智能的研究和应用提供了丰富的实践基础。数据训练场的建立促进了数据资源的跨行业共享。在传统情况下,各行业的数据往往孤立存在,难以实现资源的有效整合。而数据训练场提供了一个统一的平台,使得医疗、交通、金融等不同行业的数据能够相互流通和共享,从而提高了数据的利用效率和价值,能够最大化程度释放现有数据的价值。通过构建安全可靠的数据共享平台,北京在人工智能领域的发展迈出了坚实的一步,为其他地区和行业树立了良好的示范作用。

此外,这一试点项目还有助于推动相关技术和标准的制定,加快人工智能产业的规范化和健康发展。数据训练场的进一步完善和推广,预计将为人工智能技术的创新和应用提供更加强大的支撑,促进社会各领域的智能化转型。公共运算平台的建立无疑是推动人工智能产业发展的一大助力。它不仅提供了强大的算力支持,使得大规模模型的训练成为可能,而且促进了行业间的合作与交流,加速了产业大模型的成型和应用。通过这样的平台,企业可以更有效地利用资源,减少重复建设,提高整个行业的效率,为人工智能产业注入新的活力。

特别地,初创企业无需投入大量资金建设数据训练的基础设施,降低了创业门槛,也更容易地接触到最新的技术和算法,促进了技术创新和应用创新。这对于初创企业的成长和发展具有极其重要的意义,能够激发更多的创业活力和创新潜能。随着这些企业的不断壮大和成熟,它们将成为我国人工智能产业的重要支柱,为我国在全球人工智能竞争中占据有利地位提供坚实的基础。

同时,公共运算平台还能够促进技术创新,帮助企业探索新的商业模式和服务模式,推动人工智能技术在更多领域的应用。这些企业在公共运算平台的支持下,能够更加专注于核心技术的研发和创新,加快产品和服务的市场化进程。这对于加快人工智能产业的发展,提升我国在全球人工智能竞争中的地位具有重要意义。北京亦庄的人工智能训练场是一个具有划时代意义的项目,它不仅解决了人工智能发展中的关键问题,也为中国乃至全球的人工智能产业发展树立了一个新的标杆。数据训练基建的建设将带动相关产业链的发展,包括硬件制造、软件开发、数据服务等,形成一个完整的人工智能产业生态系统。

随着人工智能技术的快速发展和应用需求的增长,预计未来我国将建立更多的数据训练场,覆盖更广泛的领域和地区,形成全国性的数据训练基建网络。为了适应日益复杂的人工智能模型和算法,数据训练基建将不断引入新的技术和设备,提高算力效率和数据处理能力,支持更高级别的人工智能研究和开发。面对全球人工智能技术的竞争,未来我国的数据训练基建有望与其他国家和地区的相应机构进行合作,共享数据和算力资源,促进国际间的技术交流和合作。

本文仅代表作者观点。

举报

文章作者

相关阅读

国资委:全面实施“AI+”专项行动,布局新赛道、培育新动能

会议强调,持续推动产业高端化、智能化、绿色化发展,全面实施“AI+”专项行动,进一步优化人才发展支持政策。

07-23 20:59

新型数字化基础设施:经济社会高质量发展的赋能引擎

近年来,我国新型数字基础设施扩容提速发展态势持续向好,5G网络广泛覆盖、IPv6全面增长、光纤宽带网络升级提速、移动物联网应用丰富等,为战略性、系统性、协同性推进全域数字化转型提供了坚实的基础。新型数字基础设施建设作为支撑国民经济和社会事业发展的基础产业,也是现代化建设的重要内容。打造互联互通、协同发展的新型数字基础设施,既能够加速推进现代产业技术的发展,构建现代化格局形成,同时对实现经济高质量发展具有重要的作用和巨大的价值。

07-23 16:04

发挥数据要素价值,实现精准核算 ———推动数据要素纳入国民经济核算体系的思考

 2024年7月10日,《广州市数据条例(草案二次审议稿•征求意见稿)》提出,市统计部门应当推动数据要素纳入国民经济和社会发展的统计核算体系。此前,我国的数据生产要素统计核算试点已经从2021年的南山区试点拓展到2022年的深圳全市,并开展了一系列专题研究。当下,数据要素纳入国民经济核算体系发展面临着新的难点。需以政策为导向,以加强技术创新与研发为重点,进一步健全数据共享机制,促进理论体系与实际应用的深度融合及数据要素的高效流通,激活要素价值,发挥要素积极作用,实现要素市场规范化,使数字化经济核算迈入新台阶。

07-16 01:33

建设数字人才队伍,布局未来数字经济

2024年7月11日,北京市人社局联合人才工作局、发改委等多部门,联合印发了《北京市加快数字人才培育支撑数字经济发展实施方案》(以下简称《方案》)。北京市的这一举措,充分展现了市委市政府对于数字经济未来发展的重视,将进一步完善北京市的数字人才培养体系,发挥数字人才对于数字经济的基础性作用,为数字经济产业发展输送源源不断的优质人才。本文将从北京市数字人才培养现状、《方案》政策特点和政策影响三个方面进行分析。

07-15 04:51

人工智能:驱动产业变革与区域发展的新时代

近年来,人工智能(AI)技术的迅猛发展正在深刻改变各行各业的运作方式,成为推动全球经济发展的重要动力源。作为新一轮科技革命和产业变革的重要驱动力,AI不仅重塑了传统产业的运营模式,还催生了大量新兴产业和商业模式,显著提升了生产效率和创新能力。在这篇文章中,我们将探讨AI在产业中的广泛应用及其带来的深远影响,剖析政策支持和区域优势对AI产业发展的关键作用,并探讨各地在推进AI产业时如何结合自身特点,实现高效发展。

07-12 03:20
一财最热
点击关闭