首页 > 新闻 > 一财号

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

数据训练基建:驱动我国人工智能产业升级

第一财经 2024-04-02 15:37:11

作者:王鹏    责编:张健

2024年3月30日,2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经开区举办,会上,人工智能公共算力平台3000P智能算力投入使用,北京人工智能数据训练基地启用,发布100个人工智能大模型高质量数据集,数据总量逾150PB,覆盖多模态语料,涉及20个领域应用场景

(本文作者王鹏,北京市社会科学院研究员,数据资产化研究院执行院长)

2024年3月30日,2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经开区举办,会上,人工智能公共算力平台3000P智能算力投入使用,北京人工智能数据训练基地启用,发布100个人工智能大模型高质量数据集,数据总量逾150PB,覆盖多模态语料,涉及20个领域应用场景。同时,《北京经济技术开发区关于加快打造AI原生产业创新高地的若干政策》提出14条具体措施,包括推动算力赋能产业发展、构建高效协同创新体系等,发布了多个创新平台和重点项目。

作为国内首家投入运营的人工智能数据训练基地,北京亦庄人工智能公共算力平台是北京最大规模的高性能人工智能计算集群,旨在帮助企业推动开展大模型训练,推广行业应用。北京亦庄人工智能公共算力平台提供的3000P算力,超过了百万台电脑的算力,能为大模型训练提供稳定的算力支持,大幅提高训练效率,并面向算法企业等提供公共运算平台,推动企业开展大模型训练,推进我国大模型技术进步。到2026年,亦庄人工智能数据训练基地将培育性能达到国际先进水平的通用大模型,打造人工智能标杆应用场景10个,集聚人工智能产业链企业100家,实现园区营业收入1000亿元,建成人工智能算力10000P。

在人工智能和大模型的发展中,数据、算法和算力被视为三大核心要素。这三者相互依赖,共同推动着人工智能技术的进步。在这个框架下,如何构建要素使用组合和框架成为我国人工智能行业发展的一个重要课题。我国在数据开发领域拥有丰富的资源,包括优秀的科研机构、人才和企业,这为算法的开发提供了坚实的基础。

然而,要充分挖掘这些数据的潜力,需要强大的算力来支持复杂算法的运行和实验测试。因此,建立一个能够提供巨大算力的平台变得尤为关键。本次人工智能训练场的设立有助于加速这一过程,提供一个集中的、稳定的、高效的平台,使得科研机构和企业能够更高效地访问和利用所需的算力资源。训练场不仅提供了必要的硬件支持,还可能提供软件和工具的支持,进一步简化了模型训练和测试的过程。

北京通过本次数据训练场的试点,带头解决了数据的运输安全问题,跨行业、跨领域、跨区域、跨层级形成了更多高质量的数据集,帮助人工智能大模型进行训练。这一举措不仅促进了数据资源的共享和利用,还为人工智能的研究和应用提供了丰富的实践基础。数据训练场的建立促进了数据资源的跨行业共享。在传统情况下,各行业的数据往往孤立存在,难以实现资源的有效整合。而数据训练场提供了一个统一的平台,使得医疗、交通、金融等不同行业的数据能够相互流通和共享,从而提高了数据的利用效率和价值,能够最大化程度释放现有数据的价值。通过构建安全可靠的数据共享平台,北京在人工智能领域的发展迈出了坚实的一步,为其他地区和行业树立了良好的示范作用。

此外,这一试点项目还有助于推动相关技术和标准的制定,加快人工智能产业的规范化和健康发展。数据训练场的进一步完善和推广,预计将为人工智能技术的创新和应用提供更加强大的支撑,促进社会各领域的智能化转型。公共运算平台的建立无疑是推动人工智能产业发展的一大助力。它不仅提供了强大的算力支持,使得大规模模型的训练成为可能,而且促进了行业间的合作与交流,加速了产业大模型的成型和应用。通过这样的平台,企业可以更有效地利用资源,减少重复建设,提高整个行业的效率,为人工智能产业注入新的活力。

特别地,初创企业无需投入大量资金建设数据训练的基础设施,降低了创业门槛,也更容易地接触到最新的技术和算法,促进了技术创新和应用创新。这对于初创企业的成长和发展具有极其重要的意义,能够激发更多的创业活力和创新潜能。随着这些企业的不断壮大和成熟,它们将成为我国人工智能产业的重要支柱,为我国在全球人工智能竞争中占据有利地位提供坚实的基础。

同时,公共运算平台还能够促进技术创新,帮助企业探索新的商业模式和服务模式,推动人工智能技术在更多领域的应用。这些企业在公共运算平台的支持下,能够更加专注于核心技术的研发和创新,加快产品和服务的市场化进程。这对于加快人工智能产业的发展,提升我国在全球人工智能竞争中的地位具有重要意义。北京亦庄的人工智能训练场是一个具有划时代意义的项目,它不仅解决了人工智能发展中的关键问题,也为中国乃至全球的人工智能产业发展树立了一个新的标杆。数据训练基建的建设将带动相关产业链的发展,包括硬件制造、软件开发、数据服务等,形成一个完整的人工智能产业生态系统。

随着人工智能技术的快速发展和应用需求的增长,预计未来我国将建立更多的数据训练场,覆盖更广泛的领域和地区,形成全国性的数据训练基建网络。为了适应日益复杂的人工智能模型和算法,数据训练基建将不断引入新的技术和设备,提高算力效率和数据处理能力,支持更高级别的人工智能研究和开发。面对全球人工智能技术的竞争,未来我国的数据训练基建有望与其他国家和地区的相应机构进行合作,共享数据和算力资源,促进国际间的技术交流和合作。

本文仅代表作者观点。

举报

文章作者

相关阅读

推动创新数字消费:解析《关于实施数字消费提升行动的通知》

近日,商务部印发《关于实施数字消费提升行动的通知》(以下简称《通知》),以充分发挥数字消费释潜力、扩内需、稳增长、促转型的重要作用。《通知》从供给、消费、载体、业态4个方面提出具体举措,旨在加快促进数字消费领域形成更高水平供需动态平衡,推动数字消费规模稳步增长。

04-17 02:37

百家争鸣,各有所长---“京沪广深贵”五大数据交易所对比分析

根据2023年全球数商大会发布的《2023年中国数据交易市场研究分析报告》显示,2022年,我国数据交易市场规模同比增长42%,达到876.8亿元,在全球占比13.4%,在亚洲的占比更高达66.5%。预计到2025年,我国数据行业市场规模有望达到2046亿元。我国数据交易市场发展一片欣欣向荣,在数据要素市场建设和价值释放的过程中,数据交易所成为了推动数据要素交易流通不可或缺的一环。

04-10 23:21

全面推进智慧城市建设:解读《深化智慧城市发展 推进城市全域数字化转型的指导意见》

4月2日国家数据局发布了《深化智慧城市发展 推进城市全域数字化转型的指导意见》(以下简称《意见》),阐述了智慧城市发展的重要性、总体要求、基本原则、主要目标以及全领域推进城市数字化转型的具体措施。该文件涉及了智慧城市发展的多个方面,包括指导思想、基本原则、主要目标以及具体的推进措施。

04-09 23:34

擘画数字未来,深化数据改革——“首次全国数据工作会议”解析与展望

在数字化转型的关键时刻,中国正迈向一个由数据驱动的未来。这一转变,旨在深化数据要素市场化配置改革,是全球数字经济竞争中不可或缺的一环。4月1日至2日,北京成功举办了首次全国数据工作会议,这不仅是对数据要素市场化配置改革重要性的强调,也是对数字中国建设未来蓝图的深度探讨。

04-08 03:36

数字化赋能高质量发展:解析2024年全国数据工作会议

4月1日,全国数据工作会议在北京召开。作为国家数据局正式挂牌后的首次全国数据工作会议,会议从健全基础制度、释放要素潜能、加快转型赋能、促进科技创新、完善基础设施、强化安全保障、推进国际合作、抓好试点试验八个方面做出工作部署。本次会议的召开将进一步推动数据要素市场培育,为我国数字经济和新质生产力发展提供有力支撑。

04-07 02:48
一财最热
点击关闭