
{{aisd}}
AI生成 免责声明
当地时间2026年6月24日,OpenAI与半导体巨头博通联合发布首款定制AI推理芯片Jalapeño。
据披露,这是一款专为大语言模型(LLM)推理设计的专用集成电路(ASIC)。该项目从最初设计到完成流片仅用9个月,开发过程中采用了OpenAI自身的AI模型进行设计加速。分工上,OpenAI负责底层架构设计,博通负责硅片实现与网络硬件,加拿大电子制造服务商Celestica负责板卡与机架系统的集成。
目前,Jalapeño芯片工程样片已在实验室中以量产目标频率和功耗运行各类机器学习工作负载,包括GPT5.3、Codex和Spark。
尽管OpenAI仍在评估最终性能,但OpenAI方面表示,早期测试表明,Jalapeño的每瓦性能将优于当前最先进水平。有关性能的详细技术报告将在未来几个月内发布。
该架构减少了数据移动,并实现了计算、内存与网络资源的均衡配置,使实际利用率更接近理论峰值性能。博通的硅实现与网络技术,包括Tomahawk网络芯片,助力该平台实现大规模量产。
OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)表示,世界正迈向以计算为核心的经济时代,Jalapeño是OpenAI长期全栈基础设施战略的一部分。通过自主设计更多底层技术栈,能够以更高的效率提供更强大的智能。

负责OpenAI硬件项目的理查德・何(Richard Ho)表示,团队围绕对前沿 AI 模型最为关键的内核、内存传输、网络以及服务模式,对架构进行了全面优化。
根据早期测试结果,Jalapeño能够在接近硬件理论极限的条件下高效执行重要的工作负载。博通公司总裁兼首席执行官陈福阳表示,这仅仅是一份跨越数代的路线图的开端。通过与OpenAI共同研发芯片,博通正助力微软及其他合作伙伴自2026年起部署千兆瓦级数据中心。
Jalapeño的流片标志着OpenAI打破了纯软件与算法层面的局限,迈出了软硬一体基础设施建设的关键一步。
过去,OpenAI在早期阶段主要通过独家绑定云厂商,以资本换算力,接受微软投资,租用由数万枚NVIDIA GPU组成的微软Azure专属集群进行模型训练与托管。2024年至2025年,OpenAI开始进行多元化供应链平衡,维持微软核心合作的同时,与甲骨文等第三方云服务商达成算力租赁协议,在模型层面引入MRC(多径可靠连接)协议,联合AMD、博通、英特尔、NVIDIA及微软,优化多芯片间的高速通信,压榨硬件极限。
OpenAI选择在2026年中期推出Jalapeño,是高昂运营成本、市场竞争及供应链压力交织的必然结果。目前行业主流模型推理端算力消耗已逐渐超过训练端,摆脱单一供应商依赖也是厂商共性选择。
行业内,谷歌凭借自研TPU系列芯片,在算力成本控制和软硬协同优化上展现出巨大的利润空间。Anthropic与亚马逊、谷歌两大云厂商深度资本与算力绑定,同时联合多家算力、硬件厂商搭建多元算力底座。OpenAI若要维持技术与商业的领先,必须补齐芯片这块拼图。
OpenAI表示,Jalapeño是多代计算平台的第一步,该平台计划于2026年底前实现首次部署,并在未来几年持续扩展。