维度网讯,6月24日,美国OpenAI与美国博通联合发布首款智能处理器Jalapeño。该芯片专为大规模语言模型(LLM)推理设计,是双方共同打造的多代计算平台中的首款AI加速器,目标是提高AI服务运行速度、可靠性和可获得性,并把先进AI能力以更高效率推向更大规模部署场景。美国OpenAI称,Jalapeño是其首款Intelligence Processor,面向未来LLM推理需求进行架构设计。
Jalapeño并不是把通用AI加速器改造成推理芯片,而是围绕美国OpenAI日常运行的模型、内核、服务系统和产品需求重新设计。美国OpenAI在公告中提到,该芯片面向ChatGPT、Codex、API以及未来智能体产品的运行特点,重点优化大模型推理中的计算、内存访问、网络连接和调度效率。对LLM服务而言,推理环节直接关系到用户等待时间、系统响应稳定性和单位算力成本,芯片架构若能减少数据搬运并提高硬件利用率,就能在大规模服务中释放更高效率。
美国OpenAI表示,Jalapeño工程样片已在实验室以目标频率和功耗运行机器学习工作负载,其中包括GPT-5.3-Codex-Spark。公司尚未公布最终性能测试结果,但早期测试显示,Jalapeño的每瓦性能将显著优于当前先进水平。美国OpenAI还称,后续将发布更详细的技术报告,进一步说明该芯片在推理性能、能效和系统部署方面的表现。
这款芯片的开发周期被压缩到9个月。美国OpenAI称,Jalapeño从初始设计到制造流片由双方共同完成,并使用OpenAI模型加速部分设计和优化工作。芯片设计通常涉及架构定义、验证、物理实现、软件适配和制造准备等多个环节,周期长、风险高;此次项目把模型能力引入芯片设计流程,也反映出AI工具正在进入半导体研发本身。美国博通负责硅实现和网络技术支持,其Tomahawk网络芯片等技术将参与平台规模化生产。
美国OpenAI还把Jalapeño放入更长期的全栈基础设施战略中。该公司过去主要被视为模型和AI产品开发者,此次推出自研智能处理器,意味着其能力正在向芯片架构、内存系统、网络、调度和部署系统延伸。美国OpenAI总裁兼联合创始人Greg Brockman表示,Jalapeño是公司长期全栈基础设施战略的一部分,目的在于让计算资源更充足,使AI更快、更可靠、更可负担。
按照双方规划,Jalapeño将成为多代计算平台的第一步,初步部署计划在2026年底前启动,并在未来几年继续扩展。该平台将结合美国OpenAI设计的加速器、美国博通的硅实现、网络和连接技术,以及加拿大Celestica在板卡、机架和系统集成方面的能力。美国博通总裁兼首席执行官Hock Tan称,双方合作将支持与美国微软及其他合作伙伴一起部署吉瓦级数据中心。
对美国OpenAI而言,推理芯片的意义在于把大模型服务成本和响应速度进一步纳入自身控制范围。训练决定模型能力上限,推理决定模型能否以稳定、低成本方式触达用户。随着ChatGPT、Codex、API和智能体产品调用量增加,推理基础设施需要同时处理吞吐、延迟、能耗和可靠性问题。Jalapeño若在后续部署中达到预期,将为美国OpenAI降低AI服务成本、提高模型访问稳定性提供新的硬件基础。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









