OpenAI联手博通打造AI芯片Jalapeño:智能工具如何重构算力格局?
图片来源:AI生成

大模型狂飙突进,算力饥渴却从未缓解。当英伟达GPU一卡难求时,OpenAI选择了一条更激进的路径——自研芯片。近日,OpenAI首次对外展示了与博通联合设计的定制AI芯片Jalapeño,这款专为推理场景打造的芯片,号称性能可与英伟达Blackwell和谷歌TPU媲美。在算力成为AI行业最大瓶颈的当下,这款智能工具的出现,不仅是对英伟达霸权的一次挑战,更可能重新定义AI基础设施的演进方向。

从依赖到自立:OpenAI为何押注定制芯片

OpenAI的算力需求有多恐怖?训练GPT-5需要数万张GPU连续运行数月,而推理阶段的调用量更是指数级增长。过去几年,OpenAI一直依赖英伟达的GPU供应链,但随着黄仁勋的“AI iPhone时刻”口号响彻业界,GPU价格暴涨且交付周期拉长,算力成本已成为吞噬研发预算的黑洞。

更深层的焦虑在于技术锁定。英伟达的CUDA生态让开发者很难脱身,而OpenAI作为AI赛道的领头羊,绝不想被单一供应商扼住咽喉。自研芯片成为必然选择——不仅要降低成本,更要掌握硬件优化的主动权。此次与博通合作推出的Jalapeño芯片,正是这一战略的阶段性成果。

值得注意的是,Jalapeño并非全面取代英伟达,而是专攻推理场景。大模型推理需要极高的吞吐量和低延迟,传统GPU在推理效率上其实存在冗余。定制化设计可以剔除不必要的计算单元,将资源集中在矩阵乘法和注意力机制上,从而大幅提升效率。这与大模型训练过程中使用的通用GPU形成鲜明对比——推理芯片追求的是单位功耗下的算力输出,而非训练时的绝对计算能力。

OpenAI硬件主管Richard Ho透露,Jalapeño专门针对大语言模型进行优化,能够更快、更高效地运行支撑各类AI应用的模型。这一设计思路,恰恰体现了AI工具导航中所强调的“专用智能工具优于通用方案”的趋势。

OpenAI联手博通打造AI芯片Jalapeño:智能工具如何重构算力格局?配图
图片来源:AI生成

Jalapeño技术解析:如何做到媲美Blackwell?

Jalapeño的具体架构细节尚未完全公开,但从已知信息中已能窥见其技术野心。该芯片由OpenAI的硬件团队与博通的ASIC设计团队共同完成,采用台积电先进制程。博通CEO陈福阳在接受采访时直言:“Jalapeño的性能可与英伟达Blackwell芯片和谷歌TPU相媲美。”

这一评价含金量极高。英伟达Blackwell是面向下一代AI计算的旗舰产品,采用多芯片模块设计,晶体管数量超过2000亿。而Jalapeño作为一款定制推理芯片,能在推理任务上与之匹敌,说明其在专用电路设计上下了狠功夫。

核心优势在于两点:第一,内存带宽优化。推理任务需要大量访问模型权重,Jalapeño配备了高带宽内存(HBM3e),由SK海力士和三星供应,确保数据搬运不拖后腿。第二,计算单元定制化。芯片内部集成了专为Transformer架构设计的张量核心,能高效执行多头注意力计算。

在搭配GPT-5.3-Codex-Spark模型进行测试时,Jalapeño样品在功耗和性能上均达到设计目标。这意味着OpenAI已经找到了一条“自给自足”的路径——未来完全可以用自家芯片跑自家模型,不再看英伟达脸色。这种闭环能力,或许才是最新科技真正令人振奋的地方。

9个月设计奇迹:AI辅助芯片开发的未来

Jalapeño从概念到流片只用了约9个月,这对于一款高性能AI芯片而言堪称光速。传统的芯片设计周期通常在18-24个月,英伟达的GPU更是积累了数十年的架构迭代。OpenAI的秘诀是什么?答案正是AI本身。

OpenAI透露,工程师在芯片设计过程中大量使用了AI辅助工具。例如,在布局布线阶段,AI算法可以自动搜索最优的物理排列方案,减少信号延迟;在功耗分析时,机器学习模型能快速预测不同工作负载下的能耗分布,指导设计师做出取舍。更关键的是,AI还参与了RTL代码的生成和验证,大幅缩短了迭代周期。

这一模式令人想起AI画图工具如何改变了创意设计领域——同样的逻辑正在硬件工程中上演。AI不再只是芯片上的应用,而成为了芯片设计流程中的核心节点。可以预见,未来越来越多的公司将采用“用AI设计AI芯片”的范式,进一步加速科技产品的迭代速度。

当然,9个月的奇迹也离不开博通的经验。博通在定制芯片领域深耕多年,为苹果、谷歌等巨头提供过ASIC方案,其设计流程已经高度自动化。OpenAI的AI能力与博通的硬件工程能力结合,催生了这一速度基因。

定制芯片的利润博弈:博通为何接单?

尽管Jalapeño性能亮眼,但博通CEO陈福阳却坦言,定制AI芯片的利润率低于公司其他产品线。原因在于AI芯片需要配备大量的HBM内存,而HBM本身价格高昂,且由SK海力士和三星寡头垄断,导致博通的成本压力剧增。

这背后反映了定制芯片生意的本质:规模换利润。博通为OpenAI设计的这款芯片不对外销售,仅供内部使用,意味着无法通过大批量出货摊薄NRE(一次性工程费用)。此外,定制芯片的客户往往拥有强势议价能力,OpenAI作为AI巨头,必然要求博通提供有竞争力的报价。

那么博通为什么还要接单?答案在于战略卡位。AI芯片市场是未来十年最大的增量市场,博通必须建立定制芯片的设计能力和客户关系。即使短期利润率不高,但通过服务OpenAI这样的标杆客户,博通可以积累技术经验,并吸引更多AI企业下单。同时,博通也在布局网络交换机、光学互联等AI基础设施中的高利润环节,定制芯片作为“敲门砖”可以带动整体解决方案的销售。

对于OpenAI而言,自研芯片的经济账是另一番考量。与其每年花费数百亿美元租用英伟达GPU,不如前期投入数十亿美元自研芯片,然后以极低的边际成本运行推理任务。这类似于云厂商自研服务器芯片的逻辑——虽然初期投入巨大,但长期来看能显著降低企业数字化转型中的算力成本。

生态变局:Jalapeño对AI行业意味着什么

Jalapeño的诞生,标志着AI行业正从“买芯片”走向“造芯片”的深水区。此前,只有谷歌(TPU)、亚马逊(Trainium/Inferentia)等云巨头有实力自研AI芯片。如今OpenAI的入局,将加速这一趋势。

首当其冲的是英伟达。虽然Jalapeño目前只用于推理,且规模有限,但一旦OpenAI验证了自研芯片的可行性和性价比,其他大模型公司(如Anthropic、Meta)很可能跟进。届时,英伟达的GPU市场份额将面临侵蚀,尤其是在推理这一高增长领域。

对芯片设计工具和IP市场而言,这是重大利好。AI辅助芯片设计的新范式(AI for Chip Design)将催生出一系列智能工具,用于自动生成RTL、优化能效、检测时序违例。而文生图等生成式AI技术也可能被引入硬件描述语言的生成中,进一步降低设计门槛。

此外,Jalapeño的定制化思路对普通用户也有间接影响。当AI芯片效率提升后,大模型的API调用成本会大幅降低,更多创新的抠图AI诗词等应用将变得廉价且普遍。普通消费者或许不会直接感受到芯片的存在,但他们会发现那些依赖AI的科技产品响应更快、收费更低。

下一代芯片:多代演化与算力民主化

OpenAI硬件主管Richard Ho明确表示,Jalapeño只是起点,后续还将推出多代自研芯片。这意味着OpenAI正在构建一个长期的自研芯片路线图,从推理芯片起步,未来可能扩展至训练芯片。

想象一下,当OpenAI拥有自己的训练芯片后,它将具备从芯片到框架到模型的全栈能力。这种垂直整合模式,不仅能带来极致的大模型性能,还能让OpenAI在算力分配上拥有前所未有的灵活性——比如针对特定任务临时调整芯片的微架构。

更深远的影响在于算力民主化。当前AI算力高度集中于少数拥有巨额资本的公司,中小企业和个人开发者只能通过云API获取能力。如果OpenAI的自研芯片能大幅降低成本,并且其模型在自家芯片上运行效率极高,那么OpenAI完全有可能推出更便宜甚至免费的API层。这将倒逼整个AI生态朝着更普惠的方向发展。

当然,挑战依然存在。定制芯片的研发投入巨大,且需要持续迭代才能跟上算法演进的速度。OpenAI是否能在芯片领域复制其在模型领域的领先地位,仍有待观察。但至少,Jalapeño已经证明了这条路的可行性。

作为关注最新科技的观察者,我们不妨期待未来几年内,更多AI实验室将加入自研芯片的行列。届时,“智能工具”将不再只是软件层面的创新,而是深入到每一块硅片的晶圆之中。