英伟达计划推出全新AI推理芯片OpenAI将成为最大客户重塑竞争格局
英伟达计划推出全新AI推理芯片OpenAI将成为最大客户重塑竞争格局
英伟达计划发布一款专为OpenAI及其他客户定制的全新处理器,助力打造更快、更高效的工具。这是其业务的重大调整,或将重新定义AI竞赛格局。
据知情人士透露,该公司正在为AI推理计算设计全新系统——这类计算负责让AI模型响应用户请求。这款新平台将于下月在圣何塞举办的英伟达GTC开发者大会上正式公布,将整合初创公司Groq设计的芯片。

推理计算成为竞争焦点
推理计算已成为行业激烈竞争的焦点。竞争对手谷歌和亚马逊均已推出芯片,与英伟达旗舰产品抗衡。同时,科技行业自主编码技术的爆发式增长,催生了对能更高效处理复杂AI任务的新型芯片的需求。
部分知情人士称,OpenAI已同意成为这款新处理器的最大客户之一,对英伟达而言是重大胜利。这家ChatGPT开发者本就是英伟达的核心客户,过去数月一直在寻找英伟达芯片的更高效替代方案,并于上月与一家芯片初创公司签约,新增了供应选择。
面临推理芯片压力
英伟达在设计与销售GPU领域占据主导地位,但自AI热潮兴起以来,英伟达首次面临其旗舰产品的性能瓶颈。随着市场向推理方向转移,部分客户正施压英伟达,要求推出能更高效支撑AI应用的芯片。
许多开发和运营AI智能体的企业发现,GPU成本过高、功耗过大,且并不完全适配模型实际运行需求。随着智能体AI快速崛起,英伟达面临巨大压力,亟需研发成本更低、能效更高的推理芯片。
AI推理计算两大环节
AI推理计算主要分为两大环节:预填充是模型理解用户提示词的过程,解码是模型逐词生成回复的过程。对大型AI模型而言,预填充通常更快,而解码往往尤其缓慢。
编码应用已成为企业AI最重要、最赚钱的应用场景之一,Anthropic的ClaudeCode被公认为该领域龙头。但Anthropic主要依靠亚马逊云科技和谷歌云旗下团队设计的芯片支撑模型,而非英伟达。
Claude最主要的竞争对手之一是OpenAI快速增长的Codex工具。知情人士表示,OpenAI计划利用英伟达新系统升级Codex。



