- OpenAI 在推理工作负载中出现性能担忧后,正在寻求一些 Nvidia GPU 的替代品,这可能会改变其计算策略。
- 此举凸显了对专用 AI 硬件日益增长的需求,以及 AI 芯片领域竞争加剧。
发生了什么:OpenAI 探索 Nvidia 替代方案用于推理任务
据知情人士向 Reuters 透露,ChatGPT 的制造商 OpenAI 对 Nvidia 部分最新人工智能芯片感到不满,并正在为其部分计算工作负载探索替代方案。报道称,担忧主要集中在推理工作负载上,即 AI 模型响应用户查询并生成输出的过程,包括编码助手等工具。OpenAI 员工表示,Nvidia 的 GPU 在这些任务中有时在速度和内存访问方面表现滞后,促使该公司研究具有片上内存和其他架构差异的专用芯片。
尽管 Nvidia 仍然是训练大型模型(一项涉及密集并行计算的任务)的主要硬件供应商,但推理已成为一个独立的战场,随着 AI 公司大规模部署模型,性能和成本效益变得越来越重要。
根据报道,OpenAI 与 Nvidia 的分歧至少从 2025 年就已开始,当时该公司寻求潜在合作伙伴和芯片制造商,如 AMD 和 Cerebras,以获取可能更适应其不断变化的推理需求的 GPU 和加速器。
尽管 Nvidia 坚称其仍为 OpenAI 的大部分推理机群提供动力,并提供有竞争力的性能和总拥有成本,但 OpenAI 据报道的战略转向突显了快速增长的 AI 领域硬件优先级的转变。
另请参阅:SoftBank 与 OpenAI 的 300 亿美元谈判引发担忧
另请参阅:Amazon 考虑 500 亿美元投资 OpenAI
为何重要
这一消息表明,即使是市场领导者也在重新评估根深蒂固的供应商关系,以应对不断变化的技术需求和成本压力。随着推理——AI 模型的实际应用——在计算工作负载中占据更大份额,芯片所需的特性(如快速内存通道和低延迟)可能与模型训练中优先考虑的特性不同。
OpenAI 对替代供应商和硬件方法的探索反映了更广泛的行业趋势:公司越来越关注异构计算——混合使用 GPU、专用加速器和定制芯片——以优化每美元性能。关于异构 AI 硬件的研究表明,新兴的加速器架构可以实现有竞争力的能效和性能配置,即使软件和生态系统支持仍处于成熟阶段。
在战略层面,这一潜在转变也可能使 OpenAI 与 Nvidia 之间的关系复杂化。据其他报道,两家公司曾通过拟议的数十亿美元投资和密切合作而联系在一起,Nvidia 甚至计划对 OpenAI 进行巨额资本承诺。尽管 Nvidia 公开否认有任何根本性裂痕,且 OpenAI 强调其持续依赖 Nvidia 硬件,但对替代方案的潜在推动表明,竞争压力和技术优先级如何重塑合作伙伴关系。
最后,这一情况凸显了 AI 行业的一个更广泛趋势:随着神经网络成为越来越多应用的核心,硬件堆栈必须不断演进,以满足训练、推理、部署规模和成本管理的多样化需求。像 OpenAI 这样的旗舰 AI 公司寻求 Nvidia 芯片替代方案,可能会鼓励对专用芯片(包括新的加速器设计和小芯片)的投资,因为各公司都希望在性能和经济性上实现差异化。

