• 谷歌正在与 Marvell 探索两款专注于推理和内存优化的 AI 芯片设计。
  • 这些计划包括一款内存处理单元和一款用于推理工作负载的下一代 TPU。

发生了什么

谷歌正在与 Marvell Technology 讨论共同开发两款新的 AI 芯片,据路透社和 The Information 援引的报道。  

这些芯片旨在提高运行 AI 模型时的效率,特别是在推理任务中。一种设计是内存处理单元,用于支持谷歌现有的张量处理单元(TPU)。第二种是专为推理工作负载量身定制的新 TPU。

这些公司仍处于早期设计讨论阶段。他们计划在明年完成内存芯片的设计。之后,他们将进入测试生产阶段。

谷歌一直在稳步扩展其定制芯片战略。其 TPU 已经支持其云业务中的大规模 AI 服务。该公司还在 AI 基础设施市场与 Nvidia 竞争。      

为何重要

这笔交易反映了 AI 计算领域向推理效率的更广泛转变。训练 AI 模型曾主导芯片需求。如今,推理正成为实际应用中的主要工作负载。

这一转变增加了对降低延迟和能耗的专用芯片的需求。谷歌旨在减少对 Nvidia 通用 GPU 的依赖,而是建立一个垂直整合的硬件和软件堆栈。

此次合作也凸显了 AI 半导体领域日益激烈的竞争。博通、AMD 和 Marvell 等公司都在将自己定位为超大规模客户的定制芯片合作伙伴。

对谷歌而言,更强大的内部芯片可以提高其云业务的利润率,还有助于锁定需要大规模 AI 部署的企业客户。

与此同时,此举也加深了战略风险。设计定制芯片成本高昂且复杂,还增加了对供应链合作伙伴在制造和封装方面的依赖。

更广泛的行业趋势表明,AI 基础设施的支出仍在加速增长。即使存在供应过剩或需求周期放缓的担忧,云服务提供商仍在继续大力投资专用计算。

另请阅读: Nvidia 将向亚马逊供应多达 100 万颗 AI 芯片的云交易    

另请阅读: Anthropic 考虑开发自有 AI 芯片