• Google está explorando dos diseños de chips de IA con Marvell centrados en la inferencia y la optimización de memoria.
  • Los planes incluyen una unidad de procesamiento de memoria y una TPU de nueva generación para cargas de trabajo de inferencia.

¿Qué ha pasado?

Google está en conversaciones con Marvell Technology para desarrollar conjuntamente dos nuevos chips de IA,según informes citados por Reuters y The Information.  

Los chips buscan una mayor eficiencia en la ejecución de modelos de IA, especialmente en tareas de inferencia. Un diseño es una unidad de procesamiento de memoria que apoyaría las unidades de procesamiento tensorial (TPU) existentes de Google. El segundo es una nueva TPU diseñada específicamente para cargas de trabajo de inferencia.

Las empresas aún están en conversaciones de diseño en etapas tempranas. Su objetivo es finalizar el diseño del chip de memoria el próximo año. Después, lo pasarían a producción de prueba.

Googleha estado expandiendo constantemente su estrategia de silicio personalizado. Sus TPU ya respaldan servicios de IA a gran escala en su negocio en la nube. La compañía también compite con Nvidia en los mercados de infraestructura de IA.      

¿Por qué es importante?

El acuerdo refleja un cambio más amplio en la computación de IA hacia la eficiencia de la inferencia. El entrenamiento de modelos de IA alguna vez dominó la demanda de chips. Ahora, la inferencia se está convirtiendo en la principal carga de trabajo en aplicaciones del mundo real.

Este cambio aumenta la demanda de chips especializados que reducen la latencia y el consumo de energía. Google pretende reducir la dependencia de las GPU de uso general de Nvidia. En cambio, está construyendo una pila integrada verticalmente de hardware y software.

La colaboración también pone de relieve la intensificación de la competencia en semiconductores de IA. Empresas como Broadcom, AMD y Marvell se están posicionando como socios de chips personalizados para hiperescaladores.

Para Google, chips internos más potentes podrían mejorar los márgenes en su negocio en la nube. También podría ayudar a fidelizar a los clientes empresariales que necesitan una implementación de IA a gran escala.

Al mismo tiempo, la medida profundiza los riesgos estratégicos. El diseño de silicio personalizado es costoso y complejo. También aumenta la dependencia de los socios de la cadena de suministro para la fabricación y el empaquetado.

La tendencia más amplia de la industria sugiere que el gasto en infraestructura de IA sigue acelerándose. Los proveedores de nube continúan invirtiendo fuertemente en computación especializada, incluso en medio de preocupaciones sobre exceso de oferta o ciclos de demanda en desaceleración.

También lea:Nvidia suministrará hasta un millón de chips de IA a Amazon en acuerdo de nube   

También lea:Anthropic considera desarrollar sus propios chips de IA