• Google explore deux conceptions de puces d'IA avec Marvell, axées sur l'inférence et l'optimisation de la mémoire.
  • Les plans incluent une unité de traitement mémoire et un TPU de nouvelle génération pour les charges de travail d'inférence.

Ce qui s'est passé

Google est en pourparlers avec Marvell Technology pour développer conjointement deux nouvelles puces d'IA,selon des rapports cités par Reuters et The Information.  

Les puces visent à améliorer l'efficacité de l'exécution des modèles d'IA, en particulier lors des tâches d'inférence. L'une des conceptions est une unité de traitement mémoire qui viendrait soutenir les unités de traitement tensoriel (TPU) existantes de Google. La seconde est un nouveau TPU spécialement conçu pour les charges de travail d'inférence.

Les entreprises en sont encore aux premières discussions de conception. Elles visent à finaliser la conception de la puce mémoire l'année prochaine. Ensuite, elles passeraient à la production test.

Googleétend régulièrement sa stratégie de silicium personnalisé. Ses TPU prennent déjà en charge des services d'IA à grande échelle dans son activité cloud. L'entreprise est également en concurrence avec Nvidia sur les marchés de l'infrastructure d'IA.      

Pourquoi c'est important

Cet accord reflète un virage plus large de l'informatique d'IA vers l'efficacité de l'inférence. L'entraînement des modèles d'IA dominait autrefois la demande de puces. Aujourd'hui, l'inférence devient la principale charge de travail dans les applications réelles.

Ce changement accroît la demande de puces spécialisées réduisant la latence et la consommation d'énergie. Google vise à réduire sa dépendance aux GPU polyvalents de Nvidia. Au lieu de cela, il construit une pile verticalement intégrée de matériel et de logiciels.

La collaboration met également en évidence une concurrence croissante dans le domaine des semi-conducteurs pour l'IA. Des entreprises comme Broadcom, AMD et Marvell se positionnent toutes comme des partenaires de puces personnalisées pour les hyperscalers.

Pour Google, des puces internes plus performantes pourraient améliorer les marges dans son activité cloud. Cela pourrait également aider à fidéliser les entreprises clientes ayant besoin de déploiements d'IA à grande échelle.

En même temps, cette décision accroît les risques stratégiques. La conception de silicium personnalisé est coûteuse et complexe. Elle augmente également la dépendance vis-à-vis des partenaires de la chaîne d'approvisionnement pour la fabrication et l'emballage.

La tendance plus large du secteur suggère que les dépenses en infrastructure d'IA continuent d'accélérer. Les fournisseurs de cloud continuent d'investir massivement dans le calcul spécialisé, malgré les inquiétudes concernant une offre excédentaire ou un ralentissement des cycles de demande.

À lire aussi:Nvidia va fournir jusqu'à un million de puces d'IA à Amazon dans le cadre d'un accord cloud   

À lire aussi:Anthropic envisage de développer ses propres puces d'IA