« Google en pourparlers avec Marvell pour co-développer des puces d'inférence IA » est profilé par BTW Media car des preuves publiées le relient à l'infrastructure Internet, à la gouvernance, aux dépendances opérationnelles ou à la visibilité sur le marché.
« Google en pourparlers avec Marvell pour co-développer des puces d'inférence IA » est suivi en tant qu'institution d'infrastructure Internet au sein de l'écosystème de l'infrastructure Internet.
« Google en pourparlers avec Marvell pour co-développer des puces d'inférence IA » a une pertinence de source publique pour les opérations de réseau, la gouvernance, la cartographie des dépendances ou la structure du marché.
« Google en pourparlers avec Marvell pour co-développer des puces d'inférence IA » est suivi en tant qu'institution d'infrastructure Internet au sein de l'écosystème de l'infrastructure Internet.
Marché cadre les preuves de ce dossier.
Google, filiale d'Alphabet, travaillerait avec Marvell Technology sur de nouvelles puces personnalisées visant à améliorer l'efficacité de l'inférence en IA, cherchant à renforcer sa stratégie de silicium interne et à défier la domination de Nvidia sur le matériel d'IA.
Google en pourparlers avec Marvell pour co-développer des puces d'inférence IA porte un impact Moyen dans ce dossier.
Plusieurs sources publiques
- Google explore deux conceptions de puces d'IA avec Marvell, axées sur l'inférence et l'optimisation de la mémoire.
- Les plans incluent une unité de traitement mémoire et un TPU de nouvelle génération pour les charges de travail d'inférence.
Ce qui s'est passé
Google est en pourparlers avec Marvell Technology pour développer conjointement deux nouvelles puces d'IA,selon des rapports cités par Reuters et The Information.
Les puces visent à améliorer l'efficacité de l'exécution des modèles d'IA, en particulier lors des tâches d'inférence. L'une des conceptions est une unité de traitement mémoire qui viendrait soutenir les unités de traitement tensoriel (TPU) existantes de Google. La seconde est un nouveau TPU spécialement conçu pour les charges de travail d'inférence.
Les entreprises en sont encore aux premières discussions de conception. Elles visent à finaliser la conception de la puce mémoire l'année prochaine. Ensuite, elles passeraient à la production test.
Googleétend régulièrement sa stratégie de silicium personnalisé. Ses TPU prennent déjà en charge des services d'IA à grande échelle dans son activité cloud. L'entreprise est également en concurrence avec Nvidia sur les marchés de l'infrastructure d'IA.
Pourquoi c'est important
Cet accord reflète un virage plus large de l'informatique d'IA vers l'efficacité de l'inférence. L'entraînement des modèles d'IA dominait autrefois la demande de puces. Aujourd'hui, l'inférence devient la principale charge de travail dans les applications réelles.
Ce changement accroît la demande de puces spécialisées réduisant la latence et la consommation d'énergie. Google vise à réduire sa dépendance aux GPU polyvalents de Nvidia. Au lieu de cela, il construit une pile verticalement intégrée de matériel et de logiciels.
La collaboration met également en évidence une concurrence croissante dans le domaine des semi-conducteurs pour l'IA. Des entreprises comme Broadcom, AMD et Marvell se positionnent toutes comme des partenaires de puces personnalisées pour les hyperscalers.
Pour Google, des puces internes plus performantes pourraient améliorer les marges dans son activité cloud. Cela pourrait également aider à fidéliser les entreprises clientes ayant besoin de déploiements d'IA à grande échelle.
En même temps, cette décision accroît les risques stratégiques. La conception de silicium personnalisé est coûteuse et complexe. Elle augmente également la dépendance vis-à-vis des partenaires de la chaîne d'approvisionnement pour la fabrication et l'emballage.
La tendance plus large du secteur suggère que les dépenses en infrastructure d'IA continuent d'accélérer. Les fournisseurs de cloud continuent d'investir massivement dans le calcul spécialisé, malgré les inquiétudes concernant une offre excédentaire ou un ralentissement des cycles de demande.
À lire aussi:Nvidia va fournir jusqu'à un million de puces d'IA à Amazon dans le cadre d'un accord cloud
À lire aussi:Anthropic envisage de développer ses propres puces d'IA
Brief signal
- Signal: Google en pourparlers avec Marvell pour co-développer des puces d'inférence IA
- Type de signal: Sujet associé
- Région: Monde
- Classe de marché: Tendances services cloud mondiales
Surface opérationnelle
- Les sources publiées doivent identifier les parties touchées, la surface opérationnelle et l'exposition de marché avant que cette carte de tendance soit considérée comme complète.
Contexte de marché
- Pertinence opérationnelle: Moyen
- Horizon: Prochain trimestre
À surveiller
- Surveiller les déclarations officielles, les évolutions réglementaires, l'exposition clients ou partenaires et les publications de suivi.
Briefing membre
Contexte de tendance approfondi
Connectez-vous avec le bon niveau d'adhésion pour débloquer le briefing complet et les notes de source.
Réservé au Cercle stratégique
Cercle stratégique
Ouvert à tous les lecteurs. Débloquez les briefings de tendance après adhésion et connexion.
Rejoindre le Cercle stratégiqueRéservé à l'Alliance de leadership
Alliance de leadership
Pour les opérateurs, investisseurs et équipes politiques qui ont besoin de preuves relationnelles, de scénarios d'échec et de notes de source. Connectez-vous pour débloquer.
Rejoindre l'Alliance de leadership
