- OpenAI cherche des alternatives à certaines GPU Nvidia suite à des préoccupations de performance dans les charges de travail d'inférence, ce qui pourrait modifier sa stratégie de calcul.
- Cette démarche met en évidence la demande croissante de matériel IA spécialisé et l'intensification de la concurrence dans le paysage des puces IA.
Ce qui s'est passé: OpenAI explore des alternatives à Nvidia pour les tâches d'inférence
OpenAI — le créateur de ChatGPT — est de plus en plus insatisfait de certaines des dernières puces d'intelligence artificielle de Nvidia et explore des alternatives pour une partie de sa charge de travail informatique, ont déclaré à Reuters des sources proches du dossier. Les préoccupations rapportées concernent les charges de travail d'inférence, où les modèles d'IA répondent aux requêtes des utilisateurs et génèrent des résultats, y compris des outils tels que les assistants de codage.
Le personnel d'OpenAI a indiqué que les GPU de Nvidia accusent parfois un retard en termes de vitesse et d'accès mémoire pour ces tâches, ce qui conduit l'entreprise à examiner des puces spécialisées dotées de mémoire intégrée et d'autres différences architecturales.
Bien que Nvidia reste un fournisseur dominant de matériel pour l'entraînement de grands modèles — une tâche qui implique un calcul parallèle intensif — l'inférenceest devenue un champ de bataille distinct, la performance et la rentabilité devenant de plus en plus importantes à mesure que les entreprises d'IA déploient des modèles à grande échelle.
Selon le rapport, la divergence d'OpenAI par rapport à Nvidia est en cours depuis au moins 2025, alors que l'entreprise recherchait des partenaires et des fabricants de puces potentiels tels qu'AMD et Cerebras pour des GPU et des accélérateurs qui pourraient mieux répondre à ses besoins évolutifs en matière d'inférence.
Bien que Nvidia affirme qu'elle alimente toujours la majorité de la flotte d'inférence d'OpenAI et offre des performances compétitives ainsi qu'un coût total de possession avantageux, le pivot stratégique rapporté d'OpenAI souligne l'évolution des priorités matérielles dans le secteur de l'IA en pleine croissance.
Lire aussi:Les discussions de SoftBank à 30 milliards de dollars avec OpenAI suscitent des inquiétudes
Lire aussi:Amazon envisage un investissement de 50 milliards de dollars dans OpenAI
Pourquoi c'est important
Cette nouvelle indique que même les leaders du marché réévaluent les relations fournisseurs bien établies en réponse à l'évolution des exigences techniques et aux pressions sur les coûts. Alors que l'inférence — l'utilisation réelle des modèles d'IA — représente une part croissante des charges de travail informatiques, les caractéristiques requises des puces (telles que des chemins de mémoire rapides et une faible latence) peuvent différer de celles privilégiées lors de l'entraînement des modèles.
L'exploration par OpenAI de fournisseurs alternatifs et d'approches matérielles reflète des tendances plus larges du secteur: les entreprises s'intéressent de plus en plus aucalcul hétérogène — mélangeant GPU, accélérateurs spécialisés et silicium personnalisé — pour optimiser les performances par dollar.Des études sur le matériel IA hétérogène suggèrent que les architectures d'accélérateurs émergentes peuvent atteindre une efficacité énergétique et des profils de performance compétitifs, même si le support logiciel et l'écosystème restent des domaines en cours de maturation.
Sur le plan stratégique, ce changement potentiel pourrait également compliquer la relation entre OpenAI et Nvidia. Les deux entreprises ont été liées par des propositions d'investissements de plusieurs milliards de dollars et une coopération étroite, Nvidia prévoyant même d'importants engagements en capital envers OpenAI, selon d'autres rapports. Bien que Nvidia ait publiquement nié toute rupture fondamentale et qu'OpenAI ait souligné sa dépendance continue au matériel Nvidia, la dynamique sous-jacente en faveur des alternatives montre comment les pressions concurrentielles et les priorités techniques peuvent remodeler les partenariats.
Enfin, la situation met en évidence une tendance plus large dans le secteur de l'IA: à mesure que les réseaux neuronaux deviennent centraux pour un éventail croissant d'applications, les piles matérielles doivent évoluer pour répondre aux demandes diverses de l'entraînement, de l'inférence, de l'échelle de déploiement et de la gestion des coûts.
La recherche d'alternatives aux puces Nvidia par une entreprise d'IA phare comme OpenAI pourrait encourager l'investissement dans le silicium spécialisé, y compris de nouvelles conceptions d'accélérateurs et de chiplets, alors que les entreprises cherchent à se différencier sur les performances et l'économie.