• Un agrégateur de GPU avertit que Nvidia risque un déclin similaire à celui d'IBM en raison d'une stratégie d'IA centralisée
  • Les GPU haut de gamme à 30 000 $ sont jugés inadaptés à un avenir d'IA évolutive et décentralisée

Ce qui s’est passé: Un point d’inflexion stratégique pour l’avenir de l’IA de Nvidia

Lors de sa conférence annuelle GTC la semaine dernière, Nvidia a tenté de reprendre le contrôle du récit sur l’IA après un début d’année difficile. Du scandale DeepSeek à l’accueil mitigé de la série RTX 50, 2024 a mis à l’épreuve la confiance des investisseurs dans le géant des semi-conducteurs. Mais de nouvelles inquiétudes ont émergé concernant la direction à long terme de l’entreprise, en particulier sa dépendance à des GPU haut de gamme et coûteux comme pierre angulaire de sa stratégie d’infrastructure IA.

Tory Green, PDG de l’agrégateur de GPU io.net, a établi un parallèle frappant dans une interview avec Capacity, avertissant que Nvidia pourrait subir le même sort qu’IBM. Autrefois une force dominante dans l’informatique, IBM a pris du retard alors que l’industrie s’orientait vers des modèles décentralisés et rentables. Selon Green, les GPU à 30 000 $ de Nvidia ne sont déjà plus en phase avec les exigences évolutives des charges de travail d’IA.

L’argument de Green se concentre sur la décentralisation: un passage à la répartition des tâches de calcul sur un ensemble diversifié de ressources GPU à moindre coût, plutôt que de les consolider dans des centres de données hyperscale remplis de matériel coûteux. Ce modèle, favorisé par les fournisseurs de périphérie, les petits centres de données, et même les contributeurs individuels, peut associer intelligemment les tâches au niveau de performance approprié, réduisant ainsi les inefficacités et les coûts.

Nvidia a reconnu la nécessité d’un certain changement. L’entreprise s’est récemment tournée vers la photonique et l’informatique quantique, revenant sur ses rejets antérieurs. Le PDG Jensen Huang a annoncé un nouveau centre de recherche quantique à Boston et a lancé le « Quantum Day » au GTC. Mais des critiques comme Green suggèrent que ces mesures pourraient être réactives plutôt que visionnaires.

En particulier, la tarification de Nvidia reste préoccupante. Les analystes notent que ses puces Blackwell sont plus coûteuses à fabriquer que les générations précédentes, ce qui pourrait réduire les marges. Si les modèles décentralisés gagnent du terrain, l’approche centralisée de Nvidia pourrait devenir un handicap coûteux plutôt qu’un avantage stratégique.

Lire aussi: Le PDG de DigitalBridge sur les tendances de l'infrastructure et des investissements en IA
Lire aussi: Le groupe Iliad investit 3 milliards de dollars dans l'infrastructure IA

Pourquoi c’est important

Les préoccupations soulevées par Tory Green mettent en lumière un changement plus large dans l’évolution de l’infrastructure de l’intelligence artificielle. Au cœur du débat se trouve la question de l’évolutivité: l’avenir de l’IA appartient-il aux supercalculateurs centralisés ou aux réseaux de GPU distribués ? Nvidia, actuellement le fournisseur dominant de puces d’IA, mise fortement sur le premier, ses GPU phares à 30 000 $ alimentant la plupart des centres de données hyperscale. Cependant, si les modèles décentralisés gagnent du terrain, cet investissement pourrait perdre sa pertinence stratégique.

L’informatique décentralisée offre une flexibilité en associant des tâches spécifiques à des niveaux de performance appropriés, ce que les modèles hyperscale peinent parfois à réaliser efficacement. Avec l’augmentation de la complexité et du volume des charges de travail d’inférence, la nécessité de les acheminer de manière rentable devient primordiale. Green soutient que la décentralisation expose un plus large éventail de ressources GPU, permettant une allocation plus intelligente et potentiellement des économies substantielles.

Il est important de noter que l’analogie de Green avec IBM est plus qu’un commentaire historique: c’est un avertissement. La chute d’IBM de sa domination dans les ordinateurs centraux n’est pas due à un manque de technologie, mais à une incapacité à s’adapter aux nouveaux paradigmes informatiques. L’avenir de Nvidia pourrait dépendre de sa capacité à équilibrer le prestige et la puissance de ses puces phares avec l’efficacité et l’accessibilité exigées par les développeurs et entreprises d’IA de nouvelle génération.

Avec l’entrée de la photonique et de l’informatique quantique dans la stratégie, Nvidia n’ignore pas la tendance. Mais il reste à voir si ces paris s’aligneront sur les tendances décentralisées ou renforceront davantage une architecture centralisée.