- Microsoft lance son propre accélérateur IA pour alimenter ses charges de travail internes et ses services cloud, réduisant ainsi sa dépendance aux GPU coûteux et rares de Nvidia.
- Cette initiative souligne une tendance sectorielle plus large, les hyperscalers cherchant à mieux contrôler les performances, les coûts et les chaînes d'approvisionnement.
Ce qui s'est passé: une étape stratégique dans le silicium
Début 2024, Microsoft a dévoilé sa première puce IA conçue en interne dans le cadre d'un effort plus large visant à renforcer son infrastructure cloud et d'intelligence artificielle, selon Tech in Asia. Microsoft, un géant américain des logiciels et du cloud computing surtout connu pour Windows et Azure, a déclaré que ce processeur contribuerait à alimenter les charges de travail IA tout en réduisant la dépendance aux unités de traitement graphique dominantes de Nvidia.
La puce, conçue en interne mais fabriquée par une fonderie tierce, est destinée principalement aux centres de données de Microsoft et à la plateforme cloud Azure plutôt qu'aux clients finaux. Elle reflète la pression croissante sur les hyperscalers pour gérer les coûts élevés de l'IA et les pénuries chroniques de matériel Nvidia avancé.
Selon les dirigeants de Microsoft cités par Tech in Asia, l'entreprise ne prévoit pas d'abandonner totalement Nvidia. Au lieu de cela, la nouvelle puce est destinée à compléter les GPU existants et à offrir une flexibilité pour des tâches spécifiques d'inférence et d'entraînement IA. Nvidia, une entreprise américaine de semi-conducteurs dont les puces sous-tendent une grande partie de l'essor actuel de l'IA générative, reste un fournisseur critique pour Microsoft et ses partenaires.
Cette annonce fait suite à des mesures similaires de concurrents tels que Google et Amazon, qui ont également développé des accélérateurs IA personnalisés pour optimiser leurs services cloud et leurs charges de travail.
À lire aussi: Le PDG de Microsoft émet une note de prudence sur l'IA
À lire aussi: Perturbation des services Microsoft 365 pour des milliers d'utilisateurs
Pourquoi c'est important
La décision de Microsoft montre comment l'IA redéfinit la stratégie cloud. Les semi-conducteurs personnalisés permettent aux fournisseurs de cloud d'ajuster les performances, de contrôler les coûts et de réduire l'exposition aux goulets d'étranglement de la chaîne d'approvisionnement. D'un point de vue financier, les puces conçues en interne peuvent améliorer les marges en réduisant les dépenses d'investissement à long terme, même si les coûts initiaux de recherche sont élevés.
Cependant, la position de Nvidia reste redoutable. Son écosystème logiciel, en particulier CUDA, est profondément ancré dans le développement de l'IA, créant une barrière difficile à franchir même lorsque du matériel alternatif existe. Comme le note Tech in Asia, l'initiative de Microsoft vise la diversification plutôt que le remplacement.
Plus largement, ce changement indique une tendance à l'intégration verticale de l'ensemble de la chaîne IA, les grandes entreprises technologiques concevant des puces, construisant des modèles et exploitant des plates-formes cloud sous un même toit. Cette consolidation pourrait accélérer l'innovation, mais elle risque aussi de concentrer le pouvoir entre les mains d'un petit groupe d'acteurs mondiaux, redessinant la concurrence dans le cloud computing et l'intelligence artificielle.

