• Le cluster prend en charge Anthropic et son modèle Claude pour l'entraînement et l'inférence, et est construit avec des puces Trainium2 conçues par AWS.
  • Avec environ 500 000 puces désormais actives, AWS déclare que Rainier est 70 % plus grand que toute plateforme interne précédente et dépassera le million de puces d'ici fin 2025.

Que s'est-il passé: AWS active le supercluster IA du projet Rainier

AWS a officiellement activé le projet Rainier, une installation majeure d'infrastructure IA désormais peuplée de près de 500 000 de ses puces propriétaires Trainium2. Le cluster, dévoilé pour la première fois lors de l'événement Re:Invent d'AWS fin 2024, est réparti sur plusieurs sites de centres de données et utilise une architecture spécialisée — des « UltraServers » dotés de 64 puces Trainium2 chacun, interconnectés par des liaisons à haut débit.

Dans le cadre du déploiement, AWS a indiqué que son partenaire Anthropic exécutera ses modèles d'IA Claude sur le cluster Rainier, avec l'ambition d'étendre l'utilisation à plus d'un million de puces Trainium2 d'ici fin 2025. Certains sites déjà en exploitation comprennent un vaste campus dans l'Indiana avec plusieurs bâtiments et une consommation électrique potentielle de 2,2 GW.

À lire aussi: Les États-Unis renforcent les restrictions sur les exportations de puces vers Huawei et SMIC
À lire aussi: Alibaba accepte de payer 433,5 millions de dollars pour régler un recours collectif pour fraude à la sécurité

Pourquoi c'est important

Le déploiement du projet Rainier marque une étape importante dans le passage des plateformes GPU polyvalentes vers des puces IA conçues sur mesure à l'échelle hyperscale. En construisant son propre matériel d'entraînement et de service, AWS obtient un contrôle plus étroit sur la pile — de la puce au cloud — pour optimiser les coûts, les performances et l'efficacité énergétique.

Pour Anthropic et les entreprises d'IA similaires, l'accès à ce volume de calcul personnalisé ouvre la porte à l'entraînement de modèles plus grands et plus performants plus rapidement. Le fait qu'AWS affirme que le cluster est déjà 70 % plus grand que toute offre interne précédente souligne la rapidité de la course aux armements en matière de calcul.

D'un point de vue concurrentiel, le déploiement à grande échelle d'AWS met la pression sur les autres fournisseurs de cloud et fabricants de puces (y compris ceux qui dépendent des GPU) pour égaler les performances et l'échelle de l'infrastructure. La rapidité avec laquelle AWS est passé de l'annonce au lancement en moins d'un an laisse entrevoir une nouvelle référence en matière de fourniture d'infrastructure IA.

En résumé, le projet Rainier ne représente pas seulement plus de calcul — il signale une nouvelle ère dans l'infrastructure d'IA cloud, où l'intégration verticale du silicium, des serveurs et des centres de données devient un différenciateur stratégique.