• AWS a lancé les instances Trainium2 avec les puces Trainium3 de nouvelle génération pour accélérer l'entraînement des modèles d'IA.
  • Ces innovations améliorent les charges de travail d'IA dans le cloud, offrant une efficacité et une évolutivité accrues.

Ce qui s'est passé: AWS lance des instances Trainium2 ultra-performantes

Le 3 décembre, Amazon Web Services a présenté Trainium3, sa puce personnalisée de nouvelle génération pour l'entraînement et le déploiement efficaces de l'IA, et a annoncé le déploiement complet d'instances cloud alimentées par AWS Trainium2, mettant des capacités d'IA hautes performances à la disposition des clients.

Amazon a dévoilé Trainium3 lors de la conférence AWS re:Invent, la conférence annuelle de l'entreprise sur le cloud computing, précisant qu'il s'agira de la première puce AWS fabriquée avec un procédé de trois nanomètres, établissant une nouvelle norme en matière d'efficacité énergétique et de densité. Ces puces offriront deux fois plus de performances et une efficacité énergétique 40 % supérieure à celle des puces Trainium2 actuelles.

La famille de silicium personnalisé AWS Trainium aide les entreprises à gérer l'échelle croissante des modèles d'IA, qui nécessitent une puissance de traitement substantielle pour gérer d'énormes ensembles de données. À mesure que ces modèles se développent, ils nécessitent davantage de ressources pour être entraînés et déployés efficacement. Pour répondre à ce besoin, AWS a lancé les instances Elastic Compute Cloud Trainium2, dotées de 16 puces Trainium2, capables de fournir une performance de pointe de 20,8 pétaflops.

Ces instances offrent 30 % de calcul en plus et 25 % de bande passante mémoire en plus par rapport aux instances EC2 comparables, fournissant les mêmes capacités à un coût inférieur.

À lire également: AWS promet 100 millions de dollars en crédits cloud pour stimuler l'éducation
À lire également: AWS d'Amazon va investir 1,8 milliard de dollars au Brésil d'ici 2034

Pourquoi c'est important

L'introduction des instances Trainium2 et Trainium3 d'AWS met en évidence un changement majeur dans le développement de l'IA, en fournissant une infrastructure cloud puissante à une fraction du coût des solutions traditionnelles sur site. Les petites entreprises et les startups, qui peuvent manquer de ressources pour du matériel personnalisé, peuvent désormais accéder à des capacités d'IA de pointe via ces instances cloud abordables. Cela est particulièrement important alors que les modèles d'IA deviennent de plus en plus complexes, nécessitant une puissance de calcul immense. Par exemple, une petite startup d'IA comme Vicarious, qui se concentre sur les systèmes de vision robotique, peut désormais tirer parti de Trainium2 d'AWS pour faire évoluer ses modèles d'IA sans investir massivement dans une infrastructure physique.

Cette accessibilité est cruciale dans un paysage dominé par de grandes entreprises aux poches profondes, où le développement de l'IA favorise souvent les mieux financés. En proposant des solutions évolutives et rentables, AWS permet aux acteurs plus petits de rivaliser, accélérant l'innovation dans tous les secteurs. Cependant, l'essor des infrastructures cloud propriétaires comme celle d'AWS pourrait également étouffer la concurrence à long terme, les entreprises devenant de plus en plus dépendantes de ces fournisseurs.

Face aux préoccupations croissantes concernant la sécurité des données et la dépendance vis-à-vis d'un fournisseur, les entreprises doivent trouver un équilibre entre les avantages des services cloud et les risques potentiels à long terme.