• Uber adopte les puces personnalisées d'Amazon pour réduire les coûts de calcul IA et diminuer sa dépendance à Nvidia
  • Ce mouvement signale un basculement du secteur vers le silicium propriétaire des fournisseurs de cloud pour l'IA à grande échelle

Ce qui s'est passé

Uber, une plateforme de VTC et de livraison de repas, approfondit son partenariat avec AWS pour exécuter des charges de travail IA sur des puces personnalisées dans un contexte de hausse des coûts de calcul

Uber étend son utilisation des puces conçues sur mesure par Amazon Web Services (AWS) pour alimenter ses charges de travail en intelligence artificielle. L'entreprise tire parti du silicium spécialisé d'AWS — qui inclut notoirement les processeurs Trainium et Inferentia — pour améliorer l'efficacité de l'entraînement et du déploiement de modèles d'IA.

Ce changement intervient alors qu'Uber cherche à optimiser l'équilibre coût-performance de ses opérations d'IA, qui sous-tendent des services essentiels tels que la mise en relation des passagers, les algorithmes de tarification et la logistique de livraison. En utilisant les puces d'AWS, Uber vise à réduire sa dépendance aux GPU polyvalents plus coûteux, généralement fournis par Nvidia.

Amazon, géant américain du commerce électronique et du cloud computing, a positionné ses puces personnalisées comme une alternative moins coûteuse pour les charges de travail IA à grande échelle, en particulier pour les tâches d'inférence et certains scénarios d'entraînement. L'adoption par Uber reflète une tendance plus large parmi les entreprises technologiques qui cherchent à diversifier leur pile de calcul alors que la demande d'infrastructure IA explose.

Pourquoi c'est important

Alors que la demande d'IA entraîne des pénuries de puces et une hausse des coûts du cloud, les entreprises qui adoptent le silicium des hyperscalers gagnent en levier tarifaire et en flexibilité architecturale, remodelant ainsi la dynamique concurrentielle de l'infrastructure IA.

La décision d'Uber met en évidence un changement structurel dans l'écosystème de l'IA: les fournisseurs de cloud ne sont plus de simples vendeurs d'infrastructure, mais sont de plus en plus compétitifs au niveau de la couche silicium. En adoptant les puces personnalisées d'AWS, Uber réduit non seulement son exposition aux coûts, mais s'aligne également plus étroitement sur la pile IA verticalement intégrée d'Amazon. Cela pourrait accélérer les cycles d'innovation tout en renforçant les risques de dépendance vis-à-vis d'un fournisseur.

Plus largement, cette décision souligne l'intensification de la concurrence entre les puces cloud propriétaires et l'écosystème GPU dominant de Nvidia. À mesure que les hyperscalers perfectionnent leurs processeurs internes, les entreprises pourraient adopter de plus en plus des stratégies de calcul hybrides — équilibrant performance, coût et disponibilité — pour soutenir la croissance de l'IA à grande échelle.

À lire aussi:Broadcom et Google concluent un accord à long terme sur les puces IA personnalisées

À lire aussi:Meta dévoile quatre puces personnalisées pour alimenter l'IA et les recommandations