Maia 100 est conçu pour l’entraînement et l’exécution de modèles d’intelligence artificielle, tandis que Cobalt 100 est destiné à l’exécution de charges de travail générales. Maia 100 et Cobalt 100 devraient être déployés dans les centres de données Azure au début de l’année prochaine. Microsoft a développé ses propres puces d’intelligence artificielle personnalisées, l’accélérateur IA Azure Maia et le processeur Azure Cobalt. Ces puces sont fabriquées en interne et visent à optimiser les performances, la consommation d’énergie et le coût des charges de travail d’intelligence artificielle.

Puce IA Microsoft Maia Selon Reuters, Microsoft n’a pas l’intention de vendre ces puces à Nvidia, AMD, Intel et autres, mais plutôt de les utiliser pour alimenter ses produits logiciels par abonnement et ses services de cloud computing Azure. Les puces Maia sont conçues pour faire fonctionner le produit Copilot de Microsoft et Azure OpenAI, développé en collaboration avec OpenAI. Les dirigeants de Microsoft ont déclaré leur intention de faire face à des coûts potentiellement décuplés pour les services traditionnels comme les moteurs de recherche en utilisant un modèle d’intelligence artificielle fondamental unifié.

Ils ont mentionné que les puces Maia sont optimisées à cette fin. Scott Guthrie, vice-président exécutif du groupe Cloud et IA de Microsoft, a déclaré: « Nous pensons que cela nous offre une solution supérieure, nous permettant de répondre aux demandes des clients plus rapidement, de manière plus économique et avec une qualité supérieure. » À lire aussi: OpenAI envisage la production de puces en interne dans un contexte de pénuries mondiales.

Prendre en charge la charge de travail: Cobalt Pat Stemen, chef de projet de l’équipe AHSI, a mentionné qu’avant 2016, la majeure partie de l’infrastructure de Microsoft Cloud était établie par l’achat d’équipements sur étagère. Par la suite, Microsoft a décidé de commencer à construire des serveurs et des racks sur mesure en interne pour réduire les coûts et offrir une expérience plus cohérente aux clients. Au fil du temps, le silicium est devenu l’une des exigences clés.

Selon les actualités officielles de Microsoft, Stemen a déclaré que Microsoft avait partagé son expérience de conception de racks personnalisés avec des partenaires industriels, les rendant utilisables quel que soit le silicium placé à l’intérieur. « Tout ce que nous construisons, qu’il s’agisse d’infrastructure, de logiciels ou de microprogrammes, nous pouvons en tirer parti, que nous déployions nos propres puces ou celles de nos partenaires industriels », a-t-il déclaré.

Microsoft, grâce au développement de ses capacités internes en silicium personnalisé, peut répondre précisément à des normes de qualité spécifiques et garantir des performances optimales des puces sous des charges de travail critiques. Le processus de test consiste à évaluer les performances de chaque puce dans différentes conditions de fréquence, de température et d’alimentation afin d’assurer les performances de pointe les plus élevées.

Il est crucial que, dans les centres de données réels de Microsoft, chaque puce soit testée dans des conditions et configurations simulant des scénarios réels pour garantir que les performances répondent aux attentes. Cette architecture silicium améliore non seulement l’efficacité du refroidissement de Microsoft, mais optimise également l’utilisation de ses actifs actuels de centre de données, maximisant la capacité des serveurs dans son empreinte existante.

Microsoft a l’intention d’étendre ces options à l’avenir et a commencé à concevoir la deuxième génération de la série d’accélérateurs IA Azure Maia et de la série de processeurs Azure Cobalt. Stemen a souligné que la mission de l’entreprise reste cohérente: optimiser les différents niveaux de la pile technologique, des composants de silicium de base aux services finaux. À lire aussi: Intel lance les accélérateurs IA Habana Gaudi2 en Chine comme alternative aux puces NVIDIA A800 Actuellement, Maia 100 est en phase de test sur GPT-3.5 Turbo, prenant en charge des modèles tels que ChatGPT, les charges de travail Bing AI et GitHub Copilot.

Microsoft en est au stade précoce du déploiement et n’a pas encore publié d’informations spécifiques sur les spécifications ou les benchmarks de performances de Maia.