- Une version des puces de mémoire à large bande passante (HBM) de cinquième génération de Samsung Electronics, ou HBM3E, a réussi les tests de Nvidia pour une utilisation dans ses processeurs d'intelligence artificielle, selon trois sources informées des résultats.
- Ce développement marque une étape importante dans la collaboration entre les deux géants de la technologie et signale un pas en avant dans l'avancement de la technologie de l'IA.
NOTRE AVIS
Nvidia est une entreprise pionnière dans le domaine des unités de traitement graphique (GPU) et des processeurs d'IA, dédiée à l'avancement des technologies informatiques pour un large éventail d'applications. Samsung Electronics est un fabricant de renommée mondiale d'électronique grand public et de semi-conducteurs, connu pour ses produits innovants et avancés qui font progresser l'industrie. Les puces HBM3E de Samsung dans les processeurs d'IA de Nvidia promettent des vitesses plus rapides, une meilleure efficacité et la capacité de gérer des modèles d'IA plus grands et plus complexes, propulsant l'innovation en IA.
–Rebecca Xu, journaliste BTW
Ce qui s'est passé
Selon trois sources informées de la question, une variante des puces de mémoire à large bande passante (HBM) de nouvelle génération de Samsung Electronics, connue sous le nom de HBM3E, a passé avec succès les évaluations de Nvidia pour une intégration dans ses processeurs d'intelligence artificielle.
Bien que Samsung et Nvidia n'aient pas encore officialisé d'accord de fourniture pour les puces HBM3E à 8 couches testées, des initiés anticipent que l'accord sera conclu prochainement, avec des livraisons prévues pour le quatrième trimestre 2024.
La norme HBM, une mémoireDRAM(mémoire vive dynamique) introduite en 2013, empile les puces verticalement pour économiser de l'espace et réduire la consommation d'énergie. Elle est essentielle pour les GPU d'IA, aidant au traitement de grands volumes de données provenant d'applications complexes. Les puces HBM3E devraient devenir le produit HBM dominant sur le marché cette année, avec des expéditions concentrées au second semestre, selon la société de rechercheTrendForce.
À lire aussi:Samsung prévoit une hausse de la demande de puces tirée par l'IA
À lire aussi:Le retard des puces IA de Nvidia est un test pour la chaîne d'approvisionnement en IA
Pourquoi c'est important
L'adoption des puces HBM3E à 8 couches de Samsung par Nvidia devrait avoir un impact significatif sur l'avenir de la technologie de l'IA, en particulier en améliorant les performances et l'efficacité.
Premièrement, les puces HBM3E offrent une augmentation substantielle de la bande passante mémoire, ce qui est crucial pour les processeurs d'IA traitant des charges de travail complexes. Les puces fournissent un débit de données de 9,6 Gb/s, ce qui est une amélioration par rapport aux 6,4 Gb/s offerts par HBM3, conduisant à plus de 1 200 Go/s de bande passante mémoire contre 819 Go/s pour la génération précédente. Ce bond en bande passante permet le traitement de modèles d'IA plus grands et plus sophistiqués, améliorant ainsi les performances des applications d'IA.
Deuxièmement, les puces HBM3E sont conçues avec des technologies avancées telles que lesgrilles métalliques à haute constante diélectrique(HKMG) qui réduisent les fuites de courant électrique, optimisant le circuit interne et améliorant l'efficacité énergétique de 12 % par rapport à la génération précédente. Cette augmentation de l'efficacité est vitale pour les processeurs d'IA qui nécessitent une bande passante mémoire élevée à une consommation d'énergie réduite, leur permettant de fonctionner à des plages de température optimales sans compromettre les performances.
De plus, les puces HBM3E de Samsung sont les premières au monde et sont 50 % plus rapides que les HBM3 actuelles, offrant un total de 10 To/s de bande passante combinée. Cela permet à la nouvelle plate-forme d'exécuter des modèles 3,5 fois plus grands que la version précédente, tout en améliorant les performances avec une bande passante mémoire 3 fois plus rapide. La capacité de connecter plusieurs GPU pour des performances exceptionnelles et une conception de serveur facilement évolutive amplifie encore le potentiel des processeurs d'IA à s'attaquer à des charges de travail d'IA générative plus étendues.

