• NVIDIA estime que le marché des puces IA pourrait atteindre 1 000 milliards de dollars d'ici 2027, à mesure que l'IA passe de l'entraînement de modèles à l'inférence en temps réel.
  • Ce changement met en évidence une demande croissante d'infrastructures informatiques capables de fournir des réponses d'IA instantanées.

Que s'est-il passé: l'informatique IA entre dans l'ère de l'inférence

NVIDIA a prédit que le marché mondial des puces d'intelligence artificielle pourrait atteindre 1 000 milliards de dollars d'ici 2027, alors que l'industrie se concentre de plus en plus sur l'inférence IA en temps réel plutôt que sur le seul entraînement de modèles.

Selon une analyse publiée par Tekedia, NVIDIA s'attend à une forte augmentation de la demande de processeurs IA spécialisés, car les entreprises déploient des applications d'intelligence artificielle nécessitant des réponses immédiates.

L'inférence désigne le processus consistant à exécuter des modèles d'IA entraînés pour générer des résultats en temps réel, comme répondre à des requêtes, recommander des produits ou alimenter des assistants numériques. Alors que l'entraînement des modèles nécessite une puissance de calcul énorme, les charges de travail d'inférence devraient croître rapidement à mesure que les systèmes d'IA sont intégrés dans les services quotidiens.

NVIDIA est devenu l'un des principaux fournisseurs de puces utilisées pour l'informatique IA dans les centres de données et les infrastructures cloud. Ses unités de traitement graphique (GPU) sont largement utilisées par les entreprises technologiques développant des systèmes d'apprentissage automatique à grande échelle.

L'entreprise soutient que la prochaine étape du boom de l'IA sera motivée par le déploiement à grande échelle de systèmes d'inférence dans tous les secteurs, y compris la santé, la finance, la fabrication et les applications grand public.

Selon le rapport, la transition vers des services d'IA en temps réel crée une nouvelle catégorie de demande informatique qui pourrait considérablement élargir le marché des semi-conducteurs spécialisés.

À lire également:NVIDIA fixe un objectif de bonus de 4 millions de dollars pour le PDG Huang
À lire également:NVIDIA prévoit un investissement de 2 milliards de dollars dans la société de cloud IA Nebius

Pourquoi c'est important

Cette prédiction reflète un changement plus large dans l'industrie de l'intelligence artificielle, passant de l'entraînement expérimental de modèles à un déploiement à grande échelle.

Ces dernières années, une grande partie de la demande de calcul liée à l'IA a été motivée par les entreprises entraînant des modèles de plus en plus volumineux. Cependant, une fois ces modèles construits, ils doivent être exécutés en continu pour fournir des services aux utilisateurs.

Cela crée un nouveau défi d'infrastructure, potentiellement plus vaste: fournir une puissance de calcul suffisante pour fournir des réponses d'IA instantanément et de manière fiable à travers des millions d'applications.

Pour les fournisseurs de cloud et les opérateurs de centres de données, l'essor des charges de travail d'inférence pourrait entraîner des investissements supplémentaires dans des infrastructures informatiques spécialisées conçues pour le traitement IA à haute vitesse.

D'un point de vue financier, les prévisions de NVIDIA soulignent à quel point les matériels semi-conducteurs sont devenus essentiels à l'économie mondiale de l'IA. Les investisseurs considèrent de plus en plus les puces IA comme l'un des segments les plus précieux de la chaîne d'approvisionnement technologique.

Si les projections de l'entreprise s'avèrent exactes, les prochaines années pourraient connaître une expansion énorme de la demande de processeurs conçus spécifiquement pour alimenter les systèmes d'intelligence artificielle en temps réel.

Le passage à l'inférence suggère donc que la prochaine phase du boom de l'IA pourrait être définie non seulement par la construction de modèles plus intelligents, mais aussi par leur livraison instantanée à l'échelle mondiale.