- Le système, appelé Pareto, améliore l'efficacité de la puce d'IA en simplifiant son fonctionnement, réduisant ainsi la consommation d'énergie.
- Testé avec succès sur le modèle d'IA de la plateforme principale, Recogni vise à collaborer avec des entreprises de matériel pour permettre une adoption plus large.
NOTRE AVIS
La nouvelle méthode brevetée, appelée Pareto, pourrait rendre les puces utilisées pour entraîner et exécuter les systèmes d'IA plus petites, plus rapides et moins coûteuses à exploiter. En surpassant les innovations existantes dans l'exécution de grands modèles d'IA, cela pourrait avoir un impact significatif sur l'industrie de la technologie IA en la rendant plus efficace et plus rentable.
— Iydia Ding, journaliste BTW
Ce qui s'est passé
puce d'IA et la startup de logiciels Recogni ont dévoilé mardi une nouvelle approche de calcul qui rend les puces utilisées pour entraîner et exécuter les systèmes d'intelligence artificielle plus petites, plus rapides et moins coûteuses à exploiter. Soutenue par BMW, Bosch et la société de capital-risque Mayfield, Recogni a développé des puces et des logiciels spécialisés pour permettre le raisonnement IA – le processus par lequel les modèles d'IA entraînés font des prédictions ou prennent des décisions sur de nouvelles données non vues.
Le nouveau système breveté, appelé Pareto, utilise une approche logarithmique qui surpasse les méthodes existantes pour exécuter de grands modèles d'IA, a déclaré l'entreprise. Gilles Backhus, co-fondateur et vice-président de l'intelligence artificielle chez Recogni, a déclaré qu'il s'agissait d'un énorme bond en avant dans le calcul IA pour tous les KPI (indicateurs clés de performance) qui affectent la conception des systèmes matériels en silicium. L'entreprise a testé Pareto sur des modèles d'IA développés par Meta Platforms, Stability AI et d'autres.
À lire aussi: ZPE lance un nouveau serveur console et une plateforme NVIDIA améliorant la charge de travail IA
À lire aussi: Le PDG de GitHub prône la concurrence et l'open source dans l'IA
Pourquoi c'est important
Les modèles d'IA actuels, tels que GPT-4 d'OpenAI et Gemini de Google, nécessitent des centaines de milliers d'opérations mathématiques gourmandes en énergie pour de simples requêtes provenant de chatbots comme ChatGPT. Et Recogni affirme que son nouveau système convertit ces opérations de multiplication en addition, réduisant considérablement la consommation d'énergie tout en maintenant la précision.
Le système améliore l'efficacité de la puce d'IA en convertissant des opérations complexes en opérations plus simples, réduisant ainsi la consommation d'énergie. En testant avec succès le modèle d'IA sur les principales plateformes, Recogni vise à collaborer avec des entreprises de matériel pour permettre une adoption plus large. Les progrès de la technologie des puces et son déploiement affecteront la dynamique de l'industrie dans son ensemble. Recogni a exprimé sa volonté de déployer sa technologie dans le monde entier et discute avec des entreprises qui installent leur matériel dans des centres de données et le livrent dans le monde.
Ces types de développements innovants dans le matériel sous-jacent auront un impact significatif sur l'ensemble de l'industrie technologique en rendant la technologie IA plus efficace et plus rentable, fournissant un support technologique plus efficace à tous les secteurs de la société.

