- Anthropic annonce un programme visant à financer le développement de nouveaux benchmarks pour évaluer les performances et l’impact des modèles d’IA.
- Anthropic estime que le développement d’évaluations de haute qualité liées à la sécurité reste difficile et que la demande dépasse l’offre.
NOTRE AVIS
Compte tenu des intérêts commerciaux de l’entreprise, l’impartialité des projets financés par Anthropic pourrait être compromise. De plus, pour certains des risques d’IA « catastrophiques » et « trompeurs » mentionnés par Anthropic, certains experts estiment que cela pourrait détourner l’attention des problèmes réglementaires plus urgents de l’IA actuelle.
–Zora Lin, journaliste BTW
Ce qui s’est passé
Anthropic a annoncé lundi le lancement d’une nouvelle initiative visant à financer de nouveaux benchmarks pour évaluer les performances et l’impact des modèles d’IA, tels que les modèles génératifs comme Claude.
Selon un billet de blog officiel d’Anthropic, l’entreprise fournira un soutien financier à des organisations tierces pour développer des outils permettant de « mesurer efficacement les capacités avancées des modèles d’intelligence artificielle ». Les organisations intéressées peuvent soumettre leurs candidatures, et les évaluations seront menées de manière continue.
L’initiative d’Anthropic fait suite aux critiques croissantes des benchmarks existants pour les modèles d’IA, comme l’évaluation MLPerf menée deux fois par an par l’entité à but non lucratif MLCommons. Il est largement admis que les benchmarks les plus populaires utilisés pour évaluer les modèles d’IA évaluent mal la manière dont les gens ordinaires utilisent réellement les systèmes d’IA au quotidien.
Anthropic espère encourager la communauté de recherche en IA à proposer des benchmarks plus exigeants, axés sur leur impact social et leur sécurité, et appelle à une refonte des méthodes existantes.
À lire aussi: Qui est Dario Amodei ? PDG d’Anthropic, le gardien de la sécurité de l’IA
À lire aussi: Schneider et NVIDIA vont concevoir un centre de données de référence pour l’IA
Pourquoi c’est important
L’investissement d’Anthropic vise à élever l’ensemble du domaine de la sécurité de l’IA, en fournissant des outils précieux pour tout l’écosystème.
L’innovation en matière de benchmarks met l’accent non seulement sur les performances techniques du modèle, mais aussi sur son impact social et sa sécurité. Grâce à ce nouveau benchmark, les chercheurs peuvent mieux évaluer les problèmes sociaux et de sécurité de l’IA, fournir un soutien solide pour la construction de systèmes d’IA plus fiables et contribuer à accroître la confiance du public dans la technologie de l’IA.
En apportant un soutien financier, Anthropic encourage les organisations tierces à participer au développement de nouveaux outils de benchmarking, ce qui attirera davantage d’innovateurs et d’entrepreneurs dans le domaine de l’intelligence artificielle et favorisera sa prospérité.

