• Google a dévoilé trois nouveaux modèles Gemma 2, dont le léger Gemma 2 2B, qui surpasse des modèles plus grands avec un nombre de paramètres plus faible.
  • Parallèlement, ShieldGemma agit comme un classificateur de sécurité, et Gemma Scope offre une interprétabilité améliorée. Ces modèles sont conçus pour faire progresser une intelligence artificielle plus sûre, plus efficace et plus transparente.

NOTRE AVIS
Les nouveaux modèles Gemma 2 de Google illustrent une évolution vers une IA plus efficace, plus sûre et plus transparente. En démontrant que des modèles plus petits peuvent surpasser des modèles plus grands, Google remet en question le statu quo et promeut un développement responsable de l'IA. L'accent mis sur la sécurité et l'interprétabilité est louable, favorisant la confiance et une adoption plus large.
–Vicky Wu, journaliste BTW

Ce qui s'est passé

Googlea publié trois nouveaux modèles de sa famille Gemma 2 d'IA générative, présentés comme plus petits, plus sûrs et plus transparents que leurs homologues. Les nouveaux modèles, Gemma 2 2B, ShieldGemma et Gemma Scope, sont conçus pour répondre à diverses applications tout en privilégiant la sécurité et l'interprétabilité.

Gemma 2 2B est unmodèle de langage large(LLM) léger optimisé pour une exécution sur appareil local et sous licence pour la recherche et l'utilisation commerciale. Malgré seulement 2,6 milliards de paramètres, Gemma 2 2B surpasse des modèles plus grands comme GPT-3.5 d'OpenAI et Mistral 8x7B de Mistral AI, comme en témoignent des évaluations indépendantes. Au contraire, Gemma 2 2B démontre l'efficacité des techniques d'entraînement avancées, des architectures supérieures et des données de haute qualité. Google espère que cela encouragera un changement vers l'affinage des modèles plutôt que l'augmentation de leur taille, et souligne l'importance de la compression et de la distillation de modèles pour une IA plus accessible avec des exigences de calcul moindres.

ShieldGemma est une collection de classificateurs de sécurité qui détectent le contenu toxique, comme les discours de haine et le matériel sexuellement explicite, en filtrant les invites et le contenu généré. Gemma Scope offre une transparence accrue en permettant aux développeurs d'examiner des aspects spécifiques des modèles Gemma 2, rendant leur fonctionnement interne plus interprétable.

À lire également:Apple utilise les puces de Google pour l'entraînement de modèles d'IA

À lire également:L'autorité antitrust britannique examine le partenariat de Google avec Anthropic

Pourquoi c'est important

Ces sorties interviennent peu de temps après que le département du Commerce des États-Unis a approuvé les modèles d'IA ouverts, soulignant les avantages d'élargir l'accessibilité de l'IA générative. Les nouveaux modèles démontrent que des tailles de paramètres plus petites peuvent atteindre des performances compétitives grâce à des techniques d'entraînement avancées et des données de haute qualité, remettant en question l'idée que les modèles plus grands sont toujours plus performants.

Les modèles Gemma 2 de Google favorisent la bonne volonté au sein de la communauté de l'IA, à l'instar des modèles Llama de Meta, en offrant des options entièrement open source. L'accent mis sur la sécurité et l'interprétabilité est crucial alors que les organisations adoptent de plus en plus les technologies d'IA, garantissant un déploiement responsable et éthique.

La disponibilité de ces modèles marque une étape significative vers une IA plus accessible et responsable, pouvant conduire à un changement dans l'orientation de l'industrie, de la taille brute vers l'affinage et l'optimisation.