Google suspend la génération d’images du modèle IA Gemini

Google s’attaque aux problèmes de la fonction de génération d’images de son modèle d’IA Gemini en suspendant la génération de personnages et en prévoyant une version améliorée.
Des plaintes concernant des inexactitudes dans la génération d’images de Gemini, y compris des représentations incorrectes dans des contextes historiques, ont émergé sur les réseaux sociaux.
Malgré les progrès dans la lutte contre les biais raciaux, le modèle d’IA Gemini de Google fait face à des critiques pour une correction excessive, mise en évidence par sa réticence à afficher certaines images et sa récente mise à niveau vers Gemini 1.5 dans un contexte de concurrence avec Sora d’OpenAI.

Google a annoncé jeudi qu’il s’efforce de résoudre les problèmes récents de la fonction de génération d’images du modèle d’IA Gemini, en suspendant la génération de personnages et en prévoyant de republier une version améliorée prochainement. La veille, Google s’est excusé, reconnaissant des inexactitudes dans certaines descriptions de génération d’images historiques par le grand modèle Gemini et s’efforçant de s’améliorer.

Des représentations historiques inexactes

Des plaintes ont été exprimées récemment sur les réseaux sociaux concernant la fonction texte-image de Gemini, comme des femmes et des personnes de couleur apparaissant dans des images sur le thème de « George Washington, père fondateur américain », ce qui est incorrect. De plus, lorsque des utilisateurs ont demandé à Gemini de générer des soldats allemands nazis, Gemini a produit des photos de femmes noires, asiatiques et blanches portant des uniformes militaires nazis.
Les utilisateurs se sont également plaints que Gemini ne voulait pas afficher d’images de personnes blanches. Lorsqu’on lui a demandé d’afficher la photo d’une personne blanche, Gemini a répondu qu’il ne pouvait pas répondre à cette demande. Cependant, invité à montrer des images de personnes noires, Gemini a suggéré d’afficher des images « célébrant la diversité et les réalisations des personnes noires ». Lorsqu’on lui a demandé de montrer des images célébrant la diversité et les réalisations des personnes blanches, Gemini a dit qu’il était « hésitant » à répondre à cette demande.

L’analyse suggère qu’il pourrait s’agir d’une correction excessive des problèmes de biais raciaux de longue date dans le domaine de l’IA, reflétant la quête de « multiculturalisme » de Google. Comparé aux modèles d’IA précédents, Gemini a fait des progrès significatifs dans la résolution des problèmes de biais raciaux, mais le problème est « exagéré ».

Gemini est le modèle d’IA multimodal le plus grand et le plus puissant de Google. La semaine dernière, l’entreprise a publié le dernier modèle d’IA de nouvelle génération Gemini 1.5, qui représente une avancée significative par rapport à Gemini 1.0 sorti en décembre dernier.

Gemini rate la cible

Jack Krawczyk, directeur principal des produits pour Gemini chez Google, a déclaré que les capacités de génération d’images de l’entreprise reflètent la « base d’utilisateurs mondiale » de ce géant technologique, et qu’il prend au sérieux la représentation et les biais. « La génération d’images de Gemini atteint effectivement un large public, ce qui est généralement une bonne chose car les gens du monde entier l’utilisent, mais elle manque sa cible. »

Plus tôt ce mois-ci, Google a commencé à proposer des services de génération d’images via Gemini, mais le lancement du nouvel outil Sora a porté un coup à Google qui tente de rattraper OpenAI, soutenue par Microsoft. Sora peut générer des vidéos continues de 60 secondes uniquement à partir de invites, stupéfiant l’ensemble de l’industrie technologique. Le Sora d’OpenAI présente non seulement les détails avec précision, mais comprend également l’existence des objets dans le monde physique, qu’il s’agisse des visuels, de la profondeur de champ, des mouvements de caméra, ou même des micro-expressions humaines et des expressions animales, qui sont toutes déjà incroyablement réalistes.

Google suspend la fonction de génération d’images de son modèle d’IA Gemini

Des représentations historiques inexactes

Gemini rate la cible

Brief signal

Surface opérationnelle

Contexte de marché

À surveiller

Contexte de tendance approfondi

Cercle stratégique

Alliance de leadership

Briefing Cercle stratégique

Briefing Alliance de leadership