• Imagen 3 est un générateur d'images photoréalistes qui excelle avec des instructions détaillées et créatives.
  • Google dévoile Imagen 3 dans le cadre de sa stratégie pour rester en tête du marché concurrentiel de la génération d'images par IA.
  • L'intégration d'Imagen 3 avec Vertex AI devrait apporter des capacités avancées de génération d'images à un public plus large, améliorant diverses applications dans tous les secteurs.

Google a présenté Imagen 3, son modèle de génération d'images par texte de la plus haute qualité à ce jour, disponible en avant-première privée. Ce nouveau modèle promet d'offrir un niveau de détail sans précédent, une compréhension améliorée du langage naturel et des capacités de rendu de texte améliorées.

Améliorations et avantages concurrentiels

Douglas Eck, directeur de recherche senior chez Google DeepMind, a souligné les avancées d'Imagen 3 lors de la conférence des développeurs I/O de l'entreprise. « C'est notre modèle de génération d'images le plus performant à ce jour », a déclaré Eck. « Imagen 3 est plus photoréaliste, avec des détails plus riches et moins d'artefacts visuels ou d'images déformées. Il comprend les instructions écrites de manière naturelle — plus vous êtes créatif et détaillé, meilleur est le résultat. Et Imagen 3 n'oublie pas d'intégrer les petits détails dans les longues instructions.

De plus, c'est notre meilleur modèle à ce jour pour le rendu de texte, ce qui a toujours été un défi pour les modèles de génération d'images. »

À lire également: Google ajoute son modèle d'IA Gemini Nano à Chrome pour ordinateur

Le lancement d'Imagen 3 intervient six mois après la sortie d'Imagen 2 sur Vertex AI. Cette initiative s'inscrit dans la stratégie de Google visant à garder une longueur d'avance dans le paysage concurrentiel de l'IA, où des rivaux tels que DALL-E d'OpenAI, Midjourney, Firefly d'Adobe, l'IA de Meta et Designer de Microsoft innovent également dans la technologie de génération d'images. Le récent déploiement par Google en avril dernier des capacités de conversion texte-vers-live pour ses modèles démontre encore son engagement à dominer le marché de la génération d'images par IA.

Imagen 3 est actuellement disponible en avant-première privée pour certains utilisateurs, un déploiement plus large étant prévu lorsque les développeurs pourront s'inscrire sur la liste d'attente. L'intégration avec Vertex AI devrait apporter des capacités avancées de génération d'images à un public plus large, améliorant diverses applications dans tous les secteurs.

À lire également: Google lance la puce IA Trillium, cinq fois plus rapide

Gestion des controverses

Malgré ses avancées, Google a rencontré des difficultés dans ce domaine. Plus tôt cette année, l'entreprise a été critiquée pour ses images générées par IA représentant des personnages et événements historiques de manière inexacte, ce qui a conduit à des accusations selon lesquelles l'IA serait « trop woke ». Google a présenté ses excuses pour ces incidents, le PDG Sundar Pichai réaffirmant l'engagement de l'entreprise à améliorer ses modèles lors d'une interview avec Emily Chang de Bloomberg.