• Imagen 3 es un generador de imágenes fotorrealistas que destaca con indicaciones detalladas y creativas.
  • Google presenta Imagen 3 como parte de su estrategia para mantenerse a la vanguardia en el competitivo mercado de generación de imágenes con IA.
  • Se prevé que la integración de Imagen 3 con Vertex AI brinde capacidades avanzadas de generación de imágenes a una audiencia más amplia, mejorando diversas aplicaciones en distintas industrias.

Google ha presentadoImagen 3, su modelo de texto a imagen de mayor calidad hasta la fecha, disponible en vista previa privada. Este nuevo modelo promete ofrecer un detalle sin precedentes, una comprensión mejorada del lenguaje natural y capacidades de renderizado de texto mejoradas.

Mejoras y ventajas competitivas

Douglas Eck, Director Sénior de Investigación de Google DeepMind, destacó los avances de Imagen 3 durante la conferencia de desarrolladores I/O de la compañía. “Es nuestro modelo de generación de imágenes más capaz hasta el momento”, afirmó Eck. “Imagen 3 es más fotorrealista, con detalles más ricos y menos artefactos visuales o imágenes distorsionadas. Comprende las indicaciones escritas de la forma en que la gente escribe: cuanto más creativo y detallado seas, mejor. Además, Imagen 3 recuerda incorporar pequeños detalles en indicaciones más largas.

Y este es nuestro mejor modelo hasta ahora para renderizar texto, lo cual ha sido un desafío para los modelos de generación de imágenes”.

Lea también:Google añade su modelo de IA Gemini Nano a Chrome para escritorio

El lanzamiento de Imagen 3 se produce seis meses después del lanzamiento de Imagen 2 en Vertex AI. Esta medida forma parte de la estrategia de Google para mantenerse a la vanguardia en el competitivo panorama de la IA, donde rivales comoDALL-E de OpenAI, Midjourney, Firefly de Adobe, IA de Meta y Designer de Microsoft también están innovando en tecnología de generación de imágenes. El reciente despliegue de capacidades de 'text-to-live' para sus modelos en abril demuestra aún más su compromiso de liderar el mercado de generación de imágenes con IA.

Actualmente, Imagen 3 está disponible en vista previa privada para usuarios seleccionados, y se espera un lanzamiento más amplio a medida que los desarrolladores puedan inscribirse en la lista de espera. Se prevé que la integración con Vertex AI lleve capacidades avanzadas de generación de imágenes a una audiencia más amplia, mejorando diversas aplicaciones en todas las industrias.

Lea también:Google lanza el chip de IA Trillium, que es cinco veces más rápido

Abordando las controversias

A pesar de sus avances, Google ha enfrentado desafíos en este espacio. A principios de este año, la compañía fue criticada por sus imágenes generadas por IA que representaban de manera inexacta figuras y eventos históricos, lo que llevó a acusaciones de que la IA era “demasiado woke”. Google se disculpó por estos incidentes, y el CEO Sundar Pichai reiteró el compromiso de la compañía de mejorar sus modelos durante una entrevista con Emily Chang de Bloomberg.