Google presenta Imagen 3: su modelo de texto a imagen más

Imagen 3 es un generador de imágenes fotorrealistas que destaca con indicaciones detalladas y creativas.
Google presenta Imagen 3 como parte de su estrategia para mantenerse a la vanguardia en el competitivo mercado de generación de imágenes con IA.
Se prevé que la integración de Imagen 3 con Vertex AI brinde capacidades avanzadas de generación de imágenes a una audiencia más amplia, mejorando diversas aplicaciones en distintas industrias.

Google ha presentadoImagen 3, su modelo de texto a imagen de mayor calidad hasta la fecha, disponible en vista previa privada. Este nuevo modelo promete ofrecer un detalle sin precedentes, una comprensión mejorada del lenguaje natural y capacidades de renderizado de texto mejoradas.

Mejoras y ventajas competitivas

Douglas Eck, Director Sénior de Investigación de Google DeepMind, destacó los avances de Imagen 3 durante la conferencia de desarrolladores I/O de la compañía. “Es nuestro modelo de generación de imágenes más capaz hasta el momento”, afirmó Eck. “Imagen 3 es más fotorrealista, con detalles más ricos y menos artefactos visuales o imágenes distorsionadas. Comprende las indicaciones escritas de la forma en que la gente escribe: cuanto más creativo y detallado seas, mejor. Además, Imagen 3 recuerda incorporar pequeños detalles en indicaciones más largas.

Y este es nuestro mejor modelo hasta ahora para renderizar texto, lo cual ha sido un desafío para los modelos de generación de imágenes”.

Lea también:Google añade su modelo de IA Gemini Nano a Chrome para escritorio

El lanzamiento de Imagen 3 se produce seis meses después del lanzamiento de Imagen 2 en Vertex AI. Esta medida forma parte de la estrategia de Google para mantenerse a la vanguardia en el competitivo panorama de la IA, donde rivales comoDALL-E de OpenAI, Midjourney, Firefly de Adobe, IA de Meta y Designer de Microsoft también están innovando en tecnología de generación de imágenes. El reciente despliegue de capacidades de 'text-to-live' para sus modelos en abril demuestra aún más su compromiso de liderar el mercado de generación de imágenes con IA.

Actualmente, Imagen 3 está disponible en vista previa privada para usuarios seleccionados, y se espera un lanzamiento más amplio a medida que los desarrolladores puedan inscribirse en la lista de espera. Se prevé que la integración con Vertex AI lleve capacidades avanzadas de generación de imágenes a una audiencia más amplia, mejorando diversas aplicaciones en todas las industrias.

Lea también:Google lanza el chip de IA Trillium, que es cinco veces más rápido

Abordando las controversias

A pesar de sus avances, Google ha enfrentado desafíos en este espacio. A principios de este año, la compañía fue criticada por sus imágenes generadas por IA que representaban de manera inexacta figuras y eventos históricos, lo que llevó a acusaciones de que la IA era “demasiado woke”. Google se disculpó por estos incidentes, y el CEO Sundar Pichai reiteró el compromiso de la compañía de mejorar sus modelos durante una entrevista con Emily Chang de Bloomberg.

Google presenta Imagen 3: su modelo de texto a imagen más avanzado

Mejoras y ventajas competitivas

Abordando las controversias

Resumen de señal

Superficie operativa

Contexto de mercado

Qué vigilar

Contexto de tendencia profundo

Círculo Estratégico

Alianza de Liderazgo

Briefing del Círculo Estratégico

Briefing de la Alianza de Liderazgo