• Meta Platforms lanzó versiones anticipadas de su último modelo de lenguaje extenso, Llama 3, con nuevas capacidades de codificación informática y la capacidad de procesar comandos de imágenes. Los modelos se integrarán en el asistente virtual Meta AI, que la compañía presenta como el más sofisticado entre sus pares de uso gratuito.
  • Las versiones de Llama 3 previstas para ser lanzadas en los próximos meses también serán capaces de "multimodalidad", lo que significa que pueden generar tanto texto como imágenes, mientras compite por alcanzar al líder del mercado de IA generativa, OpenAI.
  • El modelo Llama 2 es incapaz de entender el contexto básico, Meta reduce estos problemas en Llama 3 utilizando "datos de alta calidad" para permitir que el modelo reconozca matices. La demanda de datos para modelos de IA generativa se ha convertido en una fuente importante de tensión en el desarrollo de la tecnología.

Meta Platforms lanzó versiones anticipadas de su último modelo de lenguaje extenso, Llama 3, con nuevas capacidades de codificación informática y la capacidad de procesar comandos de imágenes. El generador de imágenes integrado actualizará las imágenes en tiempo real mientras los usuarios escriben indicaciones, mientras compite por alcanzar al líder del mercado de IA generativa, OpenAI.
Vea el video explicativo del CEO Mark Zuckerberg.

Apunta al modelo de IA con multimodalidad

Las versiones de Llama 3 previstas para ser lanzadas en los próximos meses también serán capaces de "multimodalidad", lo que significa que pueden generar tanto texto como imágenes, aunque por ahora el modelo solo generará texto, dijo Chris Cox, director de producto de Meta, en una entrevista.

Los modelos se integrarán en el asistente virtual Meta AI, que la compañía presenta como el más sofisticado entre sus pares de uso gratuito. Un razonamiento más avanzado, como la capacidad de elaborar planes de varios pasos más largos, vendrá en versiones posteriores.

Lea también: Meta estrena un chip MTAI "todoterreno" 3 veces más rápido que el anterior

La inclusión de imágenes en el entrenamiento de Llama 3 mejoraría una actualización que se lanzará este año para las gafas inteligentes Ray-Ban Meta, una asociación con el fabricante de gafas Essilor Luxottica, lo que permitiría a Meta AI identificar objetos que ve el usuario y responder preguntas sobre ellos, dijo Chris Cox.

Crisis de datos para entrenar modelos de IA

El modelo Llama 2 es incapaz de entender el contexto básico, Meta reduce estos problemas en Llama 3 utilizando "datos de alta calidad" para permitir que el modelo reconozca matices. La empresa rival Google ha tenido problemas similares y recientemente suspendió el uso de su herramienta de generación de imágenes Gemini AI después de ser criticada por representaciones inexactas de figuras históricas.

El CEO de Meta, Mark Zuckerberg, dijo que la versión más grande de Llama 3 se está entrenando actualmente con 400 mil millones de parámetros y ya obtiene una puntuación de 85 en Comprensión Masiva del Lenguaje Multitarea, citando métricas utilizadas para transmitir la fortaleza y la calidad del rendimiento de los modelos de IA.

Lea también: Representante de EE. UU. propone proyecto de ley que obliga a las empresas de IA a revelar datos de entrenamiento

La voraz demanda de datos para los modelos de IA generativa se ha convertido en una fuente importante de tensión en el desarrollo de la tecnología. Meta no detalló los conjuntos de datos utilizados, aunque suministró a Llama 3 siete veces más datos de los que utilizó Llama 2, y utilizó datos "sintéticos" o creados por IA para mejorar áreas como la codificación y el razonamiento.