• Mistral presentó su último modelo insignia de IA, Large 2, posicionándolo como un competidor formidable frente a los modelos avanzados de OpenAI y Meta el 24 de julio.
  • El lanzamiento de Large 2 de Mistral marca un hito significativo en el panorama de la IA en rápida evolución, destacando varios aspectos críticos del desarrollo y la competencia actuales en IA.

NUESTRA OPINIÓN
El Large 2 de Mistral hace un debut fuerte, desafiando a los gigantes Meta y OpenAI. Sin embargo, el tamaño no lo es todo. Con 123 mil millones de parámetros en comparación con los 405 mil millones de Llama, la precisión de Large 2 sobre la fuerza bruta es intrigante. No obstante, su naturaleza de código cerrado y su costosa licencia podrían desanimar a algunos. Además, la falta de capacidades multimodales significa que OpenAI sigue liderando en la integración de imagen y texto. El rápido ascenso de Mistral, combinado con su ventana de 128K tokens, demuestra su enfoque estratégico, avanzando una indicación del tamaño de un libro a la vez.
–Miurio Huang, periodista de BTW

Qué sucedió

Mistral AIpresentó su último modelo insignia de IA, Large 2, posicionándolo como un competidor formidable frente a los modelos avanzados de OpenAI y Meta el 24 de julio. Este lanzamiento se produjo solo un día después de que Meta presentara su propio modelo avanzado, Llama 3.1 405b. Mistral afirma que Large 2 sobresale en áreas como generación de código, matemáticas y razonamiento, igualando o superando a sus rivales en rendimiento.

Large 2 cuenta con 123 mil millones de parámetros, significativamente menos que Llama 3.1 405B, pero según se informa supera al modelo de Meta en pruebas de referencia específicas. Un enfoque principal durante el entrenamiento de Large 2 fue reducir los problemas de alucinación, con el modelo diseñado para reconocer cuándo carece de conocimiento en lugar de inventar información plausible.

La startup de IA con sede en París, Mistral, recaudó recientemente 640 millones de dólares en una ronda de financiación Serie B, liderada por General Catalyst, alcanzando una valoración de 6 mil millones de dólares. A pesar de ser un actor relativamente nuevo en la industria de la IA, Mistral ha avanzado rápidamente a la vanguardia, lanzando constantemente modelos de IA de alto rendimiento.

Sin embargo, es crucial señalar que los modelos de Mistral, como muchos otros, no son de código abierto en el sentido tradicional. Las aplicaciones comerciales de Large 2 requieren una licencia de pago, y la implementación de un modelo tan grande exige una experiencia e infraestructura sustanciales. Además, Large 2, al igual que Llama 3.1 de Meta, carece de capacidades multimodales, una característica donde OpenAI lidera actualmente, permitiendo que la IA procese imágenes y texto simultáneamente.

Large 2 cuenta con una ventana de 128,000 tokens, lo que le permite manejar datos sustanciales en una sola indicación, equivalente a un libro de unas 300 páginas. El modelo también ofrece un soporte multilingüe mejorado, entendiendo idiomas como inglés, francés, alemán, español, italiano, portugués, árabe, hindi, ruso, chino, japonés y coreano, así como 80 lenguajes de codificación. Cabe destacar que Mistral afirma que Large 2 ofrece respuestas más concisas que otros modelos de IA, que a menudo tienden a ser verbosos.

El nuevo modelo está disponible en plataformas importantes como Google Vertex AI, Amazon Bedrock, Azure AI Studio yIBM Watsonx.Además, los usuarios pueden probar Large 2 en la plataforma de Mistral bajo el nombre "mistral-large-2407" y probarlo de forma gratuita en el competidor de ChatGPT de la startup, IE Chat.

Lea también:Reino Unido lidera Europa en startups de GenAI, según Accel

Lea también:La diferencia entre IA conversacional y GenAI

Por qué es importante

El lanzamiento de Large 2 de Mistral marca un hito significativo en el panorama de la IA en rápida evolución, destacando varios aspectos críticos del desarrollo y la competencia actuales en IA. En primer lugar, las pruebas de rendimiento del modelo y la eficiencia de parámetros subrayan la carrera en curso entre las empresas de IA por crear soluciones más potentes y rentables. Al superar a Llama 3.1 405B de Meta con menos parámetros, Mistral demuestra que la eficiencia y el rendimiento pueden coexistir, estableciendo un nuevo estándar para los modelos de IA.

Reducir los problemas de alucinación en los modelos de IA es otro avance crucial. Los sistemas de IA que pueden reconocer con precisión sus limitaciones mejoran la fiabilidad y la confianza, particularmente en aplicaciones profesionales y críticas. Este enfoque en crear un modelo exigente posiciona a Mistral como líder en el desarrollo de soluciones de IA más fiables.

La importante financiación de la Serie B y la valoración de 6 mil millones de dólares reflejan el alto nivel de confianza de los inversores en las capacidades y el potencial de mercado de Mistral. Este respaldo financiero probablemente impulsará una mayor innovación y expansión, permitiendo a Mistral seguir desafiando a gigantes establecidos de la IA como OpenAI y Meta.

Sin embargo, la naturaleza propietaria de Large 2, que requiere licencias pagadas para uso comercial, destaca una tendencia más amplia de la industria hacia la monetización de tecnologías avanzadas de IA. Este enfoque puede limitar la accesibilidad para empresas más pequeñas o individuos que carecen de los recursos necesarios, lo que podría ralentizar la adopción e innovación generalizadas.

La falta de capacidades multimodales en Large 2 señala un área donde OpenAI mantiene una ventaja competitiva. Los sistemas de IA multimodales son cada vez más importantes para aplicaciones que requieren el procesamiento simultáneo de diversos tipos de datos, como imágenes y texto. A medida que las startups se esfuerzan por incorporar estas características, es probable que la competencia se intensifique, impulsando nuevos avances en la tecnología de IA.

El amplio soporte multilingüe de Large 2 y su capacidad para procesar un gran volumen de datos en una sola indicación lo convierten en una herramienta versátil para aplicaciones globales. Esta capacidad es particularmente valiosa en entornos lingüísticos diversos y tareas computacionales complejas, ampliando la aplicabilidad del modelo en varios sectores.

Large 2 de Mistral representa un salto significativo en el desarrollo de la IA, mostrando la capacidad de la empresa para competir con los líderes de la industria. Los avances del modelo en rendimiento, fiabilidad y soporte multilingüe posicionan a Mistral como un actor formidable en el panorama de la IA, impulsando la innovación y estableciendo nuevos puntos de referencia para los futuros modelos de IA.