- Mistral ha presentado su nuevo modelo insignia de IA, Large 2, que según afirma compite con los últimos modelos de OpenAI y Meta en términos de generación de código, matemáticas y razonamiento.
- A pesar de los altos costos y desafíos legales, Large 2 demuestra mejoras significativas en soporte multilingüe y precisión de respuesta.
NUESTRA OPINIÓN
Mistral Large 2, aunque con menos parámetros (123 mil millones), ofrece un rendimiento superior en estas áreas en comparación con el reciente lanzamiento de Meta. Mistral se enfoca en reducir los problemas de alucinación de Large 2, entrenándolo para que sea más perspicaz en sus respuestas. La empresa, que recientemente recaudó 640 millones de dólares con una valoración de 6 mil millones, se está convirtiendo rápidamente en un actor importante en la IA. Sin embargo, como la mayoría de los modelos de IA, Large 2 no es gratuito para uso comercial y requiere una licencia de pago.
-Rae Li, reportera de BTW
Lo que sucedió
La startup de IA con sede en París Mistral presentó el miércoles un nuevo modelo insignia de IA llamado Large 2, que según se afirma iguala a los últimos modelos de vanguardia de OpenAI y Meta en términos de generación de código, matemáticas y razonamiento. Mistral afirma que Large 2 establece un nuevo estándar para modelos de código abierto en cuanto a rendimiento y rentabilidad. En términos de generación de código y desempeño matemático, Large 2 parece superar a Llama 3.1.
Durante el entrenamiento, Mistral presta especial atención a reducir el problema de alucinación del modelo, entrenando a Large 2 para que sea capaz de admitir ignorancia cuando no sabe la respuesta, en lugar de inventar algo que parezca razonable. Es importante señalar que los modelos de Mistral no son de código abierto en el sentido tradicional, y cualquier aplicación comercial requiere una licencia de pago. Además, debido a la enorme escala del modelo, solo unas pocas personas en el mundo tienen la experiencia y la infraestructura para implementar modelos tan grandes.
Mistral Large 2 está disponible en Google Vertex AI, Amazon Bedrock, Azure AI Studio e IBM watsonx.ai.
Lea también: Meta lanza una versión mejorada de su modelo de IA Llama 3
Lea también: Meta lanza el potente modelo de IA Llama 3.1 de forma gratuita, generando debate
Por qué es importante
El lanzamiento del nuevo modelo de IA de Mistral, Large 2, marca un nuevo avance en el campo de la IA. Este desarrollo no solo destaca el rápido avance de la tecnología de IA, sino que también refleja la feroz competencia dentro de la industria.
La introducción de Large 2 y sus esfuerzos por reducir los problemas de alucinación del modelo demuestran los avances en precisión y fiabilidad de los modelos de IA. No obstante, su modelo de negocio no abierto y los altos requisitos de experiencia e infraestructura también revelan los desafíos de la adopción y aplicación de la tecnología de IA.

