• Mistral AI es una empresa francesa que vende productos de inteligencia artificial (IA). Fue fundada en abril de 2023 por exempleados de Meta Platforms y Google DeepMind.
  • Dos modelos, Mistral 7B y Mixtral 8x7B, han sido publicados y están disponibles como pesos. Tres modelos, Mistral Small, Mistral Medium y Mistral Large, están disponibles solo a través de API.
  • Mistral AI también ha lanzado un chatbot llamado Le Chat, un contrapunto a ChatGPT, y ha establecido una asociación con el gigante tecnológico Microsoft.

Perplexity AI es una empresa joven que se especializa en soluciones de IA y aprendizaje automático. Se enfocan en desarrollar algoritmos y tecnologías avanzadas para abordar problemas complejos en diversas industrias, incluyendo finanzas, salud y tecnología.

¿Qué es Mistral AI?

Mistral AI, una empresa francesa de venta de IA, fue fundada en abril de 2023 por exempleados de Meta Platforms y Google DeepMind. Produce modelos de lenguaje grandes de código abierto (LLMs) citando la importancia fundamental del software de código abierto y como respuesta a los modelos propietarios.

Antes de co-fundar Mistral AI, Arthur Mensch trabajó en Google DeepMind, el laboratorio de inteligencia artificial de Google, mientras que Guillaume Lample y Timothée Lacroix trabajaron en Meta Platforms. Los cofundadores se conocieron cuando eran estudiantes en la École Polytechnique.

Modelos de pesos abiertos de Mistral

Dos modelos, Mistral 7B y Mixtral 8x7B, han sido publicados y están disponibles como pesos.

Su primer modelo de procesamiento de lenguaje "Mistral 7B" estuvo disponible el 27 de septiembre de 2023 bajo la licencia gratuita Apache 2.0. Este modelo tiene 7 mil millones de parámetros, un tamaño pequeño en comparación con sus competidores.

La empresa lanzó el modelo Mixtral 8x7B con 46.7 mil millones de parámetros, pero usando solo 12.9 mil millones por token gracias a la arquitectura de mezcla de expertos, el 11 de diciembre de 2023. El modelo domina 5 idiomas (francés, español, italiano, inglés y alemán) y supera, según las pruebas de sus desarrolladores, al modelo "LLama 2 70B" de Meta.

Lea también: La startup francesa de IA Mistral revoluciona el sector con el lanzamiento sorpresa de un LLM mejor que ChatGPT

Mistral: modelos solo API

Tres modelos, Mistral Small, Mistral Medium y Mistral Large, están disponibles solo a través de API, lo que significa que estos modelos son de código cerrado y solo están disponibles a través de las interfaces de programación de aplicaciones de Mistral.

Microsoft anunció una nueva asociación con la empresa en febrero para expandir su presencia en la industria de IA en rápida evolución. Según el acuerdo, los potentes modelos de lenguaje de Mistral estarán disponibles en la nube Azure de Microsoft, mientras que el asistente conversacional multilingüe "Le Chat" se lanzará al estilo de ChatGPT.

Entre todos los modelos Large actualmente accesibles a través de la API, Mistral Large ocupa el segundo lugar, justo después de GPT-4, y es el único que obtiene más de 80 puntos en el examen MMLU.

Con el lanzamiento de Mistral Large, Mistral AI también ha lanzado un chatbot llamado Le Chat, un contrapunto a ChatGPT, para replicar el exitoso camino de OpenAI. Incluso con el soporte de los recursos informáticos de Microsoft Azure, los servidores de Le Chat siguen estando saturados.

Lea también: Mistral de Francia lanza Le Chat para desafiar a ChatGPT

En términos de precisión de inferencia, Mistral Large ha superado a Claude 2, Gemini 1.0 Pro, GPT-3.5 y otros modelos grandes conocidos, y también admite una ventana de contexto de 32k tokens, admite instrucciones precisas y viene con capacidades de llamada a funciones. En velocidad de razonamiento, Mistral Large supera incluso a GPT-4 y al recién lanzado Gemini Pro de Google.

Muchos entusiastas de los modelos grandes de código abierto temen que Mistral AI pase de ser abierta a cerrada como OpenAI. Según la entrevista con el CEO de Mistral, no solo continuarán adhiriéndose al concepto de código abierto en el futuro, sino que al mismo tiempo, también introducirán el modelo de código cerrado más potente para competir en el negocio.