Mistral AI: qué es y cómo usar sus modelos de lenguaje

La startup francesa de IA está llevando la IA generativa a nuevas cotas con sus LLM comerciales y de código abierto.
Con un fuerte respaldo de inversores de alto perfil como Microsoft y Andreessen Horowitz, Mistral ha alcanzado una valoración de 5 mil millones de dólares, posicionándose como un competidor formidable en el cada vez más saturado mercado de la IA generativa.
Al hacer sus LLM más accesibles que los de algunas de las empresas de IA más poderosas, Mistral sostiene que “entrenando nuestros propios modelos, publicándolos públicamente y facilitando las contribuciones de la comunidad, podemos construir una alternativa creíble al emergente oligopolio de la IA”.

¿Qué es Mistral AI?

Mistral AI es una startup francesa de inteligencia artificial lanzada en 2023. Construye modelos de IA de código abierto y comerciales, algunos de los cuales logran un rendimiento de vanguardia en múltiples benchmarks de la industria.

Con un fuerte respaldo de inversores de alto perfil como Microsoft y Andreessen Horowitz, Mistral está valorada en 5 mil millones de dólares, posicionándose como un competidor formidable en el cada vez más saturado mercado de la IA generativa. El LLM comercial de mayor rendimiento de la empresa supera a los desarrollados por empresas establecidas como Google y Anthropic en varios benchmarks de la industria, e incluso hace que el GPT-4 de OpenAI, a menudo considerado el estándar de oro del rendimiento de modelos de IA, valga la pena.

La empresa también ha creado un conjunto de modelos de código abierto que cualquiera puede usar y modificar de forma gratuita. Al hacer sus LLM más accesibles que los de algunas de las empresas de IA más poderosas, Mistral sostiene que “entrenando nuestros propios modelos, publicándolos públicamente y facilitando las contribuciones de la comunidad, podemos construir una alternativa creíble al emergente oligopolio de la IA”.

¿Qué ofrece Mistral AI?

Mistral AI ofrece varios LLM, tanto comerciales como de código abierto. Cada uno tiene su propio conjunto único de fortalezas y capacidades.

Todos los modelos comerciales de Mistral son de código cerrado y solo están disponibles a través de su API.

Mistral Large: El más avanzado de los modelos de Mistral AI.

Ideal para tareas complejas como la generación de texto sintético y la generación de código.

Ocupa el segundo lugar después de GPT-4 en varios benchmarks de la industria.

Cuenta con una ventana de contexto máxima de 32k tokens.

Fluidez nativa en inglés, francés, español, alemán e italiano, así como en código.

Mistral Small: Centrado en el razonamiento eficiente para cargas de trabajo de baja latencia.

Ideal para tareas simples que se pueden hacer en masa, como la generación de texto y la clasificación de texto.

Cuenta con una ventana de contexto máxima de 32k tokens.

Fluidez nativa en inglés, francés, español, alemán e italiano, así como en código.

Mistral Embed: Convierte texto en representaciones numéricas (también llamadas “embeddings”) para que pueda procesar y analizar palabras de una manera comprensible para un ordenador.

Ideal para tareas como el análisis de sentimiento y la clasificación de texto.

Actualmente disponible solo en inglés.

Todos los modelos de código abierto de Mistral están disponibles de forma gratuita bajo Apache 2.0, una licencia totalmente permisiva que permite a cualquiera usarlos en cualquier lugar, sin restricciones.

Mistral 7B: Diseñado para una fácil personalización y despliegue rápido.

Puede manejar grandes volúmenes de datos más rápido y con un costo computacional mínimo.

Entrenado en un conjunto de datos de aproximadamente 7 mil millones de parámetros, pero supera a Llama 2 (13 mil millones de parámetros) y se equipara a modelos con hasta 30 mil millones de parámetros.

Cuenta con una ventana de contexto máxima de 32k tokens.

Se puede usar en inglés y código.

Mixtral 8x7B: Diseñado para rendir bien con un esfuerzo computacional mínimo.

Utiliza una arquitectura de mezcla de expertos; solo usa alrededor de 12 mil millones de sus posibles 45 mil millones de parámetros para la inferencia.

Supera tanto a Llama 2 (70 mil millones de parámetros) como a GPT-3.5 (175 mil millones de parámetros) en la mayoría de los benchmarks.

Cuenta con una ventana de contexto máxima de 32k tokens.

Fluidez nativa en inglés, francés, español, alemán e italiano, así como en código.

Mixtral 8x22B: El más avanzado de los modelos de código abierto de Mistral AI

Ideal para tareas como resumir documentos grandes o generar mucho texto.

Una versión más grande de Mixtral 8x7B; solo usa alrededor de 39 mil millones de sus posibles 141 mil millones de parámetros para la inferencia.

Supera a Llama 2 70B y a Command R y R+ de Cohere en relación costo-rendimiento.

Cuenta con una ventana de contexto máxima de 64k tokens.

Fluidez nativa en inglés, francés, español, alemán e italiano, así como en código.

Le Chat: Además de sus LLM, Mistral AI ofrece Le Chat, un chatbot de IA que puede generar contenido y mantener conversaciones con los usuarios — similar a plataformas como ChatGPT, Gemini y Claude. Mistral AI también permite a los usuarios elegir qué modelo quieren que funcione internamente — Mistral Large para un mejor razonamiento, Mistral Small para velocidad y rentabilidad o Mistral Next, un modelo prototipo diseñado para dar respuestas breves y concisas.

Sin embargo, Le Chat no tiene acceso en tiempo real a Internet, por lo que sus respuestas pueden no estar siempre actualizadas. Y como cualquier herramienta de IA generativa, puede producir respuestas sesgadas y cometer errores. Pero Mistral dice que está trabajando para hacer que sus modelos sean “lo más útiles y lo menos sesgados posible”.

Lea también: ¿Cómo crear un modelo de lenguaje grande (LLM)?

¿Para qué se utiliza Mistral AI?

Todos los LLM de Mistral AI son modelos base, lo que significa que pueden ser ajustados y utilizados para una amplia gama de tareas de procesamiento del lenguaje natural, tales como:

Chatbots: Permiten a los chatbots entender las consultas en lenguaje natural de los usuarios y responder de manera más precisa y humana.

Resumen de texto: Extraen la esencia de artículos y documentos y resumen sus puntos clave en una visión general concisa.

Creación de contenido: Generan texto en lenguaje natural, incluyendo correos electrónicos, contenido para redes sociales, historias cortas, cartas de presentación y más.

Clasificación de texto: Categorizan el texto en diferentes categorías, como marcar correos electrónicos como spam o no spam según su contenido.

Completado de código: Generan fragmentos de código, optimizan código existente y sugieren correcciones de errores para acelerar el proceso de desarrollo.

¿Cómo usar los modelos de Mistral AI?

Todos los modelos de Mistral AI se pueden encontrar en su sitio web. También están disponibles en plataformas como Amazon Bedrock, Databricks, Snowflake Cortex y Azure AI.

Para usar estos modelos directamente en el sitio web de Mistral AI, visite La Plateforme, su plataforma de desarrollo e implementación de IA. Desde allí, puede configurar barreras de seguridad y ajustar los modelos a sus especificaciones antes de integrarlos en sus propias aplicaciones y proyectos. El rango de precios depende del modelo que utilice. Por ejemplo, el Mistral 7B cuesta 0,25 dólares por millón de tokens de entrada, mientras que el Mistral Large cuesta 24 dólares por millón de tokens de salida.

También puede interactuar con modelos grandes y pequeños de Mistral a través de Le Chat, el chatbot de IA gratuito de la empresa.Todos los modelos de Mistral AI se pueden encontrar en su sitio web. También están disponibles en plataformas como Amazon Bedrock, Databricks, Snowflake Cortex y Azure AI.

También puede interactuar con modelos grandes y pequeños de Mistral a través de Le Chat, el chatbot de IA gratuito de la empresa.

¿Qué es Mistral AI?

¿Qué es Mistral AI?

¿Qué ofrece Mistral AI?

¿Para qué se utiliza Mistral AI?

¿Cómo usar los modelos de Mistral AI?

Resumen de señal

Superficie operativa

Contexto de mercado

Qué vigilar

Contexto de tendencia profundo

Círculo Estratégico

Alianza de Liderazgo

Briefing del Círculo Estratégico

Briefing de la Alianza de Liderazgo