- Mistral AI est une entreprise française vendant des produits d'intelligence artificielle (IA). Elle a été fondée en avril 2023 par d'anciens employés de Meta Platforms et de Google DeepMind.
- Deux modèles, Mistral 7B et Mixtral 8x7B, ont été publiés et sont disponibles sous forme de poids. Trois modèles, Mistral Small, Mistral Medium et Mistral Large, sont disponibles uniquement via API.
- Mistral AI a également lancé un chatbot appelé Le Chat, un contrepoint à ChatGPT, et a conclu un partenariat avec le géant technologique Microsoft.
Perplexity AI est une jeune entreprise spécialisée dans les solutions d'IA et d'apprentissage automatique. Elle se concentre sur le développement d'algorithmes et de technologies avancés pour résoudre des problèmes complexes dans divers secteurs, notamment la finance, la santé et la technologie.
Qu'est-ce que Mistral AI ?
Mistral AI, une entreprise française vendant de l'IA, a été fondée en avril 2023 par d'anciens employés de Meta Platforms et de Google DeepMind. Elle produit des grands modèles de langage (LLM) open source, citant l'importance fondamentale des logiciels open source et en réponse aux modèles propriétaires.
Avant de co-fonder Mistral AI, Arthur Mensch travaillait chez Google DeepMind, le laboratoire d'intelligence artificielle de Google, tandis que Guillaume Lample et Timothée Lacroix travaillaient chez Meta Platforms. Les cofondateurs se sont rencontrés alors qu'ils étaient étudiants à l'École Polytechnique.
Les modèles open-weight de Mistral
Deux modèles, Mistral 7B et Mixtral 8x7B, ont été publiés et sont disponibles sous forme de poids.
Son premier modèle de traitement du langage « Mistral 7B » a été mis à disposition le 27 septembre 2023 sous la licence gratuite Apache 2.0. Ce modèle comprend 7 milliards de paramètres, une petite taille par rapport à ses concurrents.
La société a publié le modèle Mixtral 8x7B avec 46,7 milliards de paramètres, mais n'en utilise que 12,9 milliards par token grâce à l'architecture de mélange d'experts, le 11 décembre 2023. Le modèle maîtrise 5 langues (français, espagnol, italien, anglais et allemand) et surpasse, selon les tests de ses développeurs, le modèle « LLama 2 70B » de Meta.
À lire également: La startup française Mistral bouleverse le secteur avec la sortie surprise d'un LLM meilleur que ChatGPT
Mistral‘: modèles API-only
Trois modèles, Mistral Small, Mistral Medium et Mistral Large, sont disponibles uniquement via API, ce qui signifie que ces modèles sont propriétaires et uniquement accessibles via les interfaces de programmation d'applications de Mistral.
Microsoft a annoncé un nouveau partenariat avec la société en février pour étendre sa présence dans le secteur en évolution rapide de l'IA. Selon l'accord, les riches modèles de langage de Mistral seront disponibles sur le cloud Azure de Microsoft, tandis que l'assistant conversationnel multilingue « Le Chat » sera lancé dans le style de ChatGPT.
Parmi tous les grands modèles actuellement accessibles via l'API, Mistral Large se classe deuxième, juste derrière GPT-4, et est le seul à obtenir plus de 80 points à l'examen MMLU.
Avec le lancement de Mistral Large, Mistral AI a également lancé un chatbot appelé Le Chat, un contrepoint à ChatGPT, pour reproduire le succès d'OpenAI. Même avec le soutien des ressources informatiques de Microsoft Azure, les serveurs du Chat sont toujours saturés.
À lire également: Mistral France lance Le Chat pour défier ChatGPT
En termes de précision d'inférence, Mistral Large a surpassé Claude 2, Gemini 1.0 Pro, GPT-3.5 et d'autres grands modèles bien connus, et il prend également en charge les fenêtres de contexte de 32k tokens, les instructions précises et les capacités d'appel de fonction. En vitesse de raisonnement, le Mistral Large surpasse même le GPT-4 et le Gemini Pro récemment lancé par Google.
De nombreux passionnés de grands modèles open source craignent que Mistral AI ne passe de l'ouvert au fermé comme OpenAI. Selon l'interview du PDG de Mistral, non seulement ils continueront à adhérer au concept open source à l'avenir, mais en même temps, ils introduiront également le modèle fermé le plus puissant pour rivaliser dans le secteur.

