- Mistral a dévoilé son dernier modèle d'IA phare, Large 2, le positionnant comme un concurrent redoutable face aux modèles de pointe d'OpenAI et de Meta, le 24 juillet.
- La sortie du Large 2 de Mistral marque une étape importante dans le paysage de l'IA en évolution rapide, mettant en évidence plusieurs aspects critiques du développement et de la concurrence actuels dans le domaine de l'IA.
NOTRE AVIS
Le Large 2 de Mistral fait une entrée fracassante, défiant les géants Meta et OpenAI. Cependant, la taille ne fait pas tout. Avec 123 milliards de paramètres contre 405 milliards pour Llama, la précision du Large 2 plutôt que la force brute est intrigante. Pourtant, sa nature propriétaire et ses licences coûteuses pourraient rebuter certains. De plus, l'absence de capacités multimodales signifie qu'OpenAI garde une longueur d'avance dans l'intégration image-texte. L'ascension rapide de Mistral, combinée à sa fenêtre de 128 000 jetons, démontre son approche stratégique, avançant un prompt de la taille d'un livre à la fois.
–Miurio Huang, journaliste BTW
Ce qui s’est passé
Mistral AI a dévoilé son dernier modèle d'IA phare, Large 2, le positionnant comme un concurrent redoutable face aux modèles de pointe d'OpenAI et de Meta, le 24 juillet. Cette sortie est intervenue un jour après que Meta a présenté son propre modèle avancé, Llama 3.1 405B. Mistral affirme que Large 2 excelle dans des domaines tels que la génération de code, les mathématiques et le raisonnement, égalant ou surpassant ses rivaux en performance.
Large 2 compte 123 milliards de paramètres, soit nettement moins que Llama 3.1 405B, mais il surpasserait le modèle de Meta dans certains benchmarks. L'un des principaux objectifs lors de l'entraînement de Large 2 était de réduire les problèmes d'hallucination, le modèle étant conçu pour reconnaître lorsqu'il manque de connaissances plutôt que de fabriquer des informations plausibles.
La jeune pousse parisienne en IA, Mistral, a récemment levé 640 millions de dollars lors d'un tour de financement de série B, mené par General Catalyst, atteignant une valorisation de 6 milliards de dollars. Bien qu'étant un acteur relativement nouveau dans l'industrie de l'IA, Mistral a rapidement progressé pour se hisser au premier rang, en publiant régulièrement des modèles d'IA de haute performance.
Cependant, il est crucial de noter que les modèles de Mistral, comme beaucoup d'autres, ne sont pas open source au sens traditionnel. Les applications commerciales de Large 2 nécessitent une licence payante, et la mise en œuvre d'un modèle aussi volumineux exige une expertise et une infrastructure considérables. De plus, Large 2, tout comme le Llama 3.1 de Meta, ne possède pas de capacités multimodales – une fonctionnalité où OpenAI domine actuellement, permettant à l'IA de traiter simultanément des images et du texte.
Large 2 dispose d'une fenêtre de 128 000 jetons, lui permettant de traiter des données substantielles en une seule requête, soit l'équivalent d'environ un livre de 300 pages. Le modèle offre également un support multilingue amélioré, comprenant des langues telles que l'anglais, le français, l'allemand, l'espagnol, l'italien, le portugais, l'arabe, le hindi, le russe, le chinois, le japonais et le coréen, ainsi que 80 langages de programmation. Notamment, Mistral affirme que Large 2 fournit des réponses plus concises que les autres modèles d'IA, qui ont souvent tendance à être verbeux.
Le nouveau modèle est accessible sur les principales plateformes telles que Google Vertex AI, Amazon Bedrock, Azure AI Studio, et IBM Watsonx. De plus, les utilisateurs peuvent explorer Large 2 sur la plateforme de Mistral sous le nom « mistral-large-2407 » et le tester gratuitement sur le concurrent de ChatGPT de la startup, IE Chat.
À lire aussi: Le Royaume-Uni en tête des startups GenAI en Europe, selon Accel
À lire aussi: La différence entre l'IA conversationnelle et la GenAI
Pourquoi c’est important
La sortie du Large 2 de Mistral marque une étape importante dans le paysage de l'IA en évolution rapide, mettant en évidence plusieurs aspects critiques du développement et de la concurrence actuels dans le domaine de l'IA. Premièrement, les benchmarks de performance et l'efficacité des paramètres du modèle soulignent la course permanente entre les entreprises d'IA pour créer des solutions plus puissantes et plus rentables. En surpassant le Llama 3.1 405B de Meta avec moins de paramètres, Mistral démontre que l'efficacité et la performance peuvent coexister, établissant une nouvelle norme pour les modèles d'IA.
La réduction des problèmes d'hallucination dans les modèles d'IA est une autre avancée cruciale. Les systèmes d'IA qui peuvent reconnaître avec précision leurs limites améliorent la fiabilité et la confiance, en particulier dans les applications professionnelles et critiques. Cette focalisation sur la création d'un modèle discernant positionne Mistral comme un leader dans le développement de solutions d'IA plus fiables.
Le financement substantiel de série B et la valorisation de 6 milliards de dollars reflètent le haut niveau de confiance des investisseurs dans les capacités et le potentiel de marché de Mistral. Ce soutien financier alimentera probablement davantage d'innovation et d'expansion, permettant à Mistral de continuer à défier les géants établis de l'IA comme OpenAI et Meta.
Cependant, la nature propriétaire de Large 2, nécessitant des licences payantes pour une utilisation commerciale, met en évidence une tendance plus large de l'industrie à monétiser les technologies d'IA avancées. Cette approche peut limiter l'accessibilité pour les petites entreprises ou les particuliers ne disposant pas des ressources nécessaires, ce qui pourrait ralentir l'adoption généralisée et l'innovation.
L'absence de capacités multimodales dans Large 2 montre un domaine où OpenAI conserve un avantage concurrentiel. Les systèmes d'IA multimodaux sont de plus en plus importants pour les applications nécessitant le traitement simultané de divers types de données, telles que les images et le texte. Alors que les startups s'efforcent d'intégrer ces fonctionnalités, la concurrence s'intensifiera probablement, entraînant de nouvelles avancées dans la technologie de l'IA.
Le support multilingue étendu de Large 2 et sa capacité à traiter un grand volume de données en une seule requête en font un outil polyvalent pour les applications mondiales. Cette capacité est particulièrement précieuse dans des environnements linguistiques diversifiés et des tâches computationnelles complexes, élargissant l'applicabilité du modèle à divers secteurs.
Le Large 2 de Mistral représente un bond en avant significatif dans le développement de l'IA, montrant la capacité de l'entreprise à rivaliser avec les leaders du secteur. Les avancées du modèle en termes de performance, de fiabilité et de support multilingue positionnent Mistral comme un acteur redoutable dans le paysage de l'IA, stimulant l'innovation et établissant de nouveaux benchmarks pour les futurs modèles d'IA.

