• Mistral a dévoilé son nouveau modèle d’IA phare, Large 2, qui, selon elle, rivalise avec les derniers modèles d’OpenAI et de Meta en matière de génération de code, de mathématiques et de raisonnement.
  • Malgré des coûts élevés et des défis juridiques, Large 2 démontre des améliorations significatives en matière de support multilingue et de précision des réponses.

NOTRE AVIS
Bien que disposant de moins de paramètres (123 milliards), Large 2 de Mistral offre des performances supérieures dans ces domaines par rapport au récent lancement de Meta. Mistral s’efforce de réduire les problèmes d’hallucination de Large 2, en l’entraînant à être plus pertinent dans ses réponses. L’entreprise, qui a récemment levé 640 millions de dollars pour une valorisation de 6 milliards de dollars, devient rapidement un acteur important de l’IA. Cependant, comme la plupart des modèles d’IA, Large 2 n’est pas gratuit pour un usage commercial et nécessite une licence payante.

-Rae Li, journaliste BTW

Ce qui s’est passé

La start-up d’IA parisienne Mistral a dévoilé mercredi un nouveau modèle d’IA phare appelé Large 2, qui, selon ses dires, rivalise avec les derniers modèles de pointe d’OpenAI et de Meta en matière de génération de code, de mathématiques et de raisonnement. Mistral affirme que Large 2 établit une nouvelle norme pour les modèles open source en termes de performance et de rentabilité. En ce qui concerne la génération de code et les performances mathématiques, Large 2 semble surpasser Llama 3.1.

Lors de l’entraînement, Mistral porte une attention particulière à la réduction du problème d’illusion du modèle en entraînant Large 2 à reconnaître son ignorance lorsqu’il ne connaît pas la réponse, plutôt que d’inventer ce qui semble plausible. Il est essentiel de noter que les modèles de Mistral ne sont pas open source au sens traditionnel, et toute application commerciale nécessite une licence payante. De plus, en raison de l’échelle considérable du modèle, seules quelques personnes dans le monde disposent de l’expertise et de l’infrastructure nécessaires pour mettre en œuvre de tels modèles à grande échelle.

Mistral Large 2 est disponible sur Google Vertex AI, Amazon Bedrock, Azure AI Studio et IBM watsonx.ai.

À lire également: Meta lance une version améliorée de son modèle d’IA Llama 3

À lire également: Meta publie gratuitement le puissant modèle d’IA Llama 3.1, suscitant le débat

Pourquoi c’est important

La sortie du nouveau modèle d’IA de Mistral, Large 2, marque une nouvelle percée dans le domaine de l’IA. Ce développement met non seulement en évidence le développement rapide de la technologie de l’IA, mais reflète également la concurrence féroce au sein de l’industrie.

L’introduction de Large 2 et ses efforts pour réduire les problèmes d’illusion du modèle démontrent les progrès en matière de précision et de fiabilité des modèles d’IA. Néanmoins, son modèle économique non open source et les exigences élevées en matière d’expertise et d’infrastructure révèlent également les défis de l’adoption et de l’application de la technologie de l’IA.