• Les modèles de fondation (FM) sont de grands réseaux de neurones d'apprentissage profond entraînés sur d'énormes ensembles de données qui ont changé la façon dont les informaticiens abordent l'apprentissage automatique (ML).
  • Au lieu de développer une intelligence artificielle à partir de zéro, les data scientists utilisent le modèle sous-jacent comme point de départ pour développer des modèles d'apprentissage automatique.

Les modèles de fondation sont des modèles d'IA entraînés sur de grands ensembles de données provenant de sources variées, basés sur des réseaux de neurones profonds et des techniques d'apprentissage auto-supervisé.

Le concept de modèle de fondation

Les modèles de fondation (FM) sont de grands réseaux de neurones d'apprentissage profond entraînés sur d'énormes ensembles de données qui ont changé la façon dont les informaticiens abordent l'apprentissage automatique (ML). Au lieu de développer une intelligence artificielle (IA) à partir de zéro, les data scientists utilisent le modèle sous-jacent comme point de départ pour développer des modèles d'apprentissage automatique afin de prendre en charge de nouvelles applications plus rapidement et à moindre coût. Le terme modèle de fondation a été inventé par des chercheurs pour décrire les modèles d'apprentissage automatique qui sont entraînés sur une large gamme de données généralisées et non étiquetées et capables d'effectuer une variété de tâches générales, telles que la compréhension du langage, la génération de texte et d'images, et la conduite de conversations en langage naturel.

À lire aussi: Les nations qui construisent leurs propres modèles d'IA augmentent la demande croissante de puces de Nvidia

Qu'est-ce qui rend le modèle de fondation unique ?

Une caractéristique unique du modèle de fondation est son adaptabilité. Ces modèles peuvent effectuer une variété de tâches différentes avec un degré élevé de précision en fonction des invites d'entrée. Certaines tâches incluent le traitement du langage naturel (NLP), la réponse aux questions et la classification d'images. L'échelle et la nature générique du FM le différencient des modèles d'apprentissage automatique traditionnels, qui effectuent généralement des tâches spécifiques telles que l'analyse des émotions dans le texte, la classification d'images et la prédiction des tendances.

Le modèle de fondation peut être utilisé comme modèle de base pour développer des applications en aval plus spécialisées. Ces modèles sont l'aboutissement de plus d'une décennie de travail de développement et, par conséquent, ils continuent de croître en taille et en complexité.

Ce que le modèle de fondation peut faire

Traitement du langage: Ces modèles ont une capacité extraordinaire à répondre aux questions en langage naturel et sont même capables d'écrire de courts scénarios ou articles basés sur des invites. Ils peuvent également traduire des langues en utilisant la technologie NLP.

Compréhension visuelle: Le FM excelle en vision par ordinateur, en particulier dans la reconnaissance d'images et d'objets physiques. Ces fonctionnalités sont susceptibles d'être utilisées dans des applications telles que la conduite autonome et la robotique. Une autre fonctionnalité est la génération d'images en entrant du texte, ainsi que l'édition de photos et de vidéos.

Génération de code: Le modèle de fondation peut générer du code informatique dans une variété de langages de programmation à partir d'une entrée en langage naturel. Vous pouvez également utiliser le FM pour évaluer et déboguer du code.

Faciliter l'IA: Les modèles d'IA générative utilisent l'apport humain pour apprendre et améliorer les résultats prédictifs. Une application importante mais parfois négligée de ces modèles est leur capacité à soutenir la prise de décision humaine. Les utilisations potentielles incluent le diagnostic clinique, les systèmes d'aide à la décision et l'analyse pour développer de nouvelles applications d'IA en affinant les modèles de fondation existants.

À lire aussi: La technique du thermomètre pourrait réduire l'excès de confiance dans les modèles d'IA