- Une formation réussie d'un modèle d'IA commence par des données de qualité qui représentent avec précision et cohérence des situations réelles et authentiques.
- L'utilisation d'un ensemble de données trop large, d'un algorithme trop complexe ou d'un mauvais type de modèle pourrait conduire à un système qui se contente de traiter les données au lieu d'apprendre et de s'améliorer.
Fondamentalement, l'IA utilise les données pour faire des prédictions. Cette capacité peut alimenter les conseils « vous pourriez aussi aimer » sur les services de streaming, mais elle est également à l'origine des chatbots capables de comprendre des requêtes en langage naturel et de prédire la réponse correcte, ainsi que des applications qui examinent une photo et utilisent la reconnaissance faciale pour suggérer qui se trouve sur l'image.
Parvenir à ces prédictions nécessite toutefois une formation efficace du modèle d'IA, et les applications plus récentes qui dépendent de l'IA peuvent exiger des approches d'apprentissage légèrement différentes.
Préparer les données
Uneformation de modèle d'IAréussie commence par des données de qualité qui représentent avec précision et cohérence des situations réelles et authentiques. Sans cela, les résultats obtenus n'ont aucun sens. Pour réussir, les équipes de projet doivent sélectionner les bonnes sources de données, mettre en place des processus et une infrastructure pour la collecte manuelle et automatisée des données, et instaurer des processus de nettoyage/transformation appropriés.
À lire aussi:Les 4 défis de la gestion des données
À lire aussi:Les techniques de NLP en science des données
Sélectionner un modèle de formation
Si la conservation des données pose les bases du projet, la sélection du modèle en construit le mécanisme. Les variables de cette décision comprennent la définition des paramètres et des objectifs du projet, le choix de l'architecture et la sélection des algorithmes du modèle. Étant donné que différents modèles de formation nécessitent différentes quantités de ressources, ces facteurs doivent être mis en balance avec des éléments pratiques tels que les exigences de calcul, les délais, les coûts et la complexité.
Effectuer la formation initiale
Comme dans l'exemple ci-dessus où l'on apprend à un enfant à différencier un chat d'un chien, la formation d'un modèle d'IA commence par les bases. L'utilisation d'un ensemble de données trop large, d'un algorithme trop complexe ou d'un mauvais type de modèle pourrait conduire à un système qui se contente de traiter les données au lieu d'apprendre et de s'améliorer. Au cours de la formation initiale, les data scientists doivent se concentrer sur l'obtention de résultats dans les paramètres attendus tout en surveillant les erreurs susceptibles de casser l'algorithme.
En s'entraînant sans en faire trop, les modèles peuvent s'améliorer méthodiquement par étapes régulières et assurées.
Valider la formation
Une fois que le modèle a passé la phase de formation initiale, il produit de manière fiable les résultats escomptés pour les critères clés. La validation de la formation représente la phase suivante. Ici, les experts cherchent à mettre le modèle à l'épreuve de manière appropriée afin de révéler des problèmes, des surprises ou des lacunes dans l'algorithme. Cette étape utilise un groupe distinct d'ensembles de données, généralement plus large et plus complexe que les ensembles de données de formation.
Au fur et à mesure que les data scientists effectuent des passages avec ces ensembles de données, ils évaluent les performances du modèle. Si la précision des résultats est importante, le processus lui-même est tout aussi crucial. Les principales priorités du processus incluent des variables telles que la précision, le pourcentage de prédictions exactes, et le rappel, le pourcentage d'identification correcte des classes. Dans certains cas, les résultats peuvent être évalués à l'aide d'une valeur métrique. Par exemple, unscore F1est une métrique attribuée aux modèles de classification qui intègre les poids de différents types de faux positifs/négatifs, permettant une interprétation plus holistique du succès du modèle.
Tester le modèle
Une fois que le modèle a été validé à l'aide d'ensembles de données sélectionnés et adaptés à l'objectif, des données réelles peuvent être utilisées pour tester les performances et la précision. Les ensembles de données de cette étape doivent être tirés de scénarios du monde réel, une étape proverbiale « d'enlèvement des roues d'entraînement » pour laisser le modèle voler de ses propres ailes. Si le modèle fournit des résultats précis — et plus important encore, attendus — avec les données de test, il est prêt à être mis en ligne.
Si le modèle présente des lacunes de quelque manière que ce soit, le processus de formation est répété jusqu'à ce que le modèle atteigne ou dépasse les normes de performance.

