• Nous allons parler de divers types de vision par ordinateur, tels que la classification d'images, la localisation d'objets, la détection d'objets et la segmentation d'images.
  • La vision par ordinateur est utilisée dans de nombreux domaines pour améliorer les activités commerciales, les transports, la santé et bien plus encore.

L'IA est un vaste sujet de recherche et de discussion. Cet article couvre les différents types de vision par ordinateur, y compris la classification d'images, la localisation d'objets, la détection d'objets et la segmentation d'images. Quel type spécifique vous intéresse ?

Types de vision par ordinateur

La vision par ordinateur est un sous-domaine de l'IA qui permet aux ordinateurs et aux systèmes de traiter des données visuelles, telles que des images et des vidéos, et de générer des modèles pour détecter, suivre et classifier des objets. Selon l'approche de l'apprentissage automatique, la vision par ordinateur peut faire partie de différents sous-domaines de l'IA. Voici quelques types de vision par ordinateur:

1. Classification d'images

La classification d'images, également appelée reconnaissance d'images, est une tâche fondamentale en vision par ordinateur qui consiste à associer une ou plusieurs étiquettes à une image donnée. Dans la classification à étiquette unique, l'objectif est d'attribuer une seule étiquette à une image à partir d'un ensemble prédéfini de catégories. Dans la classification multi-étiquettes, une image peut être associée à plusieurs étiquettes simultanément.

2. Localisation d'objets

La localisation d'objets est le processus d'identification de l'emplacement d'un objet dans une image ou une vidéo, généralement à l'aide d'une boîte englobante. C'est une tâche courante en vision par ordinateur où un seul objet apparaît dans l'image.

3. Détection d'objets

La détection d'objets étend la classification d'images en non seulement classifiant les objets mais aussi en détectant leurs emplacements dans l'image et en dessinant des boîtes englobantes autour d'eux. La détection d'objets vise à trouver tous les objets et leurs limites dans une image.

4. Segmentation d'images

La segmentation d'images consiste à diviser une image en segments ou régions pour simplifier la représentation d'un objet dans son cadre. Cela se fait au niveau du pixel pour délimiter précisément les contours de l'objet et attribuer une étiquette à chaque segment.

À lire aussi: La vision par ordinateur est-elle une science des données ?

À lire aussi: Qu'est-ce que la vision par ordinateur 3D ?

Vision humaine vs vision par ordinateur

Les chercheurs s'inspirent de la vision humaine pour développer la vision par ordinateur. La structure et le fonctionnement du système visuel humain, tels que l'agencement des neurones dans le cortex visuel et les mécanismes de reconnaissance d'objets, inspirent la conception des réseaux de neurones et des algorithmes de traitement d'images et de reconnaissance de formes.

La vision humaine implique que les yeux capturent la lumière et envoient des signaux au cerveau pour interprétation. Il s'agit d'un processus complexe qui inclut la perception, la reconnaissance et l'interprétation des informations visuelles. En revanche, la vision par ordinateur permet aux ordinateurs d'interpréter et de comprendre le monde visuel à travers des images ou des vidéos numériques.

Applications de la vision par ordinateur

Alors que la technologie de vision par ordinateur continue d'évoluer avec la recherche en cours, plusieurs applications concrètes ont été établies:

  • Google Traduction: En utilisant l'appareil photo d'un téléphone pour scanner des panneaux dans des langues étrangères, Google Traduction fournit des traductions instantanées dans la langue de l'utilisateur. L'application peut reconnaître et traduire 133 langues depuis 2022.
  • Voitures autonomes: La vision par ordinateur permet aux véhicules autonomes d'interpréter les données visuelles capturées par les caméras montées sur le véhicule. Ces données aident le véhicule à identifier les voitures, les panneaux de signalisation, les piétons, les feux et d'autres objets dans son environnement. La fonction Autopilot de Tesla, standard sur les modèles récents, est un exemple de cette technologie en action.