La « computer vision » ou vision assistée par ordinateur rassemble les technologies de deep learning qui permettent d’identifier des formes, objets ou individus sur une image ou une vidéo.
La Computer Vision est une branche de l’informatique. Grâce à des modèles d’intelligence artificielle, la Computer Vision peut extraire des caractéristiques d’images et de vidéos puis traiter massivement des données plus précisément qu’un humain et de manière beaucoup plus rapide. Cette technologie s’avère très utile dans le cadre de la médecine où l’on peut détecter des anomalies sur des images, en IRM ou en scanner. La Computer Vision est utilisée pour des tâches de classification, reconnaissance faciale, ou bien détection d’objets sur des images ou des vidéos.
Il est très important de donner au modèle un jeu de données très varié
Concrètement, la Computer Vision fonctionne avec des réseaux de neurones, communément appelé le Deep Learning. Pour qu’un tel modèle existe, il lui faut un apprentissage avec un entraînement. Il est nécessaire d’avoir des données puis des annotations associées. Ces annotations servent à donner des informations au modèle. Par exemple, dans une tâche de classification, si l’on souhaite classifier des images de chiens et de chats, à chaque image, il est nécessaire de lui associer l’annotation « chien » ou « chat ». Il est pour cela très important de donner au modèle un jeu de données très varié, notamment en prenant l’exemple de la classification « chien » et « chat », d’avoir des chiens d’espèces différentes, de couleurs différentes, pour pouvoir généraliser ce modèle et approfondir l’apprentissage.
Une fois que le modèle est entraîné, il sera capable de reconnaître si une nouvelle image présente un chien ou un chat. Le modèle de Computer Vision est capable, sur les images satellites, de repérer les formes géométriques, pour l’agriculture par exemple, ou les couleurs. Grâce à cela, on est capable de faire automatiquement de la cartographie des sols.