Reconnaissance automatique des cibles: Progrès des techniques de vision par ordinateur pour la reconnaissance de cibles
Par Fouad Sabry
()
À propos de ce livre électronique
Qu'est-ce que la reconnaissance automatique de cible
La capacité d'un algorithme ou d'un dispositif à reconnaître des cibles ou d'autres objets sur la base des données acquises à partir de capteurs est appelée reconnaissance automatique de cible, un abréviation de ces fonctionnalités.
Comment vous en bénéficierez
(I) Informations et validations sur les sujets suivants :
Chapitre 1 : Reconnaissance automatique de cibles
Chapitre 2 : Vision par ordinateur
Chapitre 3 : Radar
Chapitre 4 : Radar Doppler
Chapitre 5 : Radar à synthèse d'ouverture
Chapitre 6 : Radar d'imagerie
Chapitre 7 : Formation de faisceaux
Chapitre 8 : Radar à impulsions-Doppler
Chapitre 9 : Radar passif
Chapitre 10 : Radar inversé à synthèse d'ouverture
(II) Répondre aux principales questions du public sur la reconnaissance automatique de cible.
(III) Monde réel exemples d'utilisation de la reconnaissance automatique de cibles dans de nombreux domaines.
À qui s'adresse ce livre
Professionnels, étudiants de premier cycle et des cycles supérieurs, passionnés, amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type de reconnaissance automatique de cible.
En savoir plus sur Fouad Sabry
Technologies Émergentes en Agriculture [French]
Lié à Reconnaissance automatique des cibles
Titres dans cette série (100)
Groupe mixte d'experts en photographie: Libérer la puissance des données visuelles avec la norme JPEG Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur sous-marine: Explorer les profondeurs de la vision par ordinateur sous les vagues Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence de couleur: Comprendre la perception et la représentation en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation Hadamard: Dévoilement de la puissance de la transformation Hadamard en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHistogramme d'image: Dévoilement d'informations visuelles, exploration des profondeurs des histogrammes d'images en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDiffusion anisotrope: Améliorer l'analyse d'images grâce à la diffusion anisotrope Évaluation : 0 sur 5 étoiles0 évaluationRéduction de bruit: Amélioration de la clarté et techniques avancées de réduction du bruit en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFiltre adaptatif: Améliorer la vision par ordinateur grâce au filtrage adaptatif Évaluation : 0 sur 5 étoiles0 évaluationTransformation du radon: Dévoiler des modèles cachés dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationHistogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHomographie: Homographie : transformations en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection des bords: Explorer les limites de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFonction de correspondance des couleurs: Comprendre la sensibilité spectrale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationÉgalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de coin Harris: Dévoiler la magie de la détection des caractéristiques de l'image Évaluation : 0 sur 5 étoiles0 évaluationContour actif: Faire progresser la vision par ordinateur grâce aux techniques de contour actif Évaluation : 0 sur 5 étoiles0 évaluationRétinex: Dévoiler les secrets de la vision informatique avec Retinex Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationPeinture: Combler les lacunes de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation affine: Libérer des perspectives visuelles : explorer la transformation affine en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCorrection gamma: Améliorer la clarté visuelle en vision par ordinateur : la technique de correction gamma Évaluation : 0 sur 5 étoiles0 évaluationModèle du système visuel humain: Comprendre la perception et le traitement Évaluation : 0 sur 5 étoiles0 évaluationModèle de couleur: Comprendre le spectre de la vision par ordinateur : explorer les modèles de couleurs Évaluation : 0 sur 5 étoiles0 évaluationMéthode d'ensemble de niveaux: Faire progresser la vision par ordinateur, explorer la méthode de jeu de niveaux Évaluation : 0 sur 5 étoiles0 évaluationBanque de filtres: Aperçu des techniques de banque de filtres de Computer Vision Évaluation : 0 sur 5 étoiles0 évaluation
Livres électroniques liés
Voir la synthèse: Explorer les perspectives de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRéseau de capteurs visuels: Explorer la puissance des réseaux de capteurs visuels en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance des panneaux de signalisation: Libérer la puissance de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision industrielle: Aperçu du monde de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance optique du braille: Renforcer l'accessibilité grâce à l'intelligence visuelle Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance automatique des plaques d'immatriculation: Libérer le potentiel de la technologie de vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence active: Libérer la puissance des modèles d’apparence active dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection d'objet: Avancées, applications et algorithmes Évaluation : 0 sur 5 étoiles0 évaluationSegmentation d'images: Libérer des informations grâce à Pixel Precision Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de coin Harris: Dévoiler la magie de la détection des caractéristiques de l'image Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance vocale audiovisuelle: Avancées, applications et informations Évaluation : 0 sur 5 étoiles0 évaluationDétection des bords: Explorer les limites de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance de l'iris: Perspectives éclairantes sur la reconnaissance de l'iris en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCaméra intelligente: Révolutionner la perception visuelle avec la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCompteur de personnes: Libérer des informations grâce à l'analyse visuelle Évaluation : 0 sur 5 étoiles0 évaluationApprentissage appliqué aux véhicules terrestres: Améliorer les performances des véhicules terrestres grâce à l'apprentissage de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationAnalyse du contenu vidéo: Libérer des informations grâce aux données visuelles Évaluation : 0 sur 5 étoiles0 évaluationImagerie multispectrale: Libérer le spectre : progrès de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSystème de reconnaissance faciale: Libérer la puissance de l’intelligence visuelle Évaluation : 0 sur 5 étoiles0 évaluationCaméra de contrôle de la circulation: Avancées de la vision par ordinateur pour les caméras de contrôle de la circulation Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de bord Canny: Dévoiler l'art de la perception visuelle Évaluation : 0 sur 5 étoiles0 évaluationAnnotation automatique des images: Améliorer la compréhension visuelle grâce au marquage automatisé Évaluation : 0 sur 5 étoiles0 évaluationGraphiques de lancer de rayons: Explorer le rendu photoréaliste en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationMatrice fondamentale de la vision par ordinateur: S'il vous plaît, suggérez un sous-titre pour un livre intitulé « Matrice fondamentale de la vision par ordinateur » dans le domaine de la « Vision par ordinateur ». Le sous-titre suggéré ne doit pas contenir de ':'. Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance optique de caractères: Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères Évaluation : 0 sur 5 étoiles0 évaluationReconstruction tridimensionnelle multi-vues: Techniques avancées de perception spatiale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluation
Intelligence (IA) et sémantique pour vous
Intelligence artificielle: la quatrième révolution industrielle Évaluation : 0 sur 5 étoiles0 évaluationLe guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux Évaluation : 5 sur 5 étoiles5/5Maîtrisez ChatGPT : Du débutant à l'expert - Guide pratique pour exploiter la puissance de l'IA conversationnelle Évaluation : 0 sur 5 étoiles0 évaluationTravailler dans le Big Data - les 6 métiers vers lesquels s'orienter Évaluation : 5 sur 5 étoiles5/5Maîtriser ChatGPT : Libérez la puissance de l'IA pour améliorer la communication et les relations: French Évaluation : 0 sur 5 étoiles0 évaluationHistoire et évolution de l'Intelligence Artificielle Évaluation : 5 sur 5 étoiles5/5L’Empathie au Cœur de l’Intelligence Artificielle, Comment insérer de l’empathie dans les affaires et l’intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationRésumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social Évaluation : 0 sur 5 étoiles0 évaluationL'intelligence mixte, vers une nouvelle forme d'intelligence Évaluation : 0 sur 5 étoiles0 évaluationMonétisation ChatGPT : Exploitez la Puissance de l'IA: ChatGPT Évaluation : 0 sur 5 étoiles0 évaluationIA dans les Affaires: Guide Pratique de l'Utilisation de l'Intelligence Artificielle dans Divers Secteurs Évaluation : 0 sur 5 étoiles0 évaluationChat GPT : Comment ça fonctionne et comment gagner avec l'utilisation de la technologie d'Intelligence Artificielle Évaluation : 0 sur 5 étoiles0 évaluationLimites, dangers et menaces de l'Intelligence Artificielle: Un outil sans maîtrises Évaluation : 0 sur 5 étoiles0 évaluationGuide définitive pour créer des TikToks avec ChatGPT: Devenez le prochain influenceur sur TikTok avec l'aide de ChatGPT ! Évaluation : 0 sur 5 étoiles0 évaluationLa prophétie des anciens: Roman dystopique Évaluation : 0 sur 5 étoiles0 évaluationL'art de la création d'images avec l'IA : Techniques, applications et défis éthiques Évaluation : 0 sur 5 étoiles0 évaluationComment Réussir sur Facebook en utilisant ChatGPT: Le pouvoir de ChatGPT : découvrez comment il peut transformer votre stratégie sur Facebook Évaluation : 0 sur 5 étoiles0 évaluationOsons l'IA à l'école: Préparons nos jeunes à la révolution de l'intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluation
Avis sur Reconnaissance automatique des cibles
0 notation0 avis
Aperçu du livre
Reconnaissance automatique des cibles - Fouad Sabry
Reconnaissance automatique des cibles
Progrès des techniques de vision par ordinateur pour la reconnaissance de cibles
Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.
Un milliard de connaissances
Reconnaissance automatique des cibles
Progrès des techniques de vision par ordinateur pour la reconnaissance de cibles
Fouad Sabry
Copyright
Reconnaissance © automatique des cibles 2024 par Fouad Sabry. Tous droits réservés.
Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.
Couverture dessinée par Fouad Sabry.
Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.
Table des matières
Chapitre 1 : Reconnaissance automatique des cibles
Chapitre 2 : Vision par ordinateur
Chapitre 3 : Radar
Chapitre 3 : Radar Doppler
Chapitre 5 : Radar à synthèse d'ouverture
Chapitre 8 : Radar imageur
Chapitre 7 : Formation de faisceaux
Chapitre 8 : Radar Doppler à impulsions
Chapitre 9 : Radar passif
Chapitre 10 : Radar à synthèse d'ouverture inversée
Appendice
À propos de l'auteur
Chapitre 1 : Reconnaissance automatique des cibles
Le terme « reconnaissance automatique de cible » (ATR) fait référence à la capacité d'un algorithme ou d'un dispositif à identifier une cible ou un autre objet à partir des données du capteur.
Aux débuts du radar, les opérateurs devaient écouter les représentations audio des signaux reçus et utiliser leur formation pour déterminer quel type de cible était éclairée. Malgré les réalisations de ces experts humains, des méthodes automatisées ont été et sont en cours de développement pour améliorer la précision et la rapidité de la classification. Les animaux, les humains et la végétation encombrée ne sont que quelques-unes des cibles biologiques qui peuvent être identifiées grâce à la technologie ATR. Les domaines d'application vont de la reconnaissance d'objets sur le terrain à la réduction du bruit des oiseaux sur le radar météorologique Doppler.
Les utilisations militaires possibles incluent un identifiant facile à mettre en œuvre comme un transpondeur IFF, ainsi que des systèmes plus complexes comme les drones et les missiles de croisière. Les utilisations potentielles de l'ATR dans le domaine national attirent de plus en plus l'attention. Une variété d'applications, allant des véhicules automatisés aux systèmes de sécurité capables de détecter des objets ou des personnes sur une voie de métro, en passant par la sécurité des frontières, ont bénéficié des études ATR.
Presque aussi longtemps que le radar existe, les cibles ont été reconnues. Les opérateurs radar utiliseraient la représentation audible du signal réfléchi pour identifier les bombardiers et les chasseurs ennemis (voir Radar pendant la Seconde Guerre mondiale).
Pendant longtemps, les opérateurs écoutaient le signal en bande de base pour identifier les cibles. Les opérateurs radar formés peuvent utiliser ce signal pour déterminer le type de véhicule utilisé pour éclairer la cible, la taille de la cible et peut-être même la présence de cibles biologiques. Mais il existe de nombreuses restrictions à cette méthode. Il existe une forte probabilité d'erreur en raison de la composante de décision humaine, de la nécessité pour l'opérateur d'être formé à ce à quoi ressemblera chaque cible et de la possibilité que la cible ne soit plus audible si elle se déplace à grande vitesse. Ce concept de représentation auditive du signal, cependant, a jeté les bases d'une classification automatisée des cibles. Les caractéristiques du signal en bande de base qui ont été utilisées dans d'autres applications audio, telles que la reconnaissance vocale, ont été incorporées dans un certain nombre de schémas de classification qui ont été développés.
La portée d'un objet peut être calculée à l'aide d'un radar en chronométrant le temps qu'il faut pour que le signal revienne de la cible que le signal éclaire. L'effet Doppler décrit la modification de la fréquence provoquée par le mouvement d'un tel objet. Un décalage de fréquence peut être causé par la vibration ou la rotation d'un objet en plus du mouvement de translation de l'ensemble de l'objet. Le signal décalé par effet Doppler sera modulé si cela se produit. L'effet micro-Doppler fait référence à l'effet Doppler supplémentaire responsable de la modulation du signal. Afin de créer des algorithmes pour l'ATR, cette modulation peut avoir une signature reconnaissable. Lorsque la cible se déplace, l'effet micro-Doppler provoque un signal variant dans le temps et la fréquence.
Comme la transformée de Fourier ne prend pas en compte le temps, l'analyse de ce signal avec une transformée de Fourier est insuffisante. La transformée de Fourier en temps court est l'approche la plus simple pour obtenir une fonction fréquence-temps (STFT). Les domaines fréquentiel et temporel peuvent être représentés simultanément à l'aide de méthodes plus robustes telles que la transformée de Gabor ou la fonction de distribution de Wigner (WVD). Cependant, la résolution en fréquence et la résolution temporelle seront toujours compromises dans ces approches.
Une fois ces données spectrales extraites, elles peuvent être comparées à une base de données contenant des informations sur les cibles que le système identifiera afin de déterminer ce qu'est réellement la cible éclairée. Afin de déterminer quelle cible de la bibliothèque correspond le mieux au modèle construit à l'aide du signal reçu, une méthode d'estimation statistique telle que le maximum de vraisemblance (ML), le vote à la majorité (MV) ou le maximum a posteriori (MAP) est utilisée.
Les systèmes automatisés de reconnaissance de cibles qui utilisent les caractéristiques audio de la reconnaissance vocale pour déterminer l'identité d'une cible ont fait l'objet de recherches. Voici quelques exemples de ces coefficients :
Coefficients LPC, ou codes prédictifs linéaires
Coefficients de prédiction linéaire et de codage dans le spectre cepstral
Coefficients cevraux basés sur les fréquences mel (MFCC).
Ces coefficients sont dérivés d'un signal de bande de base traité, et une méthode statistique est ensuite utilisée pour déterminer quelle cible de la base de données est la plus similaire aux coefficients dérivés. Le système et le cas d'utilisation doivent être pris en compte lors du choix des fonctionnalités et du schéma de décision à mettre en œuvre.
Les caractéristiques de classification cible ne sont pas limitées aux coefficients motivés par la parole humaine. L'ATR peut être réalisé à l'aide de nombreux ensembles de fonctionnalités et de diverses méthodes de détection.
Le développement d'une base de données d'entraînement est nécessaire pour automatiser la détection des cibles. En règle générale, l'algorithme ATR est alimenté par des données expérimentales collectées après la détermination de la cible.
L'organigramme représente un type d'algorithme de détection. Cette technique prend M blocs de données, les modélise à l'aide d'un modèle de mélange gaussien, puis utilise les caractéristiques extraites (telles que les coefficients LPC ou MFCC) pour tirer des conclusions (GMM). Après avoir ajusté les données à un modèle, des probabilités conditionnelles sont calculées pour chaque cible de l'ensemble d'apprentissage. Ici, nous avons M blocs de données à examiner. Cela générera M probabilités individuelles, une pour chaque cible de base de données. À l'aide de ces probabilités, une détermination du maximum de vraisemblance est faite quant à ce qu'est réellement la cible. Il a été démontré que cette technique permet de déterminer de manière fiable la présence de jusqu'à trois personnes, ainsi que de distinguer les types de véhicules (véhicules à roues et véhicules à chenilles, par exemple).
Une approche basée sur CNN pour la reconnaissance des cibles
La reconnaissance de cibles à l'aide d'un réseau de neurones convolutifs (CNN) peut surpasser les approches plus traditionnelles. Après s'être entraîné sur des images de synthèse, il s'est avéré utile pour reconnaître des cibles (telles que des chars de combat) dans des images infrarouges de scènes réelles. Le réalisme des images de synthèse est très important lorsque vous essayez de reconnaître des scènes réelles de l'ensemble de test en raison des contraintes de l'ensemble d'apprentissage.
Sept couches de convolution, trois couches de mise en commun maximale et une couche Softmax constituent l'épine dorsale de l'architecture globale du réseau CNN. Après les deuxième, quatrième et cinquième couches de convolution se trouvent les couches de regroupement maximales. Avant le résultat final, une moyenne globale de mise en commun est appliquée. Leaky ReLU est utilisé comme fonction d'activation non linéaire dans toutes les couches de convolution.
{Fin du chapitre 1}
Chapitre 2 : Vision par ordinateur
L'étude de la façon dont les ordinateurs peuvent tirer des connaissances de haut niveau à partir d'images ou de vidéos numériques est au centre du domaine scientifique multidisciplinaire de la vision par ordinateur. D'un point de vue technologique, il étudie et tente d'automatiser les activités qui sont dans les capacités du système visuel humain.
Les tâches associées à la vision par ordinateur comprennent des techniques d'obtention, de traitement, d'analyse et de compréhension d'images numériques, ainsi que l'extraction de données de grande dimension de l'environnement physique afin de créer des informations numériques ou symboliques, telles que des jugements.
La vision par ordinateur est un sous-domaine de l'informatique qui étudie les fondements théoriques des systèmes artificiels conçus pour dériver des informations à partir d'images. Les données visuelles peuvent être présentées dans une variété de formats, y compris des séquences vidéo, des images obtenues à partir de plusieurs caméras, des données multidimensionnelles obtenues à partir d'un scanner 3D ou d'un équipement de numérisation médicale, etc. L'objectif du domaine technique connu sous le nom de vision par ordinateur est de mettre en œuvre les idées et les modèles qu'il a développés dans le processus de construction de systèmes de vision par ordinateur.
Les domaines de la reconstruction de scène, de la détection d'objets, de la détection d'événements, du suivi vidéo, de la reconnaissance d'objets, de l'estimation de poses 3D, de l'apprentissage, de l'indexation, de l'estimation de mouvement, de l'asservissement visuel, de la modélisation de scènes 3D et de la restauration d'images sont tous des sous-domaines de la vision par ordinateur. D'autres sous-domaines de la vision par ordinateur incluent la modélisation de scènes 3D.
La vision par ordinateur est une étude multidisciplinaire qui examine comment les ordinateurs peuvent être programmés pour extraire des connaissances de haut niveau à partir d'images ou de films numériques. Ce domaine se concentre sur la façon dont les ordinateurs peuvent apprendre à comprendre ce qui leur est montré. Du point de vue de l'ingénierie, l'objectif est de trouver des moyens d'automatiser des opérations qui peuvent déjà être effectuées par le système visuel humain. La vision par ordinateur est un domaine d'étude dans le domaine des technologies de l'information qui se concentre sur l'application des théories et des modèles existants au processus de construction de systèmes de vision par ordinateur.
À la fin des années 1960, les collèges à la pointe de l'intelligence artificielle ont été les premiers à expérimenter la vision par ordinateur. Son but était de fonctionner d'une manière similaire à celle du système visuel humain, dans le but ultime d'imprégner les robots d'un comportement intelligent. Dans les années 1990, plusieurs des zones d'étude qui avaient été étudiées auparavant sont devenues plus actives que les autres. L'étude des reconstructions projectives tridimensionnelles a permis de mieux comprendre comment calibrer une caméra. Il est devenu clair, avec l'introduction des techniques d'optimisation pour l'étalonnage des caméras, qu'un nombre important de concepts avaient déjà été étudiés par la discipline de la théorie de l'ajustement des faisceaux de la photogrammétrie. C'est ce qui est apparu à la suite de ce développement. Cela a abouti au développement de techniques permettant de faire des reconstructions tridimensionnelles éparses de scènes à l'aide de plusieurs photographies. Le problème de la correspondance stéréo dense et le développement d'autres approches stéréo à vues multiples ont connu un certain degré de mouvement vers l'avant. Simultanément, de nombreuses variantes de la coupe de graphe ont été utilisées afin de résoudre le problème de segmentation de l'image. Cette décennie est d'autant plus importante que c'est la première fois que des méthodes d'apprentissage statistique sont utilisées dans la pratique pour reconnaître les visages sur les photographies (voir Eigenface). Les domaines de l'infographie et de la vision par ordinateur sont devenus plus étroitement