Estimation du mouvement: Avancées et applications en vision par ordinateur
Par Fouad Sabry
()
À propos de ce livre électronique
Qu'est-ce que l'estimation de mouvement
En vision par ordinateur et en traitement d'images, l'estimation de mouvement est le processus de détermination des vecteurs de mouvement qui décrivent la transformation d'une image 2D à une autre ; généralement à partir d’images adjacentes dans une séquence vidéo. C'est un problème mal posé car le mouvement se produit en trois dimensions (3D) mais les images sont une projection de la scène 3D sur un plan 2D. Les vecteurs de mouvement peuvent concerner l'image entière ou des parties spécifiques, telles que des blocs rectangulaires, des patchs de forme arbitraire ou même par pixel. Les vecteurs de mouvement peuvent être représentés par un modèle de translation ou de nombreux autres modèles qui peuvent se rapprocher du mouvement d'une véritable caméra vidéo, comme la rotation et la translation dans les trois dimensions et le zoom.
Comment allez-vous procéder ? avantage
(I) Informations et validations sur les sujets suivants :
Chapitre 1 : Motion_estimation
Chapitre 2 : Motion_compensation
Chapitre 3 : Algorithme_de correspondance de blocs
Chapitre 4 : H.261
Chapitre 5 : H.262/MPEG-2_Part_2
Chapitre 6 : Codage_vidéo_avancé
Chapitre 7 : Global_motion_compensation
Chapitre 8 : Block-matching_and_3D_filtering
Chapitre 9 : Video_compression_picture_types
Chapitre 10 : Video_super-resolution
(II) Répondre aux principales questions du public sur l'estimation de mouvement.
(III) Exemples concrets d'utilisation de l'estimation de mouvement dans de nombreux domaines.
À qui s'adresse ce livre
Professionnels, étudiants de premier cycle et des cycles supérieurs, passionnés, amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type d'estimation de mouvement.
En savoir plus sur Fouad Sabry
Technologies Émergentes Dans Le Domaine De L'Énergie [French]
Lié à Estimation du mouvement
Titres dans cette série (100)
Correction gamma: Améliorer la clarté visuelle en vision par ordinateur : la technique de correction gamma Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence de couleur: Comprendre la perception et la représentation en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHomographie: Homographie : transformations en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRéduction de bruit: Amélioration de la clarté et techniques avancées de réduction du bruit en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationPeinture: Combler les lacunes de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGroupe mixte d'experts en photographie: Libérer la puissance des données visuelles avec la norme JPEG Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur sous-marine: Explorer les profondeurs de la vision par ordinateur sous les vagues Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRétinex: Dévoiler les secrets de la vision informatique avec Retinex Évaluation : 0 sur 5 étoiles0 évaluationDiffusion anisotrope: Améliorer l'analyse d'images grâce à la diffusion anisotrope Évaluation : 0 sur 5 étoiles0 évaluationTransformation affine: Libérer des perspectives visuelles : explorer la transformation affine en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTenseur trifocal: Explorer la profondeur, le mouvement et la structure en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationÉgalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationTransformation Hadamard: Dévoilement de la puissance de la transformation Hadamard en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationContour actif: Faire progresser la vision par ordinateur grâce aux techniques de contour actif Évaluation : 0 sur 5 étoiles0 évaluationFiltre adaptatif: Améliorer la vision par ordinateur grâce au filtrage adaptatif Évaluation : 0 sur 5 étoiles0 évaluationConsensus sur un échantillon aléatoire: Estimation robuste en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHistogramme d'image: Dévoilement d'informations visuelles, exploration des profondeurs des histogrammes d'images en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationBanque de filtres: Aperçu des techniques de banque de filtres de Computer Vision Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de coin Harris: Dévoiler la magie de la détection des caractéristiques de l'image Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationModèle du système visuel humain: Comprendre la perception et le traitement Évaluation : 0 sur 5 étoiles0 évaluationModèle de couleur: Comprendre le spectre de la vision par ordinateur : explorer les modèles de couleurs Évaluation : 0 sur 5 étoiles0 évaluationCartographie des couleurs: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation du radon: Dévoiler des modèles cachés dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationDétection de gouttes: Dévoiler des modèles dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluation
Livres électroniques liés
Flux optique: Explorer les modèles visuels dynamiques en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconstruction tridimensionnelle multi-vues: Techniques avancées de perception spatiale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVoir la synthèse: Explorer les perspectives de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationMatrice fondamentale de la vision par ordinateur: S'il vous plaît, suggérez un sous-titre pour un livre intitulé « Matrice fondamentale de la vision par ordinateur » dans le domaine de la « Vision par ordinateur ». Le sous-titre suggéré ne doit pas contenir de ':'. Évaluation : 0 sur 5 étoiles0 évaluationModélisation et rendu basés sur l'image: Explorer le réalisme visuel : techniques de vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationIllumination globale: Faire progresser la vision : aperçus de l’éclairage mondial Évaluation : 0 sur 5 étoiles0 évaluationChamp de mouvement: Explorer la dynamique de la vision par ordinateur : le champ de mouvement dévoilé Évaluation : 0 sur 5 étoiles0 évaluationMosaïque de documents: Libérer des informations visuelles grâce au mosaïquage de documents Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence active: Libérer la puissance des modèles d’apparence active dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRendu volumique: Explorer le réalisme visuel dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationAjustement du forfait: Optimisation des données visuelles pour une reconstruction précise Évaluation : 0 sur 5 étoiles0 évaluationGraphiques de lancer de rayons: Explorer le rendu photoréaliste en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTraitement d'image pyramidale: Explorer les profondeurs de l'analyse visuelle Évaluation : 0 sur 5 étoiles0 évaluationRendu d'infographie: Explorer le réalisme visuel : aperçus de l'infographie Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSegmentation d'images: Libérer des informations grâce à Pixel Precision Évaluation : 0 sur 5 étoiles0 évaluationSurface procédurale: Explorer la génération et l'analyse de textures en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationEstimation de la pose du corps articulé: Déverrouiller le mouvement humain dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationClassification contextuelle des images: Comprendre les données visuelles pour une classification efficace Évaluation : 0 sur 5 étoiles0 évaluationCoupes de graphiques de vision par ordinateur: Explorer les coupes graphiques en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationDistance Brouillard: Explorer la frontière visuelle : aperçu du brouillard à distance de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection de gouttes: Dévoiler des modèles dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationProfil de couleur: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModèle de caméra sténopé: Comprendre la perspective grâce à l'optique informatique Évaluation : 0 sur 5 étoiles0 évaluationModélisation géométrique: Explorer la modélisation géométrique en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFormation 3D par la pratique avec C#5 et WPF: Modeliser des molecules Évaluation : 0 sur 5 étoiles0 évaluationGraphiques raster: Comprendre les fondements des graphiques raster en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationMéthode d'ensemble de niveaux: Faire progresser la vision par ordinateur, explorer la méthode de jeu de niveaux Évaluation : 0 sur 5 étoiles0 évaluationMoments de vitesse: Capturer la dynamique : aperçu de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluation
Intelligence (IA) et sémantique pour vous
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux Évaluation : 5 sur 5 étoiles5/5Maîtriser ChatGPT : Libérez la puissance de l'IA pour améliorer la communication et les relations: French Évaluation : 0 sur 5 étoiles0 évaluationMaîtrisez ChatGPT : Du débutant à l'expert - Guide pratique pour exploiter la puissance de l'IA conversationnelle Évaluation : 0 sur 5 étoiles0 évaluationIntelligence artificielle: la quatrième révolution industrielle Évaluation : 0 sur 5 étoiles0 évaluationTravailler dans le Big Data - les 6 métiers vers lesquels s'orienter Évaluation : 5 sur 5 étoiles5/5Histoire et évolution de l'Intelligence Artificielle Évaluation : 5 sur 5 étoiles5/5Résumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social Évaluation : 0 sur 5 étoiles0 évaluationL'intelligence mixte, vers une nouvelle forme d'intelligence Évaluation : 0 sur 5 étoiles0 évaluationMonétisation ChatGPT : Exploitez la Puissance de l'IA: ChatGPT Évaluation : 0 sur 5 étoiles0 évaluationL'art de la création d'images avec l'IA : Techniques, applications et défis éthiques Évaluation : 0 sur 5 étoiles0 évaluationL’Empathie au Cœur de l’Intelligence Artificielle, Comment insérer de l’empathie dans les affaires et l’intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationIA dans les Affaires: Guide Pratique de l'Utilisation de l'Intelligence Artificielle dans Divers Secteurs Évaluation : 0 sur 5 étoiles0 évaluationChat GPT : Comment ça fonctionne et comment gagner avec l'utilisation de la technologie d'Intelligence Artificielle Évaluation : 0 sur 5 étoiles0 évaluationComment Réussir sur Facebook en utilisant ChatGPT: Le pouvoir de ChatGPT : découvrez comment il peut transformer votre stratégie sur Facebook Évaluation : 0 sur 5 étoiles0 évaluationOsons l'IA à l'école: Préparons nos jeunes à la révolution de l'intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationLimites, dangers et menaces de l'Intelligence Artificielle: Un outil sans maîtrises Évaluation : 0 sur 5 étoiles0 évaluationLa prophétie des anciens: Roman dystopique Évaluation : 0 sur 5 étoiles0 évaluationGuide définitive pour créer des TikToks avec ChatGPT: Devenez le prochain influenceur sur TikTok avec l'aide de ChatGPT ! Évaluation : 0 sur 5 étoiles0 évaluation
Avis sur Estimation du mouvement
0 notation0 avis
Aperçu du livre
Estimation du mouvement - Fouad Sabry
Estimation du mouvement
Avancées et applications de la vision par ordinateur
Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines commerciales internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One billion knowledge.
Un milliard de connaissances
Estimation du mouvement
Avancées et applications de la vision par ordinateur
Fouad Sabry
Copyright
Estimation © du mouvement 2024 par Fouad Sabry. Tous droits réservés.
Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.
Couverture conçue par Fouad Sabry.
Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans ce livre.
Table des matières
Chapitre 1 : Estimation du mouvement
Chapitre 2 : Compensation de mouvement
Chapitre 3 : Algorithme de correspondance de blocs
Chapitre 4 : H.261
Chapitre 5 : H.262/MPEG-2 Partie 2
Chapitre 6 : Codage vidéo avancé
Chapitre 7 : Compensation de mouvement globale
Chapitre 8 : Correspondance de blocs et filtrage 3D
Chapitre 9 : Types d'images de compression vidéo
Chapitre 10 : Super-résolution vidéo
Appendice
À propos de l'auteur
Chapitre 1 : Estimation du mouvement
L'estimation de la quantité de mouvement entre deux images 2D, généralement à partir d'images successives dans une séquence vidéo, est connue sous le nom d'estimation de mouvement. Le mouvement se produit en trois dimensions, mais les images sont des projections de la scène tridimensionnelle sur un plan bidimensionnel, ce qui en fait un problème mal posé. L'estimation de mouvement peut être effectuée sur l'image entière (estimation globale du mouvement) ou sur des régions plus petites ou des pixels individuels. Le modèle translationnel n'est qu'un des nombreux modèles qui peuvent être utilisés pour représenter les vecteurs de mouvement, qui peuvent inclure des éléments tels que la rotation, la translation dans les trois dimensions et le zoom avant et arrière.
L'estimation du mouvement et le flux optique sont souvent utilisés de manière interchangeable mais signifient la même chose. L'enregistrement des images et la correspondance stéréo sont également liés de cette manière. En réalité, chacune de ces expressions décrit une méthode permettant de localiser des caractéristiques correspondantes dans des photos ou des images vidéo successives. Les points de deux photographies (cadres) de la même scène ou du même objet du monde réel sont « généralement » le même point dans l'espace et le temps. La métrique correspondante, une mesure de la similitude de deux points d'image, doit être définie avant que l'estimation du mouvement puisse commencer. Il n'y a pas de réponse universellement correcte ici ; la mesure d'appariement optimale dépendra plutôt de l'objectif du mouvement estimé et de l'approche d'optimisation utilisée pendant la phase d'estimation.
En fonction de l'emplacement du même macrobloc ou d'un macrobloc comparable dans une image différente, connue sous le nom d'image de référence, un vecteur de mouvement est créé pour représenter le macrobloc en question dans l'image d'origine.
Selon la norme H.264/MPEG-4 AVC, le vecteur de mouvement est défini comme suit :
Les coordonnées de l'image décodée sont décalées par rapport aux coordonnées de l'image de référence via un vecteur bidimensionnel appelé vecteur de mouvement, qui est utilisé pour l'interprédiction.
Les approches basées sur les pixels (« directes ») et basées sur les caractéristiques (« indirectes ») peuvent être utilisées pour localiser les vecteurs de mouvement (« indirects »). Deux articles, un de chaque côté d'une controverse bien connue, ont été écrits dans le but de parvenir à une résolution.
Algorithme pour faire correspondre les blocs
Techniques basées sur la corrélation de phase et le domaine fréquentiel
Algorithmes récursifs de pixels
Flux optique
Les techniques indirectes utilisent des fonctionnalités telles que la détection des coins pour trouver des correspondances dans des images adjacentes, généralement par l'application d'une fonction statistique sur une petite ou une grande région. L'objectif de la fonction statistique est de filtrer les correspondances de mouvement erronées.
Le RANSAC est un exemple de fonction statistique utile.
On peut soutenir que la définition des critères d'appariement est une étape nécessaire dans pratiquement toute approche. La seule vraie distinction est entre comparer d'abord chaque pixel (comme avec la quadrature de la différence) et ensuite résumer une région d'image locale (comme avec les approches basées sur les caractéristiques) ou vice versa (mouvement de base de bloc et mouvement basé sur le filtre). Une nouvelle méthode de correspondance des critères fonctionne en résumant d'abord une région d'image locale à chaque emplacement de pixel (en utilisant une transformation de caractéristique comme la transformée laplacienne), puis en comparant les deux ensembles de résumés. Alors que certains critères de correspondance peuvent éliminer des paires d'éléments de données qui ne vont pas vraiment ensemble tout en ayant un score de correspondance élevé, d'autres critères de correspondance ne le peuvent pas.
En vision par ordinateur et en traitement d'images, l'estimation du mouvement affine est utilisée pour calculer une approximation approximative du mouvement relatif de deux images ou images. Suppose que le mouvement peut être représenté par une transformation linéaire suivie d'une translation et d'une rotation (transformation affine).
La compensation de mouvement est le processus d'utilisation des vecteurs de mouvement d'une image pour générer une nouvelle transformation.
L'estimation et la compensation de mouvement sont des composants essentiels de la compression vidéo car elles permettent l'utilisation de la redondance temporelle. Presque toutes les normes d'encodage vidéo, y compris les normes HEVC les plus récentes, utilisent l'estimation et la compensation de mouvement basées sur des blocs.
Reconstruire la géométrie 3D d'une scène à partir d'images de caméra en mouvement est l'objectif de la localisation et de la cartographie simultanées.
{Fin du chapitre 1}
Chapitre 2 : Compensation de mouvement
Lors de la prédiction de la prochaine image d'une vidéo en fonction des images avant et après celle-ci, la compensation de mouvement est une technique algorithmique utilisée pour tenir compte du mouvement de la caméra et/ou de l'objet. Il est utilisé pour créer des fichiers MPEG-2 et d'autres formats de compression vidéo en encodant des données