Estimation de la pose du corps articulé: Déverrouiller le mouvement humain dans la vision par ordinateur
Par Fouad Sabry
()
À propos de ce livre électronique
Qu'est-ce que l'estimation de la pose d'un corps articulé
Dans le domaine de la vision par ordinateur, l'étude des techniques et des systèmes qui récupèrent la pose d'un corps articulé, composé d'articulations. et les pièces rigides, grâce à l'utilisation d'observations basées sur des images, est appelée estimation de la pose du corps articulé. Il s'agit de l'un des défis les plus anciens en matière de vision par ordinateur en raison de la complexité des modèles qui relient l'observation à la position et en raison de la gamme de scénarios dans lesquels cela serait utile.
Comment vous bénéficierez
(I) d'informations et de validations sur les sujets suivants :
Chapitre 1 : Estimation de la pose du corps articulé
Chapitre 2 : Segmentation d'images
Chapitre 3 : Localisation et cartographie simultanées
Chapitre 4 : Reconnaissance gestuelle
Chapitre 5 : Suivi vidéo
Chapitre 6 : Matrice fondamentale (vision par ordinateur)
Chapitre 7 : Structure à partir du mouvement
Chapitre 8 : Modèle de sac de mots en vision par ordinateur
Chapitre 9 : Point- enregistrement des ensembles
Chapitre 10 : Michael J. Black
(II) Répondre aux principales questions du public sur l'estimation de la pose du corps articulé.
(III) Exemples du monde réel pour l'utilisation de l'estimation de la pose du corps articulé dans de nombreux domaines.
À qui s'adresse ce livre
Professionnels, étudiants de premier cycle et des cycles supérieurs, passionnés, amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type d'estimation de pose du corps articulé.
En savoir plus sur Fouad Sabry
Extraction D'Astéroïdes: L'extraction d'astéroïdes sera-t-elle la prochaine course en or dans l'espace ? Évaluation : 0 sur 5 étoiles0 évaluation
Lié à Estimation de la pose du corps articulé
Titres dans cette série (100)
Histogramme d'image: Dévoilement d'informations visuelles, exploration des profondeurs des histogrammes d'images en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationBanque de filtres: Aperçu des techniques de banque de filtres de Computer Vision Évaluation : 0 sur 5 étoiles0 évaluationPeinture: Combler les lacunes de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFonction de correspondance des couleurs: Comprendre la sensibilité spectrale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRétinex: Dévoiler les secrets de la vision informatique avec Retinex Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur sous-marine: Explorer les profondeurs de la vision par ordinateur sous les vagues Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationDiffusion anisotrope: Améliorer l'analyse d'images grâce à la diffusion anisotrope Évaluation : 0 sur 5 étoiles0 évaluationÉgalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationRéduction de bruit: Amélioration de la clarté et techniques avancées de réduction du bruit en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGroupe mixte d'experts en photographie: Libérer la puissance des données visuelles avec la norme JPEG Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCorrection gamma: Améliorer la clarté visuelle en vision par ordinateur : la technique de correction gamma Évaluation : 0 sur 5 étoiles0 évaluationHomographie: Homographie : transformations en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation affine: Libérer des perspectives visuelles : explorer la transformation affine en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation du radon: Dévoiler des modèles cachés dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationMéthode d'ensemble de niveaux: Faire progresser la vision par ordinateur, explorer la méthode de jeu de niveaux Évaluation : 0 sur 5 étoiles0 évaluationFiltre adaptatif: Améliorer la vision par ordinateur grâce au filtrage adaptatif Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationPerception visuelle: Aperçu du traitement visuel informatique Évaluation : 0 sur 5 étoiles0 évaluationModèle du système visuel humain: Comprendre la perception et le traitement Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationEspace colorimétrique: Explorer le spectre de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationProfil de couleur: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence de couleur: Comprendre la perception et la représentation en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation Hadamard: Dévoilement de la puissance de la transformation Hadamard en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationMoindres carrés: Techniques d'optimisation pour la vision par ordinateur : méthodes des moindres carrés Évaluation : 0 sur 5 étoiles0 évaluationAjustement du forfait: Optimisation des données visuelles pour une reconstruction précise Évaluation : 0 sur 5 étoiles0 évaluation
Livres électroniques liés
Matrice fondamentale de la vision par ordinateur: S'il vous plaît, suggérez un sous-titre pour un livre intitulé « Matrice fondamentale de la vision par ordinateur » dans le domaine de la « Vision par ordinateur ». Le sous-titre suggéré ne doit pas contenir de ':'. Évaluation : 0 sur 5 étoiles0 évaluationFlux optique: Explorer les modèles visuels dynamiques en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVoir la synthèse: Explorer les perspectives de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence active: Libérer la puissance des modèles d’apparence active dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance optique du braille: Renforcer l'accessibilité grâce à l'intelligence visuelle Évaluation : 0 sur 5 étoiles0 évaluationDétection d'objet: Avancées, applications et algorithmes Évaluation : 0 sur 5 étoiles0 évaluationReconstruction tridimensionnelle multi-vues: Techniques avancées de perception spatiale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGraphiques de lancer de rayons: Explorer le rendu photoréaliste en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRéseau de capteurs visuels: Explorer la puissance des réseaux de capteurs visuels en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection de collision: Comprendre les intersections visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGéométrie épipolaire: Libérer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection des bords: Explorer les limites de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationEstimation du mouvement: Avancées et applications en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationChamp de mouvement: Explorer la dynamique de la vision par ordinateur : le champ de mouvement dévoilé Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur sous-marine: Explorer les profondeurs de la vision par ordinateur sous les vagues Évaluation : 0 sur 5 étoiles0 évaluationContour actif: Faire progresser la vision par ordinateur grâce aux techniques de contour actif Évaluation : 0 sur 5 étoiles0 évaluationSegmentation d'images: Libérer des informations grâce à Pixel Precision Évaluation : 0 sur 5 étoiles0 évaluationSurface procédurale: Explorer la génération et l'analyse de textures en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTraitement d'image pyramidale: Explorer les profondeurs de l'analyse visuelle Évaluation : 0 sur 5 étoiles0 évaluationModèle de caméra sténopé: Comprendre la perspective grâce à l'optique informatique Évaluation : 0 sur 5 étoiles0 évaluationSystème de reconnaissance faciale: Libérer la puissance de l’intelligence visuelle Évaluation : 0 sur 5 étoiles0 évaluationIllumination globale: Faire progresser la vision : aperçus de l’éclairage mondial Évaluation : 0 sur 5 étoiles0 évaluationApprentissage des caractéristiques géométriques: Libérer des informations visuelles grâce à l'apprentissage des caractéristiques géométriques Évaluation : 0 sur 5 étoiles0 évaluationProjection tridimensionnelle: Libérer la profondeur de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModélisation et rendu basés sur l'image: Explorer le réalisme visuel : techniques de vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluation
Intelligence (IA) et sémantique pour vous
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux Évaluation : 5 sur 5 étoiles5/5Résumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social Évaluation : 0 sur 5 étoiles0 évaluationComment Réussir sur Facebook en utilisant ChatGPT: Le pouvoir de ChatGPT : découvrez comment il peut transformer votre stratégie sur Facebook Évaluation : 0 sur 5 étoiles0 évaluationLimites, dangers et menaces de l'Intelligence Artificielle: Un outil sans maîtrises Évaluation : 0 sur 5 étoiles0 évaluationMaîtriser ChatGPT : Libérez la puissance de l'IA pour améliorer la communication et les relations: French Évaluation : 0 sur 5 étoiles0 évaluationMaîtrisez ChatGPT : Du débutant à l'expert - Guide pratique pour exploiter la puissance de l'IA conversationnelle Évaluation : 0 sur 5 étoiles0 évaluationChat GPT : Comment ça fonctionne et comment gagner avec l'utilisation de la technologie d'Intelligence Artificielle Évaluation : 0 sur 5 étoiles0 évaluationL'art de la création d'images avec l'IA : Techniques, applications et défis éthiques Évaluation : 0 sur 5 étoiles0 évaluationIA dans les Affaires: Guide Pratique de l'Utilisation de l'Intelligence Artificielle dans Divers Secteurs Évaluation : 0 sur 5 étoiles0 évaluationAI Limits, Dangers and Threats: A tool without Mastery Évaluation : 0 sur 5 étoiles0 évaluationL’Empathie au Cœur de l’Intelligence Artificielle, Comment insérer de l’empathie dans les affaires et l’intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationMonétisation ChatGPT : Exploitez la Puissance de l'IA: ChatGPT Évaluation : 0 sur 5 étoiles0 évaluationL'intelligence mixte, vers une nouvelle forme d'intelligence Évaluation : 0 sur 5 étoiles0 évaluationLa prophétie des anciens: Roman dystopique Évaluation : 0 sur 5 étoiles0 évaluationOsons l'IA à l'école: Préparons nos jeunes à la révolution de l'intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationIntelligence artificielle: la quatrième révolution industrielle Évaluation : 0 sur 5 étoiles0 évaluationTravailler dans le Big Data - les 6 métiers vers lesquels s'orienter Évaluation : 5 sur 5 étoiles5/5Histoire et évolution de l'Intelligence Artificielle Évaluation : 5 sur 5 étoiles5/5
Avis sur Estimation de la pose du corps articulé
0 notation0 avis
Aperçu du livre
Estimation de la pose du corps articulé - Fouad Sabry
Estimation de la pose du corps articulé
Libérer le mouvement humain dans la vision par ordinateur
Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.
Un milliard de connaissances
Estimation de la pose du corps articulé
Libérer le mouvement humain dans la vision par ordinateur
Fouad Sabry
Copyright
Estimation © de la pose du corps articulé 2024 par Fouad Sabry. Tous droits réservés.
Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.
Couverture dessinée par Fouad Sabry.
Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.
Table des matières
Chapitre 1 : Estimation de la pose du corps articulé
Chapitre 2 : Segmentation d'images
Chapitre 3 : Localisation et cartographie simultanées
Chapitre 4 : Reconnaissance gestuelle
Chapitre 5 : Suivi vidéo
Chapitre 6 : Matrice fondamentale (vision par ordinateur)
Chapitre 7 : Structure à partir du mouvement
Chapitre 8 : Modèle de sac de mots en vision par ordinateur
Chapitre 9 : Enregistrement d'un jeu de points
Chapitre 10 : Michael J. Black
Appendice
À propos de l'auteur
Chapitre 1 : Estimation de la pose du corps articulé
Le domaine de la vision par ordinateur connu sous le nom d'« estimation de la pose d'un corps articulé » se concentre sur les techniques et les systèmes qui peuvent déterminer la position d'un objet en mouvement à partir d'une série d'images de ses articulations et de ses parties rigides. La difficulté des modèles qui relient l'observation à la position, ainsi que le large éventail d'applications, en ont fait un défi durable dans le domaine de la vision par ordinateur.
Les robots doivent être capables de détecter et de comprendre la présence de personnes dans leur voisinage immédiat. La machine interactive doit comprendre le contexte réel du scénario si un humain utilise des gestes pour pointer vers un objet spécifique. En raison de son importance et de sa difficulté, plusieurs méthodes ont été développées et mises en œuvre au cours des deux dernières décennies pour résoudre le problème de l'estimation de la pose en vision par ordinateur. L'entraînement de modèles complexes avec d'énormes ensembles de données est une approche courante.
En raison des 244 degrés de liberté et des 230 articulations du corps humain, l'estimation de la pose est un problème difficile avec les études actuelles. Le corps humain a 10 parties principales et 20 degrés de liberté, mais tous les mouvements entre les articulations ne sont pas visibles. Il y a beaucoup de variations dans l'apparence que les algorithmes doivent prendre en compte, y compris les variations dans les vêtements, la forme du corps, la taille et les coupes de cheveux. De plus, les occlusions d'auto-articulation, telles qu'une personne se couvrant le visage avec sa main, ou les occlusions externes peuvent rendre les résultats peu clairs. Enfin, la plupart des algorithmes calculent la pose à partir des images monoculaires (bidimensionnelles) de l'appareil photo standard. Des conditions d'éclairage et de caméra incohérentes peuvent contribuer au problème. Des performances supplémentaires ne font qu'ajouter à la complexité. Ces images ont beaucoup de place pour les erreurs d'interprétation car elles n'ont pas les informations de profondeur d'une posture corporelle réelle. Les efforts récents dans ce sens utilisent les informations de couleur et de profondeur capturées par les caméras RGBD.
Dans une technique basée sur un modèle utilisée par la plupart des systèmes d'estimation de la pose corporelle articulée, la similitude/différence la plus extrême/minimale entre une observation (entrée) et un modèle modèle est utilisée pour déterminer une pose estimée. Divers capteurs, tels que les suivants, ont été envisagés pour effectuer l'observation :
Imagerie aux longueurs d'onde visibles, Photos prises dans le spectre infrarouge à ondes longues, Photographie à temps de vol et
Photos prises avec un télémètre laser.
Le modèle utilise directement les représentations intermédiaires produites par ces capteurs. Voici quelques-unes des représentations :
Aspect de l'image, Reconstruction à partir de voxels (éléments de volume), En trois dimensions, à l'aide d'un total de noyaux gaussiens
Maillages de surface tridimensionnels.
Le squelette humain est l'endroit où le concept de « modèle basé sur les pièces » a émergé pour la première fois. Lorsqu'un objet a la capacité de s'articuler, il peut être désassemblé en composants qui peuvent être réorganisés dans une variété de configurations. L'échelle et l'orientation de l'objet principal sont articulées aux échelles et aux orientations des pièces. Les ressorts servent à relier les nombreux composants du modèle, ce qui permet de le décrire mathématiquement. Ainsi appelé parce qu'il ressemble à un ressort, ce modèle a d'autres noms. La compression et la dilatation des ressorts expliquent la proximité relative des différents composants. Les orientations des ressorts sont limitées par la géométrie. Les jambes, par exemple, n'ont pas de bras qui peuvent tourner en cercle complet. Par conséquent, les composants ne peuvent pas être orientés de cette manière. Le nombre de combinaisons viables est donc réduit.
Dans le modèle de ressort, les nœuds (V) représentent les composants, tandis que les arêtes (E) représentent les ressorts qui les relient.
Chaque emplacement de l'image est accessible par les x y coordonnées et de l'emplacement du pixel.
Soit {\displaystyle \mathbf {p} _{i}(x,\,y)} pointé à {\displaystyle \mathbf {i} ^{th}} l'emplacement.
Alors le coût associé à l'assemblage du ressort entre {\displaystyle \mathbf {i} ^{th}} et le {\displaystyle \mathbf {j} ^{th}} point peut être donné par {\displaystyle S(\mathbf {p} _{i},\,\mathbf {p} _{j})=S(\mathbf {p} _{i}-\mathbf {p} _{j})} .
Par conséquent, le coût total associé à la mise en place l des composants à des emplacements {\displaystyle \mathbf {P} _{l}} est donné par
{\displaystyle S(\mathbf {P} _{l})=\displaystyle \sum _{i=1}^{l}\;\displaystyle \sum _{j=1}^{i}\;\mathbf {s} _{ij}(\mathbf {p} _{i},\,\mathbf {p} _{j})}L'équation susmentionnée est une simplification du modèle de ressort couramment utilisé pour décrire la posture du corps. La minimisation de la fonction de coût ou d'énergie est utilisée pour estimer la pose à partir de photographies. Il y a deux termes dans cette fonction d'énergie. Le premier prend en compte la correspondance de chaque partie avec les données de l'image, tandis que le second tient compte de la correspondance des parties orientées (déformées), de sorte que l'articulation et la détection d'objets sont prises en compte.
Une chaîne hiérarchique est utilisée pour construire le squelette cinématique.
Chaque segment de corps rigide possède son système de coordonnées local qui peut être transformé en système de coordonnées universel via une matrice de transformation 4×4 {\displaystyle T_{l}} , {\displaystyle T_{l}=T_{\operatorname {par} (l)}R_{l},}
où {\displaystyle R_{l}} désigne la transformation locale du segment du corps S_{l} vers son parent {\displaystyle \operatorname {par} (S_{l})} .
Il y a trois degrés de