Découvrez des millions d'e-books, de livres audio et bien plus encore avec un essai gratuit

Seulement $11.99/mois après la période d'essai. Annulez à tout moment.

Tenseur trifocal: Explorer la profondeur, le mouvement et la structure en vision par ordinateur
Tenseur trifocal: Explorer la profondeur, le mouvement et la structure en vision par ordinateur
Tenseur trifocal: Explorer la profondeur, le mouvement et la structure en vision par ordinateur
Livre électronique210 pages2 heures

Tenseur trifocal: Explorer la profondeur, le mouvement et la structure en vision par ordinateur

Évaluation : 0 sur 5 étoiles

()

Lire l'aperçu

À propos de ce livre électronique

Qu'est-ce que le tenseur trifocal


Dans le domaine de la vision par ordinateur, le tenseur trifocal est un tableau numérique qui présente des dimensions de 3 × 3 × 3 et englobe toutes les relations géométriques. qui sont projectives entre les trois perspectives. Les coordonnées des points ou des lignes correspondants dans trois vues différentes sont liées entre elles par cette méthode, indépendante de la structure de la scène et reposant uniquement sur le mouvement relatif entre les trois vues ainsi que sur les paramètres d'étalonnage intrinsèques de chaque vue. . En conséquence, le tenseur trifocal peut être considéré comme la généralisation de la matrice fondamentale dans trois perspectives différentes. Malgré le fait que le tenseur soit composé de 27 éléments, il est important de souligner que seuls 18 de ces éléments sont véritablement indépendants.


Comment vous en bénéficierez


(I) Informations et validations sur les sujets suivants :


Chapitre 1 : Trifocal_tensor


Chapitre 2 : Rank_(linear_algebra)


Chapitre 3 : Trace_(linear_algebra)


Chapitre 4 : Principal_component_analysis


Chapitre 5 : Translation_(géométrie)


Chapitre 6 : Kronecker_product


Chapitre 7 : Valeurs propres et vecteurs propres


Chapitre 8 : Espace_tridimensionnel


Chapitre 9 : Matrice_fondamentale_(vision_ordinateur)


Chapitre 10 : Détection_de coin


(II) Répondre aux principales questions du public sur le tenseur trifocal.


(III) Exemples concrets d'utilisation du tenseur trifocal dans de nombreux domaines.


À qui s'adresse ce livre


Professionnels, étudiants de premier cycle et des cycles supérieurs, passionnés, amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type de tenseur trifocal.


 


 

LangueFrançais
Date de sortie1 mai 2024
Tenseur trifocal: Explorer la profondeur, le mouvement et la structure en vision par ordinateur

En savoir plus sur Fouad Sabry

Auteurs associés

Lié à Tenseur trifocal

Titres dans cette série (100)

Voir plus

Livres électroniques liés

Intelligence (IA) et sémantique pour vous

Voir plus

Articles associés

Avis sur Tenseur trifocal

Évaluation : 0 sur 5 étoiles
0 évaluation

0 notation0 avis

Qu'avez-vous pensé ?

Appuyer pour évaluer

L'avis doit comporter au moins 10 mots

    Aperçu du livre

    Tenseur trifocal - Fouad Sabry

    Tenseur trifocal

    Exploration de la profondeur, du mouvement et de la structure dans la vision par ordinateur

    Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.

    Un milliard de connaissances

    Tenseur trifocal

    Exploration de la profondeur, du mouvement et de la structure dans la vision par ordinateur

    Fouad Sabry

    Copyright

    Tenseur © trifocal 2024 par Fouad Sabry. Tous droits réservés.

    Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.

    Couverture dessinée par Fouad Sabry.

    Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.

    Table des matières

    Chapitre 1 : Tenseur trifocal

    Chapitre 2 : Rang (algèbre linéaire)

    Chapitre 3 : Trace (algèbre linéaire)

    Chapitre 4 : Analyse en composantes principales

    Chapitre 5 : Translation (géométrie)

    Chapitre 6 : Produit Kronecker

    Chapitre 7 : Valeurs propres et vecteurs propres

    Chapitre 8 : L'espace tridimensionnel

    Chapitre 9 : Matrice fondamentale (vision par ordinateur)

    Chapitre 10 : Détection des coins

    Appendice

    À propos de l'auteur

    Chapitre 1 : Tenseur trifocal

    En ce qui concerne la vision par ordinateur, le tenseur trifocal (également tritenseur) est un tableau 3×3×3 de nombres (c'est-à-dire un tenseur) qui représente l'ensemble des relations entre trois points de vue en géométrie projective.

    Les coordonnées tridimensionnelles des lignes et des points parallèles sont liées, n'ayant rien à voir avec la topologie de la scène et tout à voir avec la mobilité relative (c'est-à-dire la position) entre les trois perspectives et leurs facteurs de calibrage innés.

    Par conséquent, le tenseur trifocal peut être considéré comme une version tridimensionnelle de la matrice de base.

    Il est souligné que bien que le tenseur se compose de 27 éléments, seuls 18 d'entre eux peuvent vraiment être considérés comme autosuffisants.

    Il y a 11 degrés de liberté, ou éléments indépendants, dans ce que l'on appelle le tenseur trifocal calibré, qui encode la posture relative des caméras jusqu'à l'échelle globale en reliant les coordonnées des points et des lignes dans trois vues compte tenu de leurs propriétés intrinsèques. Moins de correspondances doivent être ajustées dans le modèle en raison de la diminution des degrés de liberté, mais cela se fait au détriment d'une non-linéarité plus élevée.

    Le tenseur peut également être vu comme une collection de trois matrices de rang deux 3 x 3 {\mathbf T}_1, \; {\mathbf T}_2, \; {\mathbf T}_3 connues sous le nom de tranches de corrélation.

    En supposant que les matrices de projection de trois vues sont {\mathbf P}=[ {\mathbf I} \; | \; {\mathbf 0} ] , {\displaystyle {\mathbf {P} }'=[{\mathbf {A} }\;|\;{\mathbf {a} }_{4}]} et {\displaystyle {\mathbf {P} ''}=[{\mathbf {B} }\;|\;{\mathbf {b} }_{4}]} , les tranches de corrélation du tenseur correspondant peuvent être exprimées sous forme fermée sous la forme ,

    {\mathbf T}_i={\mathbf a}_i {\mathbf b}_4^t - {\mathbf a}_4 {\mathbf b}_i^t, \; i=1 \ldots 3

    où {\mathbf a}_i, \; {\mathbf b}_i sont respectivement les ièmes colonnes des matrices de caméra.

    Dans la pratique, cependant, le tenseur est calculé en comparant chacune des trois perspectives pour l'appariement des points et des lignes.

    Les relations linéaires entre les lignes et les points de trois images sont l'un des résultats les plus utiles du tenseur trifocal.

    Plus précisément, pour les triplets de points correspondants {\displaystyle {\mathbf {x} }\;\leftrightarrow \;{\mathbf {x} }'\;\leftrightarrow \;{\mathbf {x} }''} et toutes les lignes correspondantes {\displaystyle {\mathbf {l} }\;\leftrightarrow \;{\mathbf {l} }'\;\leftrightarrow \;{\mathbf {l} }''} qui les traversent, les restrictions trilinéaires énumérées ci-dessous sont valides :

    {\displaystyle ({\mathbf {l} }^{\prime t}\left[{\mathbf {T} }_{1},\;{\mathbf {T} }_{2},\;{\mathbf {T} }_{3}\right]{\mathbf {l} }'')[{\mathbf {l} }]_{\times }={\mathbf {0} }^{t}}{\displaystyle {\mathbf {l} }^{\prime t}\left(\sum _{i}x_{i}{\mathbf {T} }_{i}\right){\mathbf {l} }''=0}{\displaystyle {\mathbf {l} }^{\prime t}\left(\sum _{i}x_{i}{\mathbf {T} }_{i}\right)[{\mathbf {x} }'']_{\times }={\mathbf {0} }^{t}}{\displaystyle [{\mathbf {x} }']_{\times }\left(\sum _{i}x_{i}{\mathbf {T} }_{i}\right){\mathbf {l} }''={\mathbf {0} }}{\displaystyle [{\mathbf {x} }']_{\times }\left(\sum _{i}x_{i}{\mathbf {T} }_{i}\right)[{\mathbf {x} }'']_{\times }={\mathbf {0} }_{3\times 3}}

    où [\cdot]_{\times} désigne la matrice de produits vectoriels symétriques par symétrie.

    L'emplacement d'un point dans une troisième vue peut être déterminé à partir d'une paire de points appariés dans deux vues en utilisant uniquement le tenseur trifocal de ces vues. Le transfert de points décrit ce phénomène, qui s'applique également aux lignes et aux coniques. Il est possible de transférer des courbes génériques sous forme de coniques en les modélisant d'abord sous forme de cercles osculateurs dans une courbe différentielle locale. Cependant, la question des tenseurs trifocaux non calibrés est toujours en suspens.

    Le cas type implique des correspondances en six points avec trois solutions.

    Ces dernières années ont vu la solution au problème du calcul du tenseur trifocal à l'aide de seulement neuf correspondances linéaires.

    L'estimation calibrée du tenseur trifocal est considérée comme extrêmement difficile et nécessite des correspondances en quatre points. La même méthode s'est également avérée minimale avec le degré 216 pour la situation combinée des correspondances à trois points et des correspondances à une ligne.

    {Fin du chapitre 1}

    Chapitre 2 : Rang (algèbre linéaire)

    Le rang d'une matrice A est le nombre de dimensions de l'espace vectoriel formé (ou étendu) par ses colonnes en algèbre linéaire. Par conséquent, la « non-dégénérescence » des équations linéaires et des transformations linéaires stockées par A peut être quantifiée en fonction de son rang. Le rang peut être compris de différentes manières. Le rang d'une matrice est une propriété très élémentaire.

    Le rang est généralement représenté par les symboles rank (A) ou rk (A) ; Le rang d'une matrice est défini dans cette section. Il existe un large éventail de significations potentielles, dont certaines sont explorées dans la section Significations alternatives.

    Si A est un ensemble, son rang de colonne est le nombre d'éléments dans son espace de colonne, et son rang de ligne est le nombre d'éléments dans son espace de ligne.

    En algèbre linéaire, c'est un résultat du premier ordre que le rang d'une colonne est toujours égal au rang d'une ligne.

    (Trois preuves de ce résultat sont données au § Preuves que rang de colonne = rang de ligne, ci-dessous.) Considérez cette somme (c'est-à-dire que le comptage du nombre de lignes et de colonnes uniques dans A donne son rang.

    Si une matrice a le même nombre de lignes et de colonnes que la plus grande matrice concevable de ces dimensions, alors on dit qu'elle a un rang complet. Si une matrice n'a pas de rang complet, on dit qu'elle est déficiente en rang. Si une matrice a moins de lignes que de colonnes, on dit qu'elle a un déficit de rang.

    Le rang d'une carte linéaire ou d'un opérateur \Phi est défini comme la dimension de son image :

    {\displaystyle \operatorname {rank} (\Phi ):=\dim(\operatorname {img} (\Phi ))}

    où {\displaystyle \dim } est la dimension d'un espace vectoriel, et {\displaystyle \operatorname {img} } est l'image d'une carte.

    La matrice

    {\displaystyle {\begin{bmatrix}1&0&1\\-2&-3&1\\3&3&0\end{bmatrix}}}

    a le rang 2 ; Il y a au moins deux colonnes linéairement indépendantes (la première et la deuxième), donc le rang est au moins 2, mais le rang n'est pas supérieur à 3 puisque la troisième colonne est une combinaison linéaire des deux premières (la première moins la seconde).

    La matrice

    {\displaystyle A={\begin{bmatrix}1&1&0&2\\-1&-1&0&-2\end{bmatrix}}}

    a le rang 1 ; il y a des colonnes, donc le rang est non nul ; Pourtant, deux colonnes quelconques sont linéairement dépendantes l'une de l'autre. Dans le même ordre d'idées, l'inversion

    {\displaystyle A^{\mathrm {T} }={\begin{bmatrix}1&-1\\1&-1\\0&0\\2&-2\end{bmatrix}}}

    au premier endroit, A.

    En effet, étant donné que la transposition de A a les mêmes vecteurs colonne que les vecteurs ligne de A, dire qu'une matrice a le même rang que sa transposition est comparable à dire que son rang de colonne est le même que son rang de ligne, c'est-à-dire rank(A) = rank(AT).

    La recherche du rang d'une matrice implique généralement de la transformer en une forme plus simple, appelée forme d'échelon de ligne, en utilisant uniquement des opérations de ligne simples. En raison de leur inversibilité, les opérations sur les lignes ne modifient pas l'espace des lignes (et donc le rang des lignes) et traduisent l'espace des colonnes en un espace isomorphe (ne modifient donc pas le rang des colonnes). La forme d'échelon de ligne rend le rang égal à la somme du nombre de pivots (ou colonnes de base) plus le nombre de lignes non nulles.

    Considérons la matrice A, qui peut s'écrire sous la forme

    {\displaystyle A={\begin{bmatrix}1&2&1\\-2&-3&1\\3&5&0\end{bmatrix}}}

    peut être écrit sous forme compacte d'échelon de ligne en utilisant les opérations de ligne de base suivantes :

    {\displaystyle {\begin{aligned}{\begin{bmatrix}1&2&1\\-2&-3&1\\3&5&0\end{bmatrix}}&\xrightarrow {2R_{1}+R_{2}\to R_{2}} {\begin{bmatrix}1&2&1\\0&1&3\\3&5&0\end{bmatrix}}\xrightarrow {-3R_{1}+R_{3}\to R_{3}} {\begin{bmatrix}1&2&1\\0&1&3\\0&-1&-3\end{bmatrix}}\\&\xrightarrow {R_{2}+R_{3}\to R_{3}} \,\,{\begin{bmatrix}1&2&1\\0&1&3\\0&0&0\end{bmatrix}}\xrightarrow {-2R_{2}+R_{1}\to R_{1}} {\begin{bmatrix}1&0&-5\\0&1&3\\0&0&0\end{bmatrix}}~.\end{aligned}}}

    Par conséquent, le rang de la matrice A est 2, car la matrice finale (sous forme d'échelon de ligne) comporte deux lignes qui ne sont pas 0.

    L'élimination gaussienne de base (décomposition LU) peut être instable lorsqu'elle est utilisée dans des calculs en virgule flottante sur des ordinateurs ; Une décomposition révélatrice du rang est recommandée à la place. La décomposition en valeurs singulières (SVD) est une alternative puissante, bien qu'il existe des alternatives moins chères qui sont encore plus robustes numériquement que l'élimination gaussienne, telles que la décomposition QR avec pivotement (ce que l'on appelle la factorisation QR révélatrice de rang). Un choix pratique qui dépend à la fois de la matrice et de l'application est nécessaire pour la détermination numérique du rang, tel qu'un critère de sélection lorsqu'une valeur, telle qu'une valeur singulière du SVD, doit être considérée comme nulle.

    En algèbre linéaire, l'égalité des rangs de colonnes et de lignes d'une matrice est une propriété fondamentale.

    De nombreux exemples ont été fournis.

    L'une des plus élémentaires a été esquissée dans le § Rang à partir des formes d'échelon de rangée.

    Une preuve alternative est présentée ici :

    Il est facile de démontrer qu'une opération de ligne de base n'a aucun effet sur le rang des lignes ou sur le rang des colonnes. En raison de la nature de l'élimination gaussienne, qui n'implique que des opérations de ligne simples, le rang de ligne et le rang de colonne d'une matrice sont tous deux conservés dans sa version d'échelon de ligne réduit. La matrice peut être transformée en matrice d'identité en effectuant quelques opérations de colonne plus élémentaires, telles que l'ajout d'une ligne de zéros de chaque côté. Encore une fois, cela n'a aucun effet sur l'ordre des lignes ou des colonnes. Le nombre de matrices avec des entrées non nulles est directement proportionnel au rang de chaque ligne et colonne.

    Deux autres preuves de ce résultat sont fournies. La première est indépendante du champ et n'utilise que des caractéristiques élémentaires de combinaisons linéaires de vecteurs. Wardlaw est le fondement de la preuve (2005).

    Soit A une matrice m × n.

    Considérons r comme le rang de colonne de A, et soit c1, .., cr comme une base quelconque de l'espace de colonne de A.

    Placez-les comme les colonnes d'une matrice m × r C.

    Chacune des colonnes de A peut être écrite comme une combinaison linéaire des colonnes r de C.

    Cela signifie qu'il existe une matrice r × n R telle que A = CR.

    R est la matrice dont la ième colonne est formée à partir des coefficients

    Vous aimez cet aperçu ?
    Page 1 sur 1