Tremblement: Dither : bruit visuel dans la vision par ordinateur
Par Fouad Sabry
()
À propos de ce livre électronique
Qu'est-ce que le tramage
Le tramage est une forme de bruit appliquée intentionnellement et utilisée pour randomiser les erreurs de quantification, empêchant ainsi les motifs à grande échelle tels que les bandes de couleurs dans les images. Le dithering est couramment utilisé dans le traitement des données audio et vidéo numériques et constitue souvent l'une des dernières étapes du mastering audio sur un CD.
Comment vous en bénéficierez
(I) Informations et validations sur les sujets suivants :
Chapitre 1 : Dither
Chapitre 2 : Convertisseur analogique-numérique
Chapitre 3 : Plage dynamique
Chapitre 4 : Rapport signal/bruit
Chapitre 5 : Demi-teintes
Chapitre 6 : Comparaison de l'enregistrement analogique et numérique
Chapitre 7 : Artefact de compression
Chapitre 8 : Échantillonnage (traitement du signal)
Chapitre 9 : Quantification (traitement du signal)
Chapitre 10 : Niveaux de gris
(II) Répondre aux principales questions du public sur le tramage.
(III) Exemples concrets d'utilisation du tramage dans de nombreux domaines.
À qui s'adresse ce livre
Les professionnels, les étudiants de premier cycle et des cycles supérieurs, les passionnés, les amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type de Dither.
En savoir plus sur Fouad Sabry
Gravité Artificielle: Pour maintenir votre pied dans l'espace, la gravité artificielle est indispensable Évaluation : 0 sur 5 étoiles0 évaluationHabitat Spatial Gonflable: La future station spatiale sera-t-elle construite en tissu ? Évaluation : 0 sur 5 étoiles0 évaluation
Lié à Tremblement
Titres dans cette série (100)
Égalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRéduction de bruit: Amélioration de la clarté et techniques avancées de réduction du bruit en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation du radon: Dévoiler des modèles cachés dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDiffusion anisotrope: Améliorer l'analyse d'images grâce à la diffusion anisotrope Évaluation : 0 sur 5 étoiles0 évaluationRétinex: Dévoiler les secrets de la vision informatique avec Retinex Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence de couleur: Comprendre la perception et la représentation en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur sous-marine: Explorer les profondeurs de la vision par ordinateur sous les vagues Évaluation : 0 sur 5 étoiles0 évaluationCorrection gamma: Améliorer la clarté visuelle en vision par ordinateur : la technique de correction gamma Évaluation : 0 sur 5 étoiles0 évaluationEspace colorimétrique: Explorer le spectre de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHomographie: Homographie : transformations en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFiltre à particule: Explorer les filtres à particules en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGroupe mixte d'experts en photographie: Libérer la puissance des données visuelles avec la norme JPEG Évaluation : 0 sur 5 étoiles0 évaluationModèle du système visuel humain: Comprendre la perception et le traitement Évaluation : 0 sur 5 étoiles0 évaluationPeinture: Combler les lacunes de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHistogramme d'image: Dévoilement d'informations visuelles, exploration des profondeurs des histogrammes d'images en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHistogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection de gouttes: Dévoiler des modèles dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationCartographie des couleurs: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFonction de correspondance des couleurs: Comprendre la sensibilité spectrale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationAjustement du forfait: Optimisation des données visuelles pour une reconstruction précise Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationDétection des bords: Explorer les limites de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationContour actif: Faire progresser la vision par ordinateur grâce aux techniques de contour actif Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationModèle de couleur: Comprendre le spectre de la vision par ordinateur : explorer les modèles de couleurs Évaluation : 0 sur 5 étoiles0 évaluationTransformation affine: Libérer des perspectives visuelles : explorer la transformation affine en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluation
Livres électroniques liés
Anti crénelage: Améliorer la clarté visuelle dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de bord Canny: Dévoiler l'art de la perception visuelle Évaluation : 0 sur 5 étoiles0 évaluationFiltre adaptatif: Améliorer la vision par ordinateur grâce au filtrage adaptatif Évaluation : 0 sur 5 étoiles0 évaluationRéduction de bruit: Amélioration de la clarté et techniques avancées de réduction du bruit en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationAlgorithme de dessin de ligne: Maîtriser les techniques de rendu d’images de précision Évaluation : 0 sur 5 étoiles0 évaluationCartographie des couleurs: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSuppression des lignes cachées: Dévoiler l'invisible : les secrets de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCorrection gamma: Améliorer la clarté visuelle en vision par ordinateur : la technique de correction gamma Évaluation : 0 sur 5 étoiles0 évaluationModèle du système visuel humain: Comprendre la perception et le traitement Évaluation : 0 sur 5 étoiles0 évaluationGraphique raster numérique: Dévoilement de la puissance des graphiques raster numériques dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationIllumination globale: Faire progresser la vision : aperçus de l’éclairage mondial Évaluation : 0 sur 5 étoiles0 évaluationDétection des bords: Explorer les limites de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCoupes de graphiques de vision par ordinateur: Explorer les coupes graphiques en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationCompression des données: Libérer l’efficacité de la vision par ordinateur grâce à la compression des données Évaluation : 0 sur 5 étoiles0 évaluationDépannage de l'impression 3D: Le manuel complet pour un dépannage rapide et facile de l'impression FDM 3D Évaluation : 0 sur 5 étoiles0 évaluationRendu à plage dynamique élevée: Déverrouiller le spectre visuel : techniques avancées en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationInfographie du sommet: Explorer l'intersection de l'infographie Vertex et de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationProfil de couleur: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationMéthode d'ensemble de niveaux: Faire progresser la vision par ordinateur, explorer la méthode de jeu de niveaux Évaluation : 0 sur 5 étoiles0 évaluationBanque de filtres: Aperçu des techniques de banque de filtres de Computer Vision Évaluation : 0 sur 5 étoiles0 évaluationInfographie de radiosité: Faire progresser la visualisation grâce à la radiosité dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance automatique des cibles: Progrès des techniques de vision par ordinateur pour la reconnaissance de cibles Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance des panneaux de signalisation: Libérer la puissance de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationÉgalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationGraphiques raster: Comprendre les fondements des graphiques raster en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSegmentation d'images: Libérer des informations grâce à Pixel Precision Évaluation : 0 sur 5 étoiles0 évaluation
Intelligence (IA) et sémantique pour vous
Maîtriser ChatGPT : Libérez la puissance de l'IA pour améliorer la communication et les relations: French Évaluation : 0 sur 5 étoiles0 évaluationLe guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux Évaluation : 5 sur 5 étoiles5/5Résumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social Évaluation : 0 sur 5 étoiles0 évaluationMonétisation ChatGPT : Exploitez la Puissance de l'IA: ChatGPT Évaluation : 0 sur 5 étoiles0 évaluationMaîtrisez ChatGPT : Du débutant à l'expert - Guide pratique pour exploiter la puissance de l'IA conversationnelle Évaluation : 0 sur 5 étoiles0 évaluationLimites, dangers et menaces de l'Intelligence Artificielle: Un outil sans maîtrises Évaluation : 0 sur 5 étoiles0 évaluationChat GPT : Comment ça fonctionne et comment gagner avec l'utilisation de la technologie d'Intelligence Artificielle Évaluation : 0 sur 5 étoiles0 évaluationIntelligence artificielle: la quatrième révolution industrielle Évaluation : 0 sur 5 étoiles0 évaluationIA dans les Affaires: Guide Pratique de l'Utilisation de l'Intelligence Artificielle dans Divers Secteurs Évaluation : 0 sur 5 étoiles0 évaluationLa prophétie des anciens: Roman dystopique Évaluation : 0 sur 5 étoiles0 évaluationL'art de la création d'images avec l'IA : Techniques, applications et défis éthiques Évaluation : 0 sur 5 étoiles0 évaluationL'intelligence mixte, vers une nouvelle forme d'intelligence Évaluation : 0 sur 5 étoiles0 évaluationTravailler dans le Big Data - les 6 métiers vers lesquels s'orienter Évaluation : 5 sur 5 étoiles5/5Histoire et évolution de l'Intelligence Artificielle Évaluation : 5 sur 5 étoiles5/5L’Empathie au Cœur de l’Intelligence Artificielle, Comment insérer de l’empathie dans les affaires et l’intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationOsons l'IA à l'école: Préparons nos jeunes à la révolution de l'intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluation
Avis sur Tremblement
0 notation0 avis
Aperçu du livre
Tremblement - Fouad Sabry
Dither
Tramage : bruit visuel dans la vision par ordinateur
Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.
Un milliard de connaissances
Dither
Tramage : bruit visuel dans la vision par ordinateur
Fouad Sabry
Copyright
Dither © 2024 de Fouad Sabry. Tous droits réservés.
Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.
Couverture dessinée par Fouad Sabry.
Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.
Table des matières
Chapitre 1 : Tramage
Chapitre 2 : Convertisseur analogique-numérique
Chapitre 3 : Plage dynamique
Chapitre 4 : Rapport signal/bruit
Chapitre 5 : Demi-teinte
Chapitre 6 : Comparaison de l'enregistrement analogique et numérique
Chapitre 7 : Artefact de compression
Chapitre 8 : Echantillonnage (traitement du signal)
Chapitre 9 : Quantification (traitement du signal)
Chapitre 10 : Niveaux de gris
Appendice
À propos de l'auteur
Chapitre 1 : Tramage
Le tramage est un type de bruit délibéré utilisé pour randomiser l'erreur de quantification, empêchant ainsi les motifs à grande échelle tels que les bandes de couleur sur les photographies. Le tramage est couramment utilisé dans le traitement des données audio et vidéo numériques, et constitue souvent l'une des dernières étapes du mastering audio d'un CD.
Généralement, le tramage est utilisé pour transformer une image en niveaux de gris en noir et blanc de sorte que la densité des points noirs dans l'image résultante se rapproche du niveau de gris moyen de l'image d'origine.
… L'une des premières [applications] de la tramage a eu lieu pendant la Seconde Guerre mondiale.
Les bombardiers utilisaient des ordinateurs mécaniques pour la navigation et le calcul de la trajectoire des bombes.
Curieusement, ces ordinateurs (boîtes contenant des centaines d'engrenages et de rouages) fonctionnaient plus précisément à bord de l'avion, et moins solidement établis.
Les ingénieurs ont remarqué que les vibrations de l'avion minimisaient l'erreur causée par les pièces mobiles collantes.
Au lieu de se déplacer par à-coups rapides, vous devez vous déplacer en douceur, Ils se sont déplacés avec une plus grande cohérence.
Des moteurs vibrants miniatures ont été inclus dans les ordinateurs, le terme « dither » est dérivé du verbe moyen anglais « didderen », qui signifie « secouer ». Aujourd'hui, lorsqu'un compteur mécanique est utilisé pour améliorer sa précision, vous utilisez le tramage, les dictionnaires modernes définissent le tramage comme un état d'esprit profondément anxieux, confus ou agité.
En quantités minuscules, Dither rend effectivement un système numérique plus analogique dans le sens positif du terme.
— Ken Pohlmann, Principes de l'audio numérique
Peu de temps après la Seconde Guerre mondiale, le terme dither a été publié dans la littérature sur le calcul analogique et l'armement hydraulique.
Le tramage est appliqué dans de nombreux domaines, notamment le traitement et l'analyse numériques. Ces applications comprennent l'audio numérique, la vidéo numérique, la photographie numérique, la sismologie, les radars et les systèmes de prévision météorologique qui nécessitent un traitement numérique du signal.
La quantification produit l'erreur. Si cette inexactitude est associée au signal, le résultat peut être cyclique ou prévisible. Dans certains domaines, en particulier ceux dans lesquels le récepteur est sensible à de telles distorsions, les erreurs cycliques entraînent des artefacts indésirables. L'introduction d'un tramage dans ces zones transforme l'erreur en bruit aléatoire. L'industrie de l'audio en est une excellente illustration. L'oreille humaine agit de la même manière qu'une transformée de Fourier en ce sens qu'elle détecte des fréquences distinctes.
Dans un système analogique, le signal est continu, alors que dans un système numérique PCM, l'amplitude du signal est limitée à l'un des ensembles fixes de valeurs ou de nombres. Cette méthode est connue sous le nom de quantification. Chaque valeur codée est une étape discrète ; Si un signal est quantifié sans tramage, il y aura une distorsion de quantification associée au signal d'entrée d'origine... Afin d'éviter cela, le signal est « tertiblé », une procédure qui élimine mathématiquement les harmoniques et autres distorsions hautement indésirables et les remplace par un niveau de bruit constant et fixe.
Au cours du processus de production, un plus grand nombre de bits sont souvent utilisés pour représenter chaque échantillon ; Celle-ci doit être réduite à 16 bits afin de créer un disque compact.
Il existe de nombreuses façons d'y parvenir. On peut, par exemple, jeter les bits supplémentaires ; C'est ce qu'on appelle la troncature. De plus, on peut arrondir les bits excédentaires à la valeur la plus proche. Chacune de ces stratégies, cependant, produit des failles prévisibles et calculables. Le tramage remplace ces imprécisions par un niveau de bruit continu et fixe.
Exemples d'exemples audio de troncature 6 bits
Sinusoïde 16 bits
réduit à six bits
réduit à 6 bits
Vous rencontrez des difficultés pour lire ces fichiers ? Voir la prise en charge des médias.
Prenons, par exemple, une forme d'onde avec les valeurs suivantes :
1 2 3 4 5 6 7 8
Si la forme d'onde est diminuée de 20 %, les valeurs suivantes sont obtenues :
0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4
Si ces valeurs sont raccourcies, les données résultantes sont les suivantes :
0 1 2 3 4 4 5 6
Si ces valeurs sont arrondies à la place, les données suivantes sont obtenues :
1 2 2 3 4 5 6 6
La technique consistant à diminuer l'amplitude de n'importe quelle forme d'onde d'origine de 20 % entraîne des erreurs cohérentes. Considérons une onde sinusoïdale qui, pour une partie, répond aux paramètres susmentionnés. Comme le montre l'exemple ci-dessus, chaque fois que la valeur de l'onde sinusoïdale atteignait 3,2, le résultat raccourci était erroné de 0,2. Chaque fois que la valeur de l'onde sinusoïdale atteignait 4,0, il n'y avait pas d'erreur car le résultat raccourci était décalé de 0,0, comme illustré précédemment. Tout au long du cycle de l'onde sinusoïdale, l'amplitude de l'erreur varie régulièrement et à plusieurs reprises. Cette erreur se révèle spécifiquement être une distorsion. Ce que l'oreille perçoit comme une distorsion, ce sont les informations supplémentaires à des fréquences discrètes résultant d'une erreur de quantification récurrente.
Une approche possible consisterait à arrondir le nombre à deux chiffres (par exemple, 4,8) dans l'une ou l'autre direction. Il peut être arrondi à cinq une fois, puis à quatre la suivante. Cela donnerait une moyenne à long terme de 4,5 plutôt que de 4, ce qui rapprocherait la valeur de sa valeur réelle au fil du temps. Cependant, cela entraîne toujours une erreur déterminable (bien que plus complexe). Chaque fois que la valeur 4,8 est rencontrée, le résultat est une erreur de 0,2 %, et les autres fois, l'erreur est de 0,8. Il en résulte toujours une erreur quantifiée et répétée.
Une autre option serait d'arrondir 4,8 de sorte que quatre fois sur cinq, il soit arrondi à 5 et la cinquième fois à 4. À long terme, cela représenterait en moyenne exactement 4,8. Malheureusement, il en résulte toujours des défauts récurrents et prévisibles, et ces défauts continuent de se manifester sous forme de distorsion audible.
Il en résulte la solution du tramage. Au lieu d'arrondir vers le haut ou vers le bas de manière prévisible et répétitive, il est possible d'arrondir vers le haut ou vers le bas de manière aléatoire. Si une série de nombres aléatoires compris entre 0,0 et 0,9 (par exemple, 0,6, 0,1, 0,3, 0,6, 0,9, etc.) est créée et ajoutée à 4,8, deux fois sur dix le résultat sera tronqué à 4 (si 0,0 ou 0,1 sont ajoutés à 4,8), et huit fois sur dix, le résultat sera tronqué à 5. Chaque condition a une probabilité de 20 % d'être arrondie à 4 et une probabilité de 80 % d'être arrondie à 5. La moyenne à long terme de ces résultats est de 4,8, et leur erreur de quantification est du bruit aléatoire. Ce bruit est moins désagréable pour l'oreille que la distorsion mesurable produite par d'autres solutions.
Avant la quantification ou la re-quantification, le tramage est introduit pour découpler le bruit de quantification du signal d'entrée et empêcher le comportement non linéaire (distorsion).