Reconnaissance optique de caractères: Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères
Par Fouad Sabry
()
À propos de ce livre électronique
Qu'est-ce que la reconnaissance optique de caractères
La reconnaissance optique de caractères ou lecteur optique de caractères (OCR) est la conversion électronique ou mécanique d'images de texte tapé, manuscrit ou imprimé en machine. texte encodé, qu'il s'agisse d'un document numérisé, d'une photo d'un document, d'une photo de scène ou d'un texte de sous-titre superposé à une image.
Comment vous en bénéficierez
(I) Informations et validations sur les sujets suivants :
Chapitre 1 : Reconnaissance optique de caractères
Chapitre 2 : Police de caractères
Chapitre 3 : Reconnaissance de l'écriture manuscrite
Chapitre 4 : Scanner d'images
Chapitre 5 : Reconnaissance optique de marques
Chapitre 6 : Reconnaissance intelligente de caractères
Chapitre 7 : Tesseract ( logiciel)
Chapitre 8 : OCRopus
Chapitre 9 : CuneiForm (logiciel)
Chapitre 10 : Comparaison des logiciels de reconnaissance optique de caractères
(II) Répondre aux principales questions du public sur la reconnaissance optique de caractères.
(III) Exemples concrets d'utilisation de la reconnaissance optique de caractères dans de nombreux domaines.
À qui appartient ce livre s'adresse aux professionnels, aux étudiants de premier cycle et des cycles supérieurs, aux passionnés, aux amateurs et à ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type de reconnaissance optique de caractères.
En savoir plus sur Fouad Sabry
Technologies Émergentes en Agriculture [French]
Lié à Reconnaissance optique de caractères
Titres dans cette série (100)
Groupe mixte d'experts en photographie: Libérer la puissance des données visuelles avec la norme JPEG Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur sous-marine: Explorer les profondeurs de la vision par ordinateur sous les vagues Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence de couleur: Comprendre la perception et la représentation en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation Hadamard: Dévoilement de la puissance de la transformation Hadamard en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHistogramme d'image: Dévoilement d'informations visuelles, exploration des profondeurs des histogrammes d'images en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDiffusion anisotrope: Améliorer l'analyse d'images grâce à la diffusion anisotrope Évaluation : 0 sur 5 étoiles0 évaluationRéduction de bruit: Amélioration de la clarté et techniques avancées de réduction du bruit en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFiltre adaptatif: Améliorer la vision par ordinateur grâce au filtrage adaptatif Évaluation : 0 sur 5 étoiles0 évaluationTransformation du radon: Dévoiler des modèles cachés dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationHistogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHomographie: Homographie : transformations en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection des bords: Explorer les limites de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationFonction de correspondance des couleurs: Comprendre la sensibilité spectrale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationÉgalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de coin Harris: Dévoiler la magie de la détection des caractéristiques de l'image Évaluation : 0 sur 5 étoiles0 évaluationContour actif: Faire progresser la vision par ordinateur grâce aux techniques de contour actif Évaluation : 0 sur 5 étoiles0 évaluationRétinex: Dévoiler les secrets de la vision informatique avec Retinex Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationPeinture: Combler les lacunes de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation affine: Libérer des perspectives visuelles : explorer la transformation affine en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCorrection gamma: Améliorer la clarté visuelle en vision par ordinateur : la technique de correction gamma Évaluation : 0 sur 5 étoiles0 évaluationModèle du système visuel humain: Comprendre la perception et le traitement Évaluation : 0 sur 5 étoiles0 évaluationModèle de couleur: Comprendre le spectre de la vision par ordinateur : explorer les modèles de couleurs Évaluation : 0 sur 5 étoiles0 évaluationMéthode d'ensemble de niveaux: Faire progresser la vision par ordinateur, explorer la méthode de jeu de niveaux Évaluation : 0 sur 5 étoiles0 évaluationBanque de filtres: Aperçu des techniques de banque de filtres de Computer Vision Évaluation : 0 sur 5 étoiles0 évaluation
Livres électroniques liés
Reconnaissance intelligente des caractères: Faire progresser la perception des machines dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance vocale audiovisuelle: Avancées, applications et informations Évaluation : 0 sur 5 étoiles0 évaluationCaméra intelligente: Révolutionner la perception visuelle avec la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance automatique des plaques d'immatriculation: Libérer le potentiel de la technologie de vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance optique du braille: Renforcer l'accessibilité grâce à l'intelligence visuelle Évaluation : 0 sur 5 étoiles0 évaluationVision industrielle: Aperçu du monde de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationInformatique physique: Explorer la vision par ordinateur dans l'informatique physique Évaluation : 0 sur 5 étoiles0 évaluationRéseau de capteurs visuels: Explorer la puissance des réseaux de capteurs visuels en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance gestuelle: Libérer le langage du mouvement Évaluation : 0 sur 5 étoiles0 évaluationExploration de la collection d’images: Dévoiler des paysages visuels en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationSuite logicielle: Révolutionner la vision par ordinateur avec la suite logicielle ultime Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance des panneaux de signalisation: Libérer la puissance de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationEmpreinte digitale vidéo numérique: Améliorer la sécurité et l'identification des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationLe Guide Rapide Du Cloud Computing Et De La Cybersécurité Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance de l'iris: Perspectives éclairantes sur la reconnaissance de l'iris en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationProfil de couleur: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection d'objet: Avancées, applications et algorithmes Évaluation : 0 sur 5 étoiles0 évaluationDessin technique: Libérer la perception visuelle dans le dessin technique Évaluation : 0 sur 5 étoiles0 évaluationLogiciel Aphélie: Unlocking Vision : Explorer les profondeurs du logiciel Aphelion Évaluation : 0 sur 5 étoiles0 évaluationRéalité augmentée: Explorer les frontières de la vision par ordinateur en réalité augmentée Évaluation : 0 sur 5 étoiles0 évaluationAnnotation automatique des images: Améliorer la compréhension visuelle grâce au marquage automatisé Évaluation : 0 sur 5 étoiles0 évaluationApprendre Python rapidement: Le guide du débutant pour apprendre tout ce que vous devez savoir sur Python, même si vous êtes nouveau dans la programmation Évaluation : 0 sur 5 étoiles0 évaluationInfographie: Explorer l'intersection de l'infographie et de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSystème de reconnaissance faciale: Libérer la puissance de l’intelligence visuelle Évaluation : 0 sur 5 étoiles0 évaluationReconnaissance automatique des cibles: Progrès des techniques de vision par ordinateur pour la reconnaissance de cibles Évaluation : 0 sur 5 étoiles0 évaluationCompteur de personnes: Libérer des informations grâce à l'analyse visuelle Évaluation : 0 sur 5 étoiles0 évaluationMicrosoft PixelSense: Révolutionner l'interaction homme-machine grâce à la détection visuelle Évaluation : 0 sur 5 étoiles0 évaluationMot visuel: Libérer la puissance de la compréhension des images Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluation
Robotique pour vous
Guide Rapide De La Robotique Et De L'intelligence Artificielle Évaluation : 0 sur 5 étoiles0 évaluationDroit des robots Évaluation : 0 sur 5 étoiles0 évaluationRobotique Agricole: Comment les robots viennent-ils à la rescousse de notre alimentation ? Évaluation : 0 sur 5 étoiles0 évaluationRobotique: Un Avenir Transformateur Évaluation : 0 sur 5 étoiles0 évaluation
Avis sur Reconnaissance optique de caractères
0 notation0 avis
Aperçu du livre
Reconnaissance optique de caractères - Fouad Sabry
Reconnaissance optique de caractères
Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères
Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.
Un milliard de connaissances
Reconnaissance optique de caractères
Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères
Fouad Sabry
Copyright
Reconnaissance © optique de caractères 2024 par Fouad Sabry. Tous droits réservés.
Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.
Couverture dessinée par Fouad Sabry.
Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.
Table des matières
Chapitre 1 : Reconnaissance optique de caractères
Chapitre 2 : Police de caractères
Chapitre 3 : Reconnaissance de l'écriture manuscrite
Chapitre 4 : Scanner d'images
Chapitre 5 : Reconnaissance optique des marques
Chapitre 6 : Reconnaissance intelligente des caractères
Chapitre 7 : Tesseract (logiciel)
Chapitre 8 : OCRopus
Chapitre 9 : CuneiForm (logiciel)
Chapitre 10 : Comparaison des logiciels de reconnaissance optique de caractères
Appendice
À propos de l'auteur
Chapitre 1 : Reconnaissance optique de caractères
À partir d'un document numérisé, d'une photo du document, d'une photo de scène (comme le texte sur les panneaux d'affichage d'une photo de paysage) ou d'un texte de sous-titre superposé à une image, la reconnaissance optique de caractères (OCR) est la conversion électronique ou mécanique d'images de texte dactylographié, manuscrit ou imprimé en texte codé par machine (par exemple, à partir d'une émission de télévision).
Il s'agit d'une méthode courante de numérisation de textes imprimés pour l'édition électronique, la recherche, le stockage compact, l'affichage en ligne et l'utilisation dans des processus automatiques tels que l'informatique cognitive, la traduction automatique, la synthèse vocale (extraite) et d'autres documents appropriés, tels que les documents de passeport, les factures, les relevés bancaires, les reçus informatisés, les cartes de visite, le courrier, les impressions de données statiques et d'autres documents appropriés. La reconnaissance des formes, l'IA et la vision par ordinateur contribuent toutes à l'OCR.
Les versions antérieures ne prenaient en charge qu'une seule police de caractères et nécessitaient une formation avec des photos de chaque caractère. Les systèmes modernes prennent souvent en charge de nombreux formats de fichiers d'images numériques et peuvent fournir un haut niveau de précision d'identification pour la plupart des polices de caractères. Certaines implémentations peuvent générer une copie de la page avec tous les détails de mise en forme conservés, tels que les graphiques, les colonnes et d'autres éléments non textuels.
La télégraphie et le développement d'aides à la lecture pour les aveugles sont deux antécédents possibles de la reconnaissance optique moderne des caractères.
Dans les années 1920 et 1930, Emanuel Goldberg a créé ce qu'il a appelé une « machine statistique » pour examiner les archives sur microfilms à l'aide d'un système de reconnaissance optique de codes. En 1931, il a reçu le brevet américain 1 838 389 pour sa création. IBM est maintenant propriétaire du brevet.
Après avoir développé l'OCR omni-police, qui pouvait lire du texte écrit dans presque n'importe quelle police de caractères, Ray Kurzweil a fondé Kurzweil Computer Products, Inc. en 1974. (Kurzweil est souvent crédité de l'invention de l'OCR omni-police, mais il était utilisé par des entreprises, y compris CompuScan, à la fin des années 1960 et dans les années 1970.) L'utilisation optimale de cette technologie, selon Kurzweil, serait de développer une machine à lire pour les aveugles, qui permettrait aux malvoyants de faire lire à haute voix par un ordinateur n'importe quel texte saisi par l'utilisateur. Deux technologies clés, le scanner CCD à plat et le synthétiseur de synthèse vocale, ont dû être développées pour que ce gadget devienne une réalité. Le produit final a été présenté lors d'une conférence de presse le 13 janvier 1976, présidée par Kurzweil et la Fédération nationale des aveugles. La première version commerciale du logiciel de reconnaissance optique de caractères a été publiée par Kurzweil Computer Products en 1978. En tant que l'un des premiers à l'adopter, LexisNexis a acheté le logiciel afin d'inclure des articles de presse et des mémoires juridiques dans ses bases de données en ligne naissantes. Kurzweil vendit son entreprise à Xerox deux ans plus tard en raison du désir de cette dernière de commercialiser la conversion de texte du papier à l'ordinateur. Scansoft, qui avait été scindé par Xerox, a ensuite fusionné avec Nuance Communications.
Dans les années 2000, l'OCR a été rendu accessible dans le cloud, sur les appareils mobiles et dans la traduction en temps réel des signes en langue étrangère à l'aide d'un smartphone via des services comme le WebOCR. Avec l'essor des appareils mobiles connectés à Internet comme les smartphones et les montres intelligentes, l'OCR est utilisé dans les applications qui extraient du texte à partir d'images prises avec l'appareil photo de l'appareil. Si l'appareil ne dispose pas de fonctionnalités OCR intégrées au système d'exploitation, une API OCR sera utilisée pour lire le fichier image et extraire le texte. L'API OCR renvoie le texte extrait au programme sur l'appareil, ainsi que des informations sur l'endroit où le texte a été reconnu dans l'image d'origine, afin que l'application puisse en faire quelque chose (comme le convertir en voix ou l'afficher).
Les caractères latins, cyrilliques, arabes, hébreux, indiens, bengalis (bengali), devanagari, tamouls, chinois, japonais et coréens sont tous pris en charge par une grande variété de systèmes OCR commerciaux et open source.
L'OCR des reçus, l'OCR des factures, l'OCR des chèques et l'OCR des documents de facturation légaux ne sont que quelques-uns des nombreux types d'applications OCR spécifiques à un domaine qui ont été construites sur les moteurs OCR.
Vous pouvez les utiliser dans :
Saisie d'informations provenant des dossiers de l'entreprise tels que les chèques, les passeports, les factures, les relevés bancaires et les reçus
Logiciel de lecture de plaques d'immatriculation
Dans les aéroports, pour scanner les passeports et extraire des données