Découvrez des millions d'e-books, de livres audio et bien plus encore avec un essai gratuit

Seulement $11.99/mois après la période d'essai. Annulez à tout moment.

Reconnaissance optique de caractères: Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères
Reconnaissance optique de caractères: Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères
Reconnaissance optique de caractères: Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères
Livre électronique111 pages1 heure

Reconnaissance optique de caractères: Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères

Évaluation : 0 sur 5 étoiles

()

Lire l'aperçu

À propos de ce livre électronique

Qu'est-ce que la reconnaissance optique de caractères


La reconnaissance optique de caractères ou lecteur optique de caractères (OCR) est la conversion électronique ou mécanique d'images de texte tapé, manuscrit ou imprimé en machine. texte encodé, qu'il s'agisse d'un document numérisé, d'une photo d'un document, d'une photo de scène ou d'un texte de sous-titre superposé à une image.


Comment vous en bénéficierez


(I) Informations et validations sur les sujets suivants :


Chapitre 1 : Reconnaissance optique de caractères


Chapitre 2 : Police de caractères


Chapitre 3 : Reconnaissance de l'écriture manuscrite


Chapitre 4 : Scanner d'images


Chapitre 5 : Reconnaissance optique de marques


Chapitre 6 : Reconnaissance intelligente de caractères


Chapitre 7 : Tesseract ( logiciel)


Chapitre 8 : OCRopus


Chapitre 9 : CuneiForm (logiciel)


Chapitre 10 : Comparaison des logiciels de reconnaissance optique de caractères


(II) Répondre aux principales questions du public sur la reconnaissance optique de caractères.


(III) Exemples concrets d'utilisation de la reconnaissance optique de caractères dans de nombreux domaines.


À qui appartient ce livre s'adresse aux professionnels, aux étudiants de premier cycle et des cycles supérieurs, aux passionnés, aux amateurs et à ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type de reconnaissance optique de caractères.


 


 

LangueFrançais
Date de sortie4 mai 2024
Reconnaissance optique de caractères: Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères

En savoir plus sur Fouad Sabry

Auteurs associés

Lié à Reconnaissance optique de caractères

Titres dans cette série (100)

Voir plus

Livres électroniques liés

Robotique pour vous

Voir plus

Articles associés

Avis sur Reconnaissance optique de caractères

Évaluation : 0 sur 5 étoiles
0 évaluation

0 notation0 avis

Qu'avez-vous pensé ?

Appuyer pour évaluer

L'avis doit comporter au moins 10 mots

    Aperçu du livre

    Reconnaissance optique de caractères - Fouad Sabry

    Reconnaissance optique de caractères

    Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères

    Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.

    Un milliard de connaissances

    Reconnaissance optique de caractères

    Libérer la puissance de la vision par ordinateur pour la reconnaissance optique de caractères

    Fouad Sabry

    Copyright

    Reconnaissance © optique de caractères 2024 par Fouad Sabry. Tous droits réservés.

    Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.

    Couverture dessinée par Fouad Sabry.

    Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.

    Table des matières

    Chapitre 1 : Reconnaissance optique de caractères

    Chapitre 2 : Police de caractères

    Chapitre 3 : Reconnaissance de l'écriture manuscrite

    Chapitre 4 : Scanner d'images

    Chapitre 5 : Reconnaissance optique des marques

    Chapitre 6 : Reconnaissance intelligente des caractères

    Chapitre 7 : Tesseract (logiciel)

    Chapitre 8 : OCRopus

    Chapitre 9 : CuneiForm (logiciel)

    Chapitre 10 : Comparaison des logiciels de reconnaissance optique de caractères

    Appendice

    À propos de l'auteur

    Chapitre 1 : Reconnaissance optique de caractères

    À partir d'un document numérisé, d'une photo du document, d'une photo de scène (comme le texte sur les panneaux d'affichage d'une photo de paysage) ou d'un texte de sous-titre superposé à une image, la reconnaissance optique de caractères (OCR) est la conversion électronique ou mécanique d'images de texte dactylographié, manuscrit ou imprimé en texte codé par machine (par exemple, à partir d'une émission de télévision).

    Il s'agit d'une méthode courante de numérisation de textes imprimés pour l'édition électronique, la recherche, le stockage compact, l'affichage en ligne et l'utilisation dans des processus automatiques tels que l'informatique cognitive, la traduction automatique, la synthèse vocale (extraite) et d'autres documents appropriés, tels que les documents de passeport, les factures, les relevés bancaires, les reçus informatisés, les cartes de visite, le courrier, les impressions de données statiques et d'autres documents appropriés. La reconnaissance des formes, l'IA et la vision par ordinateur contribuent toutes à l'OCR.

    Les versions antérieures ne prenaient en charge qu'une seule police de caractères et nécessitaient une formation avec des photos de chaque caractère. Les systèmes modernes prennent souvent en charge de nombreux formats de fichiers d'images numériques et peuvent fournir un haut niveau de précision d'identification pour la plupart des polices de caractères. Certaines implémentations peuvent générer une copie de la page avec tous les détails de mise en forme conservés, tels que les graphiques, les colonnes et d'autres éléments non textuels.

    La télégraphie et le développement d'aides à la lecture pour les aveugles sont deux antécédents possibles de la reconnaissance optique moderne des caractères.

    Dans les années 1920 et 1930, Emanuel Goldberg a créé ce qu'il a appelé une « machine statistique » pour examiner les archives sur microfilms à l'aide d'un système de reconnaissance optique de codes. En 1931, il a reçu le brevet américain 1 838 389 pour sa création. IBM est maintenant propriétaire du brevet.

    Après avoir développé l'OCR omni-police, qui pouvait lire du texte écrit dans presque n'importe quelle police de caractères, Ray Kurzweil a fondé Kurzweil Computer Products, Inc. en 1974. (Kurzweil est souvent crédité de l'invention de l'OCR omni-police, mais il était utilisé par des entreprises, y compris CompuScan, à la fin des années 1960 et dans les années 1970.) L'utilisation optimale de cette technologie, selon Kurzweil, serait de développer une machine à lire pour les aveugles, qui permettrait aux malvoyants de faire lire à haute voix par un ordinateur n'importe quel texte saisi par l'utilisateur. Deux technologies clés, le scanner CCD à plat et le synthétiseur de synthèse vocale, ont dû être développées pour que ce gadget devienne une réalité. Le produit final a été présenté lors d'une conférence de presse le 13 janvier 1976, présidée par Kurzweil et la Fédération nationale des aveugles. La première version commerciale du logiciel de reconnaissance optique de caractères a été publiée par Kurzweil Computer Products en 1978. En tant que l'un des premiers à l'adopter, LexisNexis a acheté le logiciel afin d'inclure des articles de presse et des mémoires juridiques dans ses bases de données en ligne naissantes. Kurzweil vendit son entreprise à Xerox deux ans plus tard en raison du désir de cette dernière de commercialiser la conversion de texte du papier à l'ordinateur. Scansoft, qui avait été scindé par Xerox, a ensuite fusionné avec Nuance Communications.

    Dans les années 2000, l'OCR a été rendu accessible dans le cloud, sur les appareils mobiles et dans la traduction en temps réel des signes en langue étrangère à l'aide d'un smartphone via des services comme le WebOCR. Avec l'essor des appareils mobiles connectés à Internet comme les smartphones et les montres intelligentes, l'OCR est utilisé dans les applications qui extraient du texte à partir d'images prises avec l'appareil photo de l'appareil. Si l'appareil ne dispose pas de fonctionnalités OCR intégrées au système d'exploitation, une API OCR sera utilisée pour lire le fichier image et extraire le texte. L'API OCR renvoie le texte extrait au programme sur l'appareil, ainsi que des informations sur l'endroit où le texte a été reconnu dans l'image d'origine, afin que l'application puisse en faire quelque chose (comme le convertir en voix ou l'afficher).

    Les caractères latins, cyrilliques, arabes, hébreux, indiens, bengalis (bengali), devanagari, tamouls, chinois, japonais et coréens sont tous pris en charge par une grande variété de systèmes OCR commerciaux et open source.

    L'OCR des reçus, l'OCR des factures, l'OCR des chèques et l'OCR des documents de facturation légaux ne sont que quelques-uns des nombreux types d'applications OCR spécifiques à un domaine qui ont été construites sur les moteurs OCR.

    Vous pouvez les utiliser dans :

    Saisie d'informations provenant des dossiers de l'entreprise tels que les chèques, les passeports, les factures, les relevés bancaires et les reçus

    Logiciel de lecture de plaques d'immatriculation

    Dans les aéroports, pour scanner les passeports et extraire des données

    Vous aimez cet aperçu ?
    Page 1 sur 1