Découvrez des millions d'e-books, de livres audio et bien plus encore avec un essai gratuit

Seulement $11.99/mois après la période d'essai. Annulez à tout moment.

Mot visuel: Libérer la puissance de la compréhension des images
Mot visuel: Libérer la puissance de la compréhension des images
Mot visuel: Libérer la puissance de la compréhension des images
Livre électronique146 pages1 heure

Mot visuel: Libérer la puissance de la compréhension des images

Évaluation : 0 sur 5 étoiles

()

Lire l'aperçu

À propos de ce livre électronique

Qu'est-ce que Visual Word


Les mots visuels, tels qu'utilisés dans les systèmes de récupération d'images, font référence à de petites parties d'une image qui contiennent un certain type d'informations liées aux fonctionnalités ou aux modifications. se produisant dans les pixels tels que le filtrage, les descripteurs de fonctionnalités de bas niveau.


Comment vous en bénéficierez


(I) Informations et validations sur les éléments suivants sujets :


Chapitre 1 : Visual Word


Chapitre 2 : Code


Chapitre 3 : Récupération d'informations


Chapitre 4 : Segmentation d'images


Chapitre 5 : Résumation automatique


Chapitre 6 : Analyse sémantique latente


Chapitre 7 : Récupération d'images basée sur le contenu


Chapitre 8 : N -gram


Chapitre 9 : Matrice de termes de document


Chapitre 10 : Recherche en texte intégral


(II) Répondre aux principales questions du public sur les mots visuels.


(III) Exemples concrets d'utilisation de mots visuels dans de nombreux domaines.


À qui s'adresse ce livre


Professionnels, Les étudiants de premier cycle et des cycles supérieurs, les passionnés, les amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type de mot visuel.


 


 

LangueFrançais
Date de sortie4 mai 2024
Mot visuel: Libérer la puissance de la compréhension des images

En savoir plus sur Fouad Sabry

Auteurs associés

Lié à Mot visuel

Titres dans cette série (100)

Voir plus

Livres électroniques liés

Intelligence (IA) et sémantique pour vous

Voir plus

Articles associés

Avis sur Mot visuel

Évaluation : 0 sur 5 étoiles
0 évaluation

0 notation0 avis

Qu'avez-vous pensé ?

Appuyer pour évaluer

L'avis doit comporter au moins 10 mots

    Aperçu du livre

    Mot visuel - Fouad Sabry

    Mot visuel

    Libérer le pouvoir de la compréhension de l'image

    Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.

    Un milliard de connaissances

    Mot visuel

    Libérer le pouvoir de la compréhension de l'image

    Fouad Sabry

    Copyright

    Visual Word © 2024 par Fouad Sabry. Tous droits réservés.

    Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.

    Couverture dessinée par Fouad Sabry.

    Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.

    Table des matières

    Chapitre 1 : Visual Word

    Chapitre 2 : Code

    Chapitre 3 : Recherche d'information

    Chapitre 4 : Segmentation d'images

    Chapitre 5 : Récapitulatif automatique

    Chapitre 6 : Analyse sémantique latente

    Chapitre 7 : Récupération d'images basée sur le contenu

    Chapitre 8 : n-gramme

    Chapitre 9 : Matrice document-terme

    Chapitre 10 : Recherche en texte intégral

    Appendice

    À propos de l'auteur

    Chapitre 1 : Visual Word

    Les mots visuels, tels qu'ils sont utilisés dans les systèmes de récupération d'images, font référence à de courtes parties d'une image qui contiennent des informations sur les caractéristiques (telles que la couleur, la forme ou la texture) ou les changements dans les pixels, tels que le filtrage, les descripteurs de caractéristiques de bas niveau (SIFT ou SURF).

    Méthodologies du système de recherche de texte (ou système de recherche d'information)

    Considérez que les pixels d'une image, qui sont les plus petites parties d'une image numérique et ne peuvent pas être divisés davantage, sont similaires aux lettres alphabétiques d'une langue. Ensuite, un groupe de pixels à l'intérieur d'une image (un patch ou des tableaux de pixels) constitue un mot. Ensuite, chaque mot peut être retraité au sein d'un système morphologique pour récupérer un terme apparenté. Ensuite, plusieurs mots ayant le même sens feront référence au même concept (comme dans n'importe quelle langue). De nombreux mots partagent le même sens et constituent la même phrase (ont la même information). Dans cette perspective, les chercheurs peuvent adapter les techniques de recherche de texte aux systèmes de recherche d'images.

    Cette approche peut être appliquée aux jeux afin de déterminer quels mots et phrases apparaîtront dans nos visuels. L'objectif est de tenter de comprendre les images à l'aide d'un vocabulaire de « mots visuels ».

    Petite région d'une image qui peut inclure n'importe quelle information dans n'importe quel espace caractéristique, telle que les changements de couleur ou de texture.

    D'une manière générale, les mots visuels (VW) existent dans un espace de caractéristiques de valeurs continues, impliquant un grand nombre de mots et, par conséquent, un vaste langage. Étant donné que les systèmes de récupération d'images doivent utiliser des techniques de récupération de texte en fonction des langues naturelles, qui ont une limite sur le nombre de termes et de mots, le nombre de mots visuels doit être réduit.

    Il existe de nombreuses façons de résoudre ce problème, telles que le partitionnement de l'espace des entités en plages avec des entités partagées (qui peuvent être considérées comme le même mot). Cependant, cette technique présente de nombreux défauts, notamment la stratégie de division et l'étendue de la gamme dans l'espace des fonctionnalités. L'utilisation d'une méthode de regroupement pour classer et fusionner des mots véhiculant des informations communes en un nombre fini de termes est une autre solution présentée par les chercheurs.

    Conséquence de l'agrégation dans l'espace des entités (centres des agrégats). Plusieurs patchs peuvent fournir les informations les plus proches dans l'espace des caractéristiques, nous pouvons donc les considérer comme équivalents.

    Étant donné que le terme dans un texte (le verbe à l'infini, les noms et les articles) fait référence à de nombreux mots courants ayant les mêmes propriétés, le terme visuel (avec son résultat d'agrégation) fera référence à tous les mots courants qui partagent les mêmes informations dans un espace de caractéristiques.

    Enfin, si toutes les images correspondent au même ensemble de concepts visuels, alors elles peuvent toutes communiquer dans le même langage (ou langage visuel).

    Une collection de mots et de phrases visuels.

    Si l'on ne considère que les termes visuels, c'est le « vocabulaire visuel » qui sera le système de référence et de récupération qui en dépendra pour récupérer les images.

    Ce langage visuel représentera toutes les images sous la forme d'une collection de mots visuels, ou d'un sac de mots visuels.

    Ensemble de mots visuels qui, ensemble, expliquent la signification d'une partie ou de l'ensemble de l'image.

    Sur la base de ce type de représentation d'images, il est possible de créer un système de récupération d'images en utilisant des techniques de recherche de texte. Néanmoins, étant donné que tous les systèmes de recherche de texte reposent sur des termes, les images de requête de l'utilisateur doivent être transformées en une collection de mots visuels dans le système. Le système comparera ensuite ces termes visuels avec tous les termes visuels de la base de données.

    {Fin du chapitre 1}

    Chapitre 2 : Code

    Aux fins de la communication et du traitement de l'information, un code est un ensemble de principes qui transforme l'information, telle qu'une lettre, un mot, un son, une image ou un geste, en une autre forme, parfois plus courte ou secrète, pour être stockée sur un périphérique de stockage ou pour être transmise sur un canal de communication. Un exemple précoce est le développement du langage, qui a permis aux gens d'exprimer verbalement ce qu'ils pensaient, voyaient, entendaient ou ressentaient aux autres. Cependant, la prise de parole restreint l'auditoire à ceux qui sont présents au moment où le discours est prononcé et limite la portée de la communication à la distance qu'une voix peut parcourir. L'avènement de l'écriture, qui a transformé la communication verbale en symboles visuels, a augmenté le potentiel de communication dans le temps et à distance.

    L'encodage est le processus de transformation des données d'une source en symboles pour la transmission ou le stockage. La procédure inverse, connue sous le nom de décodage, consiste à traduire les symboles du code dans une langue que le destinataire peut comprendre, comme l'anglais et/ou l'espagnol.

    Le codage est utilisé pour faciliter la communication dans des situations où il serait difficile ou impossible de le faire en utilisant un langage clair et simple, verbalement ou par écrit. Par exemple, le sémaphore crypte des parties du message, généralement des caractères et des chiffres uniques, en utilisant la disposition des drapeaux tenus par le signaleur ou les bras de la tour du sémaphore. Les drapeaux peuvent être lus par quelqu'un de loin, et ils peuvent répéter les messages envoyés.

    Un code est généralement considéré en théorie de l'information et en informatique comme une méthode qui représente discrètement les symboles d'un alphabet source par des chaînes codées, qui peuvent être dans un alphabet cible différent. La concaténation des chaînes codées produit une extension du code pour l'encodage des séquences de symboles dans l'alphabet source.

    Il s'agit d'un petit exemple avant de fournir une définition mathématiquement exacte. Le schéma

    C = \{\, a\mapsto 0, b\mapsto 01, c\mapsto 011\,\}

    le code, dont l'alphabet source est l'ensemble \{a,b,c\} et dont l'alphabet cible est l'ensemble \{0,1\} .

    À l'aide de l'extension du code, la chaîne codée 0011001 peut être regroupée en mots de code comme 0 011 0 01, et ceux-ci peuvent à leur tour être utilisés pour décoder l'ordre des symboles d'origine, acab.

    En utilisant des concepts de la théorie du langage formel, ce qui suit est une définition mathématique détaillée de cette idée : S et T devraient être deux ensembles finis, des alphabets connus respectivement sous le nom de source et de cible.

    Un code C:\, S \to T^* est une fonction totale qui mappe chaque symbole de S à une séquence de symboles sur T.

    L'extension C' de C , est un homomorphisme de S^{*} en T^{*} , Elle convertit automatiquement chaque ensemble de symboles source en un ensemble

    Vous aimez cet aperçu ?
    Page 1 sur 1