Analyse et représentation documentaires: Introduction à l'indexation, à la classification et à la condensation des documents
Par Michèle Hudon
3/5
()
À propos de ce livre électronique
Lié à Analyse et représentation documentaires
Livres électroniques liés
Les GENRES DE DOCUMENTS DANS LES ORGANISATIONS: Analyse théorique et pratique Évaluation : 0 sur 5 étoiles0 évaluationL' archivistique à l'ère du numérique: Les éléments fondamentaux de la discipline Évaluation : 0 sur 5 étoiles0 évaluationLes Fonctions de l'archivistique contemporaine Évaluation : 0 sur 5 étoiles0 évaluationTypologie des documents des organisations, 2e édition: De la création à la conservation Évaluation : 5 sur 5 étoiles5/5Panorama de l'archivistique contemporaine: évolution de la discipline et de la profession: Mélanges offerts à Carol Couture Évaluation : 0 sur 5 étoiles0 évaluationGuide de la recherche documentaire Évaluation : 0 sur 5 étoiles0 évaluationEmploi et gestion des ressources humaines dans l'économie du savoir Évaluation : 0 sur 5 étoiles0 évaluationGuide méthodologique universitaire: Un programme en 12 semaines Évaluation : 0 sur 5 étoiles0 évaluationL' Analyse de l'enseignement Évaluation : 0 sur 5 étoiles0 évaluationLa Planification stratégique à l'université: 2e édition Évaluation : 0 sur 5 étoiles0 évaluationTypologie des dossiers des organisations: Analyse intégrée dans un contexte analogique et numérique Évaluation : 0 sur 5 étoiles0 évaluationConcepts et outils des sondages Web: Introduction à LimeSurvey et SurveyMonkey Évaluation : 0 sur 5 étoiles0 évaluationFouille de Données Complexes Évaluation : 0 sur 5 étoiles0 évaluationLes RECHERCHES PARTENARIALES ET COLLABORATIVES Évaluation : 0 sur 5 étoiles0 évaluationLe Savoir à domicile: Pédagogie et problématique de la formation à distance Évaluation : 0 sur 5 étoiles0 évaluationAccroître le transfert des apprentissages: Vers de nouvelles connaissances, pratiques et expériences Évaluation : 0 sur 5 étoiles0 évaluationIntroduction à la méthodologie de la pensée écrite: Édition revue et corrigée Évaluation : 0 sur 5 étoiles0 évaluationL'adulte en formation... pour devenir soi: Espaces, passages, débats et défis Évaluation : 0 sur 5 étoiles0 évaluationExtraction et Gestion des Connaissances: Actes de la conférence EGC'2018 Évaluation : 0 sur 5 étoiles0 évaluationConduite d'une étude de besoins en éducation et en formation: Une approche systémique Évaluation : 0 sur 5 étoiles0 évaluationConstruire des grilles d'évaluation descriptives au collégial: Guide d'élaboration et exemples de grille Évaluation : 0 sur 5 étoiles0 évaluationConception des systèmes - Pilotage, informations et risques: Méthode "Maze", une méthode pour sortir du labyrinthe de la complexité Évaluation : 0 sur 5 étoiles0 évaluationIntervention technoclinique dans le secteur des services sociaux: Enjeux cliniques et organisationnels Évaluation : 0 sur 5 étoiles0 évaluationL'analyse des pratiques professionnelles dans les métiers relationnels: Perspectives plurielles Évaluation : 0 sur 5 étoiles0 évaluationClassification des documents numériques dans les organismes: Impact des pratiques classificatoires personnelles sur le repérage Évaluation : 0 sur 5 étoiles0 évaluationLe TABLEAU NUMERIQUE INTERACTIF: Quand chercheurs et praticiens s'unissent pour dégager des pistes d'action Évaluation : 0 sur 5 étoiles0 évaluationApprendre par l'expérience active et située Évaluation : 0 sur 5 étoiles0 évaluationLa recherche en communication: Éléments de méthodologie Évaluation : 0 sur 5 étoiles0 évaluationL' évaluation de programme axée sur le jugement crédible Évaluation : 0 sur 5 étoiles0 évaluationAnalyse d’impact réglementaire (AIR): Balises méthodologiques pour mieux évaluer les réglementations Évaluation : 0 sur 5 étoiles0 évaluation
Affaires pour vous
Développer son intelligence émotionnelle: Conseils pour mettre ses émotions à contribution Évaluation : 5 sur 5 étoiles5/5Comment prendre une bonne décision Évaluation : 4 sur 5 étoiles4/5L’art de la conversation : Comment parler à tout le monde et construire rapidement des liens en 30 étapes faciles Évaluation : 4 sur 5 étoiles4/5Le plan marketing en 4 étapes: Stratégies et étapes clés pour créer des plans de marketing qui fonctionnent Évaluation : 0 sur 5 étoiles0 évaluationCes 5 investissements que tout le monde devrait faire (pour ne plus dépendre de son salaire) - Introduction : Pourquoi est-il urgent d'investir ? Évaluation : 0 sur 5 étoiles0 évaluationLa loi de Pareto: La règle des 80/20 Évaluation : 4 sur 5 étoiles4/5Les tableaux de bord et business plan: Gérer la comptabilité de son entreprise Évaluation : 4 sur 5 étoiles4/5Père riche, père pauvre de Robert Kiyosaki (Book Review): L’éducation financière selon un millionnaire Évaluation : 5 sur 5 étoiles5/5Business Model Canvas: Élaborer une stratégie de développement Évaluation : 5 sur 5 étoiles5/5La méthode Six Sigma: La culture de la perfection Évaluation : 5 sur 5 étoiles5/5Négociation en 4 étapes: Comment négocier dans des situations difficiles, du conflit à l'accord dans les affaires et la vie quotidienne Évaluation : 0 sur 5 étoiles0 évaluationComment réaliser une étude de marché ?: Lancez votre projet d’entreprise en toute connaissance de cause Évaluation : 5 sur 5 étoiles5/5La règle du 10 X Évaluation : 5 sur 5 étoiles5/5La chaîne de valeur de Porter: Identifier la création de valeur Évaluation : 5 sur 5 étoiles5/5Le tableau de bord prospectif: Les 4 composantes essentielles pour une stratégie d'entreprise à long terme Évaluation : 0 sur 5 étoiles0 évaluationEn as-tu vraiment besoin ? Évaluation : 4 sur 5 étoiles4/5La prise de décisions en 4 étapes: Stratégies et étapes opérationnelles pour une prise de décision et un choix efficaces dans des contextes incertains Évaluation : 0 sur 5 étoiles0 évaluationJe monte ma SCI !: Le guide pour bâtir son patrimoine immobilier en réduisant ses impôts Évaluation : 5 sur 5 étoiles5/5Les 5 forces de Porter: Comprendre les sources des avantages concurrentiels Évaluation : 5 sur 5 étoiles5/5
Avis sur Analyse et représentation documentaires
2 notations0 avis
Aperçu du livre
Analyse et représentation documentaires - Michèle Hudon
apprendre.
Avant-propos
présent ouvrage est une introduction aux opérations, aux outils et aux produits principaux de l’analyse et de la représentation des sujets dont traitent les documents . Nous y évoquons d’abord les besoins et les comportements des usagers des systèmes d’information contemporains . Nous décrivons ensuite les opérations d’indexation, de classification et de rédaction de résumés qui facilitent le repérage et l’accès aux documents pertinents aux besoins de l’usager . Bien que certaines notions théoriques fondamentales soient présentées, l’essentiel du contenu est plutôt de nature pratique ; nous décrivons les objectifs à atteindre, la séquence des opérations, les outils à développer, à tenir à jour et à utiliser.
Cet ouvrage est donc conçu comme un manuel plutôt que comme un traité. Il s’inspire largement d’un Recueil de notes et d’exercices préparé par l’auteure en 1994 et mis à jour chaque année jusqu’en 2008 ; ce recueil a été distribué aux cohortes successives d’étudiants du programme de maîtrise en sciences de l’information (MSI) de l’École de bibliothéconomie et des sciences de l’information (EBSI) de l’Université de Montréal . L’auditoire visé ici est d’abord celui des futurs spécialistes de l’analyse et de la représentation de l’information et des documents, en formation dans les programmes d’études collégiales et universitaires . Nous croyons aussi que les professionnels et les techniciens en exercice pourront utiliser ce manuel comme aide-mémoire pour ramener à l’avant-plan des éléments de connaissance oubliés, ignorés, ou parfois mal interprétés dans l’urgence des obligations quotidiennes .
Plusieurs ouvrages généraux portant sur l’analyse documentaire sont proposés à nos collègues professionnels et enseignants anglophones, ainsi qu’aux étudiants en sciences de l’information dans les universités et collèges nord-américains et britanniques . Certains de ces ouvrages en sont à leur troisième ou quatrième édition ; notre domaine d’activité a évolué très rapidement entre 1980 et 2010, ce qui a entraîné la mise à jour de manuels à la réputation solidement établie¹. Ces ouvrages sont utiles à la préparation de cours portant sur l’analyse documentaire, mais ils ne peuvent guère être utilisés comme matériel d’apprentissage dans un environnement francophone en raison de différences contextuelles marquées et de la barrière de la langue. Du côté de la France et de la Belgique, il n’existe pas d’ouvrage pratique couvrant l’ensemble des opérations du traitement analytique ; les quelques titres qui abordent ce domaine d’activité le font d’un point de vue théorique et sont plus utiles à la préparation de travaux de réflexion et de recherche² .
Le domaine de l’analyse et de la représentation documentaires est vaste et il n’est ni possible ni même souhaitable, dans un manuel comme celui-ci, d’explorer en profondeur la totalité de son territoire . Nous avons choisi d’axer notre présentation sur les opérations d’analyse, les langages utilisés pour représenter les sujets, les politiques et les normes, le contrôle de qualité et les répercussions sur la recherche d’information et de documents. L’accent est mis sur les éléments de connaissance jugés fondamentaux pour l’exercice de toute profession liée à la documentation. La présentation d’applications particulières se limite à ce qui est offert en exemple ; les applications sont trop nombreuses, variées et changeantes pour qu’il soit justifié de les décrire dans un ouvrage de base dont le contenu, nous l’espérons, restera pertinent pendant plusieurs années .
Si les principes et les méthodes d’analyse et de représentation des documents textuels sont au cœur de l’ouvrage, c’est que c’est pour traiter les documents textuels que se sont développés et raffinés les techniques et les langages servant à la représentation des contenus . Ces techniques et ces langages sont désormais utilisés dans des environnements autres que la bibliothèque ou le centre d’archives traditionnels pour traiter d’autres types de documents (les images, par exemple) et d’autres formats (les formats numériques entre autres). Les principes, les méthodes et les outils d’analyse documentaire ont une longue histoire et des fondements théoriques et pratiques solides ; de plus, ils s’adaptent bien au numérique et au virtuel .
Les opérations de traitement documentaire sont complexes et coûteuses et leur utilité réelle est régulièrement remise en question. On ne peut nier que les avancées de la technologie permettent souvent la satisfaction des besoins de l’usager sans qu’il y ait nécessité d’une analyse approfondie. De plus, cette même technologie se révèle de plus en plus habile à accomplir des tâches autrefois réservées à l’analyste humain, l’indexation ou la classification, par exemple, avec des résultats acceptables . Une bonne connaissance des fondements théoriques et pratiques de l’analyse documentaire et la capacité de concevoir des réseaux sémantiques solides qui pourront être exploités par un moteur de recherche restent cependant essentielles aux gestionnaires de systèmes d’information et d’institutions documentaires .
Les questions d’ordre strictement technologique liées à la modélisation, à l’encodage et à la manipulation informatique des données résultant de l’analyse documentaire ne sont pas traitées dans ce manuel. De même, les logiciels de gestion de catalogues et de bases de données et les interfaces d’interrogation et de visualisation des résultats sont évoqués mais non décrits en détail .
L’ordre de présentation des chapitres et des éléments de connaissance liés à l’analyse et à la représentation documentaires n’est pas nécessairement celui dans lequel les opérations s’effectuent dans la réalité, ni même celui dans lequel la matière doit nécessairement être présentée dans un cadre de formation . Il n’existe pas d’ordre idéal et la structure que nous avons choisie reste subjective et perfectible. Les chapitres peuvent être utilisés indépendamment les uns des autres et un réseau de renvois permet de modifier ou d’enrichir le parcours de lecture proposé . Dans cet ouvrage à visée pédagogique, on comprendra qu’une certaine redondance soit tolérée. Pour faciliter l’utilisation du manuel par les étudiants et les non-spécialistes, un glossaire de termes spécialisés et un index des sujets traités sont inclus. Le manuel ne propose pas d’exercices pratiques mais nous y avons intégré de nombreux tableaux, figures et exemples qui pourront servir de base de discussion et d’apprentissage. Une bibliographie sélective et une liste de sites Web pertinents permettront au lecteur de parfaire ses connaissances et d’approfondir le domaine de l’analyse et de la représentation documentaires .
Comme c’est le cas dans plusieurs disciplines des sciences sociales, la terminologie des sciences de l’information est loin d’être normalisée. Nous avons fait un effort conscient pour contrôler l’usage de certains termes, que le lecteur pourrait toutefois rencontrer ailleurs avec une signification légèrement différente. Précisons que nous considérons comme synonymes les termes documents et ressources documentaires, définis globalement comme tout support ou contenant, physique ou numérique, sur ou dans lequel l’information est enregistrée . Par ailleurs, les termes système d’information et service d’information sont utilisés pour désigner toute infrastructure (informatique, institutionnelle, etc .) qui permet à l’individu en quête d’information de localiser celle-ci .
1 . Nous pensons par exemple aux ouvrages de L . M . Chan, Cataloging and Classification : An Introduction, 3e éd ., 2007, de A . G . Taylor et D . Joudrey, The Organization of Information, 3e éd ., 2009, et de J . Rowley et R . Hartley, Organizing Knowledge : An Introduction to Managing Access to Information, 4e éd ., 2008 .
2 . Nous pensons, par exemple, aux ouvrages de P. Lefèvre, La recherche d’information : du texte intégral au thésaurus, 2000, et de J. Maniez, Actualité des langages documentaires : fondements théoriques de la recherche d’information, 2002 . L’ouvrage de S . Waller et C . Masse, L’analyse documentaire : une approche méthodologique, 1999, est moins théorique, mais très centré sur des pratiques documentaires exclusives à la France .
L’usager face
au système d’information
La notion de bibliothèque est fondée sur un malentendu, à savoir que l’on irait à la bibliothèque pour chercher un livre dont on connaît le titre. C’est vrai que cela arrive souvent mais la fonction essentielle de la bibliothèque […] c’est de découvrir des livres dont on ne soupçonnait pas l’existence et dont on découvre qu’ils sont pour nous de la plus grande importance.
Umberto ECO, 1986, p . 22
omme tout être vivant, l’humain a besoin d’information pour survivre, pour apprendre et pour évoluer. Une information peut être qualifiée de « naturelle » lorsqu’elle est acquise et utilisée rapidement, instinctivement et souvent inconsciemment, en réaction à un événement ou à un danger par exemple. Mais l’être humain a aussi besoin d’information traitée, structurée et emmagasinée, pour analyser et comprendre une situation, planifier une intervention, améliorer ses conditions de vie et son environnement, etc. Pour l’aider à combler ce besoin, des ouvrages de référence et des outils de repérage d’information plus ou moins performants lui ont été proposés au fil du temps, de l’encyclopédie universelle au bottin téléphonique, du guide touristique aux bases de données factuelles, du catalogue de bibliothèque à Google. Alors que la première catégorie d’outils fournit le renseignement demandé (le bottin téléphonique et le guide touristique, par exemple), la deuxième catégorie d’instruments de recherche recense plutôt les sources au sein desquelles se trouve probablement l’information requise (le catalogue de bibliothèque ou l’index de périodiques, par exemple). Notons que cette distinction existe aussi dans des systèmes d’information poursuivant des objectifs différents .
L’usager d’un système d’information doit combler un manque. Il peut avoir besoin de données ou de renseignements précis pour répondre à une question bien définie, pour accomplir une tâche ou pour prendre une décision. Son besoin d’information est évidemment beaucoup plus englobant et complexe lorsqu’il est en processus d’apprentissage formel ou qu’il veut enrichir ses connaissances par nécessité ou par intérêt. Le besoin d’information peut être ponctuel ou récurrent, strictement utilitaire ou récréatif.
La mission du service d’information est de fournir à l’usager l’information dont il a besoin ou qu’il désire obtenir, au moment opportun, sous une forme qui lui est accessible et à un coût raisonnable. Examinons brièvement chacune des composantes de cette mission .
L’information
Tout comme Buckland (1991), nous considérons ici l’information comme une entité plutôt que comme un processus ; l’information est un renseignement, un élément de connaissance, une donnée. Il existe plusieurs façons de fournir à l’usager l’information dont il a besoin. On peut lui offrir directement le renseignement demandé ou encore le diriger vers la source au sein de laquelle il pourra localiser l’information requise. On peut le laisser seul juge de la pertinence de l’information repérée ou encore lui proposer une synthèse critique des éléments d’information requis . On peut l’encourager à explorer lui-même le système d’information, avec ou sans formation préalable, ou le faire plutôt bénéficier des services d’un intermédiaire qui interrogera le système à sa place et ne lui communiquera que les résultats les plus intéressants .
Le moment
Dans un service d’information, la prise en compte du facteur temps est essentielle . La majorité des usagers en quête d’information ont à satisfaire un besoin immédiat. L’information doit être accessible au moment où elle est requise et elle doit être offerte sur demande. On peut aussi proposer une information pertinente à l’usager avant même que celui-ci n’en ait exprimé le besoin ; cette façon de faire est plus courante dans les milieux documentaires spécialisés, où les besoins sont récurrents et bien définis . Il faut tenir compte également de l’évolution du besoin d’information d’un même usager en fonction du degré d’avancement de sa réflexion ou de son travail ; l’information requise au début d’un projet, même si elle reste pertinente, n’est souvent plus jugée essentielle lors des étapes subséquentes .
La forme
L’information doit être fournie à l’usager sous une forme qui en permet l’utilisation . Cela peut signifier la sélection de renseignements ou de documents dans une langue particulière ou dans un style de présentation particulier. Cela peut vouloir dire aussi que le système doit idéalement offrir des sources ayant adopté un point de vue particulier. Et, de façon très pratique, cela veut dire enfin que l’usager doit obtenir l’information sur un support qu’il est capable de « lire », le cas échéant, sans l’intermédiaire d’une technologie qui lui serait inconnue ou ne serait pas accessible.
Le coût
L’usager doit obtenir l’information dont il a besoin au coût le plus avantageux possible. On parle ici du coût en espèces sonnantes, bien sûr, mais également de la dépense « intellectuelle » liée à la recherche et à l’obtention de l’information. Le temps et l’effort requis pour l’obtention d’un renseignement, le repérage des documents potentiellement utiles et l’examen de ceux-ci pour en extraire les éléments de connaissance pertinents doivent en effet être comptabilisés . On sait que l’usager se satisfera d’une information ou d’un document de moindre qualité quand l’effort requis pour trouver et localiser des sources de qualité supérieure est jugé trop considérable, un phénomène naturel que Mann (1993) associe à la loi universelle du moindre effort et dont témoigne clairement le comportement informationnel des étudiants d’aujourd’hui (Fast et Campbell, 2004).
Pour répondre aux besoins des usagers, mais aussi pour leurs propres besoins de gestion, les institutions documentaires traditionnelles ont formalisé une chaîne d’opérations interdépendantes et à l’ordre d’exécution quasi immuable :
identification des documents (numérotation normalisée, contrôle bibliographique) ;
sélection des documents à acquérir ;
acquisition des documents sélectionnés ;
description des documents acquis (catalogage et contrôle d’autorité) ;
analyse et représentation du contenu des documents acquis (indexation, classification) ;
préparation matérielle et intégration des documents acquis à la collection ;
production et gestion d’instruments de repérage et de localisation (catalogues, index, bulletins de résumés) ;
promotion, diffusion et exploitation des documents acquis (service de bibliographie, de prêt, de référence, de diffusion sélective, etc .) ;
élagage ou transfert en dépôt permanent de documents acquis .
Grâce à ces opérations et aux instruments de recherche mis à sa disposition, l’usager peut :
localiser un document dont le titre ou le nom du créateur (ou les deux) lui est connu, en utilisant comme clé de recherche un nom de personne ou d’organisme, un titre intégral ou les mots significatifs d’un titre ;
repérer et localiser un document dont ni le titre ni le nom du créateur ne lui sont connus, en utilisant comme clé de recherche un ou plusieurs termes représentant une thématique ou un sujet précis .
L’automatisation des opérations de gestion documentaire, la flexibilité de la recherche dans les bases de données, l’expansion de réseaux d’information numérique accessibles à tous et la transformation de l’information en bien de consommation ont considérablement modifié non seulement l’environnement et les paramètres de la recherche d’information et de documents, mais également les attentes et les comportements des usagers . L’abolition virtuelle des frontières institutionnelles, géographiques et géopolitiques place l’usager d’aujourd’hui devant des collections de documents dont il ne peut même pas soupçonner l’étendue et la profondeur. Dans cet environnement, le service d’information peine à accomplir sa mission et reconnaît que la chaîne documentaire traditionnelle est de moins en moins pertinente, même là où la collection institutionnelle conserve son utilité et sa popularité, comme c’est le cas dans les bibliothèques publiques, par exemple. L’époque est à la collaboration, à l’interopérabilité, à la normalisation et surtout à la délocalisation des collections et des opérations de traitement .
L’usager, à qui l’on expliquait volontiers il n’y a pas si longtemps les rouages du catalogue ou de l’index de l’institution à laquelle il était rattaché (et peut-être aussi « attaché »), est désormais souvent laissé à lui-même devant une masse de données, d’information et de documents . C’est pour lui un redoutable défi, d’une part, d’y localiser l’information dont il a besoin et, d’autre part, de s’assurer de la fiabilité de celle-ci puisqu’elle peut n’avoir fait l’objet d’aucune sélection, analyse ou évaluation.
Comme il devient de plus en plus difficile pour l’usager de repérer un document par son titre ou par le nom de la personne ou de l’organisme qui l’a créé et rendu disponible, la recherche par sujet reste la plus sollicitée, comme c’était déjà le cas, soulignons-le, dans les catalogues et les index traditionnels. Or la recherche par sujet est la plus complexe et la moins efficace, peu importe l’environnement au sein duquel elle est menée.
Deux niveaux de difficulté ont un effet direct sur l’efficacité de la recherche par sujet . Premièrement, il n’est pas toujours facile pour l’usager de définir précisément son besoin d’information sous forme de sujets et, plus précisément encore, de concepts et de relations à établir entre ces concepts . Deuxièmement, même si l’usager arrive à délimiter précisément le sujet auquel il s’intéresse, il doit encore en nommer correctement chacune des facettes, à l’aide des mots de la langue naturelle, de codes ou de symboles, avant de soumettre sa requête au système d’information. Les particularités de la langue naturelle et la nécessité de connaître la signification des codes ou des symboles à utiliser sont des obstacles de taille à la réussite de l’entreprise .
Les milieux documentaires traditionnels, conscients des difficultés de la recherche par sujet, ont mis des siècles à développer des moyens de les contourner, notamment par la création de règles et de procédures visant à systématiser et à normaliser l’analyse des contenus et par l’utilisation de langages artificiels, dits langages documentaires, destinés à faciliter le transfert d’information au sein de systèmes manuels d’abord, automatisés ensuite . Leurs efforts n’ont jamais permis la pleine satisfaction des besoins, même après l’arrivée d’une première génération de catalogues en ligne (OPAC) dans la seconde moitié du XXe siècle ; ces nouveaux catalogues n’offraient encore que trop peu de flexibilité pour permettre à l’usager d’exploiter des langages documentaires complexes sans en bien comprendre d’abord la structure et le fonctionnement .
Les instruments de recherche traditionnels et les premiers systèmes automatisés tenaient compte de besoins n’ayant guère varié au fil du temps, mais négligeaient le comportement informationnel de l’usager ordinaire . L’usager veut avant tout qu’il soit facile, rapide et efficace de chercher et d’obtenir des résultats pertinents ; il se montre généralement peu intéressé à comprendre le fonctionnement des systèmes et des outils et n’utilise que rarement leurs fonctions les plus avancées. Il cherche la précision plus souvent que le rappel. L’usager en quête de précision ne veut pas nécessairement la meilleure ressource disponible ; il est satisfait si les quelques documents qui lui sont proposés fournissent une réponse à sa question. À l’opposé, l’usager en quête de rappel doit, pour combler son besoin, récupérer le plus grand nombre possible de ressources pertinentes et il ne reculera pas devant la nécessité d’examiner un grand nombre de documents qui, au final, se révéleront sans intérêt s’il s’assure ainsi de repérer le plus grand nombre possible de ressources pertinentes disponibles. Le besoin de rappel est caractéristique des environnements spécialisés et des milieux de recherche ; dans ces milieux, il s’avère souvent essentiel d’établir l’état exact des connaissances et des développements dans un domaine à un moment précis .
En mettant l’accent sur la normalisation, la systématisation et le regroupement, les systèmes d’information traditionnels ont davantage favorisé le rappel de ressources pertinentes que la précision du repérage. Les concepteurs des nouveaux environnements de recherche, sur le Web notamment, misent plutôt sur la précision de la recherche par sujet . Même si à première vue le moteur de recherche Google peut donner l’impression inverse, avec ses dizaines de milliers de liens offerts en réponse à toute requête peu complexe, c’est la pertinence des premiers liens offerts qui satisfont presque toujours un besoin d’information précise qu’il faut considérer. Les milieux traditionnels cherchent à appliquer ces nouveaux modèles pour exploiter la richesse des métadonnées accumulées au fil des ans et des générations successives de bases de données bibliographiques. Ce faisant, elles modifient les visées de leurs opérations de traitement documentaire, les relocalisant nettement dans une perspective de service à l’usager, de découverte et de facilitation du repérage plutôt que, comme ce fut le cas par le passé, dans une perspective de gestion, d’inventaire et de contrôle. Il y a un peu plus d’un siècle, Charles Cutter (1837-1903) recommandait des systèmes accessibles à l’usager et qui tiennent compte de la façon dont celui-ci voyait le monde et en nommait les diverses entités (1904) ; le temps et la technologie aidant, il semble que les spécialistes du traitement documentaire aient enfin intégré à leurs pratiques la notion de service et du « meilleur intérêt » de l’usager.
Peu importe que le traitement soit effectué par un analyste humain ou par un logiciel performant, la qualité du repérage reste tributaire de la qualité de l’analyse et des langages de représentation, ainsi que de la facilité qu’a l’usager d’interagir avec le système d’information. Mais en dépit de l’évolution des pratiques et du soin apporté à l’analyse et à la représentation des contenus, certains problèmes persistent et on sait que la proportion d’usagers totalement satisfaits reste bien en deçà de celle à laquelle il faut aspirer. Si plusieurs difficultés sont liées aux comportements de l’usager lui-même, à sa mauvaise utilisation des instruments de repérage par exemple, plusieurs problèmes sont plutôt dus à la conception et à la gestion de ces instruments . Parmi les problèmes signalés le plus souvent, citons :
les délais de traitement injustifiables ;
la qualité très variable des analyses ;
le nombre restreint d’éléments descriptifs du contenu dans la notice bibliographique d’un document ;
la trop grande généralité ou l’ambiguïté des formes de représentation des éléments de contenu ;
la complexité des langages de représentation et de recherche d’information ;
l’absence de traitement évaluatif ou critique ;
la complexité de certains instruments de repérage (dont les catalogues de bibliothèque).
Il convient de souligner cependant l’accélération récente du mouvement d’intégration de nouvelles métadonnées et de nouvelles fonctionnalités aux systèmes traditionnels de recherche d’information . Au nombre des innovations visant à améliorer le résultat de la recherche et à accroître le degré de satisfaction des usagers, notons :
l’exploitation d’un nombre et d’une variété sans cesse croissants d’éléments de description du contenu utilisables au moment de la recherche (une table des matières, un résumé informatif ou le texte d’un avant-propos, par exemple) ;
l’exploitation par le système d’information, plutôt que par l’usager lui-même, des réseaux de relations sémantiques qui structurent les langages documentaires ;
les efforts considérables consacrés à la présentation et à la réutilisation des résultats d’une recherche ;
des fonctionnalités raffinées de relance d’une recherche à l’aide d’éléments (une vedette-matière ou un indice de classification, par exemple) extraits de la description du contenu d’un document déjà examiné et jugé pertinent ;
l’amélioration des méthodes de formation des usagers à l’établissement de stratégies de recherche performantes et à l’utilisation des interfaces de recherche .
Plus récemment encore, l’avènement du Web participatif a permis pour la première fois à l’usager d’annoter la description du contenu d’un document et d’y ajouter ses propres descripteurs pour en faciliter le repérage ultérieur et la réutilisation, ce qui a permis à certains d’annoncer l’ère du système d’information personnalisé . Les méthodes les plus courantes d’évaluation de l’efficacité des systèmes d’information ne permettent pas encore de déterminer si de tels ajouts contribuent de façon significative à l’amélioration de la performance des systèmes et de la qualité des résultats .
Introduction générale
à l’analyse documentaire
L’un des défis principaux de la représentation et de l’organisation de l’information est que celle-ci n’a pas de signification propre ; sa signification est celle que lui donne une personne dans un contexte particulier. Les analystes doivent donc deviner les significations possibles et la thématique à laquelle l’usager rattachera une information. De leur côté, les usagers font face à une situation aussi difficile. Ils doivent tenter de décrire le contenu du document dont ils ont besoin, et donc souvent de décrire une chose qu’ils ne connaissent pas encore [traduction libre].
Jens-Erik MAI, 2008, p . 18
présent chapitre propose un survol rapide du processus d’analyse documentaire . Nous y définissons d’abord la nature et les fonctions principales du processus avant