Le Thésaurus de l'activité gouvernementale rassemble plusieurs milliers de mots et d'expressions, structurés hiérarchiquement selon des descripteurs allant du général au particulier. Il peut servir à classifier l'information en fonction des cinq facettes retenues pour leur pertinence dans la description de l'activité publique. Domaine, processus, intervenant, clientèle, document sont ces cinq facettes qu'on peut articuler en une phrase pour mieux les comprendre : l'Administration et d'autres intervenants créent des processus à l'intention des clientèles dans de nombreux domaines, souvent au moyen de l'échange de documents. Par rapport à des thésaurus comparables dans les autres Administrations, le nombre total de termes est élevé. L'abondance de termes n'entraîne pas, cependant, une surcharge quand les termes sont indexés et interrogeables. La surcharge ne survient qu'à la lecture alphabétique ou la navigation hiérarchique. Ainsi la portée et la précision n'ont pas à être sacrifiées, dans aucune situation, d'autant plus que la profondeur du thésaurus offre un grand nombre de synonymes favorisant la recherche sur des concepts généraux, ainsi qu'un calcul de la pertinence plus précis, car il permet de ratisser large.
Cependant, la décision peut être prise de classifier les termes selon les descripteurs des trois ou quatre niveaux supérieurs seulement, ce qui limite grandement la quantité de termes. Cette démarche avec un « thésaurus abrégé » est présentée un peu plus loin.
La classification des dossiers et autres documents ainsi que l'accessibilité au contenu en fonction des sujets ou des thèmes sont des besoins habituels des ministères et organismes. Le thésaurus doit être perçu comme un recueil général qu'un ministère ou un organisme doit tenter de mettre à sa main et d'adapter à son contexte en retenant les descripteurs les plus utiles par rapport aux particularités de sa mission. Chacune des cinq facettes de l'activité gouvernementale devrait donc être l'objet d'une mise en contexte ministérielle pour en réduire l'ampleur. Le contenu du thésaurus pourra être adapté au contexte ministériel de la façon suivante.
Le ministère ou l'organisme interroge le contenu du thésaurus pour en extraire la hiérarchie des termes disponibles pour une facette. Il reçoit la liste hiérarchisée complète des termes de ce schème dans un format qui lui permet :
Quand la sélection a été effectuée, que les équivalences ont été établies et que les ajouts ont été insérés dans la liste, l'utilisateur remplit une fiche de métadonnées sur, par exemple, le schème « type de document » afin de l'intégrer au registre central pour en faciliter la gestion, y compris les inévitables versions. Pour les termes et leurs équivalences locales ajoutés par un ministère ou un organisme, l'intégration au mécanisme du thésaurus peut être exclusivement visible aux utilisateurs de ce ministère ou de cet organisme. Ces termes peuvent également être intégrés dans le thésaurus public, sous la responsabilité d'une équipe centrale d'édition et selon leur degré d'intérêt général.
En d'autres mots, le contenu du thésaurus ne sera généralement pas repris intégralement pour la mise au point des schèmes de classification que les ministères utiliseront dans leurs applications. Une sélection est souhaitable à la fois pour réduire le volume des choix et pour ne proposer que ce qui est le plus pertinent dans un ministère donné ou sur un thème donné. En ce sens, le thésaurus est une source de type bibliographique dans laquelle on puise ce dont on a besoin, plutôt qu'une collection de schèmes de classification immuables. La règle de base est d'en respecter la structure hiérarchique générale et les définitions qu'un ministère choisit d'en extraire pour établir ses schèmes de classification ministériels. Pour chaque facette, un schème de classification est constitué, qui permet de délimiter progressivement une dimension sémantique en choisissant le nœud de l'arbre le mieux ajusté :
Pour indexer un document, il faut d'abord reconnaître les concepts principalement traités dans ce document et rattacher les termes significatifs du thésaurus au document. Le recours à un schème de classification permet de contrôler le vocabulaire d'indexation. En conséquence, quand on s'interroge sur le sujet principal d'un document, c'est en se limitant à un certain nombre de concepts contenus dans le schème d'un ministère ou d'un organisme ou d'une subdivision administrative. L'indexation consiste alors à accoler des termes à des documents de telle manière que ces termes soient ceux que pourront utiliser les Québécois (usagers, employés, intervenants) lorsqu'ils formuleront une question auprès des services publics en ligne, en s'aidant occasionnellement de la navigation dans le thésaurus. Le fait d'indexer vise donc à faciliter la recherche éventuelle. Le faire avec un vocabulaire contrôlé, tel qu'un schème de classification, augmente beaucoup l'efficacité de la recherche.
Lors de l'indexation, le choix des mots clés est une activité intellectuelle souvent difficile parce qu'il suppose qu'un système de classification ou un thésaurus ou une autre forme de vocabulaire structuré soit assez bien connu pour en utiliser les termes ou les concepts. L'indexation en tant que travail mental est donc une activité qui s'appuie sur le souci de bien désigner le sujet d'un document, d'un côté, et, de l'autre, sur la nécessité que le vocabulaire trouve des résonances et des significations assez largement partagées à l'échelle de la communauté linguistique. C'est un fait bien connu que le repérage est favorisé par le recours à des listes établies. Comme les listes sont hiérarchiques, une règle générale d'indexation veut que l'on choisisse le terme le plus précis possible, c'est-à-dire à un niveau plus détaillé, vers le bas des hiérarchies. Le sommet de chaque liste est le nœud, ou la racine, à partir duquel est tracé un chemin taxinomique (séquence des choix en descendant la hiérarchie) qui sera entièrement indexé et interrogeable. Si, par exemple, un document est indexé avec le terme asthme, les termes ou nœuds ascendants allergie, maladie, santé seront aussi indexés. L'utilisateur n'indexe que le terme-feuille asthme, alors que c'est l'application qui doit ajouter les termes-nœuds du chemin taxinomique. Il paraît raisonnable de prévoir que, dans le calcul statistique de pertinence des résultats d'une interrogation, le terme en position de feuille sera plus rare et son cœfficient de pondération sera plus élevé que pour les termes en position de nœud.
En conclusion, il est utile de rappeler que la classification sert à placer un document dans un groupe de documents, lequel sera désigné par un descripteur ayant une signification ou valeur sémantique donnée. En pratique, classifier un contenu est synonyme d'indexer un contenu. L'objectif de la classification est de favoriser l'utilisation de sens ou de vocabulaires assez clairs pour permettre une indexation, d'une part, et un repérage, d'autre part, qui soient efficaces. Le fait de pouvoir indexer et interroger en combinant les valeurs des facettes a pour effet de regrouper des contraintes de position pour un sujet formant une intersection à plusieurs dimensions. Les facettes ont été choisies pour réduire le nombre de catégories ayant une valeur générale et pour leur capacité d'aider à situer le sujet d'un document.
Le but de l'index abrégé du thésaurus est de rendre plus facile l'activité d'indexation du contenu de données, de documents ou de dossiers.
Avec plus de 8 000 termes pouvant servir de descripteurs du « sujet » comme valeur de la métadonnée Domaine/objet le thésaurus a quelque chose d'intimidant. Avant d'avoir pu se familiariser avec les neuf grandes branches de la facette domaine, la personne chargée de l'indexation peut être rebutée par la simple quantité de termes du thésaurus. Une pratique observée ailleurs face à des difficultés analogues est d'offrir un vocabulaire réduit. La liste de termes devant servir à l'indexation par sujet se présente alors comme une liste réduite à de grands secteurs de la société et de l'activité humaine, c'est-à-dire des catégories générales, de haut niveau.
Le but d'un vocabulaire abrégé est de fournir un classement d'ensemble de l'information gouvernementale. En plus d'offrir des termes servant directement à l'indexation, ces termes de l'abrégé peuvent favoriser l'usage de termes plus précis en fournissant des points d'entrée à ceux-ci. Le temps nécessaire à la familiarisation avec le contenu de l'abrégé est évidemment beaucoup plus court. Le point d'équilibre recherché est la moindre précision de catégories générales accompagnée d'une moindre exigence cognitive, par opposition à plus de précision avec le thésaurus complet, mais à une exigence de délai de familiarisation beaucoup plus long.
En Grande-Bretagne, le gouvernement retient 600 des 3 000 termes dans sa version abrégée. Ci-après est avancée une proposition allant plus loin dans la réduction de la hiérarchie conceptuelle avec une liste réduite à environ 150 termes.
Prenons un exemple. Indexer avec tous les termes du thésaurus permettrait de dire qu'un document traite de l'asthme chez les enfants en relation avec la pollution atmosphérique. Indexer le même document avec les seuls termes de l'index abrégé du thésaurus permettrait quand même de dire qu'il traite d'une maladie dans un groupe d'âge en relation avec l'environnement. Cet exemple aide à saisir l'importance relative de la perte de précision avec l'index abrégé du thésaurus et le maintien de sa pertinence même avec des termes plus généraux.
Indexer sera toujours une activité intellectuelle difficile. La proposition d'un index abrégé est audacieuse tant la sélection de termes est minimale dans un but de simplicité. Le pari est que le service rendu par une indexation plus légère apporte la meilleure part de la solution au prix d'une certaine précision. La gageure est qu'une sélection centrale peut être effectuée pour un ensemble réduit, moins exigeant pour l'apprentissage et la mémoire, et donc pour la familiarisation.
Mais la rigueur de la réduction de l'abrégé soulève souvent de nombreux principes de classement entremêlés, par exemple entre la nature de ce que produit une entreprise (agricole ou manufacturière, par exemple) et sa forme juridique. On obtient des listes plus arbitraires parce qu'elles sont plus sélectives : elles ne couvrent pas des distinctions courantes et les catégories ne sont pas toujours clairement exclusives. Indexer est un acte cognitif auquel s'opposent la variabilité du réel et le caractère évolutif, toujours incomplet, du vocabulaire qui permet de nommer des choses véhiculant du sens au sujet de ce monde réel.
Enfin, il est aisé d'offrir un outil d'indexation qui permettrait à l'utilisateur de l'index abrégé, simplement en cliquant sur n'importe quel terme de la liste, de se retrouver sur la fiche de ce terme dans l'environnement de navigation conceptuelle offert dans le mécanisme de thésaurus. Cet utilisateur pourrait alors choisir un terme plus précis pour indexer un contenu donné. Ci-après se trouve la liste des termes retenus dans l'index abrégé constitué des catégories supérieures des cinq facettes du thésaurus : domaine, processus, type de document, clientèle et intervenant.
Économie, finances et industrie
|
Ressources naturelles, agriculture, environnement
|
Éducation, emploi et sciences
|
Santé
|
Gouvernance, politique et administration publique
|
Soutien aux personnes, familles et communautés
|
Information, culture, communications
|
Tourisme et loisir
|
Loi, justice et droit
|
Processus communs>
|
Processus-activité générique
|
Document de référence
|
Document de transaction
|
Entreprise (type d'entreprise)
|
Groupe de personnes
|
Individu
|
|
|