Portail Québec - Services Québec
 
Thésaurus de l'activité gouvernementale.

Soutien à l'indexation

Le Thésaurus de l'activité gouvernementale rassemble plusieurs milliers de mots et d'expressions, structurés hiérarchiquement selon des descripteurs allant du général au particulier. Il peut servir à classifier l'information en fonction des cinq facettes retenues pour leur pertinence dans la description de l'activité publique. Domaine, processus, intervenant, clientèle, document sont ces cinq facettes qu'on peut articuler en une phrase pour mieux les comprendre : l'Administration et d'autres intervenants créent des processus à l'intention des clientèles dans de nombreux domaines, souvent au moyen de l'échange de documents. Par rapport à des thésaurus comparables dans les autres Administrations, le nombre total de termes est élevé. L'abondance de termes n'entraîne pas, cependant, une surcharge quand les termes sont indexés et interrogeables. La surcharge ne survient qu'à la lecture alphabétique ou la navigation hiérarchique. Ainsi la portée et la précision n'ont pas à être sacrifiées, dans aucune situation, d'autant plus que la profondeur du thésaurus offre un grand nombre de synonymes favorisant la recherche sur des concepts généraux, ainsi qu'un calcul de la pertinence plus précis, car il permet de ratisser large.

Cependant, la décision peut être prise de classifier les termes selon les descripteurs des trois ou quatre niveaux supérieurs seulement, ce qui limite grandement la quantité de termes. Cette démarche avec un « thésaurus abrégé » est présentée un peu plus loin.

Établissement des schèmes de classification dans un ministère ou un organisme

La classification des dossiers et autres documents ainsi que l'accessibilité au contenu en fonction des sujets ou des thèmes sont des besoins habituels des ministères et organismes. Le thésaurus doit être perçu comme un recueil général qu'un ministère ou un organisme doit tenter de mettre à sa main et d'adapter à son contexte en retenant les descripteurs les plus utiles par rapport aux particularités de sa mission. Chacune des cinq facettes de l'activité gouvernementale devrait donc être l'objet d'une mise en contexte ministérielle pour en réduire l'ampleur. Le contenu du thésaurus pourra être adapté au contexte ministériel de la façon suivante.

Le ministère ou l'organisme interroge le contenu du thésaurus pour en extraire la hiérarchie des termes disponibles pour une facette. Il reçoit la liste hiérarchisée complète des termes de ce schème dans un format qui lui permet :

  • de cocher sa sélection parmi les termes offerts ;
  • de fournir des équivalences locales pour certains des termes sélectionnés (en respectant leur sens selon la définition) ;
  • d'ajouter des termes supplémentaires, à tout niveau hiérarchique dans la liste, par saisie au clavier ou par un copier-coller avec la souris, dans des champs réservés à cette fin.

Quand la sélection a été effectuée, que les équivalences ont été établies et que les ajouts ont été insérés dans la liste, l'utilisateur remplit une fiche de métadonnées sur, par exemple, le schème « type de document » afin de l'intégrer au registre central pour en faciliter la gestion, y compris les inévitables versions. Pour les termes et leurs équivalences locales ajoutés par un ministère ou un organisme, l'intégration au mécanisme du thésaurus peut être exclusivement visible aux utilisateurs de ce ministère ou de cet organisme. Ces termes peuvent également être intégrés dans le thésaurus public, sous la responsabilité d'une équipe centrale d'édition et selon leur degré d'intérêt général.

En d'autres mots, le contenu du thésaurus ne sera généralement pas repris intégralement pour la mise au point des schèmes de classification que les ministères utiliseront dans leurs applications. Une sélection est souhaitable à la fois pour réduire le volume des choix et pour ne proposer que ce qui est le plus pertinent dans un ministère donné ou sur un thème donné. En ce sens, le thésaurus est une source de type bibliographique dans laquelle on puise ce dont on a besoin, plutôt qu'une collection de schèmes de classification immuables. La règle de base est d'en respecter la structure hiérarchique générale et les définitions qu'un ministère choisit d'en extraire pour établir ses schèmes de classification ministériels. Pour chaque facette, un schème de classification est constitué, qui permet de délimiter progressivement une dimension sémantique en choisissant le nœud de l'arbre le mieux ajusté :

  • la facette domaine-objet s'intéresse à la sémantique des subdivisions des activités de l'Administration, fondées sur les grandes missions gouvernementales, en focalisant sur le niveau de compétence provincial : elle sert à indiquer le sujet d'un document. Cette facette est celle de la perspective pangouvernementale, la somme intégrée de l'ensemble de l'appareil politique, administratif et judiciaire. Chaque ministère dessine un profil particulier dans cette grande arborescence et extrait du thésaurus ce qui est pertinent, en fonction de sa mission et de ses services ;
  • pour la facette processus, la situation du ministère ou de l'organisme est bien différente, car c'est son propre plan de classification qui est utilisé. Ce plan est généralement élaboré, mis à jour et rendu disponible par l'unité administrative de gestion documentaire de l'organisation. Cette facette englobe la structure fonctionnelle des activités du ministère ou de l'organisme. Pour cette facette, le thésaurus contient surtout les descripteurs relatifs aux processus administratifs communs. Pour les processus propres à la mission de chaque ministère ou organisme, ce sont surtout les descripteurs de domaine qui constituent un appui terminologique. Le lien entre un item du plan de classification et un terme du thésaurus n'est pas direct, comme c'est le cas pour la facette domaine, et il pourrait être avantageux de marquer l'association entre les deux pour effacer les écarts anodins entre les libellés. Ainsi les utilisateurs appelés à classifier l'information selon le plan peuvent obtenir des définitions des termes employés ;
  • la facette type de document se subdivise entre les documents de référence et les documents de transaction. Un grand nombre de documents occupent une place précise dans les activités de collaboration, car ils sont souvent le moyen de les réaliser, en permettant de franchir des étapes dans la séquence d'un processus. Le schème de classification du type de document présente une typologie qui distingue les documents de référence destinés à la lecture et les documents de transaction, pour lesquels la valeur probante doit faire l'objet d'un soin particulier dans le contexte des transactions électroniques. Tout en respectant la structure générale de la classification, un ministère extraira du thésaurus les termes les plus pertinents pour sa mission ;
  • les facettes clientèle et intervenant autorisent également la sélection, les équivalences et les ajouts qu'un ministère ou un organisme établit en fonction des parties prenantes de son secteur d'activité. Ces parties prenantes sont autant des intervenants qui collaborent avec les ministères que les clientèles (groupes cibles, etc.) des programmes et services publics.

Perspective de l'indexation par l'utilisateur

Pour indexer un document, il faut d'abord reconnaître les concepts principalement traités dans ce document et rattacher les termes significatifs du thésaurus au document. Le recours à un schème de classification permet de contrôler le vocabulaire d'indexation. En conséquence, quand on s'interroge sur le sujet principal d'un document, c'est en se limitant à un certain nombre de concepts contenus dans le schème d'un ministère ou d'un organisme ou d'une subdivision administrative. L'indexation consiste alors à accoler des termes à des documents de telle manière que ces termes soient ceux que pourront utiliser les Québécois (usagers, employés, intervenants) lorsqu'ils formuleront une question auprès des services publics en ligne, en s'aidant occasionnellement de la navigation dans le thésaurus. Le fait d'indexer vise donc à faciliter la recherche éventuelle. Le faire avec un vocabulaire contrôlé, tel qu'un schème de classification, augmente beaucoup l'efficacité de la recherche.

Lors de l'indexation, le choix des mots clés est une activité intellectuelle souvent difficile parce qu'il suppose qu'un système de classification ou un thésaurus ou une autre forme de vocabulaire structuré soit assez bien connu pour en utiliser les termes ou les concepts. L'indexation en tant que travail mental est donc une activité qui s'appuie sur le souci de bien désigner le sujet d'un document, d'un côté, et, de l'autre, sur la nécessité que le vocabulaire trouve des résonances et des significations assez largement partagées à l'échelle de la communauté linguistique. C'est un fait bien connu que le repérage est favorisé par le recours à des listes établies. Comme les listes sont hiérarchiques, une règle générale d'indexation veut que l'on choisisse le terme le plus précis possible, c'est-à-dire à un niveau plus détaillé, vers le bas des hiérarchies. Le sommet de chaque liste est le nœud, ou la racine, à partir duquel est tracé un chemin taxinomique (séquence des choix en descendant la hiérarchie) qui sera entièrement indexé et interrogeable. Si, par exemple, un document est indexé avec le terme asthme, les termes ou nœuds ascendants allergie, maladie, santé seront aussi indexés. L'utilisateur n'indexe que le terme-feuille asthme, alors que c'est l'application qui doit ajouter les termes-nœuds du chemin taxinomique. Il paraît raisonnable de prévoir que, dans le calcul statistique de pertinence des résultats d'une interrogation, le terme en position de feuille sera plus rare et son cœfficient de pondération sera plus élevé que pour les termes en position de nœud.

En conclusion, il est utile de rappeler que la classification sert à placer un document dans un groupe de documents, lequel sera désigné par un descripteur ayant une signification ou valeur sémantique donnée. En pratique, classifier un contenu est synonyme d'indexer un contenu. L'objectif de la classification est de favoriser l'utilisation de sens ou de vocabulaires assez clairs pour permettre une indexation, d'une part, et un repérage, d'autre part, qui soient efficaces. Le fait de pouvoir indexer et interroger en combinant les valeurs des facettes a pour effet de regrouper des contraintes de position pour un sujet formant une intersection à plusieurs dimensions. Les facettes ont été choisies pour réduire le nombre de catégories ayant une valeur générale et pour leur capacité d'aider à situer le sujet d'un document.

Index abrégé du thésaurus

Le but visé par l'index abrégé du thésaurus est de rendre plus facile l'activité d'indexation du contenu de données, de documents ou de dossiers.

Avec plus de 8 000 termes pouvant servir de descripteurs du « sujet » comme valeur de la métadonnée Domaine/objet le thésaurus a quelque chose d'intimidant. Avant d'avoir pu se familiariser avec les neuf grandes branches de la facette domaine, la personne chargée de l'indexation peut être rebutée par la simple quantité de termes du thésaurus. Une pratique observée ailleurs face à des difficultés analogues est d'offrir un vocabulaire réduit. La liste de termes devant servir à l'indexation par sujet se présente alors comme une liste réduite à de grands secteurs de la société et de l'activité humaine, c'est-à-dire des catégories générales, de haut niveau.

Le but d'un vocabulaire abrégé est de fournir un classement d'ensemble de l'information gouvernementale. En plus d'offrir des termes servant directement à l'indexation, ces termes de l'abrégé peuvent favoriser l'usage de termes plus précis en fournissant des points d'entrée à ceux-ci. Le temps nécessaire à la familiarisation avec le contenu de l'abrégé est évidemment beaucoup plus court. Le point d'équilibre recherché est la moindre précision de catégories générales accompagnée d'une moindre exigence cognitive, par opposition à plus de précision avec le thésaurus complet mais à une exigence de délai de familiarisation beaucoup plus long.

En Grande-Bretagne, le gouvernement retient 600 des 3 000 termes dans sa version abrégée. Ci-après est avancée une proposition allant plus loin dans la réduction de la hiérarchie conceptuelle avec une liste réduite à environ 150 termes.

Prenons un exemple. Indexer avec tous les termes du thésaurus permettrait de dire qu'un document traite de l'asthme chez les enfants en relation avec la pollution atmosphérique. Indexer le même document avec les seuls termes de l'index abrégé du thésaurus permettrait quand même de dire qu'il traite d'une maladie dans un groupe d'âge en relation avec l'environnement. Cet exemple aide à saisir l'importance relative de la perte de précision avec l'index abrégé du thésaurus et le maintien de sa pertinence même avec des termes plus généraux.

Indexer sera toujours une activité intellectuelle difficile. La proposition d'un index abrégé est audacieuse tant la sélection de termes est minimale dans un but de simplicité. Le pari est que le service rendu par une indexation plus légère apporte la meilleure part de la solution au prix d'une certaine précision. La gageure est qu'une sélection centrale peut être effectuée pour un ensemble réduit, moins exigeant pour l'apprentissage et la mémoire, et donc pour la familiarisation.

Mais la rigueur de la réduction de l'abrégé soulève souvent de nombreux principes de classement entremêlés, par exemple entre la nature de ce que produit une entreprise (agricole ou manufacturière, par exemple) et sa forme juridique. On obtient des listes plus arbitraires parce qu'elles sont plus sélectives : elles ne couvrent pas des distinctions courantes et les catégories ne sont pas toujours clairement exclusive. Indexer est un acte cognitif auquel s'opposent la variabilité du réel et le caractère évolutif, toujours incomplet, du vocabulaire qui permet de nommer des choses véhiculant du sens au sujet de ce monde réel.

Enfin, il est aisé d'offrir un outil d'indexation qui permettrait à l'utilisateur de l'index abrégé, simplement en cliquant sur n'importe quel terme de la liste, de se retrouver sur la fiche de ce terme dans l'environnement de navigation conceptuelle offert dans le mécanisme de thésaurus. Cet utilisateur pourrait alors choisir un terme plus précis pour indexer un contenu donné. Ci-après se trouve la liste des termes retenus dans l'index abrégé constitué des catégories supérieures des cinq facettes du thésaurus : domaine, processus, type de document, clientèle et intervenant.

Domaine

Économie, finances et industrie
  • Assurance
  • Commerce
  • Comptabilité
  • Économie
  • Entreprise (domaine des affaires)
  • Finance
  • Fiscalité
  • Industrie
  • Transport
Ressources naturelles, agriculture, environnement
  • Agriculture
  • Énergie
  • Environnement
  • Faune
  • Flore
  • Foresterie
  • Mine
  • Pêcherie
  • Territoire
Éducation, emploi et sciences
  • Éducation
  • Emploi
  • Sciences
  • Technologie
  • Travail
Santé
  • Acte médical
  • Équipement médical
  • Maladie
  • Orthèse, support, prothèse
  • Produits chimiques, biologiques et pharmaceutiques
  • Psychiatrie et psychologie
  • Santé publique
  • Services de santé
  • Soins
  • Techniques d'analyse et de diagnostic
Gouvernance, politique et administration publique
  • Administration publique
  • Assemblée nationale
  • Élection
  • Gouvernance
  • Politique
  • Relations internationales
Soutien aux personnes, familles et communautés
  • Civisme/distinction
  • Immigration
  • Logement
  • Protection civile
  • Services sociaux
  • Soutien socio-économique
Information, culture, communications
  • Culture (société)
  • li>Information et communications
Tourisme et loisir
  • Loisir
  • Sport
  • Tourisme
Loi, justice et droit
  • Code civil et droits
  • Criminalité
  • Droit (généralités)
  • Droit (spécialialités juridiques)
  • Justice
  • Législation
  • Police et enquête
  • Système pénal

Processus

Processus communs
  • Administration et gestion
  • Gestion des ressources financières
  • Gestion des ressources humaines
  • Gestion des ressources informationnelles
  • Communications
  • Gestion documentaire
  • Technologies de l'information (processus communs)
  • Gestion des ressouces matérielles
  • Législation et règlementation
Processus-activité générique
  • Définir les règles
  • Administrer le gouvernement
  • Diriger/gouverner
  • Légiférer
  • Réglementer
  • Faire appliquer les règles
  • Déclarer conforme
  • Enregistrer
  • Recueillir
  • Résoudre conflit
  • Sanctionner
  • Faire fonctionner les programmes et services
  • Échanger
  • Informer
  • Observer
  • Réaliser
  • Soutenir

Type de document

Document de référence
  • Document de communication
  • Document de consultation
  • Document de direction
  • Document de législation et réglementation
  • Document de réunion
  • Document de type spécialisé
  • Formulaire
  • Publication
  • Recueil (consultation)
Document de transaction
  • Titre
  • Acte
  • Attestation
  • Bail
  • Carnet
  • Carte (identification)
  • Certificat
  • Diplôme
  • Effet de commerce
  • Entente
  • Licence
  • Permis
  • Preuve de citoyenneté
  • Timbre
  • Titre minier
  • Instance de transaction

Clientèle

Entreprise (type d'entreprise)
  • Entreprise agricole
  • Entreprise commerciale
  • Entreprise culturelle
  • Entreprise de services
  • Entreprise industrielle
  • Forme juridique de l'entreprise
  • Transporteur
Groupe de personnes
  • Association
  • Chambre de commerce
  • Club
  • Communauté
  • Famille
  • Ordre professionnel
  • Organisme sans but lucratif
  • Parti politique
  • Syndicat
Individu
  • État civil (personne physique)
  • Filiation
  • Groupe d'âge
  • Profession et métier (appellation de personne)
  • Rôle personnel (état ou statut)

Intervenant

  • Chambre de commerce
  • Comité
  • Commission parlementaire
  • Commission scolaire
  • Entreprise d'économie sociale
  • Groupe parlementaire
  • Institution financière
  • Ministère
  • Organisation internationale
  • Organisme gouvernemental
  • Organisme judiciaire
  • Organisme municipal
  • Organisme parapublic
  • Organisme sans but lucratif
  • Police
  • Représentation diplomatique
  • Rôle public (fonction ou tire)
  • Table de concertation