Portail Québec - Services Québec
 
Thésaurus de l'activité gouvernementale.

Politique d'édition du thésaurus

Table des matières

  1. Qu'est-ce qu'un thésaurus ?
  2. Le lexique (ou vocabulaire d'entrée)
  3. La structure classificatoire du thésaurus et les relations sémantiques

1. Qu'est-ce qu'un thésaurus ?

Définition

Plusieurs définitions expriment la structure et la fonction d'un thésaurus. En voici quelques exemples :

« Langage documentaire fondé sur une structuration hiérarchisée d'un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes de la langue naturelle et les relations entre notions par des signes conventionnels ». Association française de normalisation (AFNOR 1987)

« Vocabulaire contrôlé et dynamique de termes ayant entre eux des relations sémantiques et génériques, et qui s'applique à un domaine particulier de la connaissance ». Grand dictionnaire terminologique (GDT) de l'Office québécois de la langue française (OQLF)

Aucune de ces définitions ne correspond exactement à l'outil de travail infiniment souple et adaptable que représente un thésaurus conçu et élaboré pour répondre aux besoins particuliers de ses concepteurs. Tout en conservant les caractéristiques générales énoncées dans sa définition et en obéissant aux règles de base se rapportant à sa construction, le thésaurus a une personnalité qui lui est propre et dépend des objectifs fixés par ses éditeurs. Dans ce contexte, nous pouvons reconnaître que le Thésaurus de l'activité gouvernementale est le résultat des efforts fournis pour rassembler les termes que la langue française parlée au Québec offre pour nommer les concepts utilisés dans l'Administration, pour communiquer à propos de l'activité gouvernementale et pour favoriser le recours aux programmes et aux services publics.

Caractéristiques

Le thésaurus se caractérise selon sa nature, ses fonctions et ses composantes.

Sa nature : le thésaurus est une liste structurée de mots simples ou d'expressions.

Ses fonctions : indexer le contenu des documents et en faciliter le repérage.

Ses trois principales composantes :

  • un lexique comprenant deux catégories de termes : des descripteurs et des non-descripteurs;
  • un ensemble de définitions et de notes d'application :

    Un grand nombre de définitions du Thésaurus de l'activité gouvernementale sont tirées du Grand dictionnaire terminologique de l'Office québécois de la langue française. La définition peut également être modifiée, tirée d'une autre source spécialisée ou créée par l'éditeur du thésaurus pour que le sens réel du descripteur apparaisse de façon claire et précise dans le contexte de l'activité gouvernementale. Des notes d'application sont parfois ajoutées aux définitions pour aider à l'interprétation des termes et à leur utilisation en tant que descripteurs;

  • une structure classificatoire :

    La structure classificatoire s'exprime par des relations sémantiques de hiérarchie, d'association ou d'analogie et d'équivalence entre les termes du lexique.

Types de présentation

Le thésaurus présente principalement :

  • une liste alphabétique des descripteurs et des non-descripteurs, clairement identifiés comme tels;
  • un ensemble hiérarchisé des termes génériques et spécifiques liés au descripteur;
  • une fiche complète du descripteur qui le définit, établit tous les liens sémantiques avec d'autres termes et fournit diverses notes d'application qui s'y rapportent ainsi que son équivalent anglais;
  • une forme graphique (bidimensionnelle), soit sous la forme d'un arbre hiérarchique (carte sémantique).

2. Le lexique (ou vocabulaire d'entrée)

Une liste de termes

Le terme est un mot ou un groupe de mots représentant un concept.

Par exemple :

  • MALADIE
  • PROTECTION DE LA FAUNE
  • RÉFORME ÉLECTORALE
  • SPORT

Catégories de termes

Deux catégories de termes forment le lexique du thésaurus :

Les descripteurs :

Les descripteurs sont des termes retenus et choisis parmi un ensemble de termes synonymes pour représenter, sans ambiguïté, un concept contenu dans un document ou dans une stratégie de recherche documentaire.

Les non-descripteurs :

Les non-descripteurs sont des termes qui appartiennent au lexique mais qui ne peuvent être utilisés pour l'indexation ou la recherche documentaire. Le non-descripteur est toujours lié au descripteur choisi pour représenter le même concept.

Les non-descripteurs sont des termes synonymes ou quasi-synonymes des descripteurs.

Par exemple :

  • centre de détention EM (employer) : ÉTABLISSEMENT PÉNITENCIAIRE
  • lieu de culte EM (employer) : ÉDIFICE RELIGIEUX
  • véhicule usagé EM (employer) : VÉHICULE D'OCCASION

Forme des descripteurs

Nature grammaticale

Le descripteur est, de préférence, un substantif (INDEMNISATION, INDEMNITÉ), plutôt qu'un verbe (INDEMNISER), ou un adjectif (INDEMNISABLE, INDEMNITAIRE).

On trouve cependant, dans la facette processus, plusieurs termes sous la forme verbale.
(Voir Vocabulaire des génériques de processus-activités).

Genre grammatical

On privilégie la forme masculine, forme non marquée, comme dans tous les dictionnaires. Si un document fait référence aux personnes des deux sexes, deux descripteurs pourront être utilisés pour indexer la notion de « personne ». Une note d'application détaillée sous chacun des descripteurs ainsi affectés s'imposera. Il conviendra également de rapprocher les descripteurs masculins et féminins au moyen d'un lien associatif. Cependant, dans la plupart des cas, on utilise le lien d'équivalence.

Nombre grammatical

Dans le thésaurus, la plupart des descripteurs sont au singulier (CAMION, ENTREPRISE, IMPÔT DES SOCIÉTÉS, RETENUE À LA SOURCE, etc.). Le pluriel est utilisé dans les cas exceptionnels où un terme n'existe pas au singulier (AMPHIBIENS, CONDITIONS ATMOSPHÉRIQUES, FINANCES PUBLIQUES), ou encore lorsqu'un terme a un sens différent selon qu'il est au singulier ou au pluriel (JEU [activité de loisir] et JEUX [compétition sportive], DROIT [spécialité juridique] et DROITS [prérogatives], etc.).

Orthographe

On privilégie l'orthographe la plus largement admise dans le milieu où évoluent les usagers potentiels du thésaurus. Au besoin, les variantes orthographiques d'un terme sont considérées comme synonymes et doivent être liées au descripteur par une relation d'équivalence.

Par exemple :

  • clef USB EMPLOYER : CLÉ USB
  • yaourt EMPLOYER : YOGOURT

Ponctuation

L'ajout de signes de ponctuation (virgule, tiret, etc.) dans un descripteur doit être limité aux seuls cas où la ponctuation est essentielle à la compréhension du sens donné au terme. Dans un thésaurus de langue française, l'apostrophe ne peut pas être supprimée. Quant au trait d'union, on l'élimine dès qu'une source reconnue en donne l'autorisation. La présence du trait d'union modifie le contenu des index de mots clés et est une source connue de difficultés pour la recherche informatisée.

Niveau de langue

On choisit de préférence la forme d'un terme qui correspond au niveau de langue commun des usagers potentiels du thésaurus (langage administratif). Il faut éviter les formes trop familières ou populaires. Les variantes linguistiques d'un terme sont considérées comme synonymes et doivent être liées au descripteur par une relation d'équivalence.

Par exemple :

  • rapport d'impôt EMPLOYER : DÉCLARATION DE REVENUS

Emprunts

Les termes empruntés à une langue étrangère sont inscrits au thésaurus tels quels, c'est-à-dire comme ils s'écrivent dans leur langue d'origine. Exemples : DUMPING, MARKETING.

Expression et mots composés

Le descripteur peut être formé de plusieurs mots ne décrivant toujours qu'un seul concept. C'est le cas des termes AIRE DE PRÉSERVATION, BASE DE DONNÉES, MALADIE DES ARBRES.

Les mots composés sont toujours présentés dans leur forme directe (c'est-à-dire dans l'ordre naturel d'énonciation, comme BASE DE DONNÉES) plutôt que sous forme inversée (DONNÉES, BASE DE). D'ailleurs, la présentation permutée dans l'index par ordre alphabétique ou dans la recherche à l'aide d'un mot ou d'une chaîne de caractères, permet de ne pas se préoccuper la forme inversée. Exemple de la présentation permutée dans la recherche du mot ACCÈS :

  • ACCÈS À L'ÉDUCATION
  • ACCÈS À L'INFORMATION
  • ACCÈS À LA PROPRIÉTÉ
  • accès aux études (ACCÈS À L'ÉDUCATION)
  • CONTRÔLE D'ACCÈS
  • INDICATIF D'ACCÈS
  • RAMPE D'ACCÈS

Homographes

L'homographe est un terme dont la forme graphique est identique à celle d'un autre terme mais qui diffère de ce dernier par l'origine et par le sens.

Dans le cas d'homographie, on précise le sens de chacun des descripteurs au moyen d'un qualificatif donné en minuscules et entre parenthèses.

Par exemple :

  • CARTE (identification)
  • CARTE (lieu)
  • GREFFE (droit)
  • GREFFE (médecine)

Noms propres (sigles et acronymes)

Les noms propres de personnes, d'endroits, d'organismes, d'événements, etc. ne sont, normalement, pas intégrés à la structure d'un thésaurus. Toutefois, pour ce qui est de l'activité gouvernementale, certains noms propres sont exceptionnellement intégrés au thésaurus, notamment pour des organismes de la santé (HÉMA-QUÉBEC, CROIX-ROUGE), pour des organismes internationaux (ORGANISATION DES NATIONS UNIES), etc.

Les sigles et les acronymes sont présentés comme des synonymes des noms propres d'organismes ou de programmes auxquels ils correspondent.

Par exemple :

  • OMS EM (employer) : ORGANISATION MONDIALE DE LA SANTÉ

Ajout de non-descripteurs

Les nouveaux termes qui expriment des notions déjà présentes dans le thésaurus sont établis comme des non-descripteurs et sont reliés, par leur équivalence, aux descripteurs qui représentent ces notions.

Par exemple :

  • affirmation solennelle EM (employer) : SERMENT

3. La structure classificatoire du thésaurus et les relations sémantiques

La structure classificatoire est représentée par des relations sémantiques (hiérarchiques, associatives ou analogiques ou encore d'équivalence) établies entre les termes du lexique et traduites par une notation symbolique.

Les relations hiérarchiques

Définition et fonction

La relation hiérarchique exprime un rapport entre des termes de concepts généraux et vastes et d'autres termes plus précis. En passant du général au particulier, la relation hiérarchique facilite la navigation dite « verticale » dans le thésaurus, permettant à l'utilisateur d'atteindre la précision désirée dans l'indexation et la recherche.

Notation

Les abréviations TG et TS annoncent respectivement les termes génériques et les termes spécifiques d'un descripteur.

Par exemple :

  • TG : ARBRE
  • TS : BOULEAU JAUNE
  • TS : ÉRABLE
  • TS : POMMIER

Types de relations hiérarchiques

Dans le Thésaurus de l'activité gouvernementale, on rencontre plusieurs types de relations hiérarchiques : le plus haut niveau de la hiérarchie correspond à des regroupements du type « ensemble et sous-ensemble », puis du type « catégorie et sous-catégorie ». Ces regroupements correspondent à la structure classificatoire des éléments du thésaurus et au chemin taxinomique entre les termes. À des niveaux inférieurs, dans la relation du type « générique et spécifique » d'un concept, une grande variété de nuances sémantiques peut exister entre deux termes liés hiérarchiquement (genre-espèce, tout-partie, etc.)

Regroupements de haut niveau :

Le plus haut niveau de la hiérarchie correspond d'abord aux diverses facettes du thésaurus (DOMAINE, PROCESSUS, DOCUMENT, CLIENTÈLE et INTERVENANT).

Chacune de ces facettes représente un ensemble de termes d'abord regroupés en sous-ensembles. Par exemple, sous le terme générique DOMAINE, on retrouvera les sous-ensembles :

  • ÉCOMONIE, FINANCES ET INDUSTRIE
  • ÉDUCATION, EMPLOI ET SCIENCES
  • GOUVERNANCE, POLITIQUE ET ADMINISTRATION PUBLIQUE,
  • etc.

Chacun des sous-ensembles se subdivise en catégories de termes. Par exemple, dans le sous-ensemble ayant comme terme générique ÉDUCATION, EMPLOI ET SCIENCES, on trouve les termes spécifiques correspondant aux catégories suivantes :

  • ÉDUCATION
  • EMPLOI
  • SCIENCES
  • TECHNOLOGIE
  • TRAVAIL

Les catégories regroupent des sous-catégories de termes. Par exemple, sous le terme générique correspondant à la catégorie TRAVAIL, nous trouvons les termes spécifiques qui représentent des sous-catégories de sujets tels que :

  • CONDITIONS DE TRAVAIL
  • NORMES DU TRAVAIL
  • RELATIONS DU TRAVAIL
  • SANTÉ ET SÉCURITÉ DU TRAVAIL
Relation hiérarchique générique (du type « genre-espèce »)

Le concept représenté par le terme spécifique (TS) est un type ou une espèce particulière du concept représenté par le terme générique (TG). Dans la relation genre-espèce, le spécifique découle du générique et implique l'héritage des propriétés de ce terme.

Par exemple :

  • un DOCUMENT DE RÉFÉRENCE (TS) est un TYPE DE DOCUMENT (TG)
  • un OISEAU (TS) est une espèce d'ANIMAL (TG).
Relation générique partitive (de type tout-partie)

Le concept représenté par le terme spécifique (TS) constitue une partie du tout décrit par le terme générique (TG).

Par exemple :

  • la PHARMACOLOGIE (TS) fait partie des SCIENCES DE LA SANTÉ (TG).
Exemples d'autres nuances sémantiques dans la relation générique-spécifique

Les exemples qui suivent ne présentent les variations qu'en ce qui concerne la relation générique-spécifique. Certaines de ces variations peuvent parfois s'exprimer dans la relation associative lorsque les termes appartiennent à des hiérarchies différentes :

  • le terme spécifique « INONDATION » est cause du terme générique « DÉSASTRE NATUREL » (relation de cause à effet);
  • le terme spécifique « MILIEU DU TRAVAIL » est instrument du terme générique « CONDITIONS DU TRAVAIL » (relation d'instrument à résultat);
  • le terme générique « SYSTÈME PÉNAL » est un processus et le terme spécifique « DÉTENTION » est la procédure associée au résultat (finalité du processus);
  • le terme spécifique « ALICAMENT » (bénéficie à..., facilite..., favorise un résultat) est dans la lignée des termes génériques « ALIMENTATION », sous « SANTÉ PUBLIQUE »;
  • le terme spécifique « TRANSPLANTATION » sous le terme générique « ACTE MÉDICAL » représente la solution du problème dans le traitement d'une maladie;
  • le terme spécifique « POLLUTION » (est nuisible, inhibe, fait obstacle à, nuit à) est un résultat visé par le terme générique « PROTECTION DE L'ENVIRONNEMENT »;
  • le terme spécifique « PARC DE CONSERVATION » (un milieu propice à un résultat pouvant être craint ou voulu) est, ici, le résultat attendu représenté par le terme générique « PROTECTION DE L'ENVIRONNEMENT »;
  • le terme spécifique « DÉZONAGE » (par opposition à...), est de sens opposé au terme générique « ZONAGE AGRICOLE ».

Polyhiérarchie

La polyhiérarchie est une caractéristique d'un langage documentaire dans lequel chaque terme peut appartenir à plusieurs hiérarchies et appartenir à plus d'un terme générique de niveau immédiatement supérieur.

Exemple :

  • le terme « CARIBOU » appartient aux termes génériques : « GIBIER » et « MAMMIFÈRE ».

Il faut éviter la polyhiérarchie entre les facettes. Par exemple, un terme de la facette clientèle ne peut être un terme de la facette domaine. On préfèrera la relation associative entre le terme « INFORMATICIEN » et le terme « INFORMATIQUE » plutôt que la relation hiérarchique.

Les relations associatives

Définition et fonction

La relation associative est un lien établi entre des descripteurs représentant des concepts que les usagers associent mentalement.

Notation

Puisque la relation associative est symétrique, une seule notation est utilisée sous chaque descripteur. C'est l'abréviation TA (terme associé) qui exprime la relation de voisinage.

Par exemple :

  • LOISIR TOURISTIQUE TA (terme associé) : VOYAGE
  • VOYAGE TA (terme associé) : LOISIR TOURISTIQUE

Types de relations associatives

La relation associative rapproche le plus souvent les descripteurs représentant les concepts suivants :

  • la cause et l'effet (exemple : EAU CONTAMINÉE et MALADIE INFECTIEUSE);
  • le tout et sa partie (exemple : INDUSTRIE DU SPECTACLE et ARTS DE LA SCÈNE);
  • l'action et son agent (exemple : COURTAGE et COURTIER);
  • l'action et son produit (exemple : HORTICULTURE et PRODUIT HORTICOLE);
  • l'action et le lieu de l'action (exemple : ENSEIGNEMENT SECONDAIRE et ÉCOLE SECONDAIRE);
  • l'action et son objet (exemple : FINANCEMENT POLITIQUE et DÉPENSE ÉLECTORALE);
  • la science et son objet (exemple : ENTOMOLOGIE et INSECTE);
  • l'objet et sa propriété (exemple : DROGUE et TOXICOMANIE);
  • l'objet et son application (exemple : CARTE À PUCE et IDENTIFICATION PAR RADIOFRÉQUENCE);
  • des concepts similaires (exemple : BATEAU et NAVIRE);
  • des concepts contraires (exemple : RÉSIDENT et NON-RÉSIDENT);
  • des concepts complémentaires (exemple : CERTIFICAT et DIPLÔME).

Validité des associations

Les descripteurs que l'on choisit d'associer doivent de préférence se situer à des niveaux de spécificité comparables au sein de leur hiérarchie respective. Il semble peu utile d'associer, par exemple, le générique ÉDUCATION et le spécifique DÉCROCHEUR. Les associations DÉCROCHAGE SCOLAIRE et DÉCROCHEUR sont déjà plus productives.

Nombre de termes associés

Le rôle et l'importance de la relation associative dans un thésaurus sont mal perçus. Si l'on trouve une interminable liste de termes associés, ceux-ci ne peuvent plus jouer leur rôle de façon efficace. Les termes associés doivent aider l'usager à mieux percevoir la signification d'un descripteur et l'aire sémantique qu'il occupe. S'ils sont trop nombreux, ils ne donnent plus qu'une image très vague de l'organisation sémantique du domaine. Avant de formaliser une association entre deux descripteurs, le concepteur du thésaurus doit donc toujours s'interroger sur l'utilité de cette association pour l'indexeur et pour le chercheur.

Les relations d'équivalence

Définition et fonction

La relation d'équivalence lie les mots ou les expressions du langage naturel qui pourraient être utilisés par différents locuteurs pour exprimer la même idée ou désigner le même objet.

En contexte thésaural, deux termes sont considérés comme synonymes quand on peut raisonnablement croire qu'on n'aura jamais besoin de les distinguer ou encore quand il est extrêmement difficile de les distinguer.

Notation

La relation d'équivalence s'exprime par les abréviations EM (employer) et sa réciproque EP (employé pour).

Par exemple :

  • jeu compulsif EM (employer) : JEU PATHOLOGIQUE
  • JEU PATHOLOGIQUE EP (employé pour) : jeu compulsif

Types de relations d'équivalence

On distingue deux types d'équivalence intralinguistique :

  • la mono-équivalence, lorsqu'un non-descripteur n'est lié qu'à un seul descripteur;
  • la pluri-équivalence, lorsqu'un non-descripteur renvoie à plusieurs descripteurs utilisables individuellement.

Par exemple :

  • administration électronique EM (employer) : ADMINISTRATION ENLIGNE
  • administration électronique EM (employer) : GESTION ÉLECTRONIQUE

Identification des équivalents conceptuels

Synonymie véritable :
  • La forme complète d'un mot et son abréviation (ex.: syndrome d'immunodéficience acquise et SIDA);
  • Le nom populaire et le nom scientifique sous lesquels un même concept est connu (ex.: mongolisme et TRISOMIE 21);
  • Les variantes orthographiques (ex. CLÉ USB et clef USB);
  • L'appellation ancienne et l'appellation moderne d'un même concept (ex.: assurance chômage et ASSURANCE-EMPLOI);
  • Les termes d'origine linguistique différente lorsqu'ils sont couramment utilisés pour désigner un même concept dans une seule langue (ex.: DESIGN et stylique);
  • Les termes d'origine culturelle différente lorsqu'ils sont couramment utilisés pour désigner un même concept dans une seule langue (ex.: parking, parc de stationnement, STATIONNEMENT).
Quasi-synonymie :
  • Les termes de niveaux hiérarchiques différents, lorsqu'on considère que l'un ou plusieurs d'entre eux, pourtant nécessaires à l'exhaustivité du vocabulaire d'entrée, sont probablement trop spécifiques pour paraître tous au thésaurus comme descripteurs.

Par exemple :

  • circuit électrique, interrupteur, prise de courant EM (employer) : INSTALLATIONS ÉLECTRIQUES
  • funiculaire, remonte-pente, téléphérique, télésiège, téléski EM (employer) : REMONTÉE MÉCANIQUE

Dans ce cas, on devra choisir le terme le plus général comme descripteur.

Les termes représentant des concepts très proches et qui ne peuvent être distingués que par des spécialistes, dans un contexte bien précis d'utilisation.

Par exemple :

  • fruitarien, lacto-ovo-végétarien, lacto-végétarien, ovo-végétarien, semi-végétarien, végétalien, végétalisme EM (employer) : VÉGÉTARISME

Il est important de reconnaître cette dernière catégorie de quasi-synonymes lorsqu'une réduction du vocabulaire s'impose.

Antonymie :

Lorsque les antonymes représentent les deux pôles d'un même axe sémantique, ils sont souvent considérés comme équivalents.

Par exemple :

  • inadaptation scolaire EM (employer) : ADAPTATION SCOLAIRE

Il faut éviter d'établir une telle équivalence entre les contraires du genre IMPORTATION et EXPORTATION, ACHAT et VENTE, POLLUTION et DÉPOLLUTION ou RÉSIDENT et NON-RÉSIDENT, alors que l'un n'est ni un degré ni une forme de l'autre. Dans ces cas, on pourra utiliser la relation associative pour lier ces termes sémantiquement.

Équivalents anglais, définitions et notes d'application

La notion d'équivalence entre les termes du lexique peut également s'exprimer de différentes façons en dehors de la stricte structure classificatoire et de sa notation symbolique. Ainsi, les relations d'équivalence interlinguistiques servent à représenter un même concept dans deux ou plusieurs langues. Dans le cas du Thésaurus de l'activité gouvernementale, on trouve l'équivalent anglais (EA) de la plupart des termes.

En outre, les définitions et les notes d'application servent également à préciser le sens de certains descripteurs dans l'environnement sémantique décrit par le thésaurus et fournissent des indications quant à l'utilisation de certains descripteurs plutôt que d'autres.

Exemple :

  • La fiche du terme « CONSEIL DE BANDE », comporte une définition, une note d'application sur la définition de « bande » et un équivalent anglais (EA) :

CONSEIL DE BANDE EP (employé pour) : bande

Définition :

Le conseil de bande est un organisme privé, entièrement autonome qui doit respecter certains règlements et certaines dispositions de la Loi sur les Indiens. Des pouvoirs lui sont conférés, dans les domaines de l'éducation, des services sociaux et de la santé, etc. Ces pouvoirs touchent également à l'adoption de règlements administratifs dans divers domaines.

Note(s) :

La bande est une subdivision de la tribu. Bien qu'il s'agisse d'un calque de l'anglais, le terme bande est très largement utilisé.

EA (équivalent anglais) : BAND COUNCIL