Plusieurs définitions expriment la structure et la fonction d'un thésaurus. En voici quelques exemples :
« Langage documentaire fondé sur une structuration hiérarchisée d'un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes de la langue naturelle et les relations entre notions par des signes conventionnels ». Association française de normalisation (AFNOR 1987)
« Vocabulaire contrôlé et dynamique de termes ayant entre eux des relations sémantiques et génériques, et qui s'applique à un domaine particulier de la connaissance ». Grand dictionnaire terminologique (GDT) de l'Office québécois de la langue française (OQLF)
Aucune de ces définitions ne correspond exactement à l'outil de travail infiniment souple et adaptable que représente un thésaurus conçu et élaboré pour répondre aux besoins particuliers de ses concepteurs. Tout en conservant les caractéristiques générales énoncées dans sa définition et en obéissant aux règles de base se rapportant à sa construction, le thésaurus a une personnalité qui lui est propre et dépend des objectifs fixés par ses éditeurs. Dans ce contexte, nous pouvons reconnaître que le Thésaurus de l'activité gouvernementale est le résultat des efforts fournis pour rassembler les termes que la langue française parlée au Québec offre pour nommer les concepts utilisés dans l'Administration, pour communiquer à propos de l'activité gouvernementale et pour favoriser le recours aux programmes et aux services publics.
Le thésaurus se caractérise selon sa nature, ses fonctions et ses composantes.
Sa nature : le thésaurus est une liste structurée de mots simples ou d'expressions.
Ses fonctions : indexer le contenu des documents et en faciliter le repérage.
Ses trois principales composantes :
Un grand nombre de définitions du Thésaurus de l'activité gouvernementale sont tirées du Grand dictionnaire terminologique de l'Office québécois de la langue française. La définition peut également être modifiée, tirée d'une autre source spécialisée ou créée par l'éditeur du thésaurus pour que le sens réel du descripteur apparaisse de façon claire et précise dans le contexte de l'activité gouvernementale. Des notes d'application sont parfois ajoutées aux définitions pour aider à l'interprétation des termes et à leur utilisation en tant que descripteurs;
La structure classificatoire s'exprime par des relations sémantiques de hiérarchie, d'association ou d'analogie et d'équivalence entre les termes du lexique.
Le thésaurus présente principalement :
Le terme est un mot ou un groupe de mots représentant un concept.
Par exemple :
Deux catégories de termes forment le lexique du thésaurus :
Les descripteurs sont des termes retenus et choisis parmi un ensemble de termes synonymes pour représenter, sans ambiguïté, un concept contenu dans un document ou dans une stratégie de recherche documentaire.
Les non-descripteurs sont des termes qui appartiennent au lexique, mais qui ne peuvent être utilisés pour l'indexation ou la recherche documentaire. Le non-descripteur est toujours lié au descripteur choisi pour représenter le même concept.
Les non-descripteurs sont des termes synonymes ou quasi-synonymes des descripteurs.
Par exemple :
Le descripteur est, de préférence, un substantif (INDEMNISATION, INDEMNITÉ), plutôt qu'un verbe (INDEMNISER), ou un adjectif (INDEMNISABLE, INDEMNITAIRE).
On trouve cependant, dans la facette processus, plusieurs termes sous la forme verbale.
(Voir Vocabulaire des génériques de processus-activités).
On privilégie la forme masculine, forme non marquée, comme dans tous les dictionnaires. Si un document fait référence aux personnes des deux sexes, deux descripteurs pourront être utilisés pour indexer la notion de « personne ». Une note d'application détaillée sous chacun des descripteurs ainsi affectés s'imposera. Il conviendra également de rapprocher les descripteurs masculins et féminins au moyen d'un lien associatif. Cependant, dans la plupart des cas, on utilise le lien d'équivalence.
Dans le thésaurus, la plupart des descripteurs sont au singulier (CAMION, ENTREPRISE, IMPÔT DES SOCIÉTÉS, RETENUE À LA SOURCE, etc.). Le pluriel est utilisé dans les cas exceptionnels où un terme n'existe pas au singulier (AMPHIBIENS, CONDITIONS ATMOSPHÉRIQUES, FINANCES PUBLIQUES), ou encore lorsqu'un terme a un sens différent selon qu'il est au singulier ou au pluriel (JEU [activité de loisir] et JEUX [compétition sportive], DROIT [spécialité juridique] et DROITS [prérogatives], etc.).
On privilégie l'orthographe la plus largement admise dans le milieu où évoluent les usagers potentiels du thésaurus. Au besoin, les variantes orthographiques d'un terme sont considérées comme synonymes et doivent être liées au descripteur par une relation d'équivalence.
Par exemple :
L'ajout de signes de ponctuation (virgule, tiret, etc.) dans un descripteur doit être limité aux seuls cas où la ponctuation est essentielle à la compréhension du sens donné au terme. Dans un thésaurus de langue française, l'apostrophe ne peut pas être supprimée. Quant au trait d'union, on l'élimine dès qu'une source reconnue en donne l'autorisation. La présence du trait d'union modifie le contenu des index de mots clés et est une source connue de difficultés pour la recherche informatisée.
On choisit de préférence la forme d'un terme qui correspond au niveau de langue commun des usagers potentiels du thésaurus (langage administratif). Il faut éviter les formes trop familières ou populaires. Les variantes linguistiques d'un terme sont considérées comme synonymes et doivent être liées au descripteur par une relation d'équivalence.
Par exemple :
Les termes empruntés à une langue étrangère sont inscrits au thésaurus tels quels, c'est-à-dire comme ils s'écrivent dans leur langue d'origine. Exemples : DUMPING, MARKETING.
Le descripteur peut être formé de plusieurs mots ne décrivant toujours qu'un seul concept. C'est le cas des termes AIRE DE PRÉSERVATION, BASE DE DONNÉES, MALADIE DES ARBRES.
Les mots composés sont toujours présentés dans leur forme directe (c'est-à-dire dans l'ordre naturel d'énonciation, comme BASE DE DONNÉES) plutôt que sous forme inversée (DONNÉES, BASE DE). D'ailleurs, la présentation permutée dans l'index par ordre alphabétique ou dans la recherche à l'aide d'un mot ou d'une chaîne de caractères, permet de ne pas se préoccuper la forme inversée. Exemple de la présentation permutée dans la recherche du mot ACCÈS :
L'homographe est un terme dont la forme graphique est identique à celle d'un autre terme, mais qui diffère de ce dernier par l'origine et par le sens.
Dans le cas d'homographie, on précise le sens de chacun des descripteurs au moyen d'un qualificatif donné en minuscules et entre parenthèses.
Par exemple :
Les noms propres de personnes, d'endroits, d'organismes, d'événements, etc. ne sont, normalement, pas intégrés à la structure d'un thésaurus. Toutefois, pour ce qui est de l'activité gouvernementale, certains noms propres sont exceptionnellement intégrés au thésaurus, notamment pour des organismes de la santé (HÉMA-QUÉBEC, CROIX-ROUGE), pour des organismes internationaux (ORGANISATION DES NATIONS UNIES), etc.
Les sigles et les acronymes sont présentés comme des synonymes des noms propres d'organismes ou de programmes auxquels ils correspondent.
Par exemple :
Les nouveaux termes qui expriment des notions déjà présentes dans le thésaurus sont établis comme des non-descripteurs et sont reliés, par leur équivalence, aux descripteurs qui représentent ces notions.
Par exemple :
La structure classificatoire est représentée par des relations sémantiques (hiérarchiques, associatives ou analogiques ou encore d'équivalence) établies entre les termes du lexique et traduites par une notation symbolique.
La relation hiérarchique exprime un rapport entre des termes de concepts généraux et vastes et d'autres termes plus précis. En passant du général au particulier, la relation hiérarchique facilite la navigation dite « verticale » dans le thésaurus, permettant à l'utilisateur d'atteindre la précision désirée dans l'indexation et la recherche.
Les abréviations TG et TS annoncent respectivement les termes génériques et les termes spécifiques d'un descripteur.
Par exemple :
Dans le Thésaurus de l'activité gouvernementale, on rencontre plusieurs types de relations hiérarchiques : le plus haut niveau de la hiérarchie correspond à des regroupements du type « ensemble et sous-ensemble », puis du type « catégorie et sous-catégorie ». Ces regroupements correspondent à la structure classificatoire des éléments du thésaurus et au chemin taxinomique entre les termes. À des niveaux inférieurs, dans la relation du type « générique et spécifique » d'un concept, une grande variété de nuances sémantiques peut exister entre deux termes liés hiérarchiquement (genre-espèce, tout-partie, etc.)
Le plus haut niveau de la hiérarchie correspond d'abord aux diverses facettes du thésaurus (DOMAINE, PROCESSUS, DOCUMENT, CLIENTÈLE et INTERVENANT).
Chacune de ces facettes représente un ensemble de termes d'abord regroupés en sous-ensembles. Par exemple, sous le terme générique DOMAINE, on retrouvera les sous-ensembles :
Chacun des sous-ensembles se subdivise en catégories de termes. Par exemple, dans le sous-ensemble ayant comme terme générique ÉDUCATION, EMPLOI ET SCIENCES, on trouve les termes spécifiques correspondant aux catégories suivantes :
Les catégories regroupent des sous-catégories de termes. Par exemple, sous le terme générique correspondant à la catégorie TRAVAIL, nous trouvons les termes spécifiques qui représentent des sous-catégories de sujets tels que :
Le concept représenté par le terme spécifique (TS) est un type ou une espèce particulière du concept représenté par le terme générique (TG). Dans la relation genre-espèce, le spécifique découle du générique et implique l'héritage des propriétés de ce terme.
Par exemple :
Le concept représenté par le terme spécifique (TS) constitue une partie du tout décrit par le terme générique (TG).
Par exemple :
Les exemples qui suivent ne présentent les variations qu'en ce qui concerne la relation générique-spécifique. Certaines de ces variations peuvent parfois s'exprimer dans la relation associative lorsque les termes appartiennent à des hiérarchies différentes :
La polyhiérarchie est une caractéristique d'un langage documentaire dans lequel chaque terme peut appartenir à plusieurs hiérarchies et appartenir à plus d'un terme générique de niveau immédiatement supérieur.
Exemple :
Il faut éviter la polyhiérarchie entre les facettes. Par exemple, un terme de la facette clientèle ne peut être un terme de la facette domaine. On préférera la relation associative entre le terme « INFORMATICIEN » et le terme « INFORMATIQUE » plutôt que la relation hiérarchique.
La relation associative est un lien établi entre des descripteurs représentant des concepts que les usagers associent mentalement.
Puisque la relation associative est symétrique, une seule notation est utilisée sous chaque descripteur. C'est l'abréviation TA (terme associé) qui exprime la relation de voisinage.
Par exemple :
La relation associative rapproche le plus souvent les descripteurs représentant les concepts suivants :
Les descripteurs que l'on choisit d'associer doivent de préférence se situer à des niveaux de spécificité comparables au sein de leur hiérarchie respective. Il semble peu utile d'associer, par exemple, le générique ÉDUCATION et le spécifique DÉCROCHEUR. Les associations DÉCROCHAGE SCOLAIRE et DÉCROCHEUR sont déjà plus productives.
Le rôle et l'importance de la relation associative dans un thésaurus sont mal perçus. Si l'on trouve une interminable liste de termes associés, ceux-ci ne peuvent plus jouer leur rôle de façon efficace. Les termes associés doivent aider l'usager à mieux percevoir la signification d'un descripteur et l'aire sémantique qu'il occupe. S'ils sont trop nombreux, ils ne donnent plus qu'une image très vague de l'organisation sémantique du domaine. Avant de formaliser une association entre deux descripteurs, le concepteur du thésaurus doit donc toujours s'interroger sur l'utilité de cette association pour l'indexeur et pour le chercheur.
La relation d'équivalence lie les mots ou les expressions du langage naturel qui pourraient être utilisés par différents locuteurs pour exprimer la même idée ou désigner le même objet.
En contexte thésaural, deux termes sont considérés comme synonymes quand on peut raisonnablement croire qu'on n'aura jamais besoin de les distinguer ou encore quand il est extrêmement difficile de les distinguer.
La relation d'équivalence s'exprime par les abréviations EM (employer) et sa réciproque EP (employé pour).
Par exemple :
On distingue deux types d'équivalence intralinguistique :
Par exemple :
Par exemple :
Dans ce cas, on devra choisir le terme le plus général comme descripteur.
Les termes représentant des concepts très proches et qui ne peuvent être distingués que par des spécialistes, dans un contexte bien précis d'utilisation.
Par exemple :
Il est important de reconnaître cette dernière catégorie de quasi-synonymes lorsqu'une réduction du vocabulaire s'impose.
Lorsque les antonymes représentent les deux pôles d'un même axe sémantique, ils sont souvent considérés comme équivalents.
Par exemple :
Il faut éviter d'établir une telle équivalence entre les contraires du genre IMPORTATION et EXPORTATION, ACHAT et VENTE, POLLUTION et DÉPOLLUTION ou RÉSIDENT et NON-RÉSIDENT, alors que l'un n'est ni un degré ni une forme de l'autre. Dans ces cas, on pourra utiliser la relation associative pour lier ces termes sémantiquement.
La notion d'équivalence entre les termes du lexique peut également s'exprimer de différentes façons en dehors de la stricte structure classificatoire et de sa notation symbolique. Ainsi, les relations d'équivalence interlinguistiques servent à représenter un même concept dans deux ou plusieurs langues. Dans le cas du Thésaurus de l'activité gouvernementale, on trouve l'équivalent anglais (EA) de la plupart des termes.
En outre, les définitions et les notes d'application servent également à préciser le sens de certains descripteurs dans l'environnement sémantique décrit par le thésaurus et fournissent des indications quant à l'utilisation de certains descripteurs plutôt que d'autres.
Exemple :
CONSEIL DE BANDE EP (employé pour) : bande
Définition :
Le conseil de bande est un organisme privé, entièrement autonome qui doit respecter certains règlements et certaines dispositions de la Loi sur les Indiens. Des pouvoirs lui sont conférés, dans les domaines de l'éducation, des services sociaux et de la santé, etc. Ces pouvoirs touchent également à l'adoption de règlements administratifs dans divers domaines.
Note(s) :
La bande est une subdivision de la tribu. Bien qu'il s'agisse d'un calque de l'anglais, le terme bande est très largement utilisé.
EA (équivalent anglais) : BAND COUNCIL