Indexation par racines
Opération de filtrage d'une source textuelle en ne retenant dans un index que les racines des mots après en avoir retiré la partie fléchie en affixe. Une racine peut se retrouver dans plus d'un radical avec des variations possibles sur la forme de base apportée par la racine. Ce procédé de « racinisation » cible donc la partie du mot restante une fois que l'on a supprimé son préfixe et son suffixe, à savoir son radical. Contrairement au lemme qui correspond à un mot réel de la langue, la racine ne correspond généralement pas à un mot réel. Par exemple, le mot « chercher » a pour radical ou stemme « cherch » qui ne correspond pas à un mot réel. Parfois appelée « indexation par radicaux ».