Thésaurus

De Thésaurus du XXIe
Aller à : navigation, rechercher


Thésaurus 
Un thésaurus est une liste organisée de termes normalisés, validés, qu’ils soient descripteurs ou non-descripteurs (c’est-à-dire rejetés), reliés par des relations sémantiques (équivalence, hiérarchie, association, synonymie…) exprimées grâce à des signes conventionnels.
Ces termes représentent les concepts d’un domaine de la connaissance et constituent un langage contrôlé pour l’indexation de documents et la recherche de ressources documentaires, selon des principes de construction élaborés depuis les années 1970 dans une norme internationale de l’ISO (dernière édition en 2011). L’indexation au moyen d’un thésaurus est fondée sur le principe combinatoire, la recherche se faisant par les opérateurs booléens (et, ou, sauf…). Le thésaurus tend à rejeter les ambiguïtés en réduisant les termes, afin de restreindre le stock et d’éviter la dispersion.
Comme les listes d’autorité, le thésaurus, en tant que langage documentaire parmi d’autres, propose donc un système d’indexation précis et structuré, qui tend aujourd’hui à être concurrencé par d’autres modes d’indexation : le principe de la folksonomie par exemple donne la possibilité de décrire des URL grâce à des tags ou mots clef, lesquels ont pour caractéristique de ne pas avoir de liens les uns avec les autres et d’être plus adaptés à l’usage de contributeurs libres.
Il existe différentes normes pour l'élaboration des thésaurus : normes ISO 254964-1, normes SKOS pour le web sémantique, normes anglaises (BS 8723 : 2005), normes américaines (ANSI/NISO Z39-19:2005)…