Présentation du DIS 25964(2

De Thésaurus du XXIe
Aller à : navigation, rechercher

ISO 25964-2 - Thésaurus et interopérabilité avec d'autres vocabulaires - DIS - Enquête publique

Information et documentation -- Thésaurus et interopérabilité avec d'autres vocabulaires -- Partie 2: Interopérabilité avec d'autres vocabulaires
Un document totalement nouveau.



Actu du 05/03/2013 - La norme est publiée https://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=53658


Actu du 27/01/2012 - Le BSI (UK) nous met le projet de norme en ligne. Une simple inscription (gratuite) suffit.


2 années pour aboutir à un projet de norme mis à l'enquête (DIS) depuis le 15 décembre sur le site de l'ISO pour cette Partie 2 de la norme ISO 25964 (environ 80 euros - pour un document jettable, çà fait cher !) - l'enquête publique a démarré mi décembre 2011 et courre jusqu'à avril 2012.

Nous attendons avec impatience sa parution sur la plateforme du BSI sur les normes en projet dans un format simple à commenter.

Petit rappel : La partie 1 sur le thésaurus pour la recherche documentaire est parue en août 2011. Quelques éléments techniques dont le schéma XML se trouvent dans une rubrique dédiée sur le site du NISO. Rédaction de ce projet de norme

  • Groupe ISO -Stella Dextre Clarke (UK, Chair), Johan De Smedt (BE), Michèle Hudon (CA), Marianne Lykke Nielsen (DK), Jutta Lindenthal (DE), Daniel Kless (DE), Esther Scheven (DE), Traugott Koch (DE), Marcia Zeng (DE), Sylvie Dalbin (FR), Bernard Vatant (FR, ontologie), Leonard Will (UK), Douglas Tudhope (UK), Daniel Kless (ontologie), Marcia Zeng (US).
  • Groupe français - travail sur cette partie 2 en petit comité au sein du Groupe français de l'Afnor (aujourd'hui ce groupe Afnor GE10 est clôt) : Hélène Zysman, Hélène Rabaud, François Feyler, Nathalie Yakovleff, Thierry Guillotin.

Le projet de norme à travers sa table des matières

Remarques :

  • Cette table des matières correspond à la seule version en ma possession d'octobre 2011 avant que ce document ne soit transmis aux "autorités ISO". Je n'ai pas la version officiel diffusé sur le site (Selon les principes de cette institution, les auteurs n'ont pas de version officielle de leur travaux - ils doivent l'acheter - ce que je n'ai pas fait).
  • J'ai laissé l'indication de la pagination ce qui vous donne une idée de l'ampleur de chacun des chapitres.
  • Les textes sont parfois des traductions de paragraphes du document d'octobre 2011, mais tous sont retravaillés et ne peuvent être considérés comme la traduction du document de projet.

Content Page

1 Scope

2 Normative references

3 Definitions Terms and Definition

4 Symbols, abbreviations and other conventions

5 Objectives and identification

6 Structural models for mapping across vocabularies

7 Types of mapping

8 Equivalence mappings

9 Hierarchical mappings

10 Associative mappings

11 Exact, inexact and partial equivalence

12 Use of mappings in information retrieval

13 Handling pre-coordination

14 Techniques for identifying candidate mappings

15 Managing the data

16 Display of mapped vocabularies

17 Classification schemes

18 Classification schemes used for records management

19 Taxonomies

20 Subject heading schemes

21 Ontologies

22 Terminologies

23 Name authority lists

24 Synonym rings

Annex A (informative) - Management of terminological data in support of interoperability

Bibliography

Quelques commentaires


Content Page

1 Scope 1

[extrait] La capacité à identifier et à repérer l'information pertinente au sein de vastes collections de ressources est aujourd'hui un défi majeur et urgent. L'interopérabilité sémantique est dans ce contexte, une nécessité. Pour appuyer cette exigence, une grande variété de services Web et d'autres outils sont en cours de développement, y compris (mais non limité à) aux registres et aux réservoirs de vocabulaires et de schémas de métadonnées ou à des services de correspondance entre vocabulaires. La présente Norme internationale fournit des recommandations fondamentales pour la création de services et produits de correspondance entre schémas et vocabulaires.

Les fondements de ces travaux sur l'interopérabilité sont exposés dans la Partie 1 de la norme ISO 25964 sur les thésaurus. Malheureusement pour les autres types de vocabulaires susceptibles d'être mis en correspondance avec les thésaurus, il n'existe pas de normes équivalentes. C'est pour cette raison que cette partie 2 de l'ISO 25964 fournit une description élémentaire de ces autres vocabulaires avant de formuler des recommandations sur l'interopérabilité entre ces derniers et les thésaurus. Il ne donne pas d'indications sur la construction des vocabulaires eux-mêmes.

Les chapitres 1 à 12 traitent des principes et des aspects pratiques de l'interopérabilité, en particulier la mise en correspondance entre vocabulaires ou éléments d'un vocabulaire qui s'appliquent à tout vocabulaire, et en particulier aux thésaurus. Le chapitre 13 fournit des indications supplémentaires pour le traitement de classes pré-coordonnées que l'on trouve dans les schémas de classifications ou dans d'autres vocabulaires s'appuyant sur des principes classificatoires.

Les chapitres 17 à 24 sont dédiés chacun à un type différent de vocabulaire, en particulier ceux dédiés aux systèmes d'indexation et de recherche de ressources documentaires comme les systèmes de classification (y compris ceux utilisés pour la gestion des dossiers d'activités ou records management), les taxonomies, les schémas de vedettes matières et les listes d'autorité de noms. Malgré leurs objectifs différents, sont également intégrés d'autres types d'outils sémantiques que sont les terminologies, les ontologies et les réseaux de synonymes.

Chaque chapitre donne une brève description informative des caractéristiques-clés du vocabulaire ainsi que des éléments de comparaison de ses composants sémantiques avec ceux d'un thésaurus. Ces premières sections donnent le contexte dans lequel s'inscrivent les contraintes d'interopérabilité et les recommandations proposées dans les sections suivantes de chaque chapitre.

2 Normative references 1

3 Definitions 1

Cette section intègre la terminologie de la Partie 1 de la norme, fournissant en tout une centaine de définitions.

4 Symbols, abbreviations and other conventions 16

Des codes sont proposés pour identifier :

  • les relations de mise en correspondance : EQ (equivalence), BM (broader mapping), NM (narrower mapping) et RM (related mapping),
  • = (exact) et ~ (inexact) peut être associé à tout type de relation

5 Objectives and identification 17

Un "vocabulaire" est un schéma de concepts

5.1 Objectives of interoperability and mapping 17

5.2 Identifying the elements to be mapped 17

Quel que soit le type de vocabulaire, ce travail de mise en correspondance vise à montrer les relations entre les concepts propres à chacun des vocabulaires. Chaque vocabulaire a un terme consacré pour ces concepts – classe dans un schéma de classification, catégorie pour les taxonomies, termes pour les thésaurus,....

6 Structural models for mapping across vocabularies 18

6.1 General 18

La norme expose trois modèles généraux (6.2, 6.3, 6.4) et un modèle alternatif (6.5). Ces modèles ne s'excluent pas et peuvent être combinés.

6.2 Model 1: Structural unity 18

Dans ce modèle « Unité structurale », tous les vocabulaires participants partagent exactement la même structure de relations hiérarchiques et associatives entre concepts.

Les vocabulaires peuvent ne pas avoir exactement la même couverture thématique, mais pour les thèmes et concepts présents il y a unité structurelle.

6.3 Model 2: Direct-linked 18

6.4 Model 3: Hub structure 19

6.5 Selective mapping 21

Sont exposés deux cas : un recouvrement partiel entre deux vocabulaires est partiel (seul un champ sémantique ou un thème d'un vocabulaire est traité) et l'interopérabilité entre les index d'une base documentaire et un vocabulaire (et non deux vocabulaires).

6.6 Choosing between the options 22

Ces modèles structurels sont présentés séparément, mais dans des applications concrètes, on a plus souvent des combinaisons entre ces modèles. Ce point doit être clarifié au début des projets avec une attention particulière au sens (direction) des correspondances.

7 Types of mapping 23

De nombreux exemples (compréhensibles en français) émaillent chacun de ces chapitres..

7.1 General 23

8 Equivalence mappings 23

8.1 General 23

8.2 Simple equivalence 23

8.3 Compound equivalence 24

8.3.1 General 24

8.3.2 Intersecting compound equivalence (EQ + ) 25

8.3.3 Cumulative compound equivalence (EQ | ) 26

8.3.4 Compound equivalence involving a combination of target vocabularies 27

9 Hierarchical mappings 27

10 Associative mappings 28

11 Exact, inexact and partial equivalence 28

11.1 General 28

11.2 Exact equivalence 29

11.3 Inexact equivalence 29

11.4 Partial equivalence 30

12 Use of mappings in information retrieval 30

12.1 Introduction 30

Chapitre très bref qui se résume à dire que la mise en correspondance peut être réalisée : au moment de l'indexation ou au moment de la recherche elle-même.

12.2 Human mediation 31

12.3 Examples of mapping implementation 31

Dans l'approche la plus simple d'un travail de mise en correspondance, l'objectif vise seulement à identifier des paires de concepts dans différents vocabulaires. Toutefois, la précision et le rappel dans des applications de recherche documentaire peuvent être grandement améliorés si les correspondances sont différenciées (voir chapitres 7 à 10) et si les degrés d'équivalence sont marqués comme recommandés dans le chapitre 11. Pour illustrer la puissance de la différenciation des alignements, le tableau 4 présenté dans ce chapitre 12.3. montre différents exemples pratiques. Pour simplifier l'exposé, on suppose que dans tous les cas des thésaurus sont impliqués dans le processus. (voir aussi le chapitre 13).

Ce tableau 4 introduit un exemple pour chacun des principaux types de correspondance décrites dans les chapitres 7 à 11. Le tableau présente les caractéristiques des processus de correspondance appliqués à des index ou des vocabulaires.

12.4 Conclusions and recommendations 33

13 Handling pre-coordination 34

Ce chapitre présente des exemples plus complexes liés au traitement de la précoordination.

13.1 Introduction 34

13.2 Mapping between a thesaurus and a scheme with context-dependent captions 35

13.2.1 General 35

13.2.2 Mappings for conversion of indexing/cataloguing entries when the thesaurus is the target vocabulary 36

13.2.3 Mappings for conversion of search expressions when the thesaurus is the target vocabulary 37

13.2.4 Mappings for conversion of indexing/cataloguing entries when the thesaurus is the source vocabulary 38

13.2.5 Mappings for conversion of search expressions when the thesaurus is the source vocabulary 38

13.3 Mapping more complex classes 40

14 Techniques for identifying candidate mappings 41

14.1 General procedure 41

14.2 Computer assisted direct matching 43

14.3 Co-occurrence mapping 44

14.4 Other methods 44

15 Managing the data 44

15.1 Types of data to be recorded 44

15.1.1 Overview 44

Les données produites au cours d'un processus de mise en correspondance de concepts peuvent être enregistrées et gérées dans le temps selon trois niveaux :

  • la correspondance entre concepts pris individuellement,
  • la correspondance entre groupes de concepts entre tout ou partie de deux vocabulaires contrôlés,
  • et enfin un ensemble coordonné de correspondances entre plus de deux vocabulaires contrôlés (par exemple, l'ensemble des correspondances entre un vocabulaire pivot et trois autres vocabulaires).

Ce chapitre fournit des recommandations sur ce qui doit être décrit et tracé dans le temps (maintenance).

15.1.2 For mappings between individual concepts 45

15.1.3 For a set of mappings between groups of concepts 45

15.1.4 For mapping clusters 46

15.2 Storing the data 46

15.2.1 Organizational aspects 46

15.2.2 Technical aspects 46

15.3 Maintaining the mappings data 47

15.3.1 General 47

15.3.2 Changes in the source or target vocabularies 47

15.3.3 Other mapping changes 48

15.3.4 The impact of mapping changes 48

16 Display of mapped vocabularies 49

16.1 General 49

16.2 Single record display 50

16.3 Complete displays based on one of the vocabularies 52

16.3.1 Alphabetical displays 52

16.3.2 Systematic displays 53

16.4 Crosswalks 53

Les chapitres 17 à 22 exposent les spécificités liés aux différents types de « vocabulaires » considérés dans un processus de mise en correspondance. Chaque chapitre suit la même structure, seule la section sur la typologie est spécifique à chacun des vocabulaires.

Le groupe de travail a jugé préférable d'adopter une approche pédagogique en prenant appui sur une typologie de « vocabulaires » existantes dans les différents terrains professionnels, plutôt que de proposer une typologie certes adaptée aux réalités techniques et sémantiques actuelles et plus cohérente sur le plan théorique, mais qui risquait de freiner l'expansion de ces recommandations.

17 Classification schemes 54

17.1 Key characteristics and background 54

17.1.1 General description 54

17.1.2 Scope and role in information retrieval 55

17.1.3 Origin and development 55

17.1.4 Vocabulary control 55

17.1.5 Types of classification schemes 55

17.2 Semantic components and relationships compared with thesaurus components 57

17.2.1 Notation 57

17.2.2 Captions 57

17.2.3 Hierarchies in classification schemes 58

17.2.4 Alphabetical indexes to classification schemes 58

17.3 Recommendations for mapping between a thesaurus and a classification scheme 59

18 Classification schemes used for records management 60

19 Taxonomies 63

« Les taxonomies prises en compte ici sont des vocabulaires hiérarchiques utilisés pour classer ou catégoriser, organiser, naviguer, naviguer, rechercher et / ou filtrer tout type de contenu dans les environnements en réseau. Un cas commun d'utilisation est l'exploitation d'une taxonomie pour la navigation […] à travers un large éventail de ressources électroniques, par exemple, sites Web, intranets, portails, wikis. ».

20 Subject heading schemes 71

21 Ontologies 76

Remarque - Je suis assez contente de ce chapitre. Dommage qu'il soit "enfermé" dans une norme ISO !

22 Terminologies 83

Ce chapitre a été contrôlé et enrichi par Sue Ellen Wright , responsable du TC 37, SC 3.

En annexe (informative) de ce document en projet, nous avons établi un tableau comparatif des modèles de données entre le format de la norme ISO 25964-1 (Thésaurus) et ISO ISO 30042 (format TBX des terminologues).

23 Name authority lists 86

24 Synonym rings 92

Annex A (informative) - Management of terminological data in support of interoperability 95

Bibliography 99