Comment mettre en place un système de catalogage ? Linteropérabilité avec dautres outils est-elle...
-
Upload
anne-aubin -
Category
Documents
-
view
112 -
download
0
Transcript of Comment mettre en place un système de catalogage ? Linteropérabilité avec dautres outils est-elle...
Comment mettre en place un système de catalogage ?
L’interopérabilité avec d’autres outils est-elle possible ?
PRATLONG Léo – IRD Montpellier – 08/2007
IRD : DSI – ISResponsables : Régis HOCDE et Bruno GRANOUILLAC
1
PLAN
2- Présentation de MDweb
I- Présentation de la mission
4- Architecture de MDweb
3- Les thésaurus
6- Interopérabilité
5- Installation de MDweb
7- Conclusion
2PRATLONG Léo – IRD Montpellier – 08/2007
LA MISSION
3PRATLONG Léo – IRD Montpellier – 08/2007
ENJEUX
• Répondre à la directive européenne INSPIRE :
Publication des métadonnéesEchange et partage de données géographiques
• Recenser les données de l’IRD en répondant aux questions :
Où se trouve la donnée ?Quand cette donnée a-t-elle été produite ?Que décrit cette donnée ?De quel type de donnée s’agit-il ?
• Faciliter le travail des chercheurs :Savoir quelles données existent, et où la trouver
4PRATLONG Léo – IRD Montpellier – 08/2007
OBJECTIFS
• Evaluer les fonctionnalités de Mdweb
• Créer un guide d’installation sur serveur virtuel Linux CentOs à l’attention des futurs utilisateurs de l’IRD
InstallationCorrectionDocumentation
• Evaluer la possibilité d’une interopérabilité entre Mdweb et d’autres outils de catalogage
Recherche étendueJeux de données enrichisRespect des normes (ISO19115 – ISO19139)
• Couvrir le besoin terminologique des chercheurs de l’IRD
Proposition de mot-clé : notion de ThesaurusEvaluer ces thesaurus
• Mettre un portail public d’accès aux métadonnées de l’IRD 5PRATLONG Léo – IRD Montpellier – 08/2007
Présentation de MDweb
6PRATLONG Léo – IRD Montpellier – 08/2007
MDWEB
• Outil de catalogage de métadonnées sous forme de portail web
• Serveur cartographique de localisation de données
• Interopérabilité : Z3950, CSW
• Modification de la structure des métadonnées
• Indexation des métadonnées à l’aide d’un thesaurus
= Présentation
• License CeCILL : utilisation libre
• Projet soutenu par l’IRD (J-c Desconnets)
= Droits d’utilisation
7PRATLONG Léo – IRD Montpellier – 08/2007
MDweb
8PRATLONG Léo – IRD Montpellier – 08/2007
9
METADONNEES
• Permet d’obtenir des informations sur une donnée :Où ?Quoi ?Quand ?
= Définition
= Exemple (morceau de métadonnée)
9PRATLONG Léo – IRD Montpellier – 08/2007
Thesaurus
DEFINITIONS GENERALES
Mot-clé
Métadonnées
Données
Décrit
Décrit
10PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS
11PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS
• Recueil terminologique hiérarchisé décrivant un domaine d’activité
• Référentiel : « processus énonciatif qui permet de différencier »
• Descripteur : mot clé choisi parmi des synonymes pour les représenter
• Différent des annuaires de termes : FishBase, LarvalBase, etc…
• Chercheurs injoignables
• Décrire les domaines d’activité de l’IRD
• Faciliter la rechercheOffrir aux chercheurs les termes dont ils ont besoins
= Définitions
= Objectifs
12PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : exemple
= Thesaurus OECD (utilisé par l’IAM)
13PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : problèmes rencontrés (1/2)
• Confusion entre le terme « thesaurus » et l’objet « thesaurus »
• Peu de thesauri libres et accessibles en ligne
• Abus de langage et fausses pistes
• Indisponibilité ou thesauri abandonnés
• Thesauri soumis à des droits d’utilisation
• Thesauri payants et non consultables
= Recherche de thesauri difficile
= Droits d’utilisation
14PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : problèmes rencontrés (2/2)
• Thesauri non normés
• Fichier de termes non hiérarchisés
• Thesauri non maintenus (mise à jour inexistante)
• Manque de précision des thesauri : description souvent trop générale
= Normalisation
= Précision
15PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS
• AGROVOC : terminologie agronomique (multilingue)
• GEMET: terminologie environnementale (multilingue)
• Toponymie : Terminologie géographique
= Dans MDweb
16PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS
= Quelques thesauri intéressants
Nom Propriétaire
Langues Domaines Disponibilité
EUROVOC UE 21 Multi (21) Oui
GeoEthno CNRS Multi Géo / Ethno Oui
MeSH INSERM 2 (Ang / franc)
Santé Oui
ASFA FAO 3 Science halieutique
Oui
Méditagri IAM Français Multi Oui
Ecothek Ministère écologie
Français Ecologie Fin 2007
Banane INIBAP 3 (fr, ang, esp)
Banane Oui
Planète Ministère écologie
Français Ecologie Oui
17PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS
= Granularité
Nom Précision
EUROVOC Faible
GeoEthno Haute
MeSH Haute
ASFA Haute
Méditagri Moyenne
Ecothek Inconnue
Banane Extrême (spécialisé)
Planète Moyenne
18PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : utilisation sur le portail
• Enrichir le recueil de termes
• Actualiser le thesaurus
• Permettre aux utilisateurs de personnaliser leur outil
= Mise à jour
• Offrir un vaste choix de domaines
• Ne compromet pas la stabilité du système
• Possibilité d’évolution
= Importation
19PRATLONG Léo – IRD Montpellier – 08/2007
Architecture de MDweb
20PRATLONG Léo – IRD Montpellier – 08/2007
ARCHITECTURE DU SERVEUR STOCKANT MDWEB
21PRATLONG Léo – IRD Montpellier – 08/2007
NORMES ET PROTOCOLES
• Normes de métadonnées
ISO19115ISO19139
• Normes de thesaurusRDFSKOSOWL
• Protocoles de communicationZ3950CSW
= Normes
= Protocoles
22PRATLONG Léo – IRD Montpellier – 08/2007
NORMES
= ISO19115
<cntOnlineRes> <linkage>http://www.ird.fr/</linkage></cntOnlineRes>
= ISO19139
<gmd:onlineResource><gmd:CI_OnlineResource><gmd:linkage><gmd:URL>http://www.ird.fr/</gmd:URL></gmd:linkage></gmd:CI_OnlineResource></gmd:onlineResource>
23PRATLONG Léo – IRD Montpellier – 08/2007
PROTOCOLES
• Version 1.6 de MDweb
= Z3950
= CSW
• Serveur Z3950 Installation côté donnéesEffectue la requête sur la base de données
qu’il relie • Client Z3950
Inclus dans MDweb
• Protocole Z3950Communication entre le client et le serveur Z3950Nécessité d’ouverture d’un port (2100, ici)
24PRATLONG Léo – IRD Montpellier – 08/2007
ARCHITECTURE DE MDWEB : Besoins
• Serveur Apache et serveur cartographiqueServeur Apache MapServer
• Serveur de base de donnéesPostgreSQL avec extension PostGis
= Besoin logiciel
• Windows
• UnixSolution choisie : Serveur virtuel
Linux CentOS sur machine distante
= Systèmes d’exploitation
25PRATLONG Léo – IRD Montpellier – 08/2007
Installation de MDweb
26PRATLONG Léo – IRD Montpellier – 08/2007
INTERFACES D’UTILISATION (1/3)
= Accès SSH : accès par un client (putty)
= Webmin : portail web
= Netdrive : accès par client
= PhpPgAdmin : portail web
27PRATLONG Léo – IRD Montpellier – 08/2007
INTERFACES D’UTILISATION (2/3)
• Interpréteur de commandes ShellAccès non restreintIndispensable pour travailler en mode console
= Accès SSH
• Interpréteur de commandes shellAccès restreint (absence de « vi »)
• Interpréteur de commandes PostgreSQL
• Commandes personnalisésActivation / redémarrage des serveurs
• Journal d’erreurs Apache / PhpDifficulté à repérer les erreurs instantanément
= Webmin
28PRATLONG Léo – IRD Montpellier – 08/2007
INTERFACES D’UTILISATION (3/3)
• Interface de gestion de fichiers distantsLogiciel très instableInterprète les fichiers Php inutilisableNécessité de renommer les fichiers *.php pour transférerMet en péril la stabilité du reste du système
= Netdrive
• Interface de gestion de base de données PostgreSQL
• Vue globale de la base
= PhpPgAdmin
29PRATLONG Léo – IRD Montpellier – 08/2007
INSTALLATION DE MDWEB 1.5
= Problèmes techniques
• Peu de docs
• Documentation pour Windows mal adaptée à Linux
• Bugs importants
= Inconvénients
• Réseau
• OutilsAccès limitéPeu ergonomique
30PRATLONG Léo – IRD Montpellier – 08/2007
INSTALLATION DE MDWEB 1.5 : problèmes
= Serveur Z3950
• Nombreuses erreurs (mapscript.so, fichiers introuvables, …)
• Bug persistant : impossibilité de modification du style des shapes
• Conséquences : installation très longue
• Aucune documentation spécifique pour Linux
= Serveur Cartographique
• Documentation inexistante
• Impossibilité d’exécuter la GUI d’installation installation impossible
• Impossibilité de correction du code
• Messages d’erreur peu explicites et illogiques31PRATLONG Léo – IRD Montpellier – 08/2007
INTEROPERABILITE
32PRATLONG Léo – IRD Montpellier – 08/2007
INTEROPERABILITE
= Conclusion
• Z3950 entre Mdweb et Géonetwork et entre Mdweb et Mdweb
• Communication active entre un serveur et un client
• Reçoit la réponse
• Ne parvient pas à interpréter et afficher la fiche
• NB : fonctionne de manière opérationnelle sur d’autres serveurs Unix (MTD)
= Z3950 : résultats
• Presque opérationnel
• Installation peu facile
33PRATLONG Léo – IRD Montpellier – 08/2007
INTEROPERABILITE
= Conclusion
• Testé : CSW entre MDweb et Géonetwork
• Implémentation du CSW nécessaire (version 1.6 encore instable, donc ici, Mdweb 1.5 enrichi du CSW)
• Reçoit les métadonnées
• Géonetwork renvoie du DublinCore : Mdweb ne l’interprète pas
• Pas d’ouverture de port
= CSW
• Opérationnel
• Technologie actuelle encore non adaptée (donc incompatibilité)
34PRATLONG Léo – IRD Montpellier – 08/2007
LIVRABLES
= Installation de Mdweb1.5 sur serveur Linux CentOs
= Documentation pour l’installation de Mdweb 1.5 sur serveur Linux CentOS
= Documentation sur les thesauri
= Documentation sur l’utilisation de MDweb
= Thesauri
35PRATLONG Léo – IRD Montpellier – 08/2007
CONCLUSION
= Interopérabilité possible : mieux vaut préférer le CSW
= Mdweb : beaucoup de fonctionnalités, mais peu opérationnel
= Outil peu concurrentiel face à Geonetwork
= Installation de Mdweb sur serveur Linux peu pratique
36PRATLONG Léo – IRD Montpellier – 08/2007
PERSPECTIVES
= Standardisation du CSW aux autres outils
= Mdweb 2.0 : version Java avec installation facilitée et CSW
37PRATLONG Léo – IRD Montpellier – 08/2007