Dublin Core
Théorie et applications Formation “Métadonnées” MEDIATIX
Saint-Cloud, 16-17 sept. 2009
Catherine Morel-Pair, INIST-CNRS
[email protected] partageable sous Licence Creative Commons
mailto:[email protected]://creativecommons.org/licenses/by-nc-sa/2.0/fr/http://creativecommons.org/licenses/by-nc-sa/2.0/fr/http://creativecommons.org/licenses/by-nc-sa/2.0/fr/
20/10/10 C. Morel-Pair
Introduction Les éléments Dublin Core et leur implémentation
Modules Dublin Core Formats d’écriture
Outils et applications Outils de formation … Archives ouvertes et protocole OAI-PMH ; TEF … Web sémantique et Web 2.0
20/10/10 C. Morel-Pair
Dublin Core Metadata InitiativeObjectif
“Pallier les insuffisances des métadonnées HTML” pour donner une sémantique au Web Métadonnées HTML insuffisamment définies et
utilisées … Par un standard généraliste pour le Web,
une “description bibliographique simplifiée” pour décrire tout type de ressource … et améliorer la “resource discovery”
20/10/10 C. Morel-Pair
Métadonnées (X)HTML ? Embarquées, dans l’en-tête de la page
Dans le navigateur : “Affichage”, “Source” Ou : clic droit, informations sur la page Ex : http://www.loc.gov/index.html
Métadonnées descriptives du contenu
20/10/10 C. Morel-Pair
Métadonnées HTML, limites Peu de documentation d’accompagnement :
DTD seule HTML est un format d’affichage pour le Web
Peu de structuration logique du document, et de description Décrit des pages HTML … seulement “Détournement” de métadonnées …
Utilisation insuffisante par les producteurs de sites … et par les moteurs
“Alternatives” Développement du Dublin Core Autres métadonnées HTML spécifiques Structuration accrue des pages “référencement naturel”
20/10/10 C. Morel-Pair
Dublin Core Metadata Initiative
Atelier à Dublin (Ohio) en 1995 (“OCLC/NCSA Metadata Workshop”) DCMI, Dublin Core Metadata Initiative Devenu une “fondation”
Normalisation internationale ISO 15836-2003, http://www.niso.org/standards/resources/Z39-85.pdf
Groupes de travail thématiques évolutifs, workshop annuel
http://www.dublincore.org acteurs et activités documentation et recommandations logiciels et outils …
http://www.niso.org/standards/resources/Z39-85.pdfhttp://www.dublincore.org/
20/10/10 C. Morel-Pair
I - Dublin Core, modules DC simple
15 éléments caractérisés par 10 propriétés Norme ISO 15836-2003, RFC 5013, ANSI-NISO 39.85
DC qualifié + “qualificatifs” (DCTERMS, “refinements, qualifiers, extensions”)
caractérisés DC étendu :
+ éléments issus d’autres standards (Learning Object Metadata, IEEE-LOM)
+ éléments récents : gestion de collections …
“Encoding schemes”, standardisation des valeurs des éléments : ressources reconnues
20/10/10 C. Morel-Pair
Dublin Core, des éléments bien définis
Chacun des 15/16 éléments est défini par 10 propriétés (norme ISO/IEC 11179 - registres de métadonnées) Name (identifiant invariable) et Label(traductions
possibles) Définition et Commentaire Version (1.1 actuelle) Autorité de gestion (DCMI) Langue de l’identifiant (anglais) Obligation et Occurrence de l’élément
tous sont facultatifs et répétables Type de son contenu (tous = texte)Voir en Français :http://www-rocq.inria.fr/~vercoust/METADATA/DC-fr.1.1.html
5 propriétés pour chaque qualificatif
http://www-rocq.inria.fr/~vercoust/METADATA/DC-fr.1.1.html
20/10/10 C. Morel-Pair
Dublin Core simple, les 15 éléments
Descriptifs du contenu Title, Description, Subject, Coverage Type, Language Relation
Description des droits Creator, Contributor, Publisher Rights Source
Techniques - structure Date, Format, Identifier Relation
un exemple en HTML www.inist.fr
http://www.inist.fr/
20/10/10 C. Morel-Pair
DC simple, éléments1 - description du contenu
Title : nom donné à la ressource Exemple : titre d’un article, nom d’une œuvre d’art …
Description : description du contenu de la ressource Exemple : résumé, table des matières, texte libre
Subject : sujet du contenu de la ressource Mots-clés, classification Recommandation : issus d’une “source reconnue”
Coverage : portée ou couverture spatio-temporelle de la ressource Période de temps ; entité ou position géographique ; juridiction
administrative Recommandation
Vocabulaire contrôlé (ex : TGN) Modèles de valeurs si numériques (DCMI Box, Point, Period) …)
Exemple : couverture d’une base de données
20/10/10 C. Morel-Pair
DC simple, éléments1 - description du contenu
Relation : référence à une autre ressource qui a un rapport avec la ressource décrite (rapport logique, ici ) R. : système formel d’identification (ex. URL, DOI …)
Type : nature ou genre du contenu Décrit des catégories, fonctions ou genres généraux du contenu R. : vocabulaire contrôlé, exemple : vocabulaire DCMItype
12 valeurs : Text, Event, Dataset, Service, Moving image … NB : autres vocabulaires, ex. CRGI (Canada)
Language : langue du contenu intellectuel de la ressource Valeurs conformes à RFC 3066
code langue à 2 ou 3 caractères (normes ISO 639) éventuellement suivi d'un code à deux lettres pour le pays (norme ISO
3166)
http://dublincore.org/documents/dcmi-type-vocabulary/http://dublincore.org/documents/dcmi-type-vocabulary/http://www.tbs-sct.gc.ca/im-gi/mwg-gtm/typ-typ/docs/2003/schem/schem-fra.asp
20/10/10 C. Morel-Pair
DC simple, éléments2 - description des droits
Creator : entité principale responsable de la création du contenu de la ressource … auteur, compositeur … Personne, collectivité ou service
Contributor : entité qui a contribué à la création du contenu de la ressource ; personne, collectivité ou service
Publisher : entité responsable de la diffusion de la ressource dans sa forme actuelle, Personne, collectivité ou service : département universitaire,
entreprise … Source : référence à une ressource dont la ressource actuelle
dérive en totalité ou en partie ex : BD statistiques rapport Recom. : système formel d’identification
Rights : droits sur la ressource Propriété intellectuelle, droits à gérer cette ressource, droits d’usage
…
20/10/10 C. Morel-Pair
DC simple, éléments3 – description technique
Date : une date associée avec un événement dans le cycle de vie de la ressource Exemple : date de création, modification, publication R. : norme ISO 8601 (W3CDTF), AAAA-MM-JJ
Identifier : référence non ambiguë à la ressource dans un contexte donné R : système formel d’identifiants uniques (URI)
dont URL, DOI, ISSN …
Format : décrit la matérialisation physique ou digitale de la ressource Support, média, dimensions (taille, durée …)
Éventuellement, logiciel ou matériel indispensable R : vocabulaire contrôlé de type MIME
Relation … dans ses aspects techniques - structure
20/10/10 C. Morel-Pair
Dublin Core étendu : des éléments complémentaires
audience
instructional method
Groupe de personnes à qui le document est destiné.
Méthode d’apprentissage
provenanceChangements signifiants pour authenticité, intégrité, interprétation depuis création : propriétaire, dépôt …
accrualMediumaccrualPeriodicityaccrualPolicy
(évolution collections)Méthode d’ajouts de nouveaux itemsFréquence des ajoutsPolitique d’accroissement
20/10/10 C. Morel-Pair
DC qualifié : plus de précision
Exemples
TitleNom donné à la ressource, titre du document
alternative : autre titre (traduit, abrégé …)
Subject
Mots-clés, codes de classement, sujet.Utilisation de vocabulaires ou classifications contrôlés recommandée (LCC, UDC,DDC LCSH, Mesh)
DescriptionDescription du document, résumé, table des matières, texte libre
abstracttableOfContents
20/10/10 C. Morel-Pair
DC qualifié, exemples élément “relation”
Relation
Lien vers une ressource liée.Il est recommandé d'utiliser une dénomination formelle des ressources (URI)
Qualificatifs
isFormatOf / hasFormatisVersionOf / hasVersionisReplacedBy / replacesisPartOf / hasPartisReferencedBy / referencesisRequiredBy / requiresconformsTo
20/10/10 C. Morel-Pair
DC qualifié, exempleélément “date”
Date Date d'un évènement dans le cycle de vie du document. Recommandation : format W3CDTF (AAAA-MM-JJ), norme ISO et Period (DCMI).
Qualificatifs created : date de créationvalid : date ou période de validitéavailable : date/période de mise à dispositionissued : date de publicationmodified : date de modificationdateAccepted : date d'acceptation (thèse, article…)dateCopyrighted : date du copyright dateSubmitted : date de soumission (article...)
20/10/10 C. Morel-Pair
Les schémas d’encodage “sémantiques” et “syntaxiques”
Pour l’homogénéisation et la non-ambiguïté du contenu des éléments Valeurs basée sur des ressources reconnues
Thésaurus, classements et ontologies… DC : LCSH, MESH, LCC, DDC, TGN, DCMItype
Listes d’autorité personnes ou organismes Codes ISO, RFC …
DC : codes langues et pays Modèles de valeurs attendues
Ex : structure d’un ISSN, d’une date + DC : zone géographique, périodes de temps …
Identifiants uniques des ressources : URI
20/10/10 C. Morel-Pair
Dublin Core, intérêt et limites
Consensus international et interprofessionnel Sémantique “commune” interdisciplinaire ; “multilinguisme” Simplicité – 2 niveaux d’usage Extensibilité et flexibilité Normalisation ET évolutivité
largement adopté aujourd’hui
Description généraliste pour la recherche d’informations Ressource plutôt électronique et isolée Métadonnées techniques et administratives limitées Architecture peu contraignante
… en association avec d’autres éléments
20/10/10 C. Morel-Pair
Dublin Core, plus d’info … Métadonnées et Dublin Core, OpenWeb group
http://www.openweb.eu.org/articles/dublin_core/… tous les éléments, qualificatifs, schémas d’encodage
Liste de discussion francophone Dublin Core http://listserv.inist.fr/wwsympa.fcgi/info/dcmi-fr
Site officiel DCMI, http://dublincore.org Guide d’usage “Using Dublin Core” ,
http://dublincore.org/documents/usageguide/ Généralités - Syntaxes – liens vers documents spécifiques
Bonnes traductions de documents du DCMI http://www.yoyodesign.org/doc/dcmi/
http://www.openweb.eu.org/articles/dublin_core/http://listserv.inist.fr/wwsympa.fcgi/info/dcmi-frhttp://dublincore.org/http://dublincore.org/documents/usageguide/http://dublincore.org/documents/usageguide/http://www.yoyodesign.org/doc/dcmi/
20/10/10 C. Morel-Pair
TP: éléments Dublin Core Objectif : découvrir les éléments Dublin Core
en décrivant une ressource Ouvrir crozat_notice.htm avec un navigateur
= notice de thèse en HTML contenant les informations à récupérer
Ouvrir crozat_DC.xls et renseigner la “notice” Dublin Core simple ou qualifié Tous les éléments sont facultatifs et répétables Préciser la valeur avec un “attribut” ???
Disponibles : langue … type (DC qualifié slt) Conclusions
20/10/10 C. Morel-Pair
II - Dublin Core, syntaxes d’écriture
Pages HTML, XHTML : métadonnées dans la ressource
Un exemple : site INIST
Fichier XML : métadonnées dans un autre fichier En RDF : les 2 possibilités
Flexibilité : éléments et qualificatifs facultatifs et répétables, formats divers
Extensivité : association possible avec des métadonnées d’autres origines
NB : “modèle abstrait” 2008 évolutions en cours
http://www.inist.fr/
20/10/10 C. Morel-Pair
1 - Dublin Core, HTML et Internet Non pris en compte
par les “grands” moteurs !
Espoirs … Moteurs spécialisés Sites professionnels +++ Logiciels Web2 (Zotero …) Intérêt des webmasters
« la question que doivent se poser les webmestres à cet instant est : les « grands » moteurs de recherche comprennent-ils le Dublin Core ? Non. La question qui suit, logiquement est : et donc, par rapport aux meta-tags classiques, que m'apporte leDublin Core ? Rien. »
« Mais l’ensemble des dysfonctionnements d’Internet réside surtout dans l’absence de structuration et de classement des données présentes sur le réseau, ce qui empêche le repérage de l’information et l’accès au document. Pourtant, l'utilisation de données sur les données - les Métadonnées - a été prévu par les concepteurs du Web »
« cependant, il est deux choses à rendre en compte : - le Dublin Core est un standard et plus ce standard
sera accepté, plus il sera employé, et par les webmestres et par les moteurs de recherche,
- dans le cas de sites intranet, il existe des outils qui prennent en compte les balises Dublin Core. Si les balises sont bien renseignées, ces outils sont d'une redoutable efficacité ! »« C’est ainsi que deux mondes distincts – celui de l’Internet et celui de la bibliothéconomie – se sont rencontrés et ont travaillé ensemble à l’amélioration de la technique des métadonnées. L’initiative du Dublin Core est une bonne illustration de cette collaboration »
http://dublincore.org/tools/
20/10/10 C. Morel-Pair
2 – DC en XMLXML et métadonnées …
XML est le format d’implémentation de
beaucoup de jeux de métadonnées
RDF et RSS sont des schémas XML
particuliers
Méta-formatsMETS …
ImagesXMPMIX
Domaines FGDC, LOM,
…
Métiers MARC-XML, MODS
EAD-EACONIX
Applis DC
PREMIS
20/10/10 C. Morel-Pair
Fichier Dublin Core en XML Déclaration des “espaces de nom”
( fait par l‘éditeur XML)
Dublin Core simple
fr Recherche d’information
Dublin Core qualifié2002-06Numeric… … Plus “pro” : plus d’attributs et de valeurs contrôlées
http://purl.org/dc/terms/http://purl.org/dc/terms/
20/10/10 C. Morel-Pair
Dublin Core simple en XML
Recherche d’information dans … Chartron, Ghislaine Dans une … fr nformation retrieval Electronic publishing 2002-03-25 http://archivesic.ccsd.cnrs.fr/sic_00000025.en.html
Text
20/10/10 C. Morel-Pair
Dublin Core qualifié en XML[espaces de nom …]UKOLNUK Office for Library and Information
Networkingnational centre, network information
support, library,community, […] 062061(410)
http://www.bath.ac.uk http://www.ukoln.ac.uk/2001-07-18
20/10/10 C. Morel-Pair
III - Quelques outils d’implémentation
Voir http://dublincore.org, Tools and Software (sous Firefox) … et ailleurs … !
1 - des outils d’aide à la découverte/création Aide-mémoire DC-assist add-on Firefox d’affichage des métadonnées DC
“Firefox Dublin Core Viewer Extension”
http://dublincore.org/
20/10/10 C. Morel-Pair
Dublin Core, affichage Mozilla
20/10/10 C. Morel-Pair
DC, outils 2 - Convertisseurs
Exemple : DC-Dot, Dublin Core Metadata Editor Des métadonnées (X)HTML
… vers des métadonnées DC en (X)HTML, XML, RDF Et vers d’autres jeux d’éléments : MARC, TEI …
Convertisseur + formulaire de saisie + « extracteur » TP
Entrer une URL, ex. http://www.loc.gov/index.html Regarder le résultat généré ; compléter les métadonnées
dans le formulaire, soumettre à nouveau Utilisation des métadonnées DC générées
En HTML : coller dans la page HTML Autres : “notice”pour catalogue, portail …
http://www.loc.gov/index.html
20/10/10 C. Morel-Pair
Dublin Core, outils (3)Autres
3 - Des “templates”, formulaires de saisie DC-Dot Interface des systèmes de gestion de bases de données
4 - Des “extracteurs” Besoin de structure … cf Lodel
5 - Des outils intégrés à des applications Content Management System comme MKdoc Outils OAI-PMH et archives ouvertes Plateformes éditoriales : Lodel, Dspace … … … Logiciels documentaires – fonction portail …
20/10/10 C. Morel-Pair
Lodel et Dublin Core Lodel : plate-forme éditoriale développée par
Revues.org Revues SHS
Présentation paramétrable Voir www.revues.org et http://lodel.demo.inist.fr
Organisation arborescente revue, année, numéro … par exemple
D’un document Word ou Open Office à la mise en ligne en format XHTML Publication document et extraction des métadonnées Contrainte : documents stylés selon le modèle Lodel
Préparation : stylage/marquage des éléments du .doc Soumission, publication
http://www.revues.org/http://lodel.demo.inist.fr/
20/10/10 C. Morel-Pair
D’un article publié ailleurs à la publication avec Lodel …
20/10/10 C. Morel-Pair
Article stylé selon le modèle Lodel
20/10/10 C. Morel-Pair
Lodel, soumission
20/10/10 C. Morel-Pair
Lodel, soumission (2)
20/10/10 C. Morel-Pair
Résultat
20/10/10 C. Morel-Pair
L’article dans Lodel, la source du document
[en-tête : métadonnées de type HTML puis DC : ]
[ autres DC.* …]
[Puis corps du texte]… Voir les sources d’articles de Revues.org
20/10/10 C. Morel-Pair
IV - Applications …Archives ouvertes
et protocole OAI-PMH
Bibliothèques numériques(profil libraries)
eBooks : standard ePUB
Corpus Recherche (OLAC …)
Thèses Electroniques Fr
Répertoires et portails des informations
publiques
Annuaires et portails
XMP et images / pdfWeb sémantique
Applications Web 2.0
Profils d’applications
Z39.50OpenURL
20/10/10 C. Morel-Pair
1 - Accès libre, archives ouvertesprotocole OAI-PMH
Un principe : le libre accès à l’information scientifique et technique Intérêt :
Accessibilité, visibilité, impact Modèle économique et social alternatif
Des pionniers, 1990-93 : ArXiv, WoPEc, ADS astrophysique, CogPrints
Conférences/conventions de Budapest, Bethesda, Berlin, Genève…: Le libre accès aux résultats de la recherche devient un postulat Différents pays et institutions adhèrent formellement à ce principe Distinctions formelles
revue libre accès / archive ouverte archive thématique / institutionnelle
Voir http://openaccess.inist.fr/
http://openaccess.inist.fr/
20/10/10 C. Morel-Pair
Archives ouvertes, protocole OAI-PMH
Extension rapide du mouvement BioMedCentral, PLoS…, serveurs du CCSD (HAL …), Plus de 2200 archives répertoriées, contenant plus de 20
millions de ressources http://gita.grainger.uiuc.edu/registry/ (1850 en 2008) http://www.opendoar.org/index.html (1200)
http://roar.eprints.org/ (940, 2008) Protocole OAI-PMH, 2001 : protocole de structuration et
d’interrogation des entrepôts de métadonnées pour l’interopérabilité HTTP, XML, Dublin Core Acteurs : data providers et service provider “verbes” de requête
http://gita.grainger.uiuc.edu/registry/http://www.opendoar.org/index.htmlhttp://roar.eprints.org/
20/10/10 C. Morel-Pair
OAI-PMH du côté utilisateurs Recherche dans un ensemble d’archives avec des
moteurs spécialisés, “moissonneurs” http://oaister.umdl.umich.edu/o/oaister/
nov. 2005 : 477 archives, 5 277 000 enregistrementsjanvier 2008 : 14 673 000 enregistrements
http://citebase.eprints.org/cgi-bin/search (facteur d’impact”) Ordre : descending, citations
http://www.scientificcommons.org (2007: 898 archives, 16M enr.)
Auto-archivage exemple dans HAL, Hyper Articles on Line, CCSD-CNRS
http://hal.archives-ouvertes.fr
http://oaister.umdl.umich.edu/o/oaister/http://citebase.eprints.org/cgi-bin/searchhttp://www.scientificcommons.org/http://hal.archives-ouvertes.fr/
20/10/10 C. Morel-Pair
Résultat requête OAIster
20/10/10 C. Morel-Pair
HAL, soumettre
20/10/10 C. Morel-Pair
OAI-PMH
?
Fournisseur de données
Fournisseur
de services
20/10/10 C. Morel-Pair
OAI-PMH, les entrepôts Contenu minimal d’un entrepôt de
métadonnées Enregistrements compatible OAI-PMH
Dublin Core – XML Dans une base de données (*SQL, ODBC …)
Autres formats moissonnables MARC-XML et MODS METS, EAD … Tout format XML de métadonnées
20/10/10 C. Morel-Pair
OAI-PMH, enregistrement minimal
identifiant, date, setSpec
Recherche d’information dans … Chartron, Ghislaine
Dans une … fr Information retrieval Electronic publishing 2002-03-25 http://archivesic.ccsd.cnrs.fr/sic_00000025.en.html Text
20/10/10 C. Morel-Pair
De la base de donnée interne d’une application à l’entrepôt OAI-PMH
La base de données interne à l’application gère ses propres éléments Ex. application INIST I-Revues, http://irevues.inist.fr
DSpace, MIT cf revue Hermès, 2005, 42, une notice détaillée
Profil d’application Dublin Core qualifié
… et les expose dans l’entrepôt OAI-PMH Ex : l’entrepôt de I-revues, requête sur Hermès,num 42
Idem pour toutes les archives ouvertes et beaucoup de logiciels doc-bib-archivistique
http://irevues.inist.fr/http://documents.irevues.inist.fr/dspace-oai/http://documents.irevues.inist.fr/dspace-oai/request?verb=ListRecords&set=hdl_2042_8929&metadataPrefix=oai_dchttp://documents.irevues.inist.fr/dspace-oai/request?verb=ListRecords&set=hdl_2042_8929&metadataPrefix=oai_dc
20/10/10 C. Morel-Pair
2 -TEF, thèses électroniques françaises
Projet ministériel de valorisation et pérennisation Circulaire, directives Visant une diffusion accrue et des échanges
Accès en ligne Signalement mutualisable dépassant le cadre des bibliothèques
AFNOR CG 46 / CN 357, métadonnées des thèses Vers une chaîne de production unique et automatisée
document électronique – métadonnées … … … Métadonnées : compatibilité OAI-PMH + richesse description
SUDOC Descriptives, version 1 2005 : DC Autres, version 2, 2006
Plateforme de saisie STAR ABES-CINES http://www.abes.fr/abes/page,428,star.html
http://www.abes.fr/abes/page,428,star.html
20/10/10 C. Morel-Pair
Métadonnées TEF Espace de nom TEF
Un “profil d’application” Dublin Core et/puis METS Version 1 : Dublin Core qualifié + MODS et ETD-MS Version 2, mai 2006 : encapsulation METS + droits METS
Valeurs contrôlées : vocabulaires, autorités MADS…
“Les métadonnées des thèses électronique françaises, TEF”, groupe AFNOR CG46/CN357/GE5, V1 http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdf V2 http://www.abes.fr/abes/page,403,tef.html
Journée d’étude sur les thèses électroniques, 26 mars 2009, Médial, Nancy, http://www.univ-nancy2.fr/medial/docligne.html?depuis_id=1093 Diapos suivantes : Isabelle Mauger Perez - ABES
http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdfhttp://www.abes.fr/abes/page,403,tef.htmlhttp://www.univ-nancy2.fr/medial/docligne.html?depuis_id=1093
20/10/10
STAR
imports de données et/ou du document thèse
Ce qui rentre dans STAR
EPrints,Cyberthèses,ORI-OAI, Apogée…
2. Star : comment on s’en sert ?
formulaires web de STAR
5. Star : comment on s’en sert ?
Éviter la double saisie !
20/10/10
STAR
Archivage pérenne *
Signalement *
URL pérenne *
Diffusion
Entrepôts national, international…
Ce qui sort de STAR chaque établissement de soutenance *
serveur OAI
3. Star : à quoi ça sert ? * obligatoire
20/10/10 C. Morel-Pair
TEF V1 … V2Un coup d’œil ?
TEF V1 Le registre
http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdf
Dans Demos/TEF, au choix Description minimale, tef_01_exemple_minimal.xml Description complète, tef_01_exemple_riche.xml Le schéma, tef_schema_01.xsl
TEF V2 http://www.abes.fr/abes/DesktopDefault.aspx?tabindex=4&tabid=403
, ‘Exemples’ (en bas)
http://www.abes.fr/abes/documents/tef/recommandation/tef_01.pdfhttp://www.abes.fr/abes/DesktopDefault.aspx?tabindex=4&tabid=403
20/10/10 C. Morel-Pair
4- eBooks : ePub, OPF et métadonnées sur la publication
Alice in Wonderlanden
123456789X Lewis Carroll…
… …
http://www.openebook.org/2007/opf/OPF_2.0_final_spec.html
http://www.openebook.org/2007/opf/OPF_2.0_final_spec.html
20/10/10 C. Morel-Pair
5 – Logiciels documentaires et DC Dans beaucoup de logiciels aujourd’hui
Exports XML variés des éléments Exposition et moissonnage OAI-PMH via la fonction portail
Plus … Koha, SIM couches internes XML, avec Dublin Core + autres
standards … Logiciels de gestion de références bibliographiques
Endnote exporte du XML maison Zotero, Web 2
Reconnaît et importe les métadonnées DC des pages HTML (entre autres …)
Exporte du DC (entre autres …) Couche interne RDF + DC + FOAF …
20/10/10 C. Morel-Pair
V - RDF Ressource Description Framework
Modèle et cadre syntaxique Pour formaliser des connaissances sur/dans des ”ressources”
très hétérogènes Objets physiques et numériques … Personnes, réseaux, lieux, événements … … Concepts
Intégrant des ensembles d’éléments divers Toute connaissance = triplet “ressource - propriété – valeur” Ecriture : graphes, n3 … – XML
Lisible par machines indépendamment du contexte
20/10/10 C. Morel-Pair
le “Web sémantique”
Un Web de données interconnectées et interprétablles par les machines Echange de données et
création de connaissances “inférence”
Structuration et granularité du contenu
Des standards d’écriture et de requête universels : RDF, OWL, SPARQL
… le “Web 2.0” (accessoirement)
Relie des personnes : “tous acteurs”
Via l’utilisation d’outils simples et collaboratifs
Blogs, wikis … Bibliothèques,
photothèques partagées Réseaux sociaux Plate-formes de “widgets”
Certains : RDF, métadonnées std
RDF pour
20/10/10 C. Morel-Pair
RDF, syntaxe
BNF Jean Gagnon
Aujourd’hui : plus de 10 milliards de triplés RDF sur le Web !
20/10/10 C. Morel-Pair
RDF et Dublin Core Quelques exemples …
Dublin Core a “sa place” pour décrire/structurer des ressources
… parmi d’autres standards et de nouveaux éléments …
20/10/10 C. Morel-Pair
1 – métadonnées “XMP” dans un
PDF ou une image
“Fichier,
Propriétés”
20/10/10 C. Morel-Pair
Document pdf et XMP
“métadonnées supplémentaires, description
20/10/10 C. Morel-Pair
Document pdf et XMP De nombreux espaces de nom
“propriétés, avancé”
20/10/10 C. Morel-Pair
XMP : du RDF extrait : partie Dublin Core
[…]
20/10/10 C. Morel-Pair
2 - Zotero, TP Add-on Firefox de gestion de références
bibliographiques https://addons.mozilla.org/fr/firefox/
Ouvrir Firefox puis Zotero Regarder cadres et boutons …
Aller sur un site interopérable avec Zotero Revues.org un article Catalogue du Sudoc une page de résultats ou un article Article de Peccatte sur métadonnées … Flick’R …
Si oui : icône dans la barre d’URL
https://addons.mozilla.org/fr/firefox/http://www.revues.org/http://www.sudoc.abes.fr/http://www.sudoc.abes.fr/http://www.sudoc.abes.fr/http://peccatte.karefil.com/software/metadata.htmhttp://peccatte.karefil.com/software/metadata.htmhttp://peccatte.karefil.com/software/metadata.htmhttp://www.flickr.com/
20/10/10 C. Morel-Pair
Zotero, TP (suite) Importer les métadonnées correspondantes
dans Zotero : Clic sur l’icône de Zotero dans la barre d’adresse
Intégration dans une collection Zotero Enrichissement possible
Onglets à droite Exporter des métadonnées :
Clic droit sur une collection ou une description “Créer une bibliographie” ( texte stylé) OU
exporter ( XML-RDF) Choix du format des éléments et de la localisation du
fichier : DC, Zotero …
20/10/10 C. Morel-Pair
3 - Logiciel dédié recherche : myExperiment
20/10/10 C. Morel-Pair
myExperiment, architecture Gestion et annotation de contenu et work-flow + réseau social
via une ontologie RDF / SPARQL, avec Dublin Core, FOAF et SIOC, OAI-ORE, Creative
Commons, URI
20/10/10 C. Morel-Pair
4 - LIBRIS, catalogue collectif suédoisRDF, DC et autres …
Source : http://blog.libris.kb.se/semweb/?p=7
http://blog.libris.kb.se/semweb/?p=7
20/10/10 C. Morel-Pair
5 - RDFa et la “valorisation sémantique des publications”
Travail de recherche : structurer un texte pour lui donner une sémantique machine
Voir et naviguer http://imageweb.zoo.ox.ac.uk/pub/2008/plospaper/latest/
Afficher la source Cet article contient des éléments sémantiques balisés, et
utilise de nombreux espaces de nom, dont DC …
L’article expliquant l’expérience : ... semantic enhancement of a research article ... Une tendance actuelle // XML
http://imageweb.zoo.ox.ac.uk/pub/2008/plospaper/latest/http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000361
20/10/10 C. Morel-Pair
6 - DC dans un moteur RDF, Sindice
20/10/10 C. Morel-Pair
VI - Un dernier effort …DCMI Abstract Model
Modèlisation abstraite des entités Dublin Core et de leurs relations DCAM, 2007-2008
DC devient une ontologie, vocabulaire de termes Propriétés (= éléments et raffinements) Schémas d’encodage syntaxiques et sémantiques Classes
Avec des relations entre termes sur le modèle RDF
Et un seul espace de noms : http://purl.org/dc/terms
20/10/10 C. Morel-Pair
DCAM, quelques précisions Ressources
Traductions fr : http://www.yoyodesign.org/doc/dcmi/abstract-model/index.html http://www.yoyodesign.org/doc/dcmi/dcmi-terms/index.html
Registre-outil, http://dcmi.kc.tsukuba.ac.jp/dcregistry/
Syntaxe XML :
20/10/10 C. Morel-Pair
Dublin Core, conclusion Un jeu d’éléments généraliste
Pour décrire tous types/formats de ressources De façon simple ou plus complète Orienté description du contenu intellectuel
Contexte Web Norme et standard - Flexibilité et évolutivité Documentation abondante
De plus en plus d’applications Intégré dans des protocoles d’échange de (méta)données Profils d’application spécifiques adaptés Une place dans le Web sémantique, dans le Web 2
Des outils d’implémentation “Basiques” Développés dans le cadre d’applications
20/10/10 C. Morel-Pair
Merci de votre attention !
Pour toute question ultérieure :
mailto:[email protected]
Diapo 1Diapo 2Diapo 3Diapo 4Diapo 5Diapo 6Diapo 7Diapo 8Diapo 9Diapo 10Diapo 11Diapo 12Diapo 13Diapo 14Diapo 15Diapo 16Diapo 17Diapo 18Diapo 19Diapo 20Diapo 21Diapo 22Diapo 23Diapo 24Diapo 25Diapo 26Diapo 27Diapo 28Diapo 29Diapo 30Diapo 31Diapo 32Diapo 33Diapo 34Diapo 35Diapo 36Diapo 37Diapo 38Diapo 39Diapo 40Diapo 41Diapo 42Diapo 43Diapo 44Diapo 45Diapo 46Diapo 47Diapo 48Diapo 49Diapo 50Diapo 51Diapo 52Diapo 53Diapo 54Diapo 55Diapo 56Diapo 57Diapo 58Diapo 59Diapo 60Diapo 61Diapo 62Diapo 63Diapo 64Diapo 65Diapo 66Diapo 67Diapo 68Diapo 69Diapo 70Diapo 71Diapo 72Diapo 73Diapo 74
Top Related