IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.
-
Upload
tederich-duberstein -
Category
Documents
-
view
104 -
download
0
Transcript of IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.
IT-Zertifikat der Phil.Fak
Kurs 4: Daten- und Metadatenstandards
Patrick Sahle DC / OAI WS 08/09
Hausaufgaben der letzten Stunde
• Probleme und Lösungen
• Meine Lösung
Dublin Core (DC)
• Einstieg:• http://de.wikipedia.org/wiki/Dublin_Core
• http://en.wikipedia.org/wiki/Dublin_Core (besser!)
• http://dublincore.org/
• Organisatorischer, historischer und konzeptioneller Hintergrund
Dublin Core
• einfacher Satz an Elementen/Begriffen zur Beschreibung von Objekten auf der Metadatenebene
• core elements, version 1.1, ISO 15836 (2003):• http://dublincore.org/documents/dces/
• identifier
• format, type, language
• title, subject, coverage, description
• creator, publisher, contributor, rights, provenance
• relation, source
• date
Dublin Core
• "Dublin Core Simple" (15 Elemente) vs.
• "Dublin Core Qualified" (element refinements)
• "Begriffe im Namensraum DCTerms" (55 Elemente):
http://dublincore.org/documents/dcmi-terms/
Dublin Core• … definiert Begriffe / Konzepte, keine Syntax
• … kann ausgedrückt werden z.B. mittels HTML oder XML
<head>
<meta name="DC.title" content="DC Einführung"/>
<meta name="DC.creator" content="Patrick Sahle"/>
<meta name="DCTERMS,created" content="2009-01-20" />
<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" />
<dc:title>DC Einführung</dc:title>
<dc:creator>Patrick Sahle</dc:creator>
<dcterms:created>2009-01-20</dcterms:created>
Dublin Core• Anwendungsbeispiel: OPAL
• http://www.opal-niedersachsen.de/
Dublin Core - Anwendungsbeispiel: OPAL - Präsentationssicht
Dublin Core - Anwendungsbeispiel: OPAL – Interne Datensicht (gekürzt)
<?xml version="1.0" encoding="UTF-8" standalone="no"?><!DOCTYPE opalcollection PUBLIC "opal.dtd" "http://opal-niedersachsen.de/opal.dtd"><opalcollection> <record> <dc.identifier.opal>kunsdeung_niedge_94</dc.identifier.opal> <dc.identifier type="cat-no">112</dc.identifier> <dc.creator>Vliegher, Simon de (um 1600-1653)</dc.creator> <dc.creator type="alternative">De Vliegher, Simon</dc.creator> <dc.creator type="alternative"></dc.creator> <dc.title>Vliegher, Simon de (um 1600-1653): Christus und die Jünger im Seesturm</dc.title> <dc.format.extent>84,5 x 101 cm</dc.format.extent> <dc.format.extent type="size">84,5 x 101 cm</dc.format.extent> <dc.format.material>Holz</dc.format.material> <dc.type.opal>Gemälde</dc.type.opal> <dc.type type="MIME">image/jpeg</dc.type> <dc.description label="Beschreibung" type="abstract">Holz, 84,5 x 101 cm. - Bezeichnet links unten auf einer schwimmenden Tonne: S/DE/VLIEGER/1637. Auf der Rückseite eine Brandmarke: /£ […]</dc.description> <dc.description label="Kommentar">Dieses frühe Werk de Vlieghers zählt zu seinen seltenen biblischen Historien. […] </dc.description> <dc.relation.isReferencedBy type="bibliographic">G. Hoet, Catalogus of Naamlijst van Schilderijen, met derzelven Prijzen. 's-Gravenhage 1752, Bd. 2, S. 390, Nr. 24. […]</dc.relation.isReferencedBy> <dc.relation.image url="http://www.opal-niedersachsen.de/content/kunsdeung_niedge_94/000001.jpg" download="yes" use="hide">Foto</dc.relation.image> <dc.publisher.digital>Kunstsammlung der Universität Göttingen</dc.publisher.digital> <dc.date.digital>2005</dc.date.digital> <dc.identifier.collection>kunsdeung_niedge</dc.identifier.collection> <dc.relation.isPartOfCollection>Niederländische Gemälde aus der Kunstsammlung der Universität Göttingen</dc.relation.isPartOfCollection> <opal.isLocatedAt>Göttingen</opal.isLocatedAt> <dc.rights type="image">Kunstsammlung der Universität Göttingen</dc.rights> <dc.rights type="metadata">Texte: Dr. Gerd Unverfehrt, Fotos: Kunstsammlung der Universität Göttingen</dc.rights> </record>
Dublin Core• Anwendungsbeispiel: OPAL
• myOpal xmlDownload ein Beispiel
• Was ist hier los? Ist das noch Dublin Core?
• Lokale Anwendung! Dokumentation über "Application Profile"
• Bei Bedarf leicht übersetzbar auf Standard-"Dublin Core" (simple oder qualified)
OAI = Open Archives Initiative(eigentlich: OAI-PMH = Protocol for Metadata Harvesting)
OAI
• Einstieg: • http://de.wikipedia.org/wiki/Open_Archives_Initiative
• http://en.wikipedia.org/wiki/Open_Archives_Initiative
• http://www.openarchives.org/
• http://www.openarchives.org/OAI/openarchivesprotocol.html
• Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über das Internet
• Wichtige Begriffe / Konzepte: Data-Provider, Service-Provider
OAI
• Datenkommunikation über http-Request• Basisadresse + Script + Verb (+ Argument)?
• Sechs "Verben" zur Kommunikation• Identify [wer bist du?]
• ListMetadataFormats [was sprichst du?]
• ListSets [was hast du für Sammlungen?]
• ListIdentifiers [gib mir deine Identifier]
• ListRecords [gib mir Datensätze]
• GetRecords [gib mir Datensätze]
• Sechs "Argumente": metadataPrefix, identifier, from, until, set, resumptionToken
OAI
• Beispielanwendungen• OAISTER (Service Provider): http://www.oaister.org/
• ZVDD (Data Provider): http://www.digitalisiertedrucke.de/• http://www.digitalisiertedrucke.de/oai2d.py?verb=ListSets
• BSB (Data Provider): http://www.bsb-muenchen.de/• http://mdz1.bib-bvb.de/~db/OAI/oai2.php?verb=Identify
• CEEC (Data Provider): http://www.ceec.uni-koeln.de/• http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=Identify
• Spielen Sie mit diesen Schnittstellen! Teilweise können Sie einfach die Links benutzen (und dann die Adressen studieren). Bei CEEC müssten Sie selbst den Request formulieren (die URL zusammenbauen)
OAI
• Beispielanwendung CEEC• Handschrift Dom 213
• Bild: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/pagesma/%22kn28-0213_001.jpg%22/segment/%22body%22
• Beschreibung: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/katl/%22kn28-0213%22
• XML (TEI-like): http://www.ceec.uni-koeln.de/projekte/CEEC/database/descriptions/kn28-0213.xml
• OAI (oai_dc): http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&identifier=kn28-0213
DC revisited
• Vor und Nachteile?
• Lob der Einfachheit! Fluch der Einfachheit!
• Informationsreduktion? (Strategien dagegen?)
• Gebunden an Perspektiven und Wissensbereiche
• Was ist das Objekt?• Granularität, Seitenbezug
• Typ, Ontologischer Status
•[Beispiel: was ist das "Datum" eines digitalisierten Objekts? Ist das digitale Bild eines Textes ein Bild oder ein Text? Ist Kermit ein Frosch oder eine Puppe?]