Post on 05-Apr-2015
Praxis derMetadatenerfassung
Markus EndersGoettingen State and University Library
www.sub.uni-goettingen.de/GDZ
Meta- und Strukturdaten
Retrieval
Anzeige
Navigation
Meta- und Strukturdaten
Elektronisches Inhaltsverzeichnis:
im PDF
Meta- und Strukturdaten
Elektronisches Inhaltsverzeichnis im Web:
Meta- und Strukturdaten
Elektronisches Inhaltsverzeichnis im Web:
Links zuden Seiten
Datenformat
RDF/XML
Logische Strukturen
pro Seite nur ein Image
eine Start- / Endseite pro log. Struktureinheit
Optional: Volltext
Datenformat
RDF/XML
Logische Strukturen
pro Seite nur ein Image
eine Start- / Endseite pro log. Struktureinheit
Zukünftig METS:
technische Metadaten
Physische Struktur
Derivate von Images
Meta- und Strukturdaten
Metadatenerfassung
Aufnahme in den Katalog
Anschliessend detailliertere Erfassung
Identifier wird während des Workflows zur eindeutigen Benennung von Ordnern / Dateien genutzt.
Meta- und Strukturdaten
Erfassung vor dem Scannen
Anhand des gedruckten Buches
Erfassung in ein Excel_Sheet
Konvertierung in RDF/XML-Datei
Meta- und Strukturdaten
Logische Seitennummern
Aufgedruckt Paginierung;
Physische Seitennummern
Paginierungssequenzen:
Eindeutige Benennung der Seiten
Meta- und StrukturdatenPaginierungssequenzen:
Spalten A and C:
Gezählte Start/Endseiten logische Seitennummern
Spalten D and E:
Ungezählte Start- und Endseiten
Spalten M and N:
Physische Seitennummer (errechnet)
Meta- und StrukturdatenStrukturdaten:
Spalte B:
Typ d. Strukturelements
Spalten C und D:
Startseite des Strukturelements
Spalten H und I:
Autor und Titel des Strukturelements
Meta- und StrukturdatenStrukturdaten:
Metadata:
TitleAuthor
Erfassen der Metadaten
Meta- und StrukturdatenStrukturdaten:
Metadata:
TitleAuthor
Erfassen der Metadaten (Autor und Titelinformation)
Meta- und StrukturdatenStrukturdaten:
Metadata:
Erfassen der Metadaten (Autor und Titelinformation)
OCR der Inhaltsverzeichnisse
Funktioniert nicht bei schlechter Druckqualität oder Frakturschrift
Meta- und StrukturdatenMetadatenübernahme
Katalogmetadaten
Übernahme der Metadaten aus dem OPAC
Download mit WiniBW
Java-Programm zum mergen der Katalogdaten mit den XML-Daten
Meta- und Strukturdaten
Erfassung nach dem Scannen
Images werden zur Metadatenerfassung genutzt
AGORA XML-Editor
Keine Konvertierung notwendig
Meta- und StrukturdatenAGORAEditor
Meta- und StrukturdatendocWorks
Software des METAe-projekts
derzeit im Testeinsatz
automatische Generierung der Struktur- und Metadaten...
Volltext
Im TEI/XML Format (mit Wortkoordinaten möglich)
Manuelle Erfassung (Dienstleister)
Automatische Generierung mit AGORA Konverter (unkorrigierter OCR-Text)
mit docWorks (während Meta- und Strukturdatenerfassung; derzeit noch kein TEI/XML)
Management
Dokumentenmanagement System
Ein System für alle Projekte
Erweiterung/Updates stehen für alle Projekte zur Verfügung
Einfache Pflege und Administration
Import
Batch-Import der Meta- und Strukturdaten mit den Images
Volltexte (TEI/XML) können separat importiert werden
Dokumenten-Management
AGORA
Java-Servlet
Meta-, Strukturdaten und Volltexte in relationaler Datenbank
Imagedaten im Dateisystem
Verity-Engine zur Volltextindexierung
Kooperation mit „Satz-Rechen-Zentrum“
Dokumenten-ManagementAdministration
Dokumenten-ManagementAdministration
Derzeit Windows basiert
Web-basierte Administrationsoberfläche in Entwicklung
Dokumenten-ManagementWeb-Präsentation
WebMacro Templates
Auch XML-Ausgabe realisierbar
Cache-Verwaltung (von HTML-Seiten)
Als JAVA-Servlet realisiert
Dokumenten-ManagementWeb-Präsentation
http://gdz.sub.uni-goettingen.de