MIGRATION als Präservationsverfahren Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred...
-
Upload
harald-allwein -
Category
Documents
-
view
110 -
download
5
Transcript of MIGRATION als Präservationsverfahren Universität zu Köln WS 2011/12 Dozent: Prof. Dr. Manfred...
MIGRATIONals Präservationsverfahren
Universität zu KölnWS 2011/12
Dozent: Prof. Dr. Manfred ThallerAM2 (Hauptseminar): Digitale Langzeitarchivierung
Referentin: Bianca Batel08.12.2011
Zustand der Bestände
Digitale Archive
• breites Spektrum an Datei Formaten• bis zum Archiverunszeitpunkt viele veraltet
oder kurz vor Unlesbarkeit (für Software und Hardware
Faktoren für Überalterung
Digitale Archive
• viele Formatspezifikationen sind spezifischer Software zugehörig Veralten der Software Veralten des Formats
• Software oft urheberrechtlich geschützt bei Einführung neuer Versionen werden die alten Formate nicht immer unterstützt
• unbeliebte/unbenutze Formate Abschaffung der Kompatibilität mit Software
Voraussetzungen
Formate für digitale Langzeitarchivierung
• detaillierte technische Informationen über Datei Formate benötigt
• gegeben bei offenen Spezifikationen Unabhängigkeit von bestimmter Software
• internationale Standards
Kriterien
Formate für digitale Langzeitarchivierung
• Disclosure• Adoption• Transparency• Self-documentation• External dependencies• Impact of patents• Technical Production machanisms
für digitale Langzeitarchivierung
Wichtige Properties
• Bewahrung der Zugänglichkeit & Bedeutung• Bewahrung der Authentizität und Integrität• 5 Kategorisierungspunkte (inSPECT): - Inhalt - Kontext (Metadaten) - Erscheinungsbild (z. B. Layout, Farbe) - Verhalten ( z. B. Interaktion, Funktionalität) - Struktur ( z. B. Seiteneinteilung, Absätze)
Kriterien der richtigen Strategie
Archiverungsmethoden
• Realisierbarkeit Fähigkeit von Hardware & Software die Methode zu implementieren
• Nachhaltigkeit muss auch in der Zukunft angewandt werden können
• Nützlichkeit angebrachte Grenzen von Schwierigkeit und Kosten
• Angemessenheit für alle digitalen Objekte eines Typs einsetzbar, erreichen des Archivierungsziels
Migration vs. Emulation
Beste Chancen, zumindest teilweise digitale Langzeitarchivierung zu garantieren
Emulation Inhalt wird sowohl im eigentlichen Format repräsentiert als auch gespeichert
Migration Inhalt wird in einem aktuellen Format wiedergegeben
Zwei Arten von Migration
Migration
• Umstieg der wesentlichen Teile eines Systems/Hardware auf ein anderes Systemmigration
• Transfer von Daten aus einer Umgebung in eine andere Datenmigration
Wichtige Punkte
Migration
• Bewahrung des vollen Informationsinhalts (Content Data Object und Representation Information)
• vollständige Umschreibung durch Metadaten• Umkehrung von Migration Sicherstellung
das keine Daten verloren gehen• Entscheidung über hinnehmbaren Verlust
Migration
Zusammenfassung:
Migration
• Reduzierung der Anzahl Formate die ein Archiv instand halten muss
• Verwendung geeigneter Formate• wichtige Properties müssen erhalten bleiben
Zeitpunkt der Migration
• stabile, sich nicht ändernde Codebasis verwenden
• genügend Erfahrungswerte, ggf. abwarten bis entsprechendes Know-How vorliegt
Vier Variationen der Datenmigration
• Backwards- Kompatibilität• Migration in Standard Formate „on ingest“• Migration in neue neuere/Standard Formate
„on obsolence“• Migration „on request“
bei Backwards- Kompatibilität
Migration
• bei kommerzieller Software• alte Version mit neuer Software geöffnet• in neuem Format gespeichert• bis -Bedrohung einer Überalterung -bessere, backwards- kompatible Version• keine Langzeitlösung für dieses Format
Probleme
Backwards- Kompatibilität
• Update Zwang aus kommerzieller Sicht, nicht zur Langzeitarchivierung
• Verlust oder Veränderung von bedeutenden Properties
• Backwards- Kompatibilität limitiert auf wenige Generationen
• kontinuierlicher Erwerb von neuer Software
in Standard Formate „on ingest“
Migration
• „Nomalisation“, „bei Aufnahme"• Objekt eines Typs werden in ein einziges
Format konvertiert• Entscheidungsfaktor: beste Voraussetzungen
für die Erhaltung Properties• Kontrolle von Kosten & Komplexität• Erhaltung des Bitstreams wenn Konvertierung
nicht möglich ist
Probleme
Migration
• Inhalt ist nicht in ursprünglicher Form erhalten• wertvolle Information könnte verloren gehen• verschiebt das Migrationsproblem, aber löst
es nicht: die Ausgesuchten Formate werden auch überholt
in neuere/Standard Formate „on obsolence“
Migration
• bei Überalterung• Erhaltung der Daten in ihren Ursprünglichen
Formaten• Warnung der technologischen
Überwachungseinrichtungen bei Überalterungen eines Formats
• alle betroffenen Formate konvertiert
in neuere/Standard Formate „on obsolence“
Migration
• Migrations- Optionen: - Konvertierung in einen logischen
Nachfolger/ höhere Version (Backwards- Kompatibiliät) - Konvertierung eines Formats in ein äquivalentes offenes Format - Konvertierung zu einer insgesamt kleineren Anzahl an Formaten (Normalisation)
Probleme
Migration
• Tools sind zwar entwickelt, aber noch nicht in Langzeitarchivierungssysteme integriert
• ähnliche Probleme wie bei Backwards- Kompatibilität und Normalisation
„on request“
Migration
„on request“
Migration
• Migration auf Anfrage• CAMiLEON Projekt• ursprünglicher bitstream bleibt erhalten• eigentlich für Emulatoren entwickelt• ein Tool für jede Klasse an Daten Formaten
Migration
Vorteile & Nutzen
Migration
• Code der ein bestimmtes Datei Format einliest und interpretiert muss nur einmal implementiert werden
• ein Migrationsschritt mehr Genauigkeit• Authentizitätsprobleme minimiert• „Baukasten“ Form umkehrbare Migration
einfacher und günstiger• massive Einsparungen bei großer Datenmenge
„on request“
Migration
Probleme
Migration
• Migration on request Tools müssen dennoch immer wieder aktualisiert werden
• benötigte Einplanung des Zeitaufwandes bis zur Migration
als geeignetes Präservationsverfahren
Migration
• gebräuchliche Strategie der digitalen Langzeitarchivierung
• zuverlässiger Weg, die wichtigsten Properties zu erhalten (besonders bei Seiten basierten Dokumenten)
• momentan noch keine großen Qualitativen unterschieder zur Emulation bemerkbar („Chuckie Egg“ Beispiel)
• überschaubare Kosten bei Migration on request
Aufklärung über Schwierigkeiten
Migration
• Verlust von Formatierung oder „look and feel“ z. T. immer gegeben
• schnelle Weiterentwicklung ständiger Aktualisierung kann nicht aus dem Weg gegangen werden, bei Migration on Request wird der Aufwand jedoch minimiert
• IPR (Intellectual Property Rights) nicht so gravierend wie bei Emulation
• seltene Formate Kostenaufteilung verschiedenerer Institutionen
Schlussfolgerung I
Migration
5 Kategorisierungspunkte für Properties• Inhalt ✔• Kontext ✔• Erscheinungsbild ~• Verhalten ✔• Struktur ✔
Schlussfolgerung II
Migration
Kriterien der richtigen (Archivierungs)Strategie• Realisierbarkeit ✔• Nachhaltigkeit ✔• Nützlichkeit ✔• Angemessenheit ✔
Quellen
• http://www.dlib.org/dlib/january05/rosenthal/01rosenthal.html• http://blog.case.edu/digitalpreservation/2010/11/29/week_5_migration_and_emulation_to
ols• http://www.paradigm.ac.uk/workbook/preservation-strategies/selecting-migration.html• http://www.webarchive.org.uk/wayback/archive/20050410120000/http://
www.leeds.ac.uk/cedars/pubconf/papers/projectReports/CedarsProjectReportToMar01.pdf• http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070513/viewer/
file1628.html#feature1• http://www.webarchive.org.uk/wayback/archive/20080408134837/http://
www.si.umich.edu/CAMILEON/reports/migreq.pdf• http://www4.in.tum.de/lehre/seminare/hs/WS0506/mvs/files/Ausarbeitung_Erdle.pdf• http://www.oclc.org/research/activities/past/rlg/digpresstudy/final-report.pdf