Metasuche in heterogenen Datenbeständen – Vorgehen ...
Transcript of Metasuche in heterogenen Datenbeständen – Vorgehen ...
HamburgWissen Digital. Metasuche in heterogenen Datenbeständen
– Vorgehen, Probleme, Perspektiven Ulrich Hagenah / Arved Solth AG Regionalportale, Stuttgart, 9.5.2012
HamburgWissen Digital | 9. Mai 2012
HamburgWissen Digital
Das Projekt Thema: Hamburgs
Geschichte und Landeskunde
Federführung: SUB und Staatsarchiv Hamburg
Laufzeit: 2,5 – 3 Jahre; Beginn: 01/2011
Zielgruppen: WissenschaftlerInnen, Studierende, Hamburg-Interessierte
Ziel: Recherche-Unterstützung
HamburgWissen Digital | 9. Mai 2012
HamburgWissen Digital
Arbeitsschwerpunkte: Linkkatalog digitaler
Ressourcen zur Geschichte und Landeskunde Hamburgs
Metasuche in den Ressourcen
weitere Angebote zur Information und Kommunikation
HamburgWissen Digital | 9. Mai 2012
HamburgWissen Digital: Die „weiteren Angebote“
fertiggestellte Angebote
HamburgWissen Digital | 9. Mai 2012
Weitere Angebote: Online-Archivführer
ca. 150 Hamburger Archive
Basis- und Detailinformationen
Such- und Filterfunktion
Kartenansicht / grafische Suche
de-/zentraler Input, Redaktion SUB
Frontend-Eingabe durch externe
Nutzer
HamburgWissen Digital | 9. Mai 2012
grafisch (Karte) verbal (Text / Filter)
Online-Archivführer: Sucheinstiege
HamburgWissen Digital | 9. Mai 2012
Weitere Angebote: Der Veranstaltungskalender
Veranstaltungen mit Hamburg-
Bezug
Basis- und Detailinformationen
Such- und Filterfunktion
de-/zentraler Input, Red. SUB
Backend-Eingabe (Wordpress)
durch externe Nutzer
HamburgWissen Digital | 9. Mai 2012
Veranstaltungskalender: Suche / Filter
Volltextsuche
Datumssuche
Eingrenzung nach:
a) Art (der Veranstaltung)
b) Name (des Veranstalters)
c) Geografischer Lage (Stadtteil)
HamburgWissen Digital | 9. Mai 2012
Weitere Angebote: Der Blog
Berichte, Ankündigungen, etc.
zum Thema Hamburg
Forum, Diskussionsplattform für
die Portalnutzer
Marketing, Informationen zum
Projektstand von HamburgWissen
Digital
Backend-Eingabe (Word-Press)
HamburgWissen Digital | 9. Mai 2012
Blog: Diskussion / Kommentarfunktion
Kommentarfunktion: Alle Kommentare werden vor ihrer Veröffentlichung redaktionell geprüft.
HamburgWissen Digital | 9. Mai 2012
HamburgWissen Digital – Der Linkkatalog
Linkkatalog: Kommentierte, thematisch sortierte Sammlung von Webressourcen, Informationen zu Kosten, Typ und Anbieter (bereits nutzbar)
HamburgWissen Digital | 9. Mai 2012
HamburgWissen Digital – Der Linkkatalog
z.Zt. ca. 110 Ressourcen (-segmente) verzeichnet
Wachstum durch neue Ressourcen und inhaltliche Erweiterung der verzeichneten Angebote
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Ressourcen aktuell Status Datenquelle Institution
Bildarchiv des Denkmalschutzamts Denkmalschutzamt Hamburg
Parlamentsdatenbank 1997- Hamburgische Bürgerschaft
stadtteilgeschichten.net stadtteilgeschichten.net e.V.
Stolpersteine [Biographien] Landeszentrale für politische Bildung (HH)
Museen Nord [zunächst: Hamburger Museen] digiCULT-Verbund eG
Hamburgensien digital Staats- und Universitätsbibliothek Hamburg
HANS-Datenbank Sondersammlungen Staats- und Universitätsbibliothek Hamburg
Hamburg-Bibliographie / Hamburger Personen Staats- und Universitätsbibliothek Hamburg
E-Dissertationen Hamburg Staats- und Universitätsbibliothek Hamburg
E-Publikationen Hamburg Staats- und Universitätsbibliothek Hamburg
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Ressourcen in Vorbereitung Status Datenquelle Institution
Zeitungsausschnittarchiv des ehem. HWWA ZBW Hamburg
Parlamentsspiegel 1980- Hamburgische Bürgerschaft / LT NRW
Statistik Statistikamt Nord
Das Jüdische Hamburg [Biographien, Themen] Institut für die Geschichte der dt. Juden
Landesrecht Hamburg Justizbehörde Hamburg / Juris
Rechtsprechung Hamburg („Urteilsdatenbank“) Justizbehörde Hamburg / Juris
Stiftungsdatenbank Justizbehörde Hamburg
AIDA online – Findmittel LA Niedersachsen Landesarchiv Niedersachsen
Handels-, Firmen-, Genossenschaftsregister Justizbehörde Hamburg
…..
HamburgWissen Digital | 9. Mai 2012
HamburgWissen Digital: Partner (Auswahl)
Staats- / Landesarchive Hamburg, Schleswig-Holstein, Niedersachsen
Hamburgische Bürgerschaft (Parlamentsdokumentation) Denkmalschutzamt Hamburg Statistikamt Nord Museen Nord / digiCult Stadtteilgeschichten.net ZBW Hamburg Landeszentrale für politische Bildung Hamburg Justizbehörde Hamburg Institut für die Geschichte der deutschen Juden Universität Hamburg / Historisches Seminar Behörde für Stadtentwicklung und Umwelt Hamburg KZ-Gedenkstätte Neuengamme (Hamburg)
HamburgWissen Digital | 9. Mai 2012
Hamburger Informatik Technologie-Center e.V. (HITeC)
Einrichtung zum Technologietransfer zwischen dem Fachbereich Informatik der Universität Hamburg und
regionalen und internationalen Unternehmen Projektarten:
- Beratung und Studien - Seminare - Projektbegleitende Unterstützung - Auftragsforschung und -entwicklung
Kompetenzbereiche: Verteilte Systeme, Software-Technik, Intelligente Systeme, Lernen mit Neuen Medien, IT-Sicherheit, Logistik-Simulation, Usability / Software-Ergonomie, Visualisierung / Interaktive Medien
HamburgWissen Digital | 9. Mai 2012
Hamburger Informatik Technologie-Center e.V. (HITeC)
Aktuelle Projekte: - HWD (HamburgWissen Digital) - RACE (Robustness by Autonomous Competence Enhancement) - Plath (Methoden zur Mehrdimensionalen Analyse von Massendaten) - Uniique (Verteiltes Management von Prozessen und Daten in Business-
Intelligence-Szenarien)
Abgeschlossene Projekte: - Redseeds (Requirements-Driven Software Development System) - Co-Friend (Cognitive and Flexible learning system operating Robust
Interpretation of Extented real scenes by multi-sensors Datafusion) - ConIPF (Configuration of Industrial Product Families) - …
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Das Herzstück
Metasuche: simultane Recherche in diversen, heterogenen Datenbeständen über ein Suchinterface.
Einfache Suche (über alle Datenbanken)
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche - Vorgehen
Einzelschritte der Realisierung 1. Definition einer Menge relevanter Suchfelder für die
Metasuchmaske 2. Abbildung der Metadatenfelder der einzelnen
Ressourcen auf die Suchfelder der Metasuche 3. Integration verschiedener Datenbanken und
Suchfunktionalitäten 4. Ggf. Filterung von Trefferlisten nach für das Portal
relevanten Inhalten
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche Abbildung „Urheber“ aus mehreren Ressourcen
HWD-Feld Felder verschiedener Ressourcen
Urheber Bildarchiv-Denkmalschutzamt: Fotograf/in, Architekt/Künstler Parlamentsdatenbank: Urheber (Abgeordnete, Fraktionen, Senat, Ausschüsse), Redner stadtteilgeschichten.net: Urheber, Herausgeber Stolpersteine: (kein abzubildendes Feld vorhanden) Museen Nord / digiCult: Hersteller, Künstler Hamburgensien digital: Autor, Herausgeber, Künstler, Zeichner HANS-Datenbank Sondersammlungen: Verfasser, beteiligte Person, Provenienz E-Dissertationen Hamburg: Verfasser
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Information Portal Suite
httpXML- Gateway
http-Gateway
Z39.50- Gateway
Perl- Gateway
…
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Gateway-Beispiel
httpXML- Gateway
Urheber=Schmidt
Feldabbildung in der Suchanfrage
Schmidt
Suchtreffer im Ressourcen-eigenen
Format
Postfilter
Vereinheitlichte Suchtrefferliste
Vereinheitlichte Suchtrefferliste
Feldabbildung in der Trefferliste
...&AU=Schmidt&... Allgemeine Such-URL
...&author:Schmidt&...
Prefilter
Ressourcen-spezifische Such-URL
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Ergebnispräsentation
Trefferliste: Detailansicht:
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Eigener Index
XML-Dialekte
…
Andere Formate
…
Webseiten
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche – Hamburg-Filter
Vorläufige Trefferliste:
Hamburg-Filter: Endgültige Trefferliste:
ja
Normdaten-Wortgut (SWD, GKD, HHBiB-SW)
Enthalten?
HamburgWissen Digital | 9. Mai 2012
HWD (Typo3) VK (Wordpress) Blog (Wordpress)
Archiv- und Bibliotheksführer
Metasuche (IPS)
HWD-Solr-Index
<add><doc>…-XML-Datei
Java-XML-Transformer
OAI-PMH-Interface (z.B. Stadtteilgeschichten, ediss, epub, in Zukunft auch digiCult)
LIDO –Export (z.B. digiCult)
OAI-Harvester
Externer Solr-Index (z.B. Hamburgensien digital)
SQL-Datenbank (z.B. HHBIB)
httpXML-Gateway http-Gateway PERL-Gateway
XML-Schema
FineConcept ParlaDB (z.B. Parlamentsdatenbank)
ParlaXML-Export
XSLT-EAD2HWD
XSLT-LIDO2HWD
XSLT-ParlaXML2HWD
Manueller Export
HTML-Seite (z.B. Statistikamt Nord, Bildarchiv
Denkmalschutzamt, Landesamt SH) Nutch-Webcrawler
Legende:
intern
extern
Daten
EAD –Export (z.B. Staatsarchiv)
Export anderer XML-Dialekte
CSV-Dateien (z.B. Stolpersteine)
Manueller Export
CSV-Export
Python-Transformationsskript
HWD-Metasuche Heterogene Datenverarbeitung
HamburgWissen Digital | 9. Mai 2012
HWD-Metasuche
Erfahrungen und Herausforderungen Abbildung verschiedenster Metadaten auf eine
gemeinsame Menge von HWD-Suchfeldern Teilweise keine nutzbare Suchfunktion in den
Datenquellen verschiedene Standards aus Bibliotheken, Museen,
Archiven, Dokumentationseinrichtungen, Bildergalerien, Statistiken, …
keine verfügbaren Standardschnittstellen
HamburgWissen Digital | 9. Mai 2012
HamburgWissen Digital
Erfahrungen und Herausforderungen Behördeninterne Datenverwaltung vs. öffentlich
zugängliche Webpräsentation Rechtlich gebotener Zwang zur Vorfilterung für die
Webpräsentation (z.B. bei Archiven, Denkmalschutz) Begrenzte Laufzeit des HWD-Projekts; dadurch offene
Fragen zu künftigem laufendem Aufwand, u.a. für: die spätere Integration neuer Ressourcen Anpassungsarbeiten bei bereits integrierten
Ressourcen Redaktionsarbeit für „weitere Angebote“
HamburgWissen Digital | 9. Mai 2012
Vielen Dank
www.hamburgwissen-digital.de Ulrich Hagenah Staats- und Universitätsbibliothek Hamburg [email protected] http://landesbibliothek.sub.uni-hamburg.de Arved Solth Hamburger Informatik Technologie-Center HITeC e.V. [email protected] http://www.hitec-hh.de