Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/24
Beispiel einer Anfrage
Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik,
Elektro und Haushaltswaren in den Bundesländern Sachsen-Anhalt und
Thüringen angefallen?
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 2/24
Fragestellungen und Aufgaben (Bsp.)
• Überprüfung des Warensortiments zur Erkennung von Ladenhütern oder
Verkaufsschlagern
• Standortanalyse zur Einschätzung der Rentabilität von Niederlassungen
• Untersuchung der Wirksamkeit von Marketing-Aktionen
• Auswertung von Kundenbefragungen, Reklamationen bezüglich bestimmter
Produkte etc.
• Analyse des Lagerbestandes
• Warnkorbanalyse mit Hilfe der Kassenbons
Kosmetik
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 3/24
Zeitraum
Produkt
SummeHaushaltElektro
1998
1999
Summe
Sachs
en-
Anhal
t
Thür
inge
nSum
me Region
KennzahlUmsatz
Ergebnis (Würfel)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 4/24
Ergebnis (Bericht)
Umsatz Kosmetik Elektro Haushalt SUMME
1998 Sachsen-Anhalt 45 123 17 185
Thüringen 43 131 21 195
SUMME 88 254 38 380
1999 Sachsen-Anhalt 47 131 19 197
Thüringen 40 136 20 196
SUMME 87 267 39 393
SUMME 175 521 77 773
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 5/24
Aspekte von Data Warehouses
Integration
• Vereinigung von Daten aus verschiedenen, meist heterogenen Quellen
• Überwindung der Heterogenität auf verschiedenen Ebenen (System, Schema,
Daten)
Analyse
• Bereitstellung der Daten in einer vom Anwender gewünschten Form (bezogen
auf Entscheidungsgebiet)
• erfordert Vorauswahl, Zeitbezug, Aggregation
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 6/24
Marktentwicklung
Marktgröße
Data Warehouse und OLAP (Quelle: OLAP Report OnLine www.olapreport.com)
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
1994 1995 1996 1997 1998 1999 2000 2001
Mrd. Euro
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 7/24
Abgrenzung zu OLTP
Klassische operative Informationssysteme
Online Transactional Processing (OLTP)
• Erfassung und Verwaltung von Daten
• Verarbeitung unter Verantwortung der jeweiligen Abteilung
• Transaktionale Verarbeitung: Kurze Lese-/Schreibzugriffe auf wenige
Datensätze
Data Warehouse
• Analyse im Mittelpunkt
• lange Lesetransaktionen auf vielen Datensätzen
• Integration, Konsolidierung und Aggregation der Daten
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 8/24
Abgrenzung zu OLTP: Anfragen
Anfrage transaktional analytisch
FokusLesen, Schreiben, Modifizieren, Löschen
Lesen, periodisches Hinzufügen
Transaktionsdauer und -typ
kurze Lese-/ Schreibtransaktionen
lange Lesetransaktionen
Anfragestruktur einfach strukturiert komplex
Datenvolumen einer Anfrage
wenige Datensätze viele Datensätze
Datenmodell anfrageflexibel analysebezogen
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 9/24
Abgrenzung zu OLTP: Daten
Daten transaktional analytisch
Datenquellen meist eine mehrere
Eigenschaftennicht abgeleitet, zeitaktuell, autonom, dynamisch
abgeleitet/konsolidiert, nicht zeitaktuell, integriert, stabil
Datenvolumen MByte…GByte GByte…TByte
Zugriffe Einzeltupelzugriff Tabellenzugriff
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 10/24
Abgrenzung zu OLTP: Anwender
Anwender transaktional analytisch
AnwendertypEin-/Ausgabe durch Angestellte oder Applikationssoftware
Manager, Controller, Analyst
Anwenderzahl sehr vielewenige (bis einige hundert)
Antwortzeit ms…sec sec…min
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 11/24
Data Warehouse: Charakteristika
Fachorientierung (subject-oriented)
• Zweck des Systems ist nicht Erfüllung einer Aufgabe (z.B.
Personaldatenverwaltung), sondern Modellierung eines spezifischen
Anwendungsziels
Integrierte Datenbasis (integrated)
• Verarbeitung von Daten aus mehreren verschiedenen Datenquellen (intern und
extern)
Nicht-flüchtige Datenbasis (non-volatile)
• stabile, persistente Datenbasis
• Daten im Data Warehouse werden nicht mehr entfernt oder geändert
Historische Daten (time-variant)
• Vergleich der Daten über Zeit möglich (Zeitreihenanalyse)
• Speicherung über längeren Zeitraum
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 12/24
Data Warehouse
Datenbank, die Daten aus unterschiedlichen Quellen integriert und Analysen
darauf unterstützt (Rahm/Vossen)
Data Mining
Nach Rahm/Vossen eine Sammlung von Verfahren zur Entdeckung von Mustern
in großen Datenmengen.
Verfahrensklassen sind Clustering, Klassifikation und die Bestimmung von
Assoziationsregeln
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 13/24
Aufgabe 1 (IR)
Information Retrieval wird durch sogenannte Suchmaschinen (Search Engines)
im Web realisiert.
Teilweise spezialisieren sich diese Suchmaschinen auf bestimmte
Themengebiete.
Finden Sie solche Anbieter mit Suchmaschinen und notieren Sie sich die
abgedeckten Themengebiete.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 14/24
Erweiterung der Abfrage
Kombination
select *
from germany, cities
where cities.name = germany.stadt
and germany.hotel like arcor
and cities.plz like 6%
or cities.plz like 5%
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 15/24
W3QL Beispiel
• select from n1, l1, (n2, l2), n3, l3
where n1 in {URL};
l1 in {path}
l2 in {path}
n3: PERLCOND, n3.format =~/image/‘
n3 in {path}
using ISSEARCH –d 5-l 1000
• Ergebnis: Tabelle mit Links
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 16/24
XML Beispiel
• WHERE <hotel>
<name>arcor<name/>
<inhaber>$i<inhaber/>
<stadt>$s<stadt/>
</hotel> IN „www.a.b/hotels.xml“
• CONSTRUCT <result>
<inhaber>$i<inhaber/>
<stadt>$s</stadt>
<result/>
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 17/24
Meta Viz
• Umgebung zur visuellen Interaktion mit Geodaten
• Ziel: Reduktion des Informationsüberflusses anderer Geodatensuchmaschinen
• Auswahl der Zielregion durch Zoomen
• Suche nach Attributen in Metadaten
• Gefundene Objekte werden im
selektierten Großraum angezeigt
• Problem: einzelne Objekte
können verdeckt werden
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 18/24
Meta Viz
• Lösung: rotierbare 3D-Darstellung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 19/24
Information Retrieval
• Art und Weise der Informationsbeschaffung
• Ziel: effektive Verwaltung großer Datenmengen
• Benutzerorientiertes Extrahieren von interessanten Informationen aus beliebiger
Datenbasis
• Sinnvolle, interaktive, graphische Sortierung/Darstellung der Suchergebnisse
Abfragesprachen
• Schnittstelle zwischen Datenbank und Benutzerinterface
• einfache Darstellung der Abfrage, verständlich für Mensch und Maschine
• flexible Gestaltung der Sprache für einfache und komplexe Abfragen
• Erweiterbarkeit von Abfragen graphischer Präsentationen unterstützt
ausgeprägte menschliche Mustererkennungsfähigkeit
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 20/24
SQL
Erweiterungen der Sprache durch CSQL und ParaSQL
W3QL
XML basierende Abfragesprachen
XML-QL
SQL
• allgemeiner Standard
• SQL hat als Datengrundlage eine relationale Datenbankstruktur
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 21/24
Aufbau von SQL
• Formulierung mittels Text
• Datentypen wie Text und Zahl
• Gliederung:
• Definition der Rückgabe select cities
• Datenquelle from germany
• Suchparameter where hotel like ar%
• Sortierreihenfolge order by inhaber
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 22/24
Ergänzungen von SQL
CSQL
• geo-technische Funktionen
• Abstand, Überschneidung (z.B. Flugbahnen, Straßen) und Grenzen
• Distance (hotel, bahnhof) <= 100
ParaSQL
• pattern matching auf Geodaten
• neue Datentypen: Raum, Zeit, Raum-Zeit
• Bsp: Circle (earth-quake(10) = high,50)
Kommerzielle Produkte
• Oracle, Sybase: Ergänzungen von SQL um eigene Funktionen
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 23/24
W3QL
• Struktur wie SQL
• Datenquelle: das WWW (Domains und Pfade)
• zur Suche regular expressions (Perl)
• Suche nach/in verschiedenen Datei-Typen: Text, HTML, LaTeX, Bildern, Filmen
• automatische Formbearbeitung
• Tiefensuche
XML und Abfragesprachen
• Datenquelle: XML-Dokumente (Objekt, Struktur)
• eignet sich zur Speicherung von Metadaten
• kein einheitlicher Standard für Abfragesprache
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 24/24
XML-QL
• Formulierung mittels Text
• typenlose bzw. an XML-Struktur gebunden
• Struktur der Abfrage
• Suchbedingungen
• Definition der Rückgabe
Top Related