Lehrstuhl für WirtschaftsinformatikProf. Dr. Karl Kurbel
Anna Jankowska
Context-Aware Mobile Information Filtering System
Doktorandenworkshop Technologien und Anwendungen von XML
Ziel des Projektes Kontext und kontext-adaptive
Anwendungen Kontext in Mobile Computing Modellierung der Kontext-Informationen Benutzerprofil Retrieval, Filtering und mobiles IF Semantische Netze Webdienste und Semantische Webdienste Probleme & Chancen Zusammenfassung & Ausblick
Überblick
1/231/23
Entwicklung und prototypische Umsetzung eines kontext-sensitiven Systems zur Filterung von Dokumenten und Webdiensten für mobile Geräte.
Ziel des Projektes
2/232/23
”Context is any information that can be used to characterize the situation of an entity. An entity is a person, place or object that is considered relevant to the interaction between a user and an application, including the user and application themselves.”
Anind K. Dey, Gregory D. Abowd
Kontext-Informationen:
- Identität - räumliche Informationen: Standort- zeitliche Informationen: Uhrzeit- soziale Situation: wer ist in der Nähe - Umgebung: Temperatur- umgebende Resourcen: Computer- Verfügbarkeit der Resourcen: Art des Netzwerkes
Kontext
3/233/23
Ein System heißt ”context-aware”, wenn es den Kontext verwendet, um relevante Informationen und/oder Dienste dem Benutzer zur Verfügung zu stellen, wobei die Relevanz von der Rolle des Benutzers abhängt.”
Dey, Abowd
Merkmale kontext-adaptiver Applikationen: – In Abhängigkeit von den aktuellen Kontext-
Informationen werden dem Benutzer Daten und Dienstleistungen zur Verfügung gestellt.
– Automatische Ausführung von Diensten, wenn ein bestimmter Zustand/Kontext auftritt.
– Verknüpfung von Kontext und Informationen für eine spätere Wiederverwendung.
Kontext-Adaptive Anwendungen
4/234/23
Mobile versus stationäre Geräte: - nicht vorhersagbarer, variierender Kontext- Ubiquität - Dienste & Informationen überall und
immer verfügbar- zusätzliche Funktionalitäten (Ortslokalisierung,
Spracherkennung etc.)- Beschränkungen (geringe CPU, kleine Displays,
etc.)
Kontext-adaptive mobile Anwendungen:- Mobile Resource Management System- Hydrogen Context-Framework- Cyberguide- Forget-Me-Not- Context-Phonebook- YellowMap Mobile Services
Kontext in Mobile Computing
5/235/23
HTTP headers- Kontext des Gerätes: ”accept”, ”user-agent”, etc.
CC/PP - Composite Capabilities Preference Profiles- setzt auf RDF auf, um Metadaten über Geräteeigenschaften und Benutzerwünsche/Bedürfnisse zwischen Server und Browser auszutauschen
UAProf - User Agent Profile - berücksichtigt gerätespezifische Charakteristika, Software-spezifische Fähigkeiten, Browser-Einstellungen und Netzwerkeigenschaften
ConteXtML - Context Markup Language
Verarbeitung der Kontext-Informationen:- DELI - DElivery Context LIbrary for CC/PP and UAProf- DICE - Device Independent Content Engine
Modellierung von Kontext-Informationen
6/236/23
Muss folgende Anforderungen erfüllen:– gut strukturiert– standardisiert– einheitlich für alle Kontext-Informationen– austauschbar zwischen Systemkomponenten– erweiterbar– kompatibel mit dem Format für Modellierung der
Benutzerinformationen Soll auf den bereits unterstützten Formaten
aufbauen (CC/PP) Alle relevanten Kontext-Informationen in session
profiles serialisierter RDF + RDF Schema (Ontologie)
Format für Kontext-Informationen
7/237/23
Format für Kontext-Informationen
8/238/23
<? xml version="1.0" ?>
<rdf:RDF
xmlns:loc="http://www.x.org/ort-schemat#">
<rdf:Description about=“http://www.x.com/person#person123”>
<ccpp:component>
<rdf:Description about=”person123PhysOrt">
<rdf:type rdf:resource="http://www.x.com/ort-
schemat#PhysOrt "/>
<loc:kontinent>Europa</loc:kontinent>
<loc:land>Deutschland</loc:land>
<loc:stadt>Berlin</loc: stadt>
</rdf:Description>
</ccpp:component>
</rdf:Description>
</rdf:RDF>
Person123
PhysOrtLogOrt
GeogrOrt
Dau
tsch
land
http
://w
ww
.berlin
.org
+4933 8266
131
192.16
8.1.10
2
Berlin
Eu
rop
a
27"28' S
153"0
2' EK
onti
nent
Sta
d
t Inte
rnetN
etz
Geogr.
Bre
ite G
eogr.
Länge
Land Telefon
Bestimmt kurzfristige und langfristige Informationsbedürfnisse des Benutzers, ist zerlegbar
Erstellung des Profils (Top-Down Ansatz):- Organisationsprofil – relativ stabile
Informationsbedürfnisse- Abteilungsprofil- Stellenbeschreibung (Rolle des Benutzers)- Vorlieben/Interessen des Benutzers
Wird jeweils um Kontext-Informationen aktualisiert (“Profile Resolution“):- Gerätekontext- zeitliche Informationen- räumliche Informationen- Informationen aus TMS: Termine, Aufgaben, Kontakte
Historischer Kontext Format: serialisierter RDF, XTM
Benutzerprofil
9/239/23
Information Retrieval
Ein Retrievalmodell besteht aus:– einer Menge D von Repräsentationen für Dokumente– einer Menge Q von Repräsentationen für
Benutzeranfragen– einer Rankingfunktion R, die jedem
Anfrage/Dokumentpaar eine reelle Zahl (das Ranking) zuweist, nach der Dokumente sortiert werden
Suche bezieht sich auf Wörter
Beurteilung der Güte der Ergebnisse: – Recall: Anteil relevanter Dokumente, die gefunden wurden: R=Da/D
– Precision: Anteil der gefundenen Dokumente, die relevant sind: P=Da/A
Ansätze:
– informatischer Ansatz – computerlinguistischer Ansatz
AntwortmengeA
Relevante Dokumente
D
Relevant Dokumente in Antwortmeng
e DA
10/2310/23
Information werdem dem Benutzer abhängig von seinen Informationsbedürfnissen/Interessen zur Verfügung gestellt
Inhaltsbasierte Filterung
– für jeden Nutzer eigene Filter– Profil: Repräsentation des Nutzerinteresses
Soziale Filterung
– Idee: Information ist relevant, wenn andere Benutzer, die bisher ähnliches Verhalten gezeigt haben, die Information ebenfalls als relevant betrachtet haben
– Bewertung der Relevanz von Informationen durch Benutzer
– Vergleich von Profilen mehrerer Nutzer
• Gemischte Ansätze
Informationsfilterung
11/2311/23
Fragen, die man bei traditionellen IF&IR Ansätzen nicht korrekt beantworten kann:
– “Finde alle Dokumente über CAR”semantische Information
– “Finde alle Dokumente, die im Projekt mIF verfaßt wurden!”Kontextinformation
– “Finde alle E-Mails mit Absender Frank Mustermann!”Logische Struktur
– “Finde das Dokument mit dem Logo der TU Berlin oben rechts!”Layout
Probleme bisheriger Ansätze
12/2312/23
Bisherige Suchverfahren rein syntaktisch, ohne Kenntnis der Wortbedeutungen
Intelligentes IF, IR:
- Berücksuchtigung der Besonderheiten natürlicher Sprachen (Polysemie, Synonymie)
- Identifizieren und Unterscheiden verschiedener Kontexte des Wortgebrauchs
- flexible Gestaltung der Anfrage
Die Suche kann oft verbessert werden, wenn Hilfsmittel zur Verfügung stehen, die etwas über die Semantik des Suchraums aussagen:
- Thesaurus
- Latent Semantic Indexing
Neue Ansätze in IF, IR
13/2313/23
Retrieval, Filtering, mIF
14/2314/23
Eigenschaft Information Filtering
Information Retrieval
Mobiles IF
Anzahl der Dokumente
unendlich endlich unendlich
Anzahl der Anfragen
endlich unendlich unendlich
Anfragetypkurzfristige Interessen
langfristige Interessen
kurz- und langfristige Interessen
Bearbeitungsart
ein Dokument
viele Anfragen
eine AnfrageDokumenten-
kollektion
eine AnfrageDokumenten-
fluss
Metadaten und Ontologien generieren Kontext-Informationen abfangen und dem System zur
Verfügung stellen Benutzerprofile erstellen (automatisch/manuell) Filterungsmaschine bauen Relevante Dokumente herausfiltern (Präzision wichtig)
- Antworten statt Trefferlisten Nützliche Informationen personalisiert und
aufgabenspezifisch anbieten- Berücksichtigung von Kontext-Informationen bei IF
und bei Präsentation der Ergebnisse (kurzfristige und langfristige Informationsbedürfnisse)
Webdienste:- relevante Webdienste herausfiltern- Transaktionen auslösen- Decision Support anbieten
• Unterstützung: Intelligente Softweareagenten
mIF - Aufgaben
15/2315/23
Traditionelle Informationsverarbeitung beruht auf:
- Zeichenketten und kontextfreier Struktur (Syntax)- Verarbeitung von Konzepten, Kontextabhängigkeiten
oder Kontextbedingungen werden vernachlässigt
Zielgerichteter Zugriff auf Informationen ist problematisch, da Inhalte im Web vom Menschen interpretiert, kombiniert und aufbereitet werden müssen.
Das Semantic Web: Ein Meta-Web, aufbauend auf dem WWW, welches die Inhalte auch für Maschinen verarbeitbar und interpretierbar macht.
Verspricht bessere Endbenutzerdienste durch:– Standardisierte Architektur für
Dokumentenverarbeitung– Standardisierte Vokabularien– Standardisierte Sprachen für Kontextbedingungen
Semantische Netze
16/2316/23
Repräsentation durch netzartige Strukturen aus Objekten und Relationen
Semantische Netze bestehen aus :- Knoten: Repräsentation von Klassen oder
Klasseninstanzen- Kanten: entsprechen 2-stelligen Relationen zwischen
Objekten Wissen über einen Knoten wird durch die Verbindungen
repräsentiert, die von ihnen ausgehen
Mögliche Inferenzen:
- Beantwortung von Anfragen durch Verfolgen von Kanten
- Spreading Activation bzw. Intersection Search
- Vererbung
Semantische Netze = Metadaten + Ontologien
Semantische Netze
17/2317/23
Beispiel für ein semantisches Netz
18/2318/23
a25volvo
besitzer
andreas
person
farbe
weiss
auto
is-a
instance-of
hat-farbe
a43
rot
instance-of
instance-of
hat-farbe
instance-of
instance-of
GenerischesKonzept (Klasse)
IndividuellesKonzept (Instanz)
u57
unfall
geschädigterverursacher
motorhat-teil
besitzer
holtmann
instance-of
instance-of
„Holtmann fuhr mit seinem roten Auto auf meinen weissen Volvo“
Quelle: Hinkelmann
• Semantik: Interpretationsfunktion von einem syntaktischen in einen semantischen Bereich
Idee: Spezifiziere alle durch ein Programm oder eine Wissensbasis verwendbaren Begriffe
Ontologie = eine Vereinbarung über ein gemeinsam zu nutzendes Vokabular, mit dem Anfragen und Aussagen zwischen Maschinen ausgetauscht werden:– eine standardisierte Menge von Begriffen mit
Kontextbedingungen– Kontextbedingungen werden durch Inferenzregeln
angegeben
Alle potentiellen Welten müssen sich auf die vorgegebenen Ontologien abstützen und die Einschränkungen erfüllen
Ontologiesprachen: RDF Schema, DAML+OIL
Ontologien
19/2319/23
Webdienste
UDDIVerzeichnisdienst
Klient Webdienst
WSDL
Schnittstellen-beschreibung
MethodenaufrufeAnfragen und Antworten
WSDL-Dokumentholen
SOAP-Nachrichten
URL des Webdienstes
Suchen nachWebdiensten
20/2320/23
Ein Webdienst ist eine Anwendung, die es erlaubt, ihre Methoden über eine Web-Schnittstelle aufzurufen.
Entwicklung des Internet: von einem Informationsnetz zum Servicenetz
Semantische Webdienste sollen ermöglichen:- automatisches Auffinden von Webdiensten- automatische Ausführung von Webdiensten- Komposition von Web Services- Überwachung der Ausführung von Webdiensten
DAML-S (DARPA Agent Markup Language for Services):- eine DAML+OIL - Ontologie für Webdienste, dessen Ziel
es ist, Webdienste in einer computer-interpretierbaren Art und Weise zu beschreiben
– ermöglicht den intelligenten Agenten, diverse Aufgaben zu erfüllen
WSMF - Web Services Modeling Framework
Semantische Webdienste
21/2321/23
22/2322/23
Probleme und Chancen
Chancen: Das Semantische Web reitet auf der "Welle" HTML/XML Technologie entwickelt sich sehr schnell Killer-Applikation
Probleme: Technologien noch nicht ausgereift Beschränkungen mobiler Geräte Nutzen der Information abhängig von:
- Informationsquellen- Qualität der Information- Kosten der Information- Aktualität der Information- Vertrauenswürdigkeit der Information
“Big Brother“ – Ansatz Abschätzung der Qualität von Webdiensten Technik muss sicher und unsichtbar sein
Semantische Netze und Webdienste als (reale) Zukunftsvision:- verbesserter Zugriff auf Wissen- verbesserte Kommunikation zwischen Maschinen- intelligente Webdienste
Context-Aware Mobile Information Filtering System: innovative Anwendung im Bereich IF ein Filterungssystem, das im Filterungsprozess die
Kontext-Informationen sowie Benutzerprofile berücksichtigt
Filterung:- Dokumente (Semantic Web)- Webdienste
Integration semantischer Technologien in bestehende Ansätze des Information Filtering
Bereitstellen der Informationen für verschiedene mobile Geräte
Umsetzung auch in Form eines Webdienstes
Zusammenfassung
23/2323/23
Lehrstuhl für WirtschaftsinformatikProf. Dr. Karl Kurbel
Anna Jankowska
Context-Aware Mobile Information Filtering System
Doktorandenworkshop Technologien und Anwendungen von XML
Top Related