Semantic Web. I problemi della ricerca in Web Querying Ambiguità della formula Browsing ...

Post on 02-May-2015

212 views 0 download

Transcript of Semantic Web. I problemi della ricerca in Web Querying Ambiguità della formula Browsing ...

Semantic Web

I problemi della ricerca in Web

Querying Ambiguità della formula

Browsing Arbitrarietà nei criteri di classificazione dei dati

= Web Documenti debolmente collegati tra loro

Occorrerebbero dei collegamenti semantici Che riconoscano i domini (=contesti) entro i quali sono

disponibili risorse

Domini, schemi e dati

Dominio è costituito da Dati

Informazione elementare Metadati

classificano i dati Schema (Ontologia)

mettono in relazione le classi

Web Semantic

2001, Tim Barners LeeRappresentare web come un insieme di

ontologie Progetto irrealistico

Ontologie specifiche Secondo settori di interesse Costruzione di ontologie: campo del Knowledge

Management:

La struttura del Web semantico

Il Semantic Web si candida ad essere una architettura universale della scambio di informazione e conoscenza

Ogni applicazione, ogni intenzione di scopo applicata ad un dominio, utilizzerà una sua propria ontologia

L'operazione di collegare ontologie che definiscono stessi oggetti con una semantica differente è chiamata Mapping

Impensabile un mapping globale ogni diverso schema dovrebbe mapparsi all'ontologia globale

che funzionerebbe così come una lingua universale Si lavorerà su una architettura federativa.

Mapping

Implica l’identificazione di soluzioni tecniche e transazioni comunicative

Potrà essere di due tipi: automatico o manuale, forse misto In una prima fase dei tool leggeranno grosse quantità di

dati e realizzeranno dei cluster, un esperto poi dovrà validare le scelte dei tool

Si adotterà il modello dell’interlingua Inizialmente alcuni gruppi di organizzazioni si

accordano per creare un standard condiviso, quando questo standard si consolida e afferma altre realtà si associano allo standard.

E-learning semantico

Due progetti http://edutella.jxta.org http://www.merlot.org

Learning objects collegati secondo schemi ontologici

I linguaggi del web semantico

Il W3C propone RDF(S) set di linguaggi dichiarativi basati su sintassi

XML

Gli schemi si scrivono in linguaggio RDF(S) e producono file *.RDFS

RDF

Resource Description Framework (RDF). per la descrizione delle risorse sul Web,

La descrizione si basa su tre tipi di oggetti: Risorse (resources)

una pagina, un gruppo di pagine, un’immagine, un server o una qualsiasi altro elemento che abbia un Universal Resource Identifier (URI), cioè un meccanismo di identificazione come l’indirizzo Web

Proprietà (properties) Una proprietà è una specifica caratteristica o attributo di una risorsa una proprietà può anche descrivere relazioni con altre risorse.

Asserzioni (statements) Una asserzione è costituita dall’insieme di una risorsa, una proprietà

e uno specifico valore per quella proprietà e descrive le caratteristiche di una risorsa e le relazioni con altre risorse

Asserzione la pagina all’indirizzo www.html.it/rdf.html ha per argomento

RDF asserzione costituita dalla

risorsa pagina all’indirizzo www.html.it/rdf.html, dalla proprietà argomento, dal valore RDF.

Per ragioni pratiche, la definizione formulata del W3C propone XML come metalinguaggio per la rappresentazione del modello RDF, mediante alcuni tags predefiniti (<rdf:descxription>…) e altra tags liberi per la descrizione

Ecco la asserzione espressa in xml:

Namespace

Nella descrizione RDF si fa uso della tecnica dei namespace di XML

Un namespace è un contesto che definisce un insieme di tag da utilizzare in un documento XML Nel precedente esempio, il tag <rdf:RDF>

indica che tale tag è definito nel namespace identificato dal prefisso rdf, la cui dichiarazione si trova nella prima riga del documento XML

Schemi RDF

La creazione libera di tags genera ambiguità

Gli schemi RDF sono vocabolari di tags concordati insiemi di proprietà ed elementi che definiscono

un contesto per la descrizione di determinate categorie di risorse

Es.: il Dublin Core Metadata: esso definisce i tag da utilizzare per la descrizione di documenti elettronici

Sviluppi

L’uso di RDF è agli inizi e non sono ancora apprezzabili gli effetti che questa tecnologia porterà sul Web.

Costruzione di un’ontologia 1)

Dichiarazione iniziale

Corso sottoclasse di “resource” (elemento radice generico)

RESOURCE

CORSO

Costruzione di un’ontologia 2)

Costruzione di un’ontologia 3)

“Argomento” sottoclasse di “corso”

RESOURCE

CORSO

ARGOMENTO

Costruzione di un’ontologia 4)

“Specializzazione” sottoclasse di ““resource” (elemento radice generico)

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

Costruzione di un’ontologia 5)

“Titolo” proprietà di “Corso” esprimibile in formato stringa (codominio#Literal)

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

titolo

Costruzione di un’ontologia 6)

“Livello di specializzazione” proprietà di “Corso” e di “Specializzazione”

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONEtitolo Livello dispecializz.

Costruzione di un’ontologia 7)

“Utenti” proprietà di “Specializzazione” e di “Utenti”

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

titoloLivello di

specializz. Utenti

Costruzione di un’ontologia 8)

“Preparazione Utenti” proprietà di “Specializzazione”

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

titoloLivello di

specializz.

Utenti

Preparazione utenti

Classe 1°

Classe 2°

Classe 1°

classe radice

proprietà proprietà

proprietà

proprietà

I metadati

I metadati dovrebbero esprimere relazioni di un documento con un certo contesto, dovrebbero definire relazioni trasversali al documento

Non può esserci un sistema di navigazione semantica senza i metadati

Non esistono ancora sistemi solidi per l'archiviazione e l'interrogazione di metadati Non si è ancora consolidata una pratica Esistono diversi sistemi

Indicizzazione automatica di metadati

Limiti: un estrattore automatico non capisce il contesto: si basa sui tesauri di cui dispone…

Text Zoner suddivide il testo in parti strutturali (title, body, etc...)

Preprocessor fa una analisi morfologica delle frasi, stabilisce cioè di che parti è

costruita una frase (soggetto, predicato, oggetto). Filter

Elimina dal testo le frasi e le sentenze irrilevanti Named Entity Recognizer

identifica strutture lessicali minime (nomi, date, numeri..) Lexical Disambiguation

assicura che i termini con più significati siano tradotti in un unico modo Semantic Interpreter

riporterà gli elementi significativi riscontrati su strutture ontologiche possedute a priori

Raccomandazioni

I metadati non sono dati non possono limitarsi a riportare in modo stringato i

contenuti di un testo I metadati possono avere valore diverso

La proprietà di una classe può essere un valore es.: “Paolo”

O puntare ad un Uri: “quel” Paolo Volatilità dei metadati Essere e asserire

Mediante la reificazione: asserzioni di asserzioni

Costruzione di metadati

Dall’ontologia ai metadati http://www.nomesito.it/nomecorso/nomecorso.html Indichiamo come si relazionano allo schema

I metadati si definiscono mediante asserzioni: Soggetto: Classe dello schema

Esprimibile come Url Lo schema è esprimibile come spacename

Predicato: Attributi della classe Oggetto: Dati

I metadati si scrivono in file *.RDF

Costruzione di metadati 1)

Qui la dichiarazione iniziale non necessita del namespace rdfs

Costruzione di metadati 2)

Prima asserzione: la prima risorsa è un corso dal titolo “nomecorso“

Costruzione di metadati 3)

Questa stessa risorsa (“Nomecorso) è legata a due argomenti diversi: nomeargomento1 e nomeargomento2

La classe “argomento” potrebbe essere espansa come http://miosito/rdfs/nomeschema/Argomento sostituendo il cancelletto con lo schema dichiarato in cima al documento

Flessibilità delle asserzioni

Gli elementi sintattici delle asserzioni possono essere sostituiti da Uri Soggetto

Generalmente la classe di uno schema anche diverso Predicato

Un attributo, ma che può puntare ad un’altra classe Oggetto

Una stringa, o un’altra classe, o classi di schemi diversi

Le asserzioni si possono collegare tra loro Tramite ID

Reificazione delle asserzioni

Inserimento di un’asserzione entro un’altra dico che in una certa pagina si dice che c'è

un corso che ha titolo nomecorso.

<rdf:Description rdf:about="http://www.nomesito.it/nomecorso/nomesito.html"> <a:assert rdf:resource="http://www.nomesito.it/data/nomeontologia/model.rdf#ST_168_sp"/> </rdf:Description> <rdf:statement rdf:about="http://www.nomesito.it/data/nomeontologia/model.rdf#ST_168_sp">  <rdf:subject rdf:resource="#Corso"/><rdf:predicate rdf:resource="#Titolo"/> <rdf:object rdf:resource="nomecorso"/></rdf:statement>

RDF oltre XML

RDF(S) è pensato per i metadati Descrive dati ma non ha dati Xml contiene dati

XML si presta poco alle relazioni tra classi Ha carattere inclusivo: nidifica bene le relazioni

parentali, ma fatica ad esprimere quelle associative

Ontologia

Delinea le strade che collegano gli oggetti del dominio

Ontologie di scopo rappresentano la struttura dei processi

Ontologie di dominio forniscono gli oggetti specifici

Ontologia di scopo: Archiviazione di e-learning

Ontologia “Archiviazione” Attributi (stringhe o puntati ad altre classi)

Contenuto Data Locazione Archiviatore

Ontologia di dominio

I concetti di scopo permettono di pensare agli oggetti che compongono il dominio

La modellazione avviene per classiGli attributi sono ereditati dal padre delle

classi dello stesso livello Il valore di un attributo può essere definito

da un’altra classe

Criteri di modellazione

Dare alle classi nomi al singolareL'albero dell'ontologia deve essere

bilanciato nella granularità I rami devono avere un numero di classi simile