L'avenir du web au prisme de la ressource
-
Upload
pascale-laurent -
Category
Technology
-
view
943 -
download
1
description
Transcript of L'avenir du web au prisme de la ressource
05/10/2012
1
l’avenir du web au prisme de la ressource
Nicolas Delaforge, Fabien Gandon et Alexandre Monnin
cinq objectifs • présenter
(un web de ressources computationnelles)
• résumer, rappeler (web de données, web sémantique)
• discuter, provoquer (le document n’existe pas)
• orienter (et pour nous alors)
• conclure, ouvrir (ce n’est que le début)
architecture web
trois composants de l’architecture du web
• identification (URI) & adressage (URL) http://www.inria.fr
http://ns.inria.fr/fabien.gandon#me
ldap://[2001:db8::7]/c=GB?objectClass?one
• communication / protocole (HTTP) GET /centre/sophia HTTP/1.1
Host: www.inria.fr
User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de)
AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4
Safari/523.10
Accept-Encoding: gzip
Accept: text/html,application/xhtml+xml,application/xml
Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
Referer: http://fabien.info/
• langage de représentation (HTML / RDF) Fabien travaille chez <a href="http://www.inria.fr">Inria</a>
<http://www.inria.fr> foaf:member data:fabien
UR*
pas pour les gens… et pourtant…
URI: identification de n’importe qu’elle ressource
URL=URI + Localisation URL=UR(I+L)
HTTP URI: URI déréférençable selon HTTP « follow your nose » / naviguer au flair
(wikipedia)
la syntaxe des URIS qui et quand ?
05/10/2012
2
URI aux jointures • entre les assertions
même si elles sont distribuées
• entre les couches réseau (Internet, Web, Web sémantique)
1 physique
2 données
3 réseau
4 transport
5 session
6 présentation
7 application web documentaire « REST in peace » • REST(ful): invocation et composition d’applications
distribuées sur le web
• primitives HTTP, actions sur la ressource GET, HEAD, POST, OPTIONS,
CONNECT, TRACE, PUT, DELETE
• le web ne fut jamais vraiment documentaire
• web…
– application centrée ressources (identifiées par URI)
– architecture orientée ressource (localisables URL)
– toile de calculs liés et non de documents
trois composants de l’architecture du web
• identification de la ressource (URI)
• accès à une représentation (HTTP URI)
• codage de la représentation (HTML , RDF, etc)
ressource
HTTP Range 14
Code HTTP Résultat Indication
200 (OK) Représentation Ressource informationnelle (IR) et
non informationnelle (NIR) ?
303 (voir autre)
URI Tout type de ressource notamment
des NIR
4XX, 5XX (erreur)
Message d’erreur
Aucune déduction possible
« ce n’est peut-être pas le problème de HTTP ou des URI »
ils n’en ont pas parlé ils en ont parlé
uri, ressource, ombre, objet
• identification
• individuation/ objectivation
zèbre (à défaut d’antilope )
05/10/2012
3
ressource • tout ce que l’on sait identifier
• pierre angulaire de l’architecture de tout le web
• concept unificateur de ses facettes
« ressource » HTTP URI requête HTTP
erreur HTTP
représentation
Généalogie : du document (B.B.) à la ressource
Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée
Ressource : Manipulation indirecte
« … » locus
l’objet
la ressource
l’état de la ressource
l’état représentationnel ou une représentation de la ressource
ressources computationnelles
« … »
règl
es
rappel et parallèle • sans notice pas d’existence dans la collection
• sans ressource pas d’existence sur le web
toile de calculs
05/10/2012
4
appearences database
1991-1993 System 33: un prédécesseur méconnu du conneg + services de rendu
Electronic documents
Rendering service
Computers
Servicing Client
Application
Other encoding formats
RPC
Psychophysically equivalents
client serveur
conneg
http
moteur et CGI
personnalisation, adaptation « Filter Bubble » Eli Pariser
Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell 6200, Windows 7, Anglais
Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris
05/10/2012
5
Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X (10.6.8), french
Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London
Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English OS: MacOs X 10.6.8, Firefox
Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7 Professional, English
il cherche « bmw », « mahler » et « gay » ? = !
BMW
« Je m’intéresse aux BMW »
05/10/2012
6
Allo Google ? C’est la Noiraude…
United States Flu Activity - Influenza estimate ● Google Flu Trends ● U.S. Centers for Disease Control.
« document sur lui-même » document vivant, chaque consultation change le document
900 millions
Chine: 1 600 millions
Inde: 1 200 millions
acebook
PORTÉE
05/10/2012
7
externaliser la socialité d’un site intérêt et danger
OGP v2 actions typées
OGP schémas… code dans votre page
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US"
xmlns:fb="https://www.facebook.com/2008/fbml">
<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE:
http://ogp.me/ns/apps/YOUR_NAMESPACE#">
<meta property="fb:app_id" content="YOUR_APP_ID" />
<meta property="og:type" content="YOUR_NAMESPACE:recipe" />
<meta property="og:title" content="Stuffed Cookies" />
<meta property="og:image" content="http://example.com/cookie.jpg" />
<meta property="og:description" content="The Turducken of Cookies" />
<meta property="og:url" content="http://example.com/cookie.html">
<script type="text/javascript">
function postCook()
{ FB.api('/me/YOUR_NAMESPACE:cook' +
'?recipe=http://example.com/cookie.html','post', (…) }); }
</script>
</head>
<body>
(…)
<form>
<input type="button" value="Cook" onclick="postCook()" />
</form>
</body>
</html>
Face… it
05/10/2012
8
changing interface…
crowdsourcing crawling & indexing affiliation social sub-networks
analyse réseaux sociaux web 2.0 & dynamique
© FriendViz © Obama’s network, Recorded Future
© Egyptian Revolution on Twitter, A. Panisson, Gephi © Facebook
une représentation est modifiée par un
commentaire contenu essentiel, lié à une
ressource spécifique (un article) vs
contenu accessoire, lié à une règle non-essentielle
(un commentaire)
une ressource change : une question
devient une réponse parfois… ? ! suppression définitive ni ressource, ni représentation
05/10/2012
9
gérér sa bibliographie : Zotero et Coins
extraction de données « page » donnant l’analyse du texte d’une autre « page »
made in web
auteurs? journal confusion des genres?
05/10/2012
10
permanence/ non permanence
raccourcisseur d’URL et re-captcha…
des jeux utiles au crowdsourcing le web comme une plateforme d’externalisation distribuée de masse.
Fold It
temps facebook 16.2 millions secondes/seconde
x 16 203 703
253
l’utilisateur utilisé
le web comme une machine universelle
de moteurs à pulsions
(méta)-données
application web
05/10/2012
11
jeu HTML5
Mario Kart en HTML5 (ouf !)
…
jouer dans le navigateur : le cloud
© HTML5Rocks
download
upload
drag & drop
© HTML5Rocks
speech input
geolocation
© HTML5Rocks
html & js html & svg
WebGL
05/10/2012
12
inputs, text, email, number, phone ©HTML5Rocks
HTML pages of specifications
39 pages 963 pages
HTML 1
Ligne de Temps
annotations des éléments multimédia
• description sémantique de ressources multimedia [Media Annotation]
• adressage d’éléments internes aux ressources [Media Fragment]
fragment multimédia • partie fragment de l’URL = après le #
http://www.example.com/example.ogv#track=audio&t=10,20
• dimensions:
– temporelle: t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z
– spatiale: xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50
– track: track=1 / track=video&track=subtitle / track=Wide
– nommée: id=chapter-1
• fragment non transmis par le navigateur: encodage dans la requête HTTP
ontologies des ressources multimédias ontology for Media Resources 1.0 <video.ogv> a ma:MediaResource ;
ma:hasTrack <video.ogv#track=audio>,
<video.ogv#track=subtitle>;
ma:hasSubtitling <video.ogv#track=subtitle> ;
ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> .
<video.ogv#track=audio> a ma:AudioTrack ;
ma:hasLanguage [ rdfs:label "en-GB" ] ;
ma:hasFragment <video.ogv#track=audio&t=10,20> .
<video.ogv#track=audio&t=10,20> a ma:MediaFragment ;
ma:hasLanguage [ rdfs:label "fr" ] .
<video.ogv#track=subtitle> a ma:DataTrack ;
ma:hasLanguage [ rdfs:label "es" ] .
<video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ;
ma:hasLanguage [ rdfs:label "bfi" ] .
05/10/2012
13
universelle une interface programmatique
serveur application
HTTP HTTP
application
navigateur
HTTP
design & affordance ceci est un ovetto
?
affordance sémantique
SAWSDL semantic annotation of WSDL (W3C Rec. 2007)
SAWSDL… sémantiquement services annotés et recherchés
fournisseur service client demandeur
annuaire
3
1 2
05/10/2012
14
pre-populating…
entrée
sortie
assistant’s phone phone name name phone name
employee assistant
workflows scientifiques
• composer des données et traitements distribués
• échanger et comparer les traitements et leurs compositions
se lier au monde Le bug de l’an…
2020 ( inspiration Gérard Berry)
SSRSSLSSS
SSLSSLSSS
05/10/2012
15
1 sec. battement de cœur
1/2 sec. double click
24 images/sec. film
500 000 décisions / sec. algorithmes boursiers « Aliénation et accélération. » Hartmut Rosa
http://mon.org/ma/ressource
règles négociation calculs composition rendu …
… …
…
…
… …
DNS, TCP/IP, Web
…
http://mon.org/ma/ressource
règles négociation calculs composition rendu …
… …
…
…
… …
…
DNS, TCP/IP, Web GET
30 min…
05/10/2012
16
5 jours…
le livre n’est pas recréé à chaque page
Stéphane Crozat: « le document numérique n'existe pas, ce qui
existe ce sont des constructions numériques dont le traitement calculatoire simule un ordre documentaire. »
Le juridique aussi souffre de l’héritage documentaire des données
nouveaux engagements, contrats • contrats de lecture + computationnel
• contrats d’identification + computationnel
• contrats d’accès + computationnel
• contrats de publication + computationnel
• contrats de stockage + computationnel
• etc.
« il n’y a plus de documents, le besoin de documentariser n’en n’est que plus fort. »
05/10/2012
17
tant à venir
le web entre nous et le monde • documents & données augmentent nos perceptions
• services & applications augmentent nos actions
• incontournable &… ingérable?
réalité augmentée par le web & augmentation du web par le réel
• vers une réalité augmentée par le web
• diversité des ressources web augmentée par diversité des ressources de notre réalité
• « documentarisation non documentaire » de la réalité par le web
• modèle documentaire rendu minoritaire / modèle calculatoire
• limite de la métaphore de la bibliothèque
• une toile de ressources informatiques
google glass project
chaque utilisateur est un détecteur web de « consommacteurs » mobiles, « crawlers » du web & du monde physique ex. Wikimapia, OpenStreetMap , etc.
© Medialab Prado © GeoSensor Image,T. Berners-Lee, RuleML kickoff, 2005
une toile de données multiples entre différents barreaux de l’échelle des sphères
« small data & big data »
05/10/2012
18
web…devices … Web Phone
… Web TV
… Web Radio
… Web Car
… Web Tablet
… Web eBook
… Web Watch
… Web GPS
…
[Web of Devices]
cintre Facebook chez C&A Brésil
nouvelles topologies du web ex. « near field communication »
05/10/2012
19
Open Street Map dans le métro navigateur web = interface universelle ex. domotique
Web 2.0 & Web Physique
05/10/2012
20
RFID&URI ex. Live Social Semantics
fabien Janet Echelman, “Her Secret is Patience”, Civic Space Park, Phoenix, AZ, USA, 2009
plusieurs évolutions concourantes • explosion multimédia et multi-modalité
• toile de ressources computationnelles liées
• ressources comme locus de calcul
• assimilation de tous les objets à des ressources web
l’effet diligence Jacques Perriault
(méta) web
liens d’association du mémex entre les informations qui nous importent
[Vannevar Bush, 1945]
05/10/2012
21
hypertexte, hypermédia une structure de fichier pour l’information
complexe, changeante et indéterminée
[Ted Nelson, 1965]
à travers le réseau liens utilisant des références
http://www.
[Tim Berners-Lee, 1989]
hypertexte et document sur le Web : de la nécessité de les reconstruire par assemblages
Hypertexte : Google
Document : Scenari
Le Web à la base n’est pas un hypertexte : il ne relie pas des documents. mais il peut le devenir ou accueillir des documents car c’est aussi une plateforme ouverte…
…
structuré vers un web
séparer forme et contenu
05/10/2012
22
2008 XML a eu dix ans <balise>…</balise>
XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html
structurer des données
en utilisant des balises
dans un format textuel
construction modulaire
une famille de langages
un format ouvert non propriétaire
XML bien formé <racine>...</racine>
<x>...</x> ou <x/>
<a><b></a></b>
<x> <X>
<1an> <xmla> <bla bla>
<a b='c'></a> ou <a b='c'/>
de langages
Scalable Vector Graphics (SVG)
XML Topic Maps (XTM)
Synchronized Multimedia Integration Language (SMIL)
eXtensible Access Control Markup Language (XACML)
OpenOffice Schemas
MusicML
MathML
Financial products Markup Language (FpML)
GPS Exchange format (GPX)
NewsML
WSDL
Chemical Markup Language (CML) XHTML
famille
namespace • espaces de nommage
• éviter les collision de noms
• associer un préfixe de balise à un URI
• exemple
• définitions héritées dans l’arbre XML
• namespace par défaut xmlns="…"
<ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note>
<bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note>
ontos logos être / êtres discours / science
“Jac
ob
Lorh
ard'
s "O
gdoa
s Sc
hol
asti
ca"
(16
06)
co
ntai
ns t
he f
irst
occ
urr
ence
of
the
term
‘o
ntol
ogi
a’
” R
aul C
ora
zzo
n o
n fo
rmal
on
tolo
gy.it
->
Ontologie ontologie
05/10/2012
23
votre réponse est basée sur une ontologie partagée
je peux comprendre
vous pouvez raisonner
Document
Book
Novel Short story
sous type
sous type
#12
#21
#47 #48
"document"
"book"
"livre"
"novel"
"roman"
"short story"
"nouvelle"
#21 #12
#48 #21 #47 #21
#21 #12
#48 #21 #47 #21
connaissance ontologique formalisée
#12
#21
#47 #48
ontologie n’est pas un synonyme de
taxinomie
la connaissance
taxinomique est une connaissance
ontologique parmi d’autres
05/10/2012
24
partie de
carbone hydrogène oxygène
dioxyde de carbone dioxygène ozone dihydrogène
méthane éthane méthanol éthanol
eau phénol méthyle
combiner différents types de connaissances ontologiques
Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition
of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294).
Limb Individual
Cat
Organic object
couverture
dans quelle mesure les primitives mobilisées par les scénarios sont couvertes par l’ontologie spécificité dans quelle mesure
les primitives sont précisément déclarées
dans l’ontologie
granularité dans quelle mesure les primitives
sont détaillées
exemple granularité [Charlet - RFIA 2002]
1. Patient-Masculin
Patient-Féminin
2. [Patient] (chrc) [Masculin]
[Patient] (chrc) [Féminin]
3. [Patient] (attr) [Sexe] (val) [Masculin]
[Patient] (attr) [Sexe] (val) [Féminin]
05/10/2012
25
dans quelle mesure les primitives sont décrites dans un langage formel
formalité
méthodes ex. rigidité dans Onto Clean [Guarino & Welty]
Rigid +R
is a necessary property for all its instances
Anti-Rigid ~R
is an optional property for all its instances
Person is y+R, Student is ~R
Constraint: ~R can't subsume y+R
structurer une “folksonomie”
folksonomies plates web 2.0
pollution
pollution des sols
has narrower
polluant énergie
related related
thesaurus
?
SKOS
combinaison espaces métriques
distances d’édition Monge-Elkan Soundex, JaroWinkler,
asymétrie Monge-Elkan Qgram
métrique contextuelle cosinus vecteur de cooccurrences de tags
métriques sociales inclusion de communautés
d’intérêt
05/10/2012
26
83 027 relations / 9 037 tags
68 633 related
11 254 hyponyms
3 193 spelling variants
ex. ademe TheseNet recherches & retours
ex. propagation sémantique
sel, eau
poivre, vin
moutarde
rugby, foot
foot, ciné
hockey sport sport
sport
condiment
condiment condiment
from RAK/LP to SemTagP
ex. Ademe 1 pollution ; 2 développent durable ; 3 énergie ; 4 chimie ; 5 pollution de l’air ; 6 métaux ; 7 biomasse ; 8 déchets.
langages de formalisation
d’ontologies
exemple
(define-class humain (?humain)
:def (animal ?humain))
subsomption dans les frames
05/10/2012
27
exemple
(defprimconcept MALE)
(defprimconcept FEMELLE)
(disjoint MALE FEMELLE)
classes disjointes en logiques de description
exemple
[Concept: Directeur]->(Def)->
[LambdaExpression:
[Personne: ]->(Dirige)->[Groupe]]
classe définie en graphes conceptuels
sémantique vers un web
le web originel liens typés…
web sémantique mentionné par Tim BL
en 1994 à WWW
[Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]
RDF , toute connaissance est décomposée en triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud )
05/10/2012
28
ex : doc.html a pour auteur Fabien et a pour thème la Musique
doc.html a pour auteur Fabien doc.html a pour thème Musique
Fabien
auteur
doc.html
thème
Musique
<RDF/> une syntaxe XML pour mieux échanger ces graphes
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-
rdf-syntax-ns#"
xmlns:inria="http://inria.fr/schema#" >
<rdf:Description
rdf:about="http://inria.fr/rr/doc.html">
<inria:author rdf:resource=
"http://inria.fr/~fabien#me" />
<inria:theme>Music</inria:theme>
</rdf:Description>
</rdf:RDF>
nœuds anonymes (blank nodes)
http://bu.ch/l23.html auteur
"Les zélés faons roses"
titre
"Laurent"
nom
"Trichard"
prenom
quantification existentielle il existe une ressource telle que… { r ; …} <rdf:Description rdf:about="http://bu.ch/123.html ">
<auteur>
<rdf:Description>
<nom>Trichard</nom>
<prenom>Laurent</prenom>
</rdf:Description>
</auteur>
<titre>Les zélés faons roses</titre>
</rdf:Description>
x ; auteur(http://bu.ch/123.html,x) nom(x,"Trichard")
prenom(x,"Laurent")
05/10/2012
29
interroger avec SPARQL SPARQL Protocol and RDF Query Language
exemple personne ayant au moins 18 ans
PREFIX ex: <http://inria.fr/schema#>
SELECT ?person ?name
WHERE {
?person rdf:type ex:Person
?person ex:name ?name .
?person ex:age ?age .
FILTER (?age > 17)
}
web de données première vague de déploiement du web sémantique (RDF, SPARQL)
May 2007 April 2008 September 2008
March 2009
September 2010
Linking Open Data
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
September 2011
0
100
200
300
400
10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012
e.g. DBpedia
05/10/2012
30
CORESE/ KGRAM
contenus et thématiques Domaines Nombre de jeux
de données Triplets % Liens sortants %
Media 25 1 841 852 061 5,82 % 50 440 705 10,01 %
Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 %
Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 %
Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 %
Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 %
Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 %
Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 %
295 31 634 213 770 503 998 829
42%
20%
13%
10%
9% 6%
0%
Gouvernement
Géographique
Inter-domaine
Sciences de la vie
Publications
Media
Contenu utilisateur
data.ratatouille.com
05/10/2012
31
principes utiliser le format RDF
utiliser des URI pour nommer
utiliser des URI HTTP (URL) pour que l’on puisse les suivre
lorsqu’un URI est suivi donner des informations (HTML, RDF)
inclure dans ces informations des liens vers d’autres données
DNS celui qui contrôle le nom de domaine contrôle le déréférencement.
ex. bit.ly & Lybie
.fr
*
.inria
isicil
(June 2012)
le cas de la France mouvement d'ouverture des données mais…
• redondance des identifiants
• hétérogénéité des formats
• diversité des vocabulaires
• hétérogénéité des accès
publication processus démo
• installation en un click
• import de données trouvées en ligne
• transformation en RDF
• publication sur le web
• interrogation directe
05/10/2012
32
RDFS pour définir les classes de ressources, leurs propriétés, et organiser leur hiérarchie
Document
Rapport
créateur
auteur
Document Personne
OWL in one…
par énumération
par intersection
par union
par complément
la disjonction
par restriction !
par cardinalité 1..1
prop. algébriques
par équivalence
[>18]
union disjointe restrict. valeur
prop. disjointes
cardinalité qualifiée 1..1
!
négation prop. indiv
prop. chainées
clefs …
alignements et liage ontologies et entités nommées
• « Ontology Alignment Evaluation Initiative »
• reconnaissance d’entités nommées
• liage de ressources
OKKAM et owl:sameAs 1
“The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query: where does John teach and what? One will make the following query on the merge of the two datasets: < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at UNI1 and philosophy of language at UNI2.” (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo)
05/10/2012
33
OKKAM et owl:sameAs 2 « when owl:sameAs is not the same » (H. Halpin, I. Herman, P. Hayes)
des représentations de ressources jugées identiques peuvent néanmoins diverger.
ex. : si ma ressource est l’élément sodium…
• OpenCyc : un élément est l’ensemble de tous les fragments de cet élément à l’état pur
• DBpedia : inclut en outre les isotopes de sodium (nombre de neutrons différent)
deux vue sur la même chose ou deux objets différents ?
chaine GATE : exemple en biologie…
thesaurus,
classifications,
sujets, taxinomies,
folksonomies, ...
vocabulaires
contrôlés
05/10/2012
34
expression naturelle pour dénoter un concept inria:CorporateSemanticWeb
skos:prefLabel "corporate semantic web"@en;
skos:prefLabel "web sémantique d'entreprise"@fr;
skos:altLabel "corporate SW"@en;
skos:altLabel "CSW"@en;
skos:hiddenLabel "web semantique d'entreprise"@fr.
labels entre concepts
inria:CorporateSemanticWeb
skos:broader w3c:SemanticWeb;
skos:narrower inria:CorporateSemanticWiki;
skos:related inria:KnowledgeManagement.
relations
inria:CorporateSemanticWeb
skos:scopeNote "only within KM community";
skos:definition "a semantic web on an intranet";
skos:example "Nokia's internal use of RDF gateway";
skos:historyNote "semantic intranet until 2006";
skos:editorialNote "keep wikipedia def. uptodate";
skos:changeNote "acronym added by fabien".
beaucoup de données dans beaucoup de pages
R2RML une transformation standard d’une base relationnelle en RDF
schéma
mapping
Triplets produits : • cellules d’une ligne sujet commun
• noms des colonnes prédicats
• une cellule un objet
• liens entre tables
nom prenom age
filar alain 34
seger thomas 45
#s1 :nom "filar" #s1 :prenom "alain" #s1 :age "34" #s2 :nom "seger" #s2 :prenom "thomas" #s2 :age "45" #s3 …
05/10/2012
35
exemple de mapping
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name a:homepage
a:author
I. Herman, W3C
(1) transformation
table personnes
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name a:homepage
a:author
:P_Table rdf:type rr:TriplesMap ; rr:subjectMap [
rr:termtype "BlankNode" ; rr:column "ID" ; ] ;
rr:predicateObjectMap [ rr:predicateMap [
rr:predicate a:name ]; rr:objectMap [
rr:column "Name" ]
] ; rr:predicateObjectMap [ rr:predicateMap [
rr:predicate a:homepage ]; rr:objectMap [
rr:column "Homepage" ; rr:termtype "IRI"
] ] ;
I. Herman, W3C
(2) transformation
table livres
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name a:homepage
a:author
I. Herman, W3C
:B_Table rdf:type rr:TriplesMap ; rr:subjectMap [
rr:template "http://...isbn/{ISBN}"; ]; rr:predicateObjectMap [
rr:predicateMap [ rr:predicate a:title
]; rr:objectMap [ rr:column "Title"
] ] ;
rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:year
]; rr:objectMap [ rr:column "Year" ;
] ] ;
(3) lier les tables
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name a:homepage
a:author
I. Herman, W3C
:B_Table a rr:TriplesMap ;
...
rr:refPredicateObjectMap [
rr:refPredicateMap [
rr:predicate a:author
];
rr:refObjectMap [
rr:parentTriplesMap :P_Table ;
rr:joinCondition
"{child}.Author = {parent}.ID"
]
]
].
RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/">
<h2 property="dc:title">The trouble with Bob</h2>
<h3 property="dc:creator">Alice</h3>
...
</div>
05/10/2012
36
provenance, confiance, explication,
“At the toolbar (menu, whatever) associated with a document there is a button marked "Oh, yeah?". You press it when you loses that feeling of trust. It says to the Web, "so how do I know I can trust this information?". The software then goes directly or indirectly back to metainformation about the document, which suggests a number of reasons.”
Tim Berners-Lee, Consistent User Interface, W3C Design Issues, 1997
Oh,yeah?
en insérant des étiquettes émises par des autorités dans les pages
protéger les enfants
<meta http-equiv="pics-label" content='(PICS-1.1
"http://www.icra.org/ratingsv02.html" labels
for "http://mm.256.com/"
generic true
ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1) "http://www.rsac.org/ratingsv01.html" labels
for "http://mm.256.com/"
generic true
ratings (n 0 s 0 v 0 l 4) )' />
VoID: décrire des sources de données schéma pour annoter des jeux de données :DBpedia a void:Dataset .
et des jeux de liens :DBpedia_Geonames a void:Linkset .
:DBpedia a void:Dataset;
void:sparqlEndpoint <http://dbpedia.org/sparql>;
void:feature :RDFXML ;
void:subset :DBpedia2Geonames ;
void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ;
dcterms:modified "2008-11-17"^^xsd:date;
dcterms:title "DBPedia";
dcterms:description "RDF data extracted from Wikipedia";
dcterms:publisher :DBpedia_community;
dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>;
dcterms:source <http://dbpedia.org/resource/Wikipedia>.
:Geonames a void:Dataset;
void:sparqlEndpoint <http://geosparql.appspot.com/query>;
void:triples "107983838"^^xsd:integer ;
dcterms:subject <http://dbpedia.org/resource/Location> .
:DBpedia2Geonames a void:Linkset ;
void:linkPredicate owl:sameAs ;
void:target :DBpedia ;
void:target :Geonames .
ex. DBpedia dataset
05/10/2012
37
provenance & traçabilité [Provenance WG]
PROV-DM & PROV-O OWL2 ontology décrire les entités et activités impliquées dans la production, livraison, etc. d’un objet
ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 .
ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated .
ex1:illustrated prov:used ex1:aggregate2 .
ex1:chart2 prov:wasGeneratedBy ex1:illustrated .
ex1:aggregated prov:wasControlledBy ex1:derek .
ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 .
++
description authentifiée
plusieurs ressources
listes
domaines, chemins
expressions régulières
grouping mechanisms...
... list URIs
... domain names, paths
... regular expressions on URIs
exemple de description POWDER « toute ressource dont l’URI commence par http://www-sop.inria.fr/fr/ concerne le centre de recherche de l’INRIA géographiquement situé à Sophia Antipolis et est en français »
certifié par inria.fr
préjugés, fausses idées
05/10/2012
38
boite noire éviter de construire une
explicites rendre les conceptualisations à base d’ontologie
ne signifie pas que l’on a besoin d’un moteur d’inférence.
de l'intérêt d'un à peu près…
ma montre n'a qu'une aiguille
mais elle n'est pas cassée.
05/10/2012
39
sens et position d’une taxonomie à une vue
a r
a=120° 360° 0°
“semantic web” and not
“semantic web”
[C. Welty, ISWC 2007]
“a lightweight ontology allows us to do lightweight reasoning”
[J. Hendler, ISWC 2007]
66 FOAF primitives 3 475 908 348 references (2)
x 52 millions
“a small tree ruling a big graph”(1)
(1) Franck Van Harmelen, ISWC 2011 (2) Libby Miller, 2009
le piège du domaine le domaine d’application n’est pas forcément celui de l’ontologie
universelle je n’ai jamais vu une ontologie
05/10/2012
40
Trouble dans la classification (F. Rastier)
la vache folle ou l’ontologue végétarien
s:MadCow rdfs:subClassOf s:Cow
gestion
besoin
conception
diffusion
utilisation évaluer
évolution
cycle
vie
modèle changeant
brique de construction
vs.
tri sélectif sémantique le web est une poubelle, le web sémantique sera une poubelle sémantique.
et pour nous ?
05/10/2012
41
hyper-documentaire de l’article scientifique à l’hyper-article multi-public
plus vieille facette, mais encore sous exploitée
donnez des URL aux contenus une URL est un nom, sans URL pas de nom, sans nom je ne peux pas en parler
• référence
• granularité
• vues
nouvelles formes de rédaction… • systématiquement enrichir de liens
• identifier des cibles internes et externes
• identifier les persona de notre public
• permettre des parcours multimédias idoines
« produire une hyper-ressource, c’est hyper long… c’est même jamais vraiment fini. »
forme / fond, structure, sémantique
• jeux de données scientifiques entrées et sorties
• des schémas de données développer http://ns.inria.fr
• Ex en biologie: HCLS IG
• SPARQL: recherche de liens, motifs et chaines
• référentiels métiers et domaines nos termes, nos définitions, nos thésaurus, ... ex. SHOINQ < ALC < Logique de Description < Langage Logique
<XML/>
utilités ? scénarios ? • reproductibilité et comparatifs
• permettre d’autres expérimentations / algo
• ex. OAEI:
– Visibilité et citation
– Alignement de domaines, sources, résultats, etc.
• journalisme de données
• génération de liens, restructuration, ranking
le web comme écriture collective
• ouverture en écriture... collective
– ne plus centraliser la rédaction: distribuer, aider, …
– « utilisacteur »: nos lecteurs peuvent aider à vulgariser, reformuler, enrichir
• ouverture en écriture collective ...
– ne plus centraliser la rédaction: animer, solliciter
– participer à d’autres sites: ex. wikipedia (édition, ref.)
05/10/2012
42
nouvelles formes de publication… • soumissions immédiatement publiques
• revues sollicitées et processus rendus publics
• ouvert aux commentaires et revues spontanés
• éditeur scientifiques vs. web ouvert
• nouveaux modes opératoires, nouveaux critères
nouvelles conférences • suivre l’ensemble de
la conférence
• percevoir les avis, réactions, questions
• interroger, réagir
• compléter, traduire, augmenter
socialité centrée ressource
• objets cristallisant une activité sociale et vice-versa
• bis repetita placent… « online or invisible »
• e.g. médiathèque sociale (vidéos, images, etc.)
– commentaires, tagging, etc. site ouvert à tous
– contributions ouvertes en interne
• e.g. « e-CRDP »
– cartographie intervenants et matériels pédagogiques
– ex. un compte slideshare, service interne… + animation
• interstice socialisé: réactions, tagging, etc.
…
au-delà du Buzz • orchestrer la communication et sa contagion
• gérer notre présence en ligne
• faire explicitement appel au peuple (sondages, campagnes de test, etc.)
• faire implicitement appel au peuple (tagging, bookmarking, etc.)
• cartographie interne et externe de nos réseaux
nos algorithmes en ligne • fournisseurs de services de haut niveau
(bibliothèque, QoS, certification, etc.)
• démonstrateurs / testeurs ex. traitement d’image
• services, API et widgets
• galerie, maintenance,
serveur application
HTTP HTTP
application
navigateur
HTTP
ex. « pseudo haptic »…
label sur des ressources web • authentifier des ressources
• valider des données
• sécuriser des accès
• certifier des services
…
05/10/2012
43
interfaces et utilisateurs partout
• HTML5: de la page à l’application nouvelles formes de production et consultation
• consommation opportuniste, contextuelle, etc.
• contenus multi-formats (ex. podcasts interstices)
• Accessibilité ?
• App. INRIA ?
doggy-bags
web 1 , 2
price convert?
person homepage?
more info?
web 1 , 2 , 3
lier le monde
lier les données
web
rec
om
man
dat
ion
s
html
http
url html http url
uri
iri
atag uaag wcag aria
mwbp earl ra cc/pp assx css
ddrsa xml eve. exi geo api dom xform
grddl inkml its cmwww ruby an. xhtml rdfa
ets omr m. ok emma p3p math ml mf
pics qa rif sec cont. sawsdl png powder
sml soap
wsdl
svg awww ttml smile
rdf owl rdfs sparql
etc. woff
webcgm
xbl xkms xlink wscdl wsp
skos
ns canon. x dtxml xproc xfrag xml xbase
xschema xml:id xpath xpointer xquery xsignat. xbop
xslt xslfo
…
05/10/2012
44
Leçon 1: faire une application web o HTML 5 o CSS 2.1 o CSS 3 Selectors o CSS 3 Media Queries o CSS 3 Text o CSS 3 Backgrounds
and Borders o CSS 3 Colors o CSS 3 2D
Transformations o CSS 3 3D
Transformations o CSS 3 Transitions o CSS 3 Animations o CSS 3 Multi-Columns o CSS Namespaces
o SVG 1.1 o WAI-ARIA 1.0 o MathML 2.0 o ECMAScript 5 o 2D Context o WebGL o Web Storage o Indexed Database o Web Workers o Web Sockets
Protocol/API o Geolocation o Server-Sent Events o Element Traversal o DOM Level 3 Events
o Media Fragments o XMLHttpRequest o Selectors API o CSSOM View Module o File API o RDFa o Microdata o WOFF o HTTP 1.1 o TLS 1.2 (updated) o IRI (updated) o …
W3C
i=j; réplication et bien anti-rival… à l’échelle du monde.
socialisation intensive de nos activités.
WEB science
263
informel
formel
usage représentation
un et un seul web…
données
personnes documents
programmes
un espace unique dans tous les sens du terme, une toile hybride
metadata
gestion-orientée métadonnée • diversité de ressources (données ou non) • métadonnées & schéma pour leur gestion • importance du web sémantique dans ce contexte
05/10/2012
45
demain, celui qui contrôlera les métadonnées,
contrôlera le web.