IGN Laboratoire COGIT
description
Transcript of IGN Laboratoire COGIT
1
IGN / COGIT
IGN Laboratoire COGIT
Réunion de lancement GeOnto18 janvier 2008
http://recherche.ign.fr/cogit
2
IGN / COGIT EPCA, 1700 personnes, budget 100M€
IGN
3
IGN / COGIT
Recherche à l’IGN
Une des missions de l’IGN
Pour la production ET l’intérêt général
~ 60 personnes• ~ 7 thèses soutenues par an
4 laboratoires• Géodésie (LAREG)
• Instrumentation (LOEMI)
• Traitement d’image (MATIS)
• Gestion et exploitation données géo (COGIT)
4
IGN / COGIT
COGIT - Thèmes de recherche
Accès aux données et aux services • Aide à la conception de légendes• Aide à l’extraction de données• Description et spécification de traitements
Cartographie• Automatisation de la généralisation• Automatisation de l’amélioration des légendes
Risques et territoires• Modélisation 3D pour l’analyse des risques• Analyse des graphes et des zones urbains
Intégration de données• Description formelle des spécifications• Appariement de données• Modélisation de BD / représentation multiple
5
IGN / COGIT
Intégration de bases de données
6
IGN / COGIT
Objectif
Intégrer BD géographiques• Appariement de schémas
• Appariement de données
BD TOPO BD CARTO
7
IGN / COGIT
Difficultés de l’appariement de schémas
Des schémas à la sémantique insuffisante
Canalisation
Tronçon de cours d’eauTronçon hydrographique
Aqueduc
8
IGN / COGIT
Cap, pointeCirqueCol, passageVolcan, cratèreSommet, crête, collineCoteau, FalaiseCuvette, dépressionValléeIleDune, plagePicPlaine, plateauRécifsRocherEspace marinBanc, haut fond
Difficultés de l’appariement de schémas
Des schémas à la sémantique insuffisante
BDCARTO BDTOPO
CapCarrière
CirqueCol
CrêteDépression
DuneEscarpement
GorgesGrotte
IleIsthme
MontagnePic
PlagePlaine ou plateau
RécifsRochersSommet
ValléeVersantVolcan
9
IGN / COGIT
Difficultés de l’appariement de schémas
Des schémas à la sémantique insuffisante• Regroupements opérés dans les classes
• Critères de sélection
• Critères de découpage
• …
Approche générale :• S’appuyer sur les spécificationsdes BDs, riches en information
10
IGN / COGIT
Approche
Schéma1 Schéma2
Specifications1 Specifications2
Ontologie 1 Ontologie 2
11
IGN / COGIT
Approche
[Gesbert 2005]
«Ent. géog.»Cours d'eau
«Ent. géog.»Canal
«Ent. géog.»Fossé
«Ent. géog.»Aqueduc
«Ent. géog.»Rivière
«Ent. géog.»Nœud réseau
«Ent. géog.»Confluent
«Ent. géog.»Diffluent
«Ent. géog.»Source
«Ent. géog.»Perte
«Ent. géog.»Embouchure
«Ent. géog.»Acc. parcours
«Ent. géog.»Barrage
«Ent. géog.»Écluse
«Ent. géog.»Cascade
«Objet de la base»Tronçon cours d’eau
«Objet de la base»Point d’eau
«Objet de la base»Cours d'eau nommé
«Objet de la base»Surface d’eau
affluent de*
0..1
BD Topo
«Ent. géog.»Élt du réseau hydroOntologie
«Ent. géog.»Cours d'eau
«Ent. géog.»Élt du réseau hydro
«Ent. géog.»Canal
«Ent. géog.»Fossé
«Ent. géog.»Aqueduc
«Ent. géog.»Rivière
«Ent. géog.»Nœud réseau
«Ent. géog.»Confluent
«Ent. géog.»Diffluent
«Ent. géog.»Source
«Ent. géog.»Perte
«Ent. géog.»Embouchure
«Ent. géog.»Acc. parcours
«Ent. géog.»Barrage
«Ent. géog.»Écluse
«Ent. géog.»Cascade
«Objet de la base»Tronçon hydro
«Objet de la base»Nœud hydro«Objet de la base»
Cours d'eau
«Objet de la base»Z.O.S.
affluent de*
0..1
BD Carto
Ontologie
12
IGN / COGIT
Formalisation des spécifications
13
IGN / COGIT
Spécifications
14
IGN / COGIT
Spécifications
Extrait des spécifications BDCarto
15
IGN / COGIT
Spécifications
Extrait des spécifications BDCarto
16
IGN / COGIT
Spécifications
Extrait des spécifications BDTopo
17
IGN / COGIT
Spécifications
Extrait des spécifications BDTopo
18
IGN / COGIT
Spécifications
Extrait des spécifications BDTopo
19
IGN / COGIT
Spécifications
Extrait des spécifications BDTopo
20
IGN / COGIT
Bilan sur les documents
Spécifications • Externes
• De nombreuses BD différentes
• Mais toutes issues de l’IGN‒ Besoin de spécifications étrangères?
Des documents:
• Très riches en information
• Très organisés / texte libre
• Volumineux
• Avec du langage naturel
• Avec des organisations sensiblement différentes
21
IGN / COGIT
« Ontologies »
22
IGN / COGIT
Création des ontologies
Schéma1 Schéma2
Specifications1 Specifications2
Ontologie 1 Ontologie 2
TALNTALN
23
IGN / COGIT
Création des ontologies1ers essais [Laurens 2006]
Analyse de la structure du document
Analyse de texteTokénisation / lemmatisation
Filtrage des expressions
Réorganisation
Description de la structure(interactive)
Dictionnaire(Morphalou)
Dictionnaire
Corpus non géographique
Sélection interactive
Hiérarchisation interactive
24
IGN / COGIT
Création des ontologies1ers essais [Laurens 2006]
~500 concepts / taxonomie créée
Hiérarchisation insuffisante• Ex: pic, sommet, gorges, plage…
Trop proche de la BD• Ex: Bâtiment ponctuel, surfacique, linéaire
Un travail interactif est nécessaire• Pour filtrer (rapide)
• Pour réorganiser (plus long)
25
IGN / COGIT
Création des ontologies1ers essais [Laurens 2006]
26
IGN / COGIT
Alignement d’ontologies
Schéma1 Schéma2
Specifications1 Specifications2
Ontologie 1 Ontologie 2
AlignementAutomatique
27
IGN / COGIT
Alignement d’ontologies 1ers essais [Abadie 2007]
Utilisation de Prompt (plug-in Protégé)• Prometteur
‒ Alignement automatique possible‒ Inférences intéressantes
• A affiner‒ Erreurs: termes proches‒ Modification de la hiérarchisation pas toujours
pertinente‒ Fort travail interactif nécessaire
28
IGN / COGIT
Alignement d’ontologies 1ers essais [Abadie 2007]
29
IGN / COGIT
Bilan sur nosressources ontologiques
On dispose de• 2 taxonomies correspondant à deux BDGéo
‒ Avec des formes assez différentes (+/- hiérarchiques)
• 1 taxonomie issue de leur fusion ‒ ~700 termes‒ Importante réorganisation interactive‒ Bilingue
Simples hiérarchies de termes• Pas de définitions, propriétés…
• Sémantique des relations insuffisante, voire fausse
30
IGN / COGIT
Données
31
IGN / COGIT
Appariement de schémas à partir del’appariement des données
BDCARTO BDTOPO
32
IGN / COGIT
Appariement schémas / données
Pas d’identifiants universels
Appariement géométrique• Difficultés : gestion des imprécisions,
incomplétudes, incohérences…
• Un processus imparfait
• L’appariement de schémas guide celui des données…
• …et inversement
33
IGN / COGIT
Appariement de schémas / données1ers essais [Abadie, Olteanu, Mustiere
2007]
34
IGN / COGIT
Attentes / GeOnto
35
IGN / COGIT
Attentes
Ontologie(s) géographique(s) • plus riche(s)
• plus juste(s)
Méthodologies• constitution d’ontologies
• alignement
• comparaison
Analyses • des façons de décrire le monde
‒ Différents points de vues, différentes échelles
• des potentialités des ontologies‒ Pour l’intégration de bases de données‒ Pour l’accès aux bases de données