Formation Ontologies Médicales (Form-Ol) Session...

12
MJ/ form_ol_1_20100623.doc 1 Formation Ontologies Médicales (Form-Ol) Session I Réunion du 23 uin 2010 Rapport par MJ avec notes de MDJ/BVB/PDP et BF Présents : BVB/RVDS/MJ/MDJ/BF/PDP/JR/SR Présentation des participants : BVB = Benny Van Bruwaene RVDS =Robert Vander Stickelen MJ = Marc Jamoulle MDJ = Michel De Jonghe BF=Benjamin Fauquert PDP =Pierre De Plaen JR =Joseph Roumier SR = Sébastien Rousseau CR = Cyril Romain Présentation des participants JR : Ingénieur informaticien ontologiste. Fait partie de l’équipe de recherche du CETIC chargé de cette formation. Equipe de recherche travaille à la création d’index de documents, web sémantique depuis le xml jusqu’au RDF/OWL/moteur d’inférence qui permettent de tirer parti de corpus existant ou de vérifier la validité d’un corpus. CETIC travaille sur le projet Ehealth for citizen (Région wallone), sur l’architecture d’intégration avec RSW (avec Didier Tymans et André VandenBergh). Le CETIC participe aussi au projet européen PONTE, une plateforme sémantique pour assurer l’interconnexion de base de données d’effets secondaires. Ainsi qu’un projet de ressources terminologiques multilingues en maintenance industrielle multi-niveau (lay and professional). Ce qui permet à chacun de garder son vocabulaire. Il fait appel à un système dénommé « terminological make up framework » pour décrire le domaine de la maintenance industrielle. Il y a donc des méthodologies qui permettent de ne pas partir de zéro. PDP : Médecin généraliste et médecin de santé publique. A travaillé à l’Institut Pasteur à Bruxelles. A participé à l’élaboration des directives européennes Environnement-Santé: soufre-fumée et oxydes d'azote (ozone). A une expérience du travail avec les traducteurs. Il est actuellement membre de la FRATEM, asbl pilote du RSW (Réseau Santé wallon) . Il se consacre à l'élaboration de l'architecture télématique hub-metahub développé au sein de la plate-forme eHealth et participe à la mise en place (gestion) des interfaces «diagnostiques» et thérapeutiques du SUMEHR . Il participe indirectemment aux travaux du G19. Pierre De Plaen est président de la Fédération des cercles de médecins généralistes du Brabant Wallon et actif dans plusieurs organisations professionnelles de médecine générale. BF : Médecin généraliste en activité clinique à 2/3 temps. Participe au CEBAM (Centre Belge d’Evidence Base Medecine), et notamment à l’élaboration d’une bibliothèque virtuelle pour médecins généralistes. Il fait face au challenge de concevoir un moteur de recherche qui fonctionne pour cette bibliothèque, il est assistant au département de médecine générale de l’ULB. MJ : Médecin généraliste en activité clinique à mi-temps. Investit dans différents domaines de médecine générale et en particulier dans le domaine des classifications. Membre de WONCA, et à ce titre, co-auteur de ICPC. Actuellement chargé d’un projet de recherche au ministère fédéral de la santé publique. Membre du groupe SEMINOP (Semantic interoperability). Membre du WICC

Transcript of Formation Ontologies Médicales (Form-Ol) Session...

Page 1: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

1

Formation Ontologies Médicales (Form-Ol)

Session I Réunion du 23 uin 2010

Rapport par MJ avec notes de MDJ/BVB/PDP et BF

Présents : BVB/RVDS/MJ/MDJ/BF/PDP/JR/SR

Présentation des participants :

BVB = Benny Van Bruwaene

RVDS =Robert Vander Stickelen

MJ = Marc Jamoulle

MDJ = Michel De Jonghe

BF=Benjamin Fauquert

PDP =Pierre De Plaen

JR =Joseph Roumier

SR = Sébastien Rousseau

CR = Cyril Romain

Présentation des participants

JR :

Ingénieur informaticien ontologiste. Fait partie de l’équipe de recherche du CETIC chargé de cette formation.

Equipe de recherche travaille à la création d’index de documents, web sémantique depuis le xml jusqu’au

RDF/OWL/moteur d’inférence qui permettent de tirer parti de corpus existant ou de vérifier la validité d’un corpus. CETIC

travaille sur le projet Ehealth for citizen (Région wallone), sur l’architecture d’intégration avec RSW (avec Didier Tymans et

André VandenBergh). Le CETIC participe aussi au projet européen PONTE, une plateforme sémantique pour assurer

l’interconnexion de base de données d’effets secondaires. Ainsi qu’un projet de ressources terminologiques multilingues en

maintenance industrielle multi-niveau (lay and professional). Ce qui permet à chacun de garder son vocabulaire. Il fait appel

à un système dénommé « terminological make up framework » pour décrire le domaine de la maintenance industrielle. Il y

a donc des méthodologies qui permettent de ne pas partir de zéro.

PDP :

Médecin généraliste et médecin de santé publique. A travaillé à l’Institut Pasteur à Bruxelles. A participé à l’élaboration des

directives européennes Environnement-Santé: soufre-fumée et oxydes d'azote (ozone). A une expérience du travail avec les

traducteurs. Il est actuellement membre de la FRATEM, asbl pilote du RSW (Réseau Santé wallon) . Il se consacre à

l'élaboration de l'architecture télématique hub-metahub développé au sein de la plate-forme eHealth et participe à la mise

en place (gestion) des interfaces «diagnostiques» et thérapeutiques du SUMEHR . Il participe indirectemment aux travaux

du G19. Pierre De Plaen est président de la Fédération des cercles de médecins généralistes du Brabant Wallon et actif

dans plusieurs organisations professionnelles de médecine générale.

BF :

Médecin généraliste en activité clinique à 2/3 temps. Participe au CEBAM (Centre Belge d’Evidence Base Medecine), et

notamment à l’élaboration d’une bibliothèque virtuelle pour médecins généralistes. Il fait face au challenge de concevoir un

moteur de recherche qui fonctionne pour cette bibliothèque, il est assistant au département de médecine générale de

l’ULB.

MJ :

Médecin généraliste en activité clinique à mi-temps. Investit dans différents domaines de médecine générale et en

particulier dans le domaine des classifications. Membre de WONCA, et à ce titre, co-auteur de ICPC. Actuellement chargé

d’un projet de recherche au ministère fédéral de la santé publique. Membre du groupe SEMINOP (Semantic

interoperability). Membre du WICC

Page 2: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

2

RVDS :

Médecin généraliste en activité. Professeur de pharmacologie au Hijmans Institute of Pharmacology, Gent. Responsable de

l’informatique au CBIP (voir cbip.be). Responsable de la préparation de la future « source authentique du médicament » à

l’intention des médecins belges. Editeur d’un vocabulaire d’abord trilingue, puis en 11 langues, destiné à l’écriture des

notices des médicaments sur deux niveaux. Il est aussi intéressé par la communication homme-machine en médecine et

particulièrement la triangulation généraliste/spécialiste/patient. Il supervise une thèse de doctorat à propos des MESH pour

les locuteurs néerlandophones. Il est organisateur de la traduction des MESH en néerlandais. Membre du groupe SEMINOP

(Semantic interoperability).

Cyril Romain :

Informaticien, spécialisé dans le domaine de l’open source et des bases de données sur internet. Contribue en tant

qu’informaticien à un programme de recherche du CBIP et à un programme de recherche du service publique fédéral de la

santé publique (REGM).

MDJ :

Médecin généraliste, travaille en équipe multi-disciplinaire. Investi dans le domaine des classifications en médecine

générale depuis une dizaine d’années, membre du WICC et co-auteur de la terminologie 3BT ( Bilingual Biclassified Belgian

Thesaurus).

BVB :

Médecin généraliste. A travaillé dans l’industrie pharmaceutique et s’est orienté depuis plusieurs années en informatique

médicale. Responsable du codage à l’hôpital universitaire de l’université flamande de Bruxelles (UZVUB). Membre du

groupe SEMINOP (Semantic interoperability).

Sébastien Rousseau :

Responsable de projet au CETIC. Spécialisé en Device Communication. Responsable pour le CETIC de la participation au

projet OLDES, plateforme de service pour les patients seniors dans le cadre de ehealth for citizens. Intéressé à se former

dans le domaine

Page 3: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

3

Joseph Roumier

Partie théorique sur base du powerpoint

Formation 1 : Ontologies fichier formation1-jamoulle-ontoterm-JR.odp

JR tente d’expliciter le but de la formation. Il s’agit d’arriver à une compréhension du concept d’ontologie et des différents outils qui gravitent autours de ce concept. Il précise qu’il s’agit d’un champ de recherche toujours en développement. Il s’agit d’un sujet en constante évolution et il est difficile dans ce domaine de rester dans le « non contestable » en ce sens que les débats sont très vifs, et la pensée en constante évolution. La formation porte donc sur comprendre l’ontologie, et pour y arriver il se base sur les éléments acquis de plusieurs domaines scientifiques convergents. En préalable à l formation JR a envoyé cette adresse http://hal.archives-ouvertes.fr/inria-00490312/fr/ en référence à l’article de Patrice Lopez et Laurent Romary ; GRISP: A Massive Multilingual Terminological Database for Scientific and Technical Domains

Note MJ ; pour la relation entre ontologie philosophique et ontologie dans le domaine des sciences informatiques voir http://www.formalontology.it/

Structure de la formation I. Introduction et exemples II. Bases pour les ontologies III. Que fait-on avec les ontologies ? IV. Quelles techniques pour les ontologies ? V. Quels logiciels pour les ontologies ?

I. Introduction et exemples

DIA 5 Notion d’ambigüité Facilement gérable par un cerveau humain. Difficile à gérer pour une machine. Les ontologies permettent de définir un domaine de connaissance et de sortir de l’ambiguïté. Exemple du terme français « portable » qui a plusieurs acceptions. On dit qu’il représente plusieurs concepts. L’ontologie doit permettre de gérer différentes compréhensions de l’objet.

1 Emanuel Dion. Invitation à la théorie de l’information. Points, Seuil, 1997

Page 4: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

4

DIA 6 à 14 Exemple du vélo, de ses composants et de la vision qu’on peut en avoir selon plusieurs points de vue. On part du principe qu’il y a une existence unique via l’exploitation des informations. Nécessité de travailler au niveau du concept dans une acception à préciser. En langue française JR signale l’intérêt de grandictionnaire.com2 (Figure 1) qui donne la traduction de termes en fonction de leur appartenance à un domaine.

Figure 1 grandictionnaire.com ; deux acceptions du terme ontologie

DIA 15 Notion d’Inférence3 : Opération qui permet de produire de nouvelles propositions à partir d'autres propositions tenues pour acquises. « Concept d’inférence », en anglais « inference ». On utilise aussi le terme « raisonneur » en français et « reasoner » en anglais4. Un raisonneur est un outil informatique qui s‘assure de la cohérence des règles et qui va être capable de produire de nouvelles règles. L’inférence est une opération qui permet de produire de nouvelles propositions à partir d’autres propositions tenues pour acquises. Il s’agit d’inférence logique et non pas d’inférence statistique.

2 http://grandictionnaire.com/btml/fra/r_motclef/index800_1.asp

3 Wikipedia : L'inférence est une opération mentale, ou jugement, qui consiste à tirer une conclusion (d'une

série de propositions reconnues pour vraies). Ces conclusions sont tirées à partir de règles de base. 4 Wikipedia ; A semantic reasoner, reasoning engine, rules engine, or simply a reasoner, is a piece of software

able to infer logical consequences from a set of asserted facts or axioms

Page 5: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

5

DIA 17 Les ontologies sont construites sur des bases logiques adaptées à l'utilisation des moteurs d'inférence DIA 18 à 21 Arrangement des connaissances dans un système documentaire. Ex des pièces de voiture Utilisation des ontologies pour la recherche des informations. Relation : Sorte_de / partie_de. Par exemple la poignée par rapport à la porte. La poignée est une partie de la porte …. transitif …. qui se transmet …. par choix décisionnel. On parle ici de partonomie. Le cadre formel des ontologies est conçu pour permettre

d'éviter les problèmes d'ambiguïté,

faciliter la représentation des connaissances concurrentes d'un même objet,

raisonner sur les connaissances et

aider à la recherche d'information.

<

Question de Benjamin Fauquert : qu’apporte une ontologie par rapport à un système de classification ? Réponse de JR : l’ontologie à une fondation logique connue, elle permet des requêtes avec l’expression de résultats. Elle comprend des outils de représentation du domaine. Nous sommes ici pour mieux interfacer connaissance et classification au moyen d’ontologies.

II. Bases pour les ontologies

DIA 27 Définition d’ontologie.

Ajout MJ

Instance : Les instances sont les réalisations des concepts, et « héritent » de ses attributs

Page 6: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

6

http://de.wikipedia.org/wiki/Meta_Object_Facility

Page 7: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

7

Meta-models are closely related to ontologies. Both are often used to describe and analyze the relations between

concepts[4]

Ontologies : express something meaningful within a specified universe or domain of discourse by utilizing a

grammar for using vocabulary. The grammar specifies what it means to be a well-formed statement, assertion,

query, etc. (formal constraints) on how terms in the ontology’s controlled vocabulary can be used together.

[Metamodel-b]

Meta-modeling : can be considered as an explicit description (constructs and rules) of how a domain-specific

model is built. In particular, this comprises a formalized specification of the domain-specific notations. Typically,

metamodels are – and always should follow - a strict rule set. [Metamodel-a]. “A valid metamodel is an ontology, but

not all ontology are modeled explicitly as metamodels” [Metamodel-b].

DIA 31 à 38

Exemple de modélisation dans Protégé. Chaque participant a téléchargé Protégé 3.4.4 et peut faire les exercices proposés. Les participants ont reçu aussi des fichiers .pprj, .pins, .pont pour exercices

Figure 2 listes des fichiers reçus

Note de mj : Perso j’ai essayé de reprendre Protégé et de comprendre de

quoi il s’agit vraiment par ex en ajoutant des marques de voitures au

bon endroit mais je n’y arrive pas. Il y a une logique la dedans dont je ne

saisis pas la séquence. En particulier je ne comprends pas la

distribution des 31 « standard-class » dans la fig suivante. Ces

« standard-class » sont listées les unes en dessous des autres et je ne

vois pas comment on peut accepter ces items comme ‘classes » et

comment on établit des relations entre elles.

Page 8: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

8

lless

Page 9: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

9

III. Que fait-on avec les ontologies ?5

Avec notes de MDJ

Catégories d'ontologies

Méta-ontologies (ex : SUMO de Sowa)6 (Suggested Upper Merged Ontology)

More fundamental than the categories themselves are the

criteria for distinguishing categories and determining whether

a particular entity belongs to one or another (John Florian

Sowa, Computer Scientist)7

Il s’agit d’une ontologie d’outils ontologiques qui correspond à la norme IEEE 1600.18 Objectif : définir proprement les concepts et les relations de haut niveau pour l'interopérabilité, l'indexation, la recherche d'information et le traitement automatique des langues... Premiers concepts : Physique ou Abstrait / Indépendant, Relatif ou Médiateur / Continu ou Occurent On peut mieux comprendre SUMO en téléchargeant le power point de Adam Pease : http://ontolog.cim3.net/file/resource/presentation/AdamPease_20070906/Suggested-Upper-Merged-Ontolog_SUMO--AdamPease-20070906.ppt L’url http://ontology.teknowledge.com/ et hors service. Le site http://www.teknowledge.com/ n’est pas vraiment informatif

Enterprise Ontology9 ou Ontologies de domaine Objectif : rassembler et ordonner tous les concepts utiles pour les entreprises et le commerce

Ontologies applicatives (ex: définir des concepts partagés pour la communication entre agents) par ex le Projet ITEA- PROTEUS show the potential of knowledge management methodology used to build conceptual models of domains as a means for integration of UML representations of distributed systems10. http://www.proteus-iteaproject.com n’est pas fonctionnel

Autres exemples MENELAS ; http://www-new.biomath.jussieu.fr/Menelas/ The Open Biological and Biomedical Ontologies www.obofoundry.org/ SNOMED-CT de IHTSDO http://www.ihtsdo.org/ MESH : http://www.ncbi.nlm.nih.gov/mesh

note de BVB : http://www.collibra.com/

note de BVD : http://www.microsoft.com/presspass/press/2009/mar09/03-11MSCreativeCommonsPR.mspx dans lequel on trouve une autre definition, assez

5 Voir aussi http://en.wikipedia.org/wiki/Ontology_(information_science)

6 SUMO ; http://www.ontologyportal.org/

7 http://www.formalontology.it/ontologists-living-6.htm#sowa

8 SUO ; http://en.wikipedia.org/wiki/Standard_upper_ontology

9 Enterprise ontology http://www.aiai.ed.ac.uk/project/enterprise/enterprise/ontology.html Intéressant de

lire ce papier pour bien comprendre ; http://www.tdan.com/view-articles/5016 10

Montroig, roomier et all. Building Conceptual Models by Knowledge Management Methodology http://hal.inria.fr/inria-00100185/fr/

Page 10: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

10

restrictive du concept Ontology ;

IV. Quelles techniques pour les ontologies ?

Préliminaire : à la base de la représentation des connaissances

DIA 47 à 57: Quelle technique : exclure les boucles DIA 48 : Système symbolique = triplet. Symbole: u p e. Axiomes: x p u e u x Théorème p=+ et e== → Sémantique donne le sens Pour tout x tel que x est un CRA alors x est un CRA. Pour aller plus loin en logique descriptive j’ai trouvé ceci ; http://www.inf.unibz.it/~franconi/dl/course/ et en particulier le papier D. Nardi, R. J. Brachman. An Introduction to Description Logics ou Tbox et Abox sont expliqués.

The ABox

The ABox contains extensional knowledge about the domain of interest, that is,

assertions about individuals, usually called membership assertions. For example,

Female П Person(ANNA)

The TBox

One key element of a DL knowledge base is given by the operations used to build

the terminology. Such operations are directly related to the forms and the meaning

of the declarations allowed in the TBox.

The basic form of declaration in a TBox is a concept definition, that is, the

definition of a new concept in terms of other previously defined concepts. For

example, a woman can be defined as a female person by writing this declaration:

Woman ≡ Person П Female

DIA 57 : analyse de phénomène nouveaux.

1) Rechercher des configurations connues 2) Rechercher celles qui se rapprochent le plus du nouveau phénomène 3) Adapter

DIA 59 : Concept = Class et Rôle = Slot. Concept universel (thing dans Protéger). Notion de T-Box : C’est une distribution du concept et des rôles. On dit : toute instance de thing appartient à bottom.

Page 11: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

11

Aucune instance n’appartient à bottom. Par rapport à T-BOX il y a A-Box. Individu/Instance, l’ensemble des individus ou instance (une pomme est une instance de fruit tandis que le pépin est une partie de la pomme). Graphique avec le sous ensemble du cancer du sein dans l’ensemble des cancers. DIA 59 Rien écrit. Remarque de BVDB : Exemple de hart infarct. Hart → Aorto→ICDDIS

V. Quels logiciels pour les ontologies ?

DIA 61 ; On note que l’url fourni pour Proteus Itea est en japonais !

Annexe : petite étude du terme ontology sur visualthesaurus.com

Figure 3 Ontology sur visualthesaurus.com

Sur le site visualthesaurus.com11 de la société Thinkmap, on voit clairement (Figure 3) les deux acceptions du terme ontology. D’une part la métaphysique et d’autre part comme branche de la science d’organisation ou d’« arrangement » des systèmes. On notera au passage la définition de ontology en science informatique présentée comme une organisation exhaustive et rigoureuse de certains domaines de la connaissance, généralement hiérarchique et comprenant les entités concernées et leurs relations.

11

http://www.visualthesaurus.com/ Le site donne droit à trois interrogations gratuites. On peut s’abonner pour une somme modique annuelle

Page 12: Formation Ontologies Médicales (Form-Ol) Session Idocpatient.net/onto/doc/rapport_formation_102306.pdfMJ/ form_ol_1_20100623.doc 3 Joseph Roumier Partie théorique sur base du powerpoint

MJ/ form_ol_1_20100623.doc

12

Figure 4 Place de ontology dans arrangement et organisation sur visualthesaurus.com

Il est aussi intéressant de rendre compte que le domaine « ontology » est rangé par l’outil ontologique qu’est justement le visualthesaurus dans les systèmes en anglais d’ «arrangement » ou d’ «organisation » eux-mêmes positionnés comme élément d’une structure en tant que composition complexe de connaissance isolée ou en combinaison (Figure 4).

Notons que si on va voir sur grandictionnaire.com les traductions du terme anglais arrangement, on remarque qu’il est utilisé dans une série impressionnante d’acceptions qui vont d’arrangement français, à squelette, disposition, plan, ordre ou classement.