Presentation about Ontologies at my Masters (UFMG, pt_BR)

53
ONTOLOGIAS: uma reflexão sobre sistemas de organização do conhecimento e sistemas de recuperação de informação Amanda Damasceno de Souza Claudiney Vander Ramos Fernanda Farinelli Jose Alberto Grossi Junior Lucélia Branquinho Rogério Amaral Bonatti

description

ONTOLOGIAS: uma reflexão sobre sistemas de organização do conhecimento e sistemas de recuperação de informação

Transcript of Presentation about Ontologies at my Masters (UFMG, pt_BR)

Page 1: Presentation about Ontologies at my Masters (UFMG, pt_BR)

ONTOLOGIAS: uma reflexão sobre sistemas de organização do conhecimento e sistemas de recuperação de informação

Amanda Damasceno de Souza Claudiney Vander Ramos Fernanda Farinelli Jose Alberto Grossi Junior Lucélia Branquinho Rogério Amaral Bonatti

Page 2: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Sumário 1.  Introdução 2.  Representação do conhecimento

•  Sistemas de Organização do Conhecimento •  Sistemas de Recuperação de Informação •  Ontologias

3.  Modelos conceituais como sistemas de organização do conhecimento

4.  Ontologias biomédicas 5.  Ontologias para sistemas de informação 6.  Ontologias para recuperação de informação 7.  Ontologias e mineração de dados 8.  Ontologias e grafos

Page 3: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Introdução •  Heterogeneidade dos dados e informações.

o  Desafio: recuperação, acesso, representação, organização, apresentação e manutenção de informações.

•  Estudos na CI voltados para a organização, representação e recuperação da informação e do conhecimento. o  Sistemas de Recuperação da Informação (SRI). o  Sistemas de Organização de Conhecimento (KOS). o  Ontologias.

Page 4: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Representação do Conhecimento

Page 5: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Representação do Conhecimento •  Reprodução da percepção do tema abordado

em um documento, independentemente do suporte e da forma como o conhecimento tenha sido registrado. (Pinto, 2003 apud Almeida, 2006).

•  Para representar o conhecimento é necessário que os termos e conceitos em concordância com comunidade ou grupo de sujeitos. (Almeida, 2005; Alvarenga, 2003)

•  A principal função da representação é criar uma estrutura eficiente para a recuperação da informação.

Page 6: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Knowledge organization Systems (KOS)

Sistemas de Organização de

Conhecimento

Page 7: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Knowledge organization Systems (KOS) •  Organização do conhecimento •  “[...] visa à construção de modelos de mundo que se

constituem em abstrações da realidade” •  “[...] é fruto de um processo de análise de domínio e

procura refletir uma visão consensual sobre a realidade que se pretende representar”. HUSSERL (1996)

•  KOS são todos os tipos de esquemas para organizar a informação e promover a gestão do conhecimento. Souza, Tudhope e Almeida (2010)

Page 8: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Knowledge organization Systems (KOS) Souza, Tudhope e Almeida (2010)

Page 9: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Sistemas de Recuperação de Informação (SRI)

Page 10: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Sistemas de Recuperação de Informação (SRI) •  SRI consistem basicamente em determinar

quais documentos de uma coleção possui maior relevância dentro de um conjunto de palavras-chaves que o usuário deseja. (BAEZA-YATES, 1999).

•  Em um SRI o usuário expressa sua necessidade de informação por meio de uma expressão de busca, composta geralmente por um conjunto de termos que a representa linguisticamente.

Page 11: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Sistemas de Recuperação de Informação (SRI) •  Um SRI é um ambiente linguístico cuja

eficiência depende de um controle adequado da linguagem de representação dos itens de informação e das requisições de seus usuários.

•  Insere-se assim como um agente mediador na comunicação entre um estoque de informação e os seus potenciais requisitantes.

•  Em um SRI, o nível e a precisão das representações dos itens de informação e das necessidades de informação dos usuários afetam diretamente no desempenho do sistema.

Page 12: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias

Page 13: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia •  Do grego onto (ser) + logia (estudo). •  Filosofia (Aristóteles) à àquilo que existe,

entender o mundo (entidades e relações). •  CC à engenharia de software, modelagem de

SI para representação do conhecimento. (GRUBER, 1993).

•  CI à representação formal de um domínio do conhecimento. (VICKERY, 1997; SOERGEL, 1997; ALMEIDA E BAX, 2003).

Page 14: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia �  Guarino (1998) propõe que as ontologias em geral

podem ser classificadas em ontologias genéricas, ontologias de domínio, ontologias de tarefa e ontologias de aplicação. ◦  Genéricas: conceitos gerais. ◦  Domínio: domínios genéricos a fim de se evitar

contradições entre dois conceitos. ◦  Tarefa: funcionalidade de um domínio. ◦  Aplicação: conceitos dependentes do domínio e da tarefa.

Page 15: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Exemplos de Ontologias

• Ontologia do mundo real

Page 16: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia

• Exemplos de ontologias: o  Basic Formal Ontology (BFO); o  Descriptive Ontology for Linguisitics and

Cognitive Engineering (DOLCE); o  General Formal Ontology (GFO); o  Unified Foundational Ontology (UFO).

Page 17: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Modelos Conceituais como Sistemas de Organização do

Conhecimento

Page 18: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Modelo Conceitual •  CI à organização da informação e do

conhecimento. (OLIVEIRA, 2009) •  CC à no desenvolvimento de SI, é o

modelo voltado para entendimento humano, representa uma tradução da estrutura do domínio de conhecimento. (ALMEIDA et. al., 2009; ALMEIDA, 2006).

Page 19: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Modelo Conceitual expresso por Ontologias Formais •  Representam conceitos de um domínio de

maneira não ambígua e consistente. (OLIVEIRA, 2009).

• Autores que defendem a representação de domínios de conhecimento por meio de uma ontologia formal: GUARINO (1998, 1998A, 1994, 1997); GRUBER (1993);

Page 20: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Modelo Conceitual expresso por Ontologias Formais

•  Integrar dois diferentes vocabulários, V1 e V2, associados a dois Sis diferentes.

•  Estabelecer relações semânticas entre os termos de V1 e os termos de V2.

•  O significado de cada termo de V1 e de V2 expresso em uma linguagem que seja mais expressiva que os próprios V1 e V2.

Page 21: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Modelos conceituais como KOS •  Ontologias são um tipo KOS que possibilita

representação do conhecimento. (SOERGEL, 1997).

•  Ontologias podem ter várias funções na construção do modelo conceitual, seja para representar o conhecimento da organização ou para descrição ou conceituação de um domínio. (GUARINO, 1998; GRUBER, 1993); SOWA, 1999; OLIVEIRA, 2009).

Page 22: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Modelo Conceitual - Ontologia UFO

Page 23: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias Biomédicas

Page 24: Presentation about Ontologies at my Masters (UFMG, pt_BR)

A informação é um elemento-chave para os profissionais de saúde

Experiência pessoal Literatura científica

Queixas

Exame físico Resultados anteriores

• O volume de informações médicas publicadas na Internet está duplicando a cada 6 meses. • Após o médico se formar, cerca de 50% das informações obtidas está obsoleta . • Crescente número de fontes de dados e conhecimentos biomédicos. • SI permitem aumento das trocas de ideias entre campos científicos e a possibilidade de buscas mais exaustivas.

Page 25: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias Biomédicas: importância •  Organizar dado e conhecimento biomédico, para realizar a

integração das informações e interoperabilidade entre sistemas médicos.

•  Pode ser utilizada para representar informações clinicas de forma consistentes e confiáveis nos registros eletrônicos de saúde – Prontuário Eletrônico do Paciente (PEP) por fornecer um núcleo terminológico consistente para este.

Manter sistemas de referência semântica, muitas vezes caracterizados como

vocabulários, tesauros, terminologias, e ontologias

Page 26: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Exemplos de Ontologias Biomédicas � Algumas contribuições examinas pelos autores:

1.  Classificação Internacional de Doenças – CID 2.  Medical Subject Headings – MeSH 3.  Gene Ontology – GO 4.  Systematized Nomenclature of Medicine - Clinical Terms

- SNOMED CT 5.  Generalized Architecture for Languages, Encyclopaedias

and Nomenclatures - openGALEN, 6.  Foundational Model of Anatomy – FMA 7.  Unified Medical Language System – UMLS 8.  Open Biomedical Ontologies (OBO) Foundry 9.  Blood Ontology – Ontologia do sangue – UFMG 10. NCI- Thesaurus - terminologias sobre câncer

Page 27: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia e Mineração de Dados

Page 28: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia e Mineração de Dados •  KDD (Descoberta de conhecimento em

banco de dados) o  Pré-processamento, Mineração de Dados e

Pós-processamento.

• Mineração de dados o  Análise de dados o  Técnicas/Algoritmos para revelar padrões

ocultos

Page 29: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia e Mineração de Dados • Ontologias para a Mineração de

Dados incorporar conhecimento ao processo com a adição de Ontologias.

• Mineração de Dados para as Ontologias adicionar conhecimento de domínio a informação de entrada ou até mesmo usar essas Ontologias para representar os resultados.

Page 30: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia e Mineração de Dados

Page 31: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia e Mineração de Dados

Page 32: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias e Sistemas de Informação

Page 33: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Sistemas de Informação •  Laudon e Laudon (2007) explicam que

sistemas de informação contribuem para a solução de vários problemas empresariais, independentemente do seu tipo ou do seu uso. o  Operacional, Conhecimento, Gerencial,

Estratégico

Page 34: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Sistemas de Informação •  Segundo Sommerville (2007), a dinâmica recente

do desenvolvimento de software, fez com que paradigmas fossem quebrados e que surgissem novas abordagens: o  Desenvolvimento rápido de software: Métodos ágeis,

Extreme Programming, o  Desenvolvimento rápido de aplicações; o  Reuso: Utilização de design patterns, Framework de

aplicações; o  Engenharia de software baseada em componentes; o  Desenvolvimento de sistemas críticos; o  Evolução de software.

Page 35: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Sistemas de Informação

Figura: Etapas de Desenvolvimento de Software - Fonte: www.macoratti.net

Etapas de Desenvolvimento de

Software

Page 36: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias e SI •  Em Ciência da Computação e Ciência da

Informação, ontologias são artefatos tecnológicos usados em sistemas de informação.

•  Elas consistem de um vocabulário especifico para descrever uma parte da realidade.

• Ontologias são usadas para validar modelos e esquemas conceituais.

Page 37: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias e SI

Page 38: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias e Grafos

Page 39: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Triplas •  Representações de relações •  Linguagem natural •  Composta por 3 elementos

SUJEITO PREDICADO OBJETO

Page 40: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Exemplo de Triplas •  "Homem bebe champagne" •  "Champagne é um tipo de bebida" •  "Champagne agrega valor” (status)

Page 41: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Grafos •  Estrutura de dados •  Representação gráfica de triplas •  Relação entre objetos •  Vértices (objetos) e arestas (predicado)

SUJEITO OBJETO PREDICADO

Page 42: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Exemplo de Grafo

amigo_de

Sim, esta é a Lídia!

#Casal

#Lídia

#Mônica

Page 43: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologia •  RDFs / OWL (XML+) •  Relações entre classes/objetos (triplas) •  Reuso de conceitos (namespaces)

o  Disciplina (Objeto) §  ufmg:disciplina §  ufrj:disciplina §  #disciplina

<owl:Class rdf:about="#Matematica"> <rdfs:label xml:lang=”br">Matemática</rdfs:label> <rdfs:subClassOf> <owl:Class rdf:about="#Disciplina"/> </rdfs:subClassOf>

</owl:Class>

Page 44: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Ontologias e RI

Page 45: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Recuperação da Informação •  RI: aplicação de tecnologia computacional à aquisição,

organização, armazenamento, recuperação e distribuição de informação.

•  SARACEVIC(1999): “a RI pode ser considerada a vertente tecnológica da CI, e é resultado da relação desta com a Ciência da Computação”.

•  Recuperar informação consiste em identificar, em um acervo documental, quais os documentos que satisfazem total ou parcialmente a uma determinada necessidade de informação do usuário.

Page 46: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Recuperação da Informação •  Dificuldade:

o  Saber quando um documento é relevante ou não para a necessidade do usuário

•  Esse conceito é essencial em RI pois o seu objetivo primordial consiste em: o  Recuperar todos os documentos relevantes

(revocação) o  Recuperar a menor quantidade possível de

documentos não relevantes (precisão)

Page 47: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Recuperação da Informação •  Expressão de busca: usuário expressa sua

necessidade de informação. o  Função de busca: compara as representações

dos documentos com a representação da expressão de busca.

o  Centro do processo de recuperação §  Ranking dos documentos relevantes

Page 48: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Recuperação da Informação •  Ontologias na recuperação da informação:

o  Melhorar a precisão e a revocação em sistemas de RI textual.

o  Incorporar conceitos do domínio no processo de busca.

o  Duas direções principais: §  Expansão de consultas através de termos

relacionados §  Uso de medidas de distância conceitual

Page 49: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Recuperação da Informação •  Grande volumes de dados (especialmente na

Web) •  Busca/recuperação baseada em texto (full-

text-search) - limitações: o  Vagueza/indeterminação da linguagem natural o  Conceitos de alto nível (não podem ser

recuperados) o  Relações semânticas (não podem ser

exploradas) o  Dimensão temporal (não pode ser tratada)

Page 50: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Documentos

Necessidade do Usuário

PROCESSO DE

INDEXAÇÃO

PROCESSO DE ESPECIFICAÇÂO DE CONSULTA

Índices

Uma representação dos documentos

Consultas

PROCESSO DE RECUPERAÇÃO

Lista de documentos recuperados

PERDA DE INFORMAÇÃO

Fonte: Cardoso(2007)

Page 51: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Recuperação da Informação •  Uso de ontologias em RI: (Ferneda, 2013)

o  Indexação automática baseada em ontologias (índice acrescido de termos)

o  Expansão de consulta baseada em ontologias (modificação da consulta)

o  SRI semânticos (documentos previamente anotados)

o  Interfaces de busca (definir termos de busca)

Page 52: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Considerações Finais �  Falta de consenso sobre a definição do que é

ontologia. � Dificuldade de consenso sobre os conceitos,

entidades e relações que as ontologias se propõe a representar de um domínio.

�  Falta de consenso sobre a metodologia ideal de desenvolvimento de ontologias.

� A escolha da ontologia de referência apropriada.

� Dificuldade de reuso de ontologias. �  Trabalho interdisciplinar que exige diferentes

tipos de profissionais.

Page 53: Presentation about Ontologies at my Masters (UFMG, pt_BR)

Obrigado!

Perguntas?