Post on 07-Aug-2015
PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA
INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS
CIENTÍFICOSCaio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br
Contextualização
Sistemas de Informação de Recuperação atuais são incapazes de recuperar informações de uma forma adequada no contexto de ambientes informacionais digitais tendo a Web como plataforma (Big Data).
Os ambientes computacionais de informação atendem plenamente as necessidades informacionais dos usuários?
Objetivo
Criar um agente de busca semântica na WEB que permita: Localização; Tratamento e Recuperação da Informação.
Domínio da busca por documentos bibliográficos de pesquisas, de modo a proporcionar a intersecção entre os metadados de publicações científicas e as necessidades informacionais dos usuários, proposto por Fusco (2010).
Metodologia
Levantamento de requisitos informacionais para acesso às pesquisas científicas;
Definição da metodologia de construção de ontologias;
Modelagem da ontologia de aplicação; Implementação do protótipo do agente
semântico de recuperação de informações baseado em conceitos semânticos;
Análise dos resultados de recuperação do protótipo (prova de conceito).
Plataforma
Figura 1: Arquitetura de Contextualização do Agente Semântico de Extração
Modelo de Extração
Figura 2: Modelo de extração do agente semântico
Ontologia
Segundo Clark (1999), uma ontologia é organizada em hierarquias de conceitos;
E utilizando a classificação de Gomes-Perez (1999), a ontologia do projeto é uma Ontologia de Aplicação, que busca solucionar um problema específico de um domínio.
Implementação Ontologia
Para realizar a implementação da ontologia, foi seguido o modelo proposto por Noy (2001), em que são realizados 7 passos na construção de ontologias;
Como domínio para a construção desta ontologia, foi utilizada busca de publicações científicas na base de dados IEEE;
Foi utilizado o programa Protégé para realizar a implementação da ontologia.
Implementação Ontologia
Figura 3: Diagrama da Ontologia
Implementação do Agente
O robô de busca extrai os metadados de artigos da página do IEEE Xplore (http://ieeexplore.ieee.org).
Após a extração, é realizada a análise dos metadados baseados nos conceitos descritos na ontologia.
Lógica de Extração
Figura 4: Lógica de Extração do Robô de Busca
Testes Para a realização dos testes, foram
realizadas buscas de publicações na área de banco de dados. Por exemplo: publicações sobre datawarehouse;
Neste exemplo, o SRI do IEEE recupera 25 artigos, porém apenas 7 são retornados pela busca semântica, pois são os de fato aderentes à necessidade informacional do usuário.
Figura 5: Relações da classe do termo pesquisado
Testes
Figura 6: Resultado de uma busca, pesquisando o termo “Datawarehouse”
Resultados
O uso de ontologias permite estender o processo de Recuperação da Informação com a utilização de conceitos semânticos;
Os resultados obtidos por este agente proporcionam uma maior intersecção entre os documentos e as necessidades informacionais dos usuários;
Demonstrou-se uma alternativa prática de implementação da Web Semântica no processo de Recuperação da Informação.
Referências Bibliográficas
Clark, D. Mad cows, metathesaurim and meaning, IEEE Intelligent Systems. 1999.
Fusco, E. Modelos conceituais de dados como parte do processo da catalogação: perspectiva de uso dos FRBR no desenvolvimento de catálogos bibliográficos digitais. 2012.
Gómez-Pérez, A. Ontological engineering A state of the art. Expert Update: Knowledge Based Systems and Applied Artificial Intelligence 2.3. 33-43. 1999.
Noy, N. F. et al. Creating Semantic Web Contents with Protégé-2000. IEEE. 2001.
PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA
INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS
CIENTÍFICOSCaio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br