Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos
-
Upload
elvis-fusco -
Category
Presentations & Public Speaking
-
view
1.642 -
download
2
Transcript of Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos
![Page 1: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/1.jpg)
PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA
INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS
CIENTÍFICOSCaio Saraiva Coneglian
Prof. Dr. Elvis Fusco
![Page 2: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/2.jpg)
Contextualização
Sistemas de Informação de Recuperação atuais são incapazes de recuperar informações de uma forma adequada no contexto de ambientes informacionais digitais tendo a Web como plataforma (Big Data).
Os ambientes computacionais de informação atendem plenamente as necessidades informacionais dos usuários?
![Page 3: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/3.jpg)
Objetivo
Criar um agente de busca semântica na WEB que permita: Localização; Tratamento e Recuperação da Informação.
Domínio da busca por documentos bibliográficos de pesquisas, de modo a proporcionar a intersecção entre os metadados de publicações científicas e as necessidades informacionais dos usuários, proposto por Fusco (2010).
![Page 4: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/4.jpg)
Metodologia
Levantamento de requisitos informacionais para acesso às pesquisas científicas;
Definição da metodologia de construção de ontologias;
Modelagem da ontologia de aplicação; Implementação do protótipo do agente
semântico de recuperação de informações baseado em conceitos semânticos;
Análise dos resultados de recuperação do protótipo (prova de conceito).
![Page 5: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/5.jpg)
Plataforma
Figura 1: Arquitetura de Contextualização do Agente Semântico de Extração
![Page 6: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/6.jpg)
Modelo de Extração
Figura 2: Modelo de extração do agente semântico
![Page 7: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/7.jpg)
Ontologia
Segundo Clark (1999), uma ontologia é organizada em hierarquias de conceitos;
E utilizando a classificação de Gomes-Perez (1999), a ontologia do projeto é uma Ontologia de Aplicação, que busca solucionar um problema específico de um domínio.
![Page 8: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/8.jpg)
Implementação Ontologia
Para realizar a implementação da ontologia, foi seguido o modelo proposto por Noy (2001), em que são realizados 7 passos na construção de ontologias;
Como domínio para a construção desta ontologia, foi utilizada busca de publicações científicas na base de dados IEEE;
Foi utilizado o programa Protégé para realizar a implementação da ontologia.
![Page 9: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/9.jpg)
Implementação Ontologia
Figura 3: Diagrama da Ontologia
![Page 10: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/10.jpg)
Implementação do Agente
O robô de busca extrai os metadados de artigos da página do IEEE Xplore (http://ieeexplore.ieee.org).
Após a extração, é realizada a análise dos metadados baseados nos conceitos descritos na ontologia.
![Page 11: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/11.jpg)
Lógica de Extração
Figura 4: Lógica de Extração do Robô de Busca
![Page 12: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/12.jpg)
Testes Para a realização dos testes, foram
realizadas buscas de publicações na área de banco de dados. Por exemplo: publicações sobre datawarehouse;
Neste exemplo, o SRI do IEEE recupera 25 artigos, porém apenas 7 são retornados pela busca semântica, pois são os de fato aderentes à necessidade informacional do usuário.
Figura 5: Relações da classe do termo pesquisado
![Page 13: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/13.jpg)
Testes
Figura 6: Resultado de uma busca, pesquisando o termo “Datawarehouse”
![Page 14: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/14.jpg)
Resultados
O uso de ontologias permite estender o processo de Recuperação da Informação com a utilização de conceitos semânticos;
Os resultados obtidos por este agente proporcionam uma maior intersecção entre os documentos e as necessidades informacionais dos usuários;
Demonstrou-se uma alternativa prática de implementação da Web Semântica no processo de Recuperação da Informação.
![Page 15: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/15.jpg)
Referências Bibliográficas
Clark, D. Mad cows, metathesaurim and meaning, IEEE Intelligent Systems. 1999.
Fusco, E. Modelos conceituais de dados como parte do processo da catalogação: perspectiva de uso dos FRBR no desenvolvimento de catálogos bibliográficos digitais. 2012.
Gómez-Pérez, A. Ontological engineering A state of the art. Expert Update: Knowledge Based Systems and Applied Artificial Intelligence 2.3. 33-43. 1999.
Noy, N. F. et al. Creating Semantic Web Contents with Protégé-2000. IEEE. 2001.
![Page 16: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos](https://reader035.fdocument.pub/reader035/viewer/2022062304/55c4aadcbb61ebc2488b46d3/html5/thumbnails/16.jpg)
PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA
INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS
CIENTÍFICOSCaio Saraiva Coneglian
Prof. Dr. Elvis Fusco