Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.
Transcript of Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.
![Page 1: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/1.jpg)
Especificação de Consultas
Eveline Alonso VelosoPUC-MINAS
![Page 2: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/2.jpg)
Referências
BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 4.
![Page 3: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/3.jpg)
Introdução Consulta:
formulação da necessidade de informação do usuário de um sistema de recuperação de informação.
Dependendo da experiência do usuário; e da clareza de sua necessidade de
informação; uma determinada forma de especificar
sua consulta é selecionada.
![Page 4: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/4.jpg)
Formas de Especificar uma Consulta Principais formas de especificar
consultas que geralmente aparecem em sistemas de recuperação de informação textual: consultas baseadas em palavras-chave:
consultas com uma única palavra-chave; consultas em um contexto:
frase exata; proximidade;
consultas booleanas; casamento de padrão; consultas estruturadas.
![Page 5: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/5.jpg)
Consultas baseadas em Palavras-chave Para os modelos de recuperação
de informação clássicos; é o principal tipo de consulta.
Uma consulta é formada por palavras-chave e algumas restrições opcionais; os documentos que possuem as
palavras-chave especificadas e atendem as restrições estabelecidas são recuperados.
![Page 6: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/6.jpg)
Consultas baseadas em Palavras-chave
Populares; intuitivas; fáceis de especificar; em geral, processadas
rapidamente.
![Page 7: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/7.jpg)
Consultas com uma Única Palavra-chave
Consulta mais elementar. Consulta é formada por uma
palavra-chave; e os documentos que possuem
a palavra-chave especificada são recuperados.
![Page 8: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/8.jpg)
Consultas com uma Única Palavra-chave
![Page 9: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/9.jpg)
Consultas em um Contexto Palavras-chave especificadas;
são pesquisadas em um dado contexto;
ou seja, próximas umas às outras.
Dois tipos de consultas em um contexto: frase exata; proximidade.
![Page 10: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/10.jpg)
Frase Exata
Sequência de palavras-chave.
Procura-se pela ocorrência da frase nos documentos indexados.
![Page 11: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/11.jpg)
Frase Exata
![Page 12: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/12.jpg)
Proximidade Versão mais “relaxada” da busca
por frase exata. Sequência de palavras-chave;
em geral, juntamente com a distância máxima permitida entre elas.
As palavras podem aparecer nos documentos recuperados; em uma ordem diferente daquela
em que foram especificadas na consulta.
![Page 13: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/13.jpg)
![Page 14: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/14.jpg)
Proximidade
![Page 15: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/15.jpg)
Consultas Booleanas Forma mais antiga de especificar
consultas; combinando palavras-chave.
Consultas são especificadas como expressões booleanas; que possuem semântica precisa.
São compostas de: palavras-chave; operadores booleanos:
AND, OR, NOT. Exemplo:
recuperação AND informação
![Page 16: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/16.jpg)
Operadores Booleanos AND (e) e OR (ou);
são conectores binários; possuem a mesma precedência.
NOT (não); conector unário; possui precedência sobre os
demais operadores booleanos.
![Page 17: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/17.jpg)
![Page 18: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/18.jpg)
Casamento de Padrão Um padrão é um conjunto de
características sintáticas que devem ocorrer em um segmento de texto.
Dizemos que os segmentos de texto que satisfazem às especificações do padrão; casam com o padrão indicado.
![Page 19: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/19.jpg)
Casamento de Padrão Consultas mais complexas;
auxiliam a busca por palavras-chave;
complementando-a com recursos mais poderosos de recuperação de dados.
Quanto mais poderoso for o conjunto de padrões, mais complexa é a implementação
do sistema de recuperação de informação.
![Page 20: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/20.jpg)
Tipos de Padrões
Prefixo; Sufixo; Substring; Permitindo erros; Expressão regular.
![Page 21: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/21.jpg)
Prefixo
Padrão que deve ocorrer no início de uma palavra.
Exemplo: Padrão:
info; casa com:
informação; informática; etc.
![Page 22: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/22.jpg)
Sufixo
Padrão que deve ocorrer no final de uma palavra.
Exemplo: Padrão:
info; casa com:
paraninfo; etc.
![Page 23: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/23.jpg)
Substring Padrão que deve ocorrer em
qualquer lugar de uma palavra. Exemplo:
Padrão: info;
casa com: desinformado; paraninfo; informática; etc.
![Page 24: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/24.jpg)
Permitindo Erros Padrão que corresponde a uma
palavra; juntamente com um patamar de erros.
Recupera palavras cujas escritas são similares à da palavra indicada.
Similaridade: distância entre duas palavras;
medida através do número mínimo de: inserções; remoções; e substituições.
![Page 25: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/25.jpg)
Permitindo Erros
Exemplo: Padrão:
informação, permitindo 5 erros; casa com:
informacao; desinformado; informática; etc.
![Page 26: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/26.jpg)
Expressão Regular Corresponde a um padrão com
operadores. Exemplos de operadores:
* pode ser substituído por 0 ou mais
caracteres; ?
pode ser substituído por um caracter.
![Page 27: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/27.jpg)
![Page 28: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/28.jpg)
Expressão Regular
![Page 29: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/29.jpg)
Consultas Estruturadas Exploram a estrutura dos
documentos. Permitem combinar o
conteúdo do documento; com sua estrutura.
Permitem a especificação de consultas mais poderosas.
![Page 30: Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.](https://reader036.fdocument.pub/reader036/viewer/2022062623/552fc0fe497959413d8bbc58/html5/thumbnails/30.jpg)