metadados e interoperabilidade em bibliotecas nacionais sul ...
Aula metadados 2012
-
Upload
rachelvesu -
Category
Technology
-
view
3.250 -
download
1
Transcript of Aula metadados 2012
METADADOS
• TIC – significativas mudanças em diversas áreas do conhecimento:
• novos tipos de recursos;
• novos ambientes informacionais - Web;
• Novos aspectos de mudança...
• na concepção dos sistemas de informação - (banco de dados);
• necessidade de novos modos de descrever os recursos
informacionais - Metadados.
Contextualizando:
Breve histórico:
• O termo “metadados” antecede a Web;
• 1960 – utilizado para descrever “conjunto de dados”;
• 1980 – aparece mais frequente na literatura sobre Sistema de Gestão de Banco de Dados (SGBD);
• 1990 – usado nas comunidades de gestão e interoperabilidade de dados geoespaciais, projetos e manutenção de sistemas.
• 1995 – utilizado para descrição e localização de recursos na Web (padrão Dublin Core).
• Metadados não são necessariamente digitais;
• Metadados não se referem apenas a descrição, mas também contextualização, gerenciamento, processamento, preservação e uso;
• Metadados podem ter origem em uma variedade de fontes (criados automaticamente ou manualmente pelo criador do recurso ou por um especialista);
• Metadados podem ser criados, modificados e excluídos;
• Metadados de um recurso podem ser simultaneamente dados de outros recursos, dependendo dos tipos de agregações e dependências entre recursos e sistemas (GILLILAND, 2008).
Fatos pouco conhecidos sobre metadados:
Metadados não são necessariamente digitais:
• Catalogadores e indexadores criam e padronizam metadados desde as primeiras tentativas de representação informacional, entretanto, não utilizavam essa denominação (MILSTEAD; FELDMAN, 1999).
xmacex
Novas formas de descrever os recursos...
• Profissionais de diversas áreas vem criando outros métodos e instrumentos de descrição, gerando uma variedade de padrões de metadados, que em muitos casos não atendem as necessidades de descrição de áreas específicas (MILSTEAD; FELDMAN, 1999).
DC
(Dublin Core)
Domínio Web
MARC Standards
(MAchine-Readable Cataloging)
Domínio Bibliográfico
EAD
(Encoded Archival Description)
Domínio Arquivístico
FGDC
(Federal Geographic Data Committee)
Domínio Geográfico
VRA Core
(Visual Resources Association)
Imagens e objetos culturais
FDA
(Foundation for Documents of Architecture)
Domínio de Arquitetura
FITS
(Flexible Image Transport System)
Imagens - Domínio de Astronomia
Exemplos de Padrões de Metadados:
• Diferentes padrões de metadados foram estabelecidos em esquemas que variam de estruturas mais simples, passando por um tipo de esquema intermediário até esquemas de estruturas mais complexas de descrição.
• Tipos ou níveis de padrões de metadados: • Simples;
• Estruturados;
• Ricos.
• Princípio de criação do padrão / Domínio.
Metadados: Representação + Tecnologia
Por que criar metadados?
• Imagine um supermercado sem rótulos em seus produtos...
• Imagine uma biblioteca sem identificação nos livros...
• Como identificar os recursos informacionais digitais?
Ambiente Web:
• Dificuldade de recuperação dos recursos;
• Falta de tratamento adequado (representação) dos recursos informacionais;
• Necessidade: • criação de novas formas de
tratamento (representação) dos recursos informacionais digitais para o contexto Web;
• Metadados são apontados como solução;
• São usados como um termo neutro entre as diversas áreas do conhecimento para denominar as novas formas de representação dos recursos no contexto Web.
Metadados: definições e características:
• Metadados: “dados sobre dados”.
Miller (1996); Souza, Catarino e Santos (1997); Milstead e Feldman (1999); Gilliland-Swetland (1999); Souza, Vendrusculo e Melo (2000); Takahashi (2000); Senso e Rosa Piñero (2002); Méndez Rodríguez (2002); Zeng e Qin (2008) entre outros.
Mas qual o significado
dessa definição?
Mike PD
• As definições variam de acordo com as diferentes áreas que desenvolvem e aplicam os metadados.
• “dados sobre dados” é uma definição relacionada a área de Banco de Dados.
Variedade de definições:
“Metadados são descrições de dados armazenados em um banco de dados
[...]”
(SOUZA; CATARINO; SANTOS, 1997, p.02)
“[...] informação descritiva sobre o contexto, qualidade, condição ou
características de um recurso, dado ou objeto que tem a finalidade de facilitar
sua recuperação, autenticação, evolução, preservação ou
interoperabilidade.
(SENSO; ROSA PIÑERO, 2002, p. 99)
“[...] dados estruturados que descrevem as características de um
recurso de informação.”
(TAKAHASHI, 2000, p.172)
“[...] conjunto de dados chamados de elementos, cujo número é variável de
acordo com o padrão, e que descreve o conteúdo de um recurso,
possibilitando a um usuário ou a um mecanismo de busca acessar e
recuperar esse recurso. [...]
(GRÁCIO, 2002, p. 21)
“[...] Esses elementos descrevem informações do tipo nome, descrição,
localização, formato, entre outras, que possibilitam um número maior de
campos para pesquisas.”
(GRÁCIO, 2002, p. 21)
“[...] também dados, mas dados representacionais, que acrescentado a própria informação adquirem um valor
semântico para substituí-la ou representá-la”
(BERNERS-LEE , 2000, p. 225 apud MÉNDEZ RODRÍGUEZ, 2002, p. 30).
Dados sobre catalogação e indexação, criados para: identificar, localizar, organizar, recuperar e tornar mais
acessível a informação.
(GILLILAND-SWETLAND, 1999).
Algumas definições:
• “[...] são atributos que representam uma entidade (objeto do mundo real) em um sistema de informação. [...]”
• “[...] são elementos descritivos ou atributos referenciais codificados que representam características próprias ou atribuídas às entidades;
• [...] são ainda dados que descrevem outros dados em um sistema de informação, com o intuito de identificar de forma única uma entidade (recurso informacional) para posterior recuperação. (ALVES, 2010, p. 47).
Metadados para o Domínio Bibliográfico:
De modo geral:
Metadados são atributos que caracterizam um recurso
informacional.
Existem diferentes tipologias para categorizar os metadados:
• Metadados intrínsecos à entidade: atributos que individualizam a entidade;
• Metadados extrínsecos: atributos que identificam a entidade em um sistema (MÉNDEZ RODRÍGUEZ, 2002).
Tipos e características gerais dos metadados:
• Administrativos: usados gerenciar e administrar coleções de recursos informacionais;
• Descritivos: usados para descrever e identificar informações sobre recursos;
• Preservação: metadados relacionados à preservação de coleções e recursos de informação;
• Técnicos: metadados relacionados com as funções do sistema e/ou o comportamento dos metadados;
• Uso: metadados relacionados com o nível e tipo de uso dos recursos informacionais (GILLILAND, 2008).
Tipos e características gerais dos metadados:
Tipos e características gerais dos metadados:
• ORIGEM DOS METADADOS:
• Metadados internos: gerados no momento da criação do recurso;
• Metadados externos: gerados posteriormente a criação do recurso;
• MÉTODO DE CRIAÇÃO DE METADADOS:
• Metadados automáticos: gerados por “computador”;
• Metadados manuais: criados por indivíduos;
(GILLILAND, 2008)
• NATUREZA DOS METADADOS:
• Metadados não especializados: criados por pessoas não especialistas em informação (ex.: criador original do objeto);
• Metadados especializados: criados por especialistas ou profissionais da informação (GILLILAND, 2008);
Tipos e características gerais dos metadados:
• STATUS:
• Metadados estáticos: que nunca mudam;
• Metadados dinâmicos: que mudam com o uso e/ou manipulação do recurso;
• Metadados de longa duração: para assegurar o acesso ao recurso e posterior uso;
• Metadados de curta duração: principalmente do tipo operacional (GILLILAND, 2008);
Tipos e características gerais dos metadados:
• ESTRUTURA:
• Metadados estruturados: que estão em conformidade a uma estrutura pré-determinada e padronizada;
• Metadados não estruturados: que não estão em conformidade com nenhuma estrutura determinada (GILLILAND, 2008);
Tipos e características gerais dos metadados:
• SEMÂNTICA:
• Metadados controlados: por padrões de conteúdo (vocabulários controlados e formatos de autoridade) que determinam os valores dos metadados;
• Metadados não controlados: que não estão de acordo com nenhum padrão de conteúdo (GILLILAND, 2008);
Tipos e características gerais dos metadados:
• NÍVEL:
• Metadados Nível de coleção: indicam coleções (conjuntos) de itens originais e/ou objetos de informação;
• Metadados Nível de Item: indicam itens individuais e/ou objetos de informação pertencentes, muitas vezes, em coleções (GILLILAND, 2008).
Tipos e características gerais dos metadados:
Funções dos metadados:
• Descrever;
• Identificar;
• Multiplicar as formas de acesso aos recursos informacionais;
• Contextualizar os recursos nos sistemas de informação;
• Gerenciar recursos e outros metadados nos sistemas;
• Otimizar a recuperação;
• Facilitar a interoperabilidade entre sistemas etc (GILLILAND, 2008).
• Para a CI - fornecem uma representação padronizada e inequívoca dos recursos informacionais
Papéis desempenhados pelos metadados:
Papéis Tradicionais:
• identificação e descrição da informação;
• busca e recuperação;
• localização dos documentos;
Papéis emergentes: • autoria e propriedade
intelectual; • formas de acesso; • atualização da informação; • preservação e conservação; • restrição de uso; • valoração do conteúdo; • visibilidade da informação; • acessibilidade dos
conteúdos.
(MÉNDEZ RODRÍGUEZ, 2002)
Padrões de metadados
• Os padrões de metadados são estruturas de descrição constituídas por um conjunto predeterminado de metadados (atributos codificados ou identificadores de uma entidade) metodologicamente construídos e padronizados. O objetivo do padrão de metadados é descrever uma entidade gerando uma representação unívoca e padronizada que possa ser utilizada para recuperação da mesma. (ALVES, 2010, p. 47).
O que são Padrões de Metadados?
• Simples: padrões com dados não-estruturados, gerados e recuperados automaticamente; apresentam uma semântica reduzida (SENSO; ROSA PIÑERO, 2003).
• Ex.: Meta Tag(s) e dados trocados na transferência
do protocolo HHTP (Hipertext Transfer Protocol) (BARRETO, 1999).
Tipos e níveis de Padrões de Metadados
• Estruturados: padrões baseados em normas emergentes que descrevem e identificam o recurso de forma estruturada (apresentam um conjunto de metadados para a descrição dos recursos) • Ex.: padrão de metadados Dublin Core para o
domínio Web (SENSO; ROSA PIÑERO, 2003).
Tipos e níveis de Padrões de Metadados
• Ricos: padrões de metadados mais complexos e específicos de um domínio. A descrição é específica e exaustiva e são baseados em normas e códigos específicos . • Ex.: o formato MARC 21 (SENSO; ROSA PIÑERO, 2003).
Tipos e níveis de Padrões de Metadados
• Padrões de Metadados para Propósito Gerais:
• Domínio Web:
• padrões de metadados simples e estruturados;
• Padrões de Metadados para Propósitos Específicos:
• Domínio Bibliográfico:
• padrões de metadados ricos.
Categorias de Padrões de Metadados:
Padrões de Metadados – Domínio Web:
• Padrões de Metadados simples:
Padrões de Metadados – Domínio Web:
• Padrões de Metadados simples:
Padrões de Metadados – Domínio Web:
• Padrões de Metadados estruturados:
Padrões de Metadados – Domínio Web:
• Padrões de Metadados estruturados:
• criado para promover a descoberta de recursos informacionais na Web por meio de uma descrição e identificação mínima (WOODLEY, CLEMENT, WINN, 2005).
• Princípios gerais:
• Simplicidade de descrição e manutenção;
• Semântica comumente compreendida;
• Alcance internacional;
• Extensibilidade.
Padrão Dublin Core:
• Características:
• simples, interoperável e flexível;
• Níveis de Descrição (granularidade):
• Nível simples:
• 15 elementos de descrição;
• Nível qualificado:
• 15 elementos de descrição;
• 3 elementos adicionais
• 2 classes de qualificadores: elementos de refinamento e elementos de codificação.
Padrão Dublin Core:
15 elementos de descrição:
1. Title: Título
2. Creator: Criador
3. Subject: Assunto
4. Description: Descrição
5. Publisher: Publicador
6. Contributor: Contribuidor
7. Date: Data
8. Type: Tipo
9. Format: Formato
10. Identifier: Identificador
11. Source: Origem
12. Language: Idioma
13. Relation: Relação
14. Coverage: Abrangência
15. Rights: Direitos
1. Audiência
2. Proveniência
3. Detentor de Direitos
Elementos adicionais:
• Elementos de refinamento: qualificadores que especificam o significado dos metadados,
• Ex.: título e título alternativo;
• Elementos de codificação: qualificadores que identificam esquemas para o valor,
• Ex.: Tesauros e tabelas de classificação para o elemento assunto;
Classes de qualificadores:
Estrutura do Padrão Dublin Core: <html>
<head>
<title>National Library of Australia</title>
<meta http-equiv="Pragma" content="no-cache">
<meta http-equiv="Content-Type" content="text/html">
<link rel="Scheme.AGLS" href="http://www.naa.gov.au/recordkeeping/gov_online/agls/1.2">
<meta name="DC.Creator" scheme="GOLD" content="c=AU; o=Commonwealth of Australia; ou=National
Library of Australia">
<meta name="DC.Publisher" scheme="GOLD" content="c=AU; o=Commonwealth of Australia; ou=National
Library of Australia">
<meta name="DC.Rights" content="Commonwealth of Australia, 2001">
<meta name="DC.Title" content="National Library of Australia">
<meta name="DC.Subject" scheme="APAIS" content="Libraries, national; Information services; Information
retrieval; Cataloguing; Acquisitions (libraries); Libraries">
<meta name="DC.Description" content="Our collections and services underpin Australian cultural life and
intellectual pursuits. We are the preeminent source for the documentary record of Australia and its place in the world. This
site provides access to our catalogue and links to other information resources; details of our collections and services;
upcoming events at the Library; the NLA Shop and information on our initiatives in the field of information management.">
<meta name="DC.Language" scheme="RFC3066" content="en">
<meta name="DC.Coverage.jurisdiction" content="Commonwealth of Australia">
<meta name="DC.Coverage.spatial" scheme="LCSH" content="Australia">
<meta name="DC.Date.created" scheme="ISO8601" content="1999-05">
<meta name="DC.Type.aggregationLevel" content="collection">
<meta name="DC.Type.documentType" content="homepage">
<meta name="DC.Format" content="text/html">
<meta name="DC.Identifier" scheme="URI" content="http://www.nla.gov.au">
<meta name="DESCRIPTION" content="Our collections and services underpin Australian cultural life and
intellectual pursuits. We are the preeminent source for the documentary record of Australia and its place in the world. This
site provides access to our catalogue and links to other information resources; details of our collections and services;
upcoming events at the Library; the NLA Shop and information on our initiatives in the field of information management.">
</head>
Código Fonte do site da Biblioteca Nacional da Austrália. Disponível em: <http://www.nla.gov.au/>.
• Marc 21:
• “O formato MARC 21 é um conjunto de padrões desenvolvidos com a finalidade de representar e comunicar de forma legível por máquina, metadados descritivos sobre itens de informação - particularmente, mas não somente, itens bibliográficos”. (CHAN,
2007, p. 447, tradução nossa).
• FUNÇÃO: criação, armazenamento, gerenciamento e intercâmbio de registros bibliográficos e catalográficos.
Padrão de Metadados - Domínio Bibliográfico
Estrutura do Padrão MARC 21
Subcampos
Diretório:
Campos de dados
variáveis
Diretório:
Campos de controle
variável Indicadores
Líder
Campo 245
Indicador 1 =1:
entrada secundária de título
Indicador 2 = 0:
número de caracteres a desprezar
na busca/alfabetação
Padrões de Metadados – Domínio Bibliográfico:
• Padrões de Metadados ricos:
Padrões de Metadados – Domínio Bibliográfico:
• Padrões de Metadados ricos:
Metadados no processo de catalogação – estão presentes na estrutura do padrão MARC 21
METADADO
DE USO
METADADO
ADMINISTRATIVO
METADADO
TÉCNICO
METADADOS
DESCRITIVOS
Tendências atuais no Domínio Bibliográfico:
• O processo de TDI é intrinsecamente ligado às tecnologias: • Redefinição e reavaliação dos métodos de representação.
• Complexidade na construção de representações: • Aspectos tecnológicos:
• padrões técnicos e de infraestrutura que consolidam os metadados nos sistemas de informação;
• Aspectos representacionais: • determinam de forma padronizada a representação os metadados,
seus valores, contextualizando-os nos sistemas (MÉNDEZ RODRÍGUEZ, 2002).
Aspectos tecnológicos:
• Padronização dos dados legíveis por “máquina” (software):
• Modelagem conceitual – modelo E-R: • metodologia que determina conceitualmente as necessidades dos
usuários e requisitos funcionais dos sistemas;
• Requisitos funcionais: • determina entidades, atributos e relacionamentos considerando as
necessidades dos usuários, as necessidades dos desenvolvedores de metadados;
• Esquemas de metadados: • conjunto de elementos descritivos (element set – esquema de
metadados) e espaços do valor.
Aspectos representacionais:
• Padronização de dados legíveis por humanos:
• determinação dos atributos e seus significados, • os valores dos metadados; • sua construção padronizada por meio de regras e códigos de
representação:
• Esquemas de codificação de conteúdo: • Padrões de estrutura de dados; • Padrões de intercâmbio de dados;
• Esquemas de codificação de valores: • Padrões de conteúdo de dados; • Padrões de valores de dados.
ESQUEMAS DE
CODIFICAÇÃO PADRÕES
DOMÍNIO BIBLIOGRÁFICO
PADRÃO MARC21
ESQUEMAS DE
CODIFICAÇÃO DE
CONTEÚDO
Padrões de estrutura de dados (data
structure standards)
Esquema de metadados: estrutura
descritiva em diretórios, campos,
subcampos, código de subcampo,
indicadores
Padrões de intercâmbio de dados
(data exchange standards)
Protocolo ANSI/NISO Z39.50
Norma ISO 2709
ESQUEMAS DE
CODIFICAÇÃO DE
VALORES
Padrões de conteúdo de dados
(data content standards)
Padrões ou códigos elaborados para
o TDI. Ex.: AACR, ISBDs, RDA
Padrões de valores de dados (data
value standards)
Tesauros, listas de autoridade,
léxicos, esquemas de classificação
Sintetizando:
• Aspectos tecnológicos:
• Modelos conceituais: FRBR, FRAD e FRSAD;
• Esquemas de metadados (padrão de metadados – MARC 21, MARCXML).
• Aspectos representacionais:
• Esquemas de codificação de conteúdo: AACR, ISBDs, RDA;
• Esquema de codificação de valores: Tesauros, listas de autoridade, esquemas de classificação.
Considerações:
• Ideia equivocada de que padrões de metadados emergentes são ideais para solucionar a representação em ambientes digitais;
• Domínios específicos exigem princípios particulares para a construção dos metadados e de seu padrão correspondente;
• Padrões de metadados emergentes não atendem satisfatoriamente às necessidades informacionais do domínio bibliográfico;
Metadados no domínio bibliográfico:
• Convergência de aspectos tecnológicos e aspectos representacionais para sua determinação adequada.
• Trata-se de um domínio específico, portanto os metadados são determinados por princípios particulares;
• Os instrumentos de descrição: modelos conceituais, esquemas de codificação e padrões de metadados, constituem-se com ferramentas fundamentais para a representação no domínio bibliográfico.
É importante considerar que:
• A complexidade está na reestruturação das bases teóricas e práticas pautadas em modelos conceituais (BIANCHINI; GUERRINI, 2009).
• Os aspectos representacionais do domínio bibliográfico orientam o desenvolvimento de soluções tecnológicas;
• Os aspectos tecnológicos contribuem para uma reavaliação dos aspectos representacionais e consolidam a existência dos metadados do domínio bibliográfico nos sistemas de informação.
Referências: • ALVES, R. C. V. Metadados como elementos do processo de catalogação. 2010, 132f. Tese (Doutorado em
Ciência da Informação)-Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2010. • BIANCHINI, C.; GUERRINI, M. From bibliographic models to cataloging rules: remarks on FRBR, ICP, ISBD,
and RDA and the relationships between them. Cataloging & Classification Quarterly, [s. l.], v. 47, n. ?, p. 105-124, 2009.
• CHAN, L. M. Cataloging and classification: an introduction. 3. Ed. Lanham, Maryland: The Scarecrow Press, 2007.
• DCMI. Making Information Work: the Dublin Core Way. Disponível em: <http://dublincore.org/resources/presentations/Dublin_Core_overview_2007.pdf>. Acesso em: 19 maio 2009.
• GILLILAND, A. J. Setting the stage. In: INTRODUCTION to metadata. 2. ed. [S. l.]: GETTY, 2008. p. 1-19. • GILLILAND-SWETLAND, A. J. La definición de los metadatos. In: INTRODUCCIÓN a los metadatos: vías a la
información digital. [S. l.]: GETTY, 1999. p. 1-9. • GRÁCIO, J. C. A. Metadados para a descrição de recursos da Internet: o padrão Dublin Core, aplicações e a
questão da interoperabilidade. 2002. 127 f. Dissertação (Mestrado em Ciência da Informação)–Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2002.
• MÉNDEZ RODRÍGUEZ, E. Metadados y recuperación de información: estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón: Trea, 2002. 429 p.
• MILSTEAD, J.; FELDMAN, S. Metadata: cataloging by any other name. Online, [S. l.], january, 1999. Disponível em: <http://www.online.com/online/ol1999/milstead1.html>. Acesso em: 22 jun. 2004.
• SENSO, J. A.; ROSA PIÑERO, A. de la. El concepto de metadato. Algo más que descripción de recursos eletrónicos. Ciência da Informação, Brasília, v. 32, n. 2, p. 95-106, maio/ago. 2003.
• SOUZA, T. B. de, CATARINO, M. E., SANTOS, P. C. dos. Metadados: catalogando dados na Internet. Transinformação, Campinas, v. 9, n. 2, maio/ago. 1997. Disponível em: <http://www.puccamp.br/~biblio/tbsouza92.html>. Acesso em: 12 jul. 2000.
• TAKAHASHI, T. (Org.). Sociedade da Informação no Brasil: o livro verde. Brasília: Ministério da Ciência e Tecnologia, 2000.
• WOODLEY, M. S.; CLEMENT, G.; WINN, P. DCMI Glossary. [S. l.: S. n.], 2005. Disponível em: <http://dublincore.org/documents/usageguide/glossary.shtml>. Acesso em: 26 jul. 2009.
Obrigada!
Rachel Cristina Vesu Alves
Bolsista CNPq – Pós-Doutorado Júnior – FFC/UNESP
Grupo de Pesquisa: Novas Tecnologias em Informação