Post on 26-Jan-2016
description
Metaadatok és digitális szövegek
Bakonyi GézaSZTE Egyetemi Könyvtár
A metaadatok filozófiája
• Piaci filozófia: miért is kellenek metaadatok?– MARC és az általános
metaadatok– absztrahálás– Fogalomalkotás
• Következmény: a digitális szöveg nem könyvtári dokumentum, hanem „hálózati” dokumentum
Metaadat megoldások
• Dublin Core• RDF (Resource Description Framework): metaadatok
szabványos szolgáltatásának rugalmas infrastruktúrája
• OWL: „Web Ontologies Language” - „Az ontológia kifejezéseket és összefüggéseket határoz meg egy adott tudásterület leírásához”
• “Warwick Framework”: konténer-modell, amely a különféle metaadat definíciók szisztematikus kezelését biztosítja
Metaadat alkalmazások
• Középpontban a keresés, az információ megtalálhatósága: Z39.50, OAI
• „Galaktikus Információ Kereső Szolgálat”: GILS:– "lokátor típusú" és "dokumentum típusú" információ
források integrációja– Decentralizált rendszerek, profilok– Lokátor: olyan információ forrás, amely más
információ forrást azonosít
• Szürke irodalom adatbázisai: pl. PhD disszertációk adatbázisai
Strukturált szövegek
• Az egyik megoldása annak, hogy egy információ forrás teljes szövegéből automatikusan kivonjuk a fogalmi kulcsszavakat az, hogy a tartalmi leírást megadott struktúra szerint végezzük el
• SGML, HTML, XML, XHTML
• TEI és TEI Header
A digitális dokumentum fejlécében elhelyezett MetaTagek
Felhasználó
Kereső RobotIndex állomány
INTERNET
MetaTag
Meta-adatlap készítése Sorszám-Kitöltés-Alap-Leírás-Adatelem-Forrás-Előfordulás-
Típus-Érték-tartomány• kötelező (K), ha a leírásnál minden esetben alkalmazni
kell, pl. adatállomány neve,• választható (V), ha a készítő dönti el, hogy megadja-e
vagy sem, pl. adatállomány készültsége,• egyedi (E), ha az adatállományra vonatkozólag egyedi,
és a leírás során csak egyszer lehet megadni, pl. adatállomány címe.
• ismétlődő (I), ha az adatállomány valamely tulajdonsága több fogalommal írható le (pl. kulcsszavak).
• összetett (Ö), ha további elemekre bontható; ebben az esetben választható, hogy adok-e leírást is magához az összetett elemhez, vagy csak a részeihez,
• egyszerű (P), ha további elemekre már nem bontható.
Meta-adatlap készítése• MARC – TEI Header – DC
GILS DUBLIN CORE METATÉR
Title Title Cím
Originator Author, Creator Szervezet
(Un)controlled Term Subject, Keyword Kulcsszavak
Abstract Description Összefoglalás
Distributor Publisher Terjesztő
Contributor Other Contributor Kapcsolattartó
Date of Publication Date Publikálás Dátuma
Medium Resource Termék
Linkage Type Format Formátum
Available Linkage Resource Identifier (URL)
Source of Data Source Forrás
Language of resource Language Nyelv
Cross Reference Relation (URL)
Supplemental Information Coverage Térbeli és Időbeli kiterjedés
Use Constraints Right Management Használatbeli Korlátozások
MegfeleltetésekSeparate records Single record Descriptive Administrative Structural
Dublin Core All LCSH, MESH, DDC, LCC, UDC, DCMI Types, TGN
N Y 1 x x x x
EAD Text (manuscripts and other documents in archival collections), images
APPM N Y 12 x x x x
FGDC Maps, places NASA master N Y 2 x x x xGILS All N Y 1 x x xIMS Text, images, moving
images, sound recordings, software, 3D, maps
N Y 4 x x x x
MARC Text, images, moving images, sound recordings, software, 3D, maps
LCSH, LCSH Childrens, MESH, NAL, Canadian subject headings, Repertoire des vedettes matieres
N Y 1 x x x x
TEI Text N Y 7 x x x x xVRA Core 3 Images, 3D, events LCSH, AAT,
TGM, ULAN, TGN
N Y 1 x x x
Data for original/surrogate Metadata typesStandard Usage Official or special thesauri
Thesauri restrictions (Y/N) Crosswalks (Y/N) Descriptive levels
DC Element DC Qualifier(s) MARC Fields Implementation notes
Title 245
Title Alternative 130, 210, 240, 242, 246, 730, 740
100, 110, 111, 700, 710, 711 Creator
720
See Appendix 1 below.
Subject LCSH 600, 610, 611, 630, 650 Second indicator=0
Subject MeSH 600, 610, 611, 630, 650 Second indicator=2
Subject LCC 050
Subject DDC 082
Subject UDC 080
Description 500-599, except 505, 506, 520, 530, 540, 546
Description TableofContents 505
Description Abstract 520 First indicator=3
Contributor See Appendix 1 below; Contributor element not used.
Publisher 260$a$b
260$c$g Date Created
533$d
260$c Date Issued
008/07-10
Leader06, Leader07 See Appendix 2 for Leader-Type rules
Type DCMI Type Vocabulary
655 Subfield $2=dct
IMT 856$q
300$a
Format
Extent
533$e
Medium 340$a
Identifier URI 856$u
Source URI 786$o
Language ISO 639-2 008/35-37
DC elemek és részek
• Dublin Core Metadata Element Set
• "qualifiers„:– Element Refinement. These qualifiers make
the meaning of an element narrower or more specific
– Encoding Scheme. These qualifiers identify schemes that aid in the interpretation of an element value
DCMES Element
Element Refinement(s)Element Encoding
Scheme(s)
Title Alternative -
Creator - -
Subject -
LCSHMeSHDDCLCCUDC
DescriptionTable Of ContentsAbstract
-
Publisher - -
Contributor - -
Date
CreatedValidAvailableIssuedModifiedDate CopyrightedDate Submitted
DCMI PeriodW3C-DTF
5. Publisher publisher (37) 6. Contributor contributor (38) 7. Date dateFirstCreated (38) dateCurrentFormCreated
(40) dateLastModified (41) dateValidFrom (43) dateValidTo (44) 8. ReourceType resourceType (24) 9. Format format (32) 10. Identifier identifier (33)
„Jel vagyunk, értelmezés nélkül …”Hölderlin