Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

48
Alt du trenger å vite om MARC men ikke har tenkt å spørre om 2014-02-03 [email protected]

description

Everything you need to know about MARC, but never thought to ask. (MARC = MAchine Readable Cataloging)

Transcript of Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Page 1: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Alt du trenger å vite om MARC

men ikke har tenkt å spørre om

2014-02-03 [email protected]

Page 2: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Dette er en presentasjon som er laget for et internt seminar om MARC ved seksjon for fellestjenester ved NTNU UB den 3. februar 2013. Utenfor denne konteksten kan den sikkert virke forvirrende her og der.

Noe av hovedbudskapet ved presentasjonen er at MARC har mange aspekter - utover den dalige omgangen med BIBSYS-MARC som dataregistreringsformat ved NTNU UB.

2014-02-03 [email protected]

Page 3: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
Page 4: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

000 $a 941081494

008 $a p $b v $c eng

020 $a 0-571-17192-3

082 $a 810

100 $a Friedman, Kinky

245 $a Elvis, Jesus & coca cola $c by Kinky Friedman

260 $a London $b Faber and Faber $c c1994

300 $a 197 s.

650 $a Elvis Presley impersonators $x Fiction

691 $a amerikansk-litteratur

740 $a Elvis, Jesus, and coca cola

Page 5: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
Page 6: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Historikk

MARC I pilot (LC)MARC Distribution Service

USMARC og dialekter utvikler segUNITMARC

MARC 21 MARCXML

1966 1969 1976 1997 2002 .

Page 7: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Hva er egentlig et MARC-format (1)

Et konseptuelt (abstrakt) metadataskjema som beskriver dataelementer på to nivåer: felter og delfelter

- der feltene er navngitt med tresifrede tall og delfeltene navngitt med alfanumeriske tegn

- pluss mye mer, f.eks. regler for koding, tegnsett, feltverdier etc

Page 8: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Hva er egentlig et MARC-format (2)

Det som beskrives av MARC 21-standarden

Inkludert skilletegn!Inkludert ISO2709!

Page 9: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

MARC 21A MARC record is composed of three elements: the record structure, the content designation, and the data content of the record. The record structure is an implementation of the international standard Format for Information Exchange (ISO 2709) and its American counterpart, Bibliographic Information Interchange (ANSI/NISO Z39.2). The content designation--the codes and conventions established explicitly to identify and further characterize the data elements within a record and to support the manipulation of that data--is defined by each of the MARC formats. The content of the data elements that comprise a MARC record is usually defined by standards outside the formats. Examples are the International Standard Bibliographic Description (ISBD), Anglo-American Cataloguing Rules, Library of Congress Subject Headings (LCSH), or other cataloging rules, subject thesauri, and classification schedules used by the organization that creates a record. The content of certain coded data elements is defined in the MARC formats (e.g., the Leader, field 007, field 008).

http://www.loc.gov/marc/bibliographic/bdintro.html

Page 10: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Forskjellige formattyper

Bibliographic (MARC 21)Authority (MARC 21)Holdings (MARC 21)Classification (MARC 21)Community (MARC 21)Personennamen (MAB)Körperschaftsnamen (MAB)Schlagwörter (MAB)Bilder (BIBSYS)

Page 11: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
Page 12: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Forskjellige bruksområder

Opprinnelig: Utveksling av MARC-poster

Seinere: Lagring, Registrering, Presentasjon

Page 13: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Utveksling

Spredning av katalogdata (MARC distributiuon service)Innsamling av katalogdata (til fysisk samkatalog)KopikatalogiseringInnholdsprodusentenes metadatatjenester (EBSCO)

Page 14: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Lagring

Egner MARC seg som lagringsformat?

Umulig å si ja eller nei

Page 15: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Registrering

Katalogiseringsprogram har mer eller mindre eksplisitt bruk av MARC-notasjon

Page 16: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Presentasjon

Egner MARC seg som presentasjonsformat?

Ja, hvis brukeren er katalogisator og brukstilfellet er MARC-katalogisering

Ellers ikke

Page 17: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Forskjellige varianter

MARCUSMARCNORMARCUNITMARCLIBRISMARCBIBSYSMARCINTERMARCCANMARCUNIMARC

danMARC2SWEMARCMARC 21MABBILDEMARC

Page 18: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Forskjellige eiere

MARCUSMARCNORMARCUNITMARCLIBRISMARCBIBSYSMARCINTERMARCCANMARCUNIMARC

MARC 21danMARC2SWEMARCMABBILDEMARC

LC

DB

KB

IFLA

BIBSYS

NLC/BNC

NB DBC

BnF

Page 19: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Hvorfor så mange forskjellige?

Godt spørsmål

Page 20: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Forskjellige kodinger

(linjeformat, utvekslingsformat (ISO 2709), XML, regneark etc)

Det fysiske formatet for digital koding av MARC-posten.

Også kalt serialisering.

NB: Av og til er ISO 2709 underforstått

Page 21: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Forskjellige kodinger

Noen kodinger tar mindre plass enn andre (ISO 2709 er mest kompakt)

Noen kodinger er mer menneskeligleselige enn andre (ISO 2709 er mest uforståelig)

Noen kodinger er lettere å behandle programmatisk enn andre

Page 22: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

MARC Exchange format (ISO 2709)01355nam 2200313Ia 4500001001100000003000800011006001900019007001500038008004100053

020001500094040002100109035002000130050002100150100005400171245011400225260003900339

300002600378490006500404490003900469500006700508504005100575533015200626650002300778

655002900801710001700830830003000847830004000877856012400917ebr2003204CaPaEBRm

u cr cn|||||||||770615r19991948enka sb 001 0 eng d z0415175372 aCaP

aEBRcCaPaEBR a(OCoLC)7072056114aJA38b.L4 1999eb1 aLasswell, Harold D.q(Harold Dwigh

t),d1902-1978.14aThe analysis of political behaviorh[electronic resource] :ban empir

ical approach /cHarold Dwight Lasswell. aLondon :bRoutledge,c1999, c1948. aix, 314

p. :bdiagrs.1 aInternational library of sociology. Political sociology ;v21 aIntern

ational library of sociology aOriginally published: London : K. Paul, Trench, Trubn

er, 1948. aIncludes bibliographical references and index. aElectronic reproduction

.bPalo Alto, Calif. :cebrary,d2009.nAvailable via World Wide Web.nAccess may be limi

ted to ebrary affiliated libraries. 0aPolitical science. 7aElectronic books.2local2

aebrary, Inc. 0aPolitical sociology ;v2. 0aInternational library of sociology.40uhtt

p://site.ebrary.com/lib/ntnu/Doc?id=2003204zAn electronic book accessible through th

e World Wide Web; click to view

Page 23: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

MarcEdit linjeformat=LDR 01355nam 2200313Ia 4500

=001 ebr2003204

=003 CaPaEBR

=006 m\\\\\\\\u\\\\\\\\

=007 cr\cn|||||||||

=008 770615r19991948enka\\\\sb\\\\001\0\eng\d

=020 \\$z0415175372

=040 \\$aCaPaEBR$cCaPaEBR

=035 \\$a(OCoLC)70720561

=050 14$aJA38$b.L4 1999eb

=100 1\$aLasswell, Harold D.$q(Harold Dwight),$d1902-1978.

=245 14$aThe analysis of political behavior$h[electronic resource] :$ban empirical approach /$cHarold Dwight Lasswell.

=260 \\$aLondon :$bRoutledge,$c1999, c1948.

=300 \\$aix, 314 p. :$bdiagrs.

=490 1\$aInternational library of sociology. Political sociology ;$v2

=490 1\$aInternational library of sociology

=500 \\$aOriginally published: London : K. Paul, Trench, Trubner, 1948.

=504 \\$aIncludes bibliographical references and index.

Page 24: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

MARCXML<marc:collection xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd">

<marc:record>

<marc:leader>01355nam a2200313Ia 4500</marc:leader>

<marc:controlfield tag="001">ebr2003204</marc:controlfield>

<marc:controlfield tag="008">770615r19991948enka sb 001 0 eng d</marc:controlfield>

<marc:datafield tag="020" ind1=" " ind2=" ">

<marc:subfield code="z">0415175372</marc:subfield>

</marc:datafield>

<marc:datafield tag="100" ind1="1" ind2=" ">

<marc:subfield code="a">Lasswell, Harold D.</marc:subfield>

<marc:subfield code="q">(Harold Dwight),</marc:subfield>

<marc:subfield code="d">1902-1978.</marc:subfield>

</marc:datafield>

<marc:datafield tag="245" ind1="1" ind2="4">

<marc:subfield code="a">The analysis of political behavior</marc:subfield>

<marc:subfield code="h">[electronic resource] :</marc:subfield>

<marc:subfield code="b">an empirical approach /</marc:subfield>

Page 25: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

NORMARC linjeformat*000 $a040458520*008 $an$be$bv$ceng*020 $z0-415-17537-2*082d $a306.2*100 $aLasswell, Harold Dwight*245 $aThe analysis of political behavior$helektronisk ressurs$ban empirical approach$cHarold Dwight Lasswell$wanalysis of political behavior*260 $aLondon$bRoutledge$c1999, c1948*300 $aix, 314 s.$bdiagrs*440 $aInternational library of sociology$pPolitical sociology$v2*440 $aInternational library of sociology*500 $aOriginally published: London : K. Paul, Trench, Trubner, 1948.*500 $aE-bok tilgjengelig for eierbibliotek via Internett*650 $aPolitical science

Page 26: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

BIBSYS Linjeformat

Page 27: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Regneark

Eksempel mangler!

Tabeller egner seg generelt dårlig, fordi MARC-postene har

● Mange tomme felter (kolonner)● Mange repeterbare felter (kolonner)

Page 28: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
Page 29: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Feltkoder, indikatorer, delfeltkoder=100 1\$aLasswell, Harold D.$q(Harold Dwight),$d1902-1978.

=245 14$aThe analysis of political behavior$h[electronic resource] :$ban empirical approach /$cHarold Dwight Lasswell.

=260 \\$aLondon :$bRoutledge,$c1999, c1948.

=300 \\$aix, 314 p. :$bdiagrs.

=490 1\$aInternational library of sociology. Political sociology ;$v2

Indikatorer: Presisering (kvalifisering) av feltkoden

Feltkoder, hierarkisk hovedinndeling

Delfeltkoder, hierarkisk underinndeling

Page 30: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Leader og directory (2709)01355nam 2200313Ia 4500001001100000003000800011006001900019007001500038008004100053

020001500094040002100109035002000130050002100150100005400171245011400225260003900339

300002600378490006500404490003900469500006700508504005100575533015200626650002300778

655002900801710001700830830003000847830004000877856012400917ebr2003204CaPaEBRm

u cr cn|||||||||770615r19991948enka sb 001 0 eng d z0415175372 aCaP

aEBRcCaPaEBR a(OCoLC)7072056114aJA38b.L4 1999eb1 aLasswell, Harold D.q(Harold Dwigh

t),d1902-1978.14aThe analysis of political behaviorh[electronic resource] :ban empir

Leader: Metainformasjon om 2709-posten

Directory: Innholdsfortegnelse, dvs liste over de enkelte feltene i 2709-posten

Page 31: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Kontrollfelter (00X) og datafelterVariable control fields - The 00X fields. These fields are identified by a field tag in the Directory but they contain neither indicator positions nor subfield codes. The variable control fields are structurally different from the variable data fields. They may contain either a single data element or a series of fixed-length data elements identified by relative character position.Variable data fields - The remaining variable fields defined in the format. In addition to being identified by a field tag in the Directory, variable data fields contain two indicator positions stored at the beginning of each field and a two-character subfield code preceding each data element within the field.

(Denne språkbruken er relatert til ISO 2709).

Page 32: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Skilletegn=100 1\$aLasswell, Harold D.$q(Harold Dwight),$d1902-1978.

=245 14$aThe analysis of political behavior$h[electronic resource] :$ban empirical approach /$cHarold Dwight Lasswell.

=260 \\$aLondon :$bRoutledge,$c1999, c1948.

=300 \\$aix, 314 p. :$bdiagrs.

=490 1\$aInternational library of sociology. Political sociology ;$v2

Page 33: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Andre metadataformater

Her forstår vi metadata som brukes til beskrivelse av dokumenter, dvs bibliografiske data

Selve metadatabegrepet er ikke så lett å få tak på

Det som er data for noen er metadata for andre

Page 34: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Dublin Core <dc:title>The analysis of political behavior [electronic resource] : an empirical approach /</dc:title>

<dc:creator>Lasswell, Harold D.(Harold Dwight),1902-1978.</dc:creator>

<dc:creator>ebrary, Inc.</dc:creator>

<dc:type>text</dc:type>

<dc:type>Electronic books.local</dc:type>

<dc:publisher>London : Routledge,</dc:publisher>

<dc:date>1999, c1948.</dc:date>

<dc:language>eng</dc:language>

<dc:description>Originally published: London : K. Paul, Trench, Trubner, 1948.</dc:description>

<dc:description>Includes bibliographical references and index.</dc:description>

<dc:description>Electronic reproduction.</dc:description>

<dc:subject>Political science.</dc:subject>

<dc:identifier>http://site.ebrary.com/lib/ntnu/Doc?id=2003204</dc:identifier>

Page 35: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Mods <mods version="3.0">

<titleInfo>

<nonSort>The </nonSort>

<title>analysis of political behavior [electronic resource]</title>

<subTitle>an empirical approach</subTitle>

</titleInfo>

<name type="personal">

<namePart>Lasswell, Harold D. (Harold Dwight)</namePart>

<namePart type="date">1902-1978</namePart>

<role>

<roleTerm authority="marcrelator" type="text">creator</roleTerm>

</role>

</name>

<name type="corporate">

<namePart>ebrary, Inc</namePart>

</name>

<typeOfResource>text</typeOfResource>

<genre authority="marc">bibliography</genre>

<genre authority="local">Electronic books.</genre>

Page 36: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
Page 37: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Katalogisering og MARC

Katalogiseringsreglene (f.eks. AACR el RDA) avgjør hvilke dataelementer som skal brukes

Metadataformatet (f.eks. BIBSYS-MARC) avgjør hvordan elementene beskrives

Kodingsformat (f.eks. ISO 2709) og tegnsett avgjør hvordan elementene kodes digitalt

Page 38: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

FRBR : Dinas bokWork

Expression

Person

Manifestation

Person Item

Page 39: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

FRBR : Kjøp 5 betal for 1001 $a 03077764x

008 $c fre $h fr $a p $b v

015 $a nf0308411

020 $a 2-910030-04-0 $b h.

082 $d 839.823[S]

100 $a Wassmo, Herbjørg

241 $a Dinas bok

245 $a Le livre de Dina $b roman

$c Herbjørg Wassmo ; traduit du norvégien par Luce Hinsch

$w livre de Dina

260 $a Larbey $b Gaïa editions $c 2003

300 $a 554 s.

096 $a NBO $c NA/A 2003:2083 $n 03ga07504

[ Person | Work | Expression | Manifestation | Item ]

Page 40: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Linked data, RDF, Bibframe, etc

Page 41: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

BIBFRAME.ORG

This technical site for the Bibliographic Framework Initiative (BIBFRAME.ORG) serves as the official repository for the vocabulary, tools and shared code in support of BIBFRAME. Led by the Library of Congress, this community effort represents the beginning of a transition from the MARC 21 communication format to a new RDF-based data model, embracing Linked Data practices in support of sharing and publishing metadata.

Page 42: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Men hva er egentlig BIBFRAME

Et metadataskjema som kan erstatte MARC, inndelt i klassene

WorkInstanceAuthorityAnnotation

BIBFRAME er ikke i samme grad som MARC fokusert på “poster”

Page 43: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

BIBFRAME<?xml version="1.0" encoding="UTF-8"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">

<bf:Work rdf:about="http://id.loc.gov/resources/bibs/3333332" xmlns:bf="http://bibframe.org/vocab/">

<rdf:type rdf:resource="http://bibframe.org/vocab/Text"/>

<bf:authorizedAccessPoint>Van Caspel, Paul. Bloomers on the Liffey : eisegetical readings of Joyce's Ulysses</bf:authorizedAccessPoint>

<bf:title>Bloomers on the Liffey : eisegetical readings of Joyce's Ulysses</bf:title>

<bf:workTitle>

<bf:Title>

<bf:titleValue>Bloomers on the Liffey :</bf:titleValue>

<bf:subtitle>eisegetical readings of Joyce's Ulysses /</bf:subtitle>

</bf:Title>

</bf:workTitle>

<bf:creator>

<bf:Person>

<bf:label>Van Caspel, Paul.</bf:label>

<bf:authorizedAccessPoint>Van Caspel, Paul.</bf:authorizedAccessPoint>

<bf:hasAuthority>

<madsrdf:Authority xmlns:madsrdf="http://www.loc.gov/mads/rdf/v1#">

<madsrdf:authoritativeLabel>Van Caspel, Paul.</madsrdf:authoritativeLabel>

Page 44: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Om MARC-verktøy

Katalogiseringsprogram (blåskjerm etc)Konverteringsprogram (MARCedit etc)Protokollverktøy (OAI-PMH, SRU etc)

Page 45: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Om BIBSYS og NB sin rolle

NB: Vedlikeholder NORMARCBIBSYS: Vedlikeholder BIBSYS-MARC

BIBSYS vil også måtte få en rolle mht en “norsk utgave av MARC 21” til bruk i Alma

Page 46: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Spesielle BIBSYS-krav

Fokus på online-katalogLenkingIndikatorerEgne typeverdierSkilletegnEksemplardataLokale emne/klassSorteringsfelt

Page 47: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

Photo: Till Krech http://www.flickr.com/photos/10508943@N00/125171884/

Page 48: Alt du trenger å vite om MARC - men ikke har tenkt å spørre om

MARC must die(Roy Tennant, 2002)

It is a template for the printed card (245 $c)It has non-explicit semanticsIt is not really machine readableIt is not normalised: 020 $a 0394170660 (Random House : pbk.) :$c $4.95It has several data elements in one subfield, with punctuationIt has redundancy (008 + 245h)It is not one standard, but different flavorsIt is domain-specificIt is mixed up with cataloging rulesIt is focused on records, not data