A.9 tartalmi feltárás

15
A.9 tétel A hagyományos tartalmi feltáró eszközök fejlődési tendenciái, funkciói és egymásra épülése a korszerű információs rendszerekben. Állításait igazolja egy szabadon választott szakirodalmi adatbázis tartalmi feltáró rendszerének bemutatásával. Bevezető, a tartalmi feltárás célja A tartalom fogalma: Az információközvetítő tevékenység a tudástársadalomban értelmezett ismeretek közvetítését jelenti. A könyvtár számára a tudás szövegben jelenik meg. A tartalom a szöveg jelentése. Azt az üzenetet kell megkeresni és kifejezni, amelynek információs értéke van annak a közösségnek a számára, amelyet az információs rendszer célközönségének, használóinak tekintünk. A feldolgozás célja: - Az állomány reprezentálása, áttekinthetővé tétele formai és tárgyi szempontok szerint, - az információk visszakereshetővé tétele, - valamint törekszik a kompatibilitásra, a szabványosságra. A feltárás két egymástól jól elkülöníthető szempont szerint folyik: - A tartalmi feltárás a dokumentum tárgyát írja le valamely természetes vagy mesterséges nyelvű osztályozási rendszer segítségével Eredménye a tárgyi katalógus - A formai feltárás magát a dokumentumot írja le a rajta megjelenő adatokkal és fizikai jellemzőkkel Eredménye a leíró katalógus Eredménye: - Tárgyi katalogizálás: A tudásfeldolgozás azon folyamata, melynek során a dokumentumban tárolt tudás rekonstrukciójával és az Információ Kereső nyelv (IKNY = közös nyelv, a könyvtár és a felhasználó között, amin a kommunikáció megvalósulhat) jelkészletének segítségével történik a reprezentáció. - Két típusuk van: A tárgyszókatalógus, és a szak-vagy szakrendi katalógus. Mindegyiken belül annyi változat alakult ki, ahány tárgyszó- vagy osztályozási rendszer létezik. Maga a tárgyszókatalógus amúgy is gyűjtő megnevezése minden mellérendelő indexelés alapján készített katalógusnak. Tartalmi feltárás - a dokumentum tárgyát írja le valamilyen természetes vagy mesterséges nyelvű osztályozási rendszer segítségével (pl. ETO) - feladata: - A szöveg egyedi információinak elemzése - A tartalom meghatározása - Tartalmi csoportok kialakítása - Hasonló tartalmú információk együtt tartása - Valamennyi tartalmi információ visszakereshetővé tétele

Transcript of A.9 tartalmi feltárás

Page 1: A.9 tartalmi feltárás

A.9 tétel A hagyományos tartalmi feltáró eszközök fejlődési tendenciái, funkciói és egymásra épülése a korszerű információs rendszerekben. Állításait igazolja egy szabadon választott szakirodalmi adatbázis tartalmi feltáró rendszerének bemutatásával. Bevezető, a tartalmi feltárás célja A tartalom fogalma:

Az információközvetítő tevékenység a tudástársadalomban értelmezett ismeretek

közvetítését jelenti.

A könyvtár számára a tudás szövegben jelenik meg.

A tartalom a szöveg jelentése.

Azt az üzenetet kell megkeresni és kifejezni, amelynek információs értéke van annak a

közösségnek a számára, amelyet az információs rendszer célközönségének, használóinak

tekintünk.

A feldolgozás célja: - Az állomány reprezentálása, áttekinthetővé tétele formai és tárgyi szempontok

szerint, - az információk visszakereshetővé tétele, - valamint törekszik a kompatibilitásra, a szabványosságra.

A feltárás két egymástól jól elkülöníthető szempont szerint folyik:

- A tartalmi feltárás a dokumentum tárgyát írja le valamely természetes vagy mesterséges nyelvű osztályozási rendszer segítségével Eredménye a tárgyi katalógus

- A formai feltárás magát a dokumentumot írja le a rajta megjelenő adatokkal és fizikai jellemzőkkel Eredménye a leíró katalógus

Eredménye: - Tárgyi katalogizálás: A tudásfeldolgozás azon folyamata, melynek során a

dokumentumban tárolt tudás rekonstrukciójával és az Információ Kereső nyelv (IKNY = közös nyelv, a könyvtár és a felhasználó között, amin a kommunikáció megvalósulhat) jelkészletének segítségével történik a reprezentáció.

- Két típusuk van: A tárgyszókatalógus, és a szak-vagy szakrendi katalógus. Mindegyiken belül annyi változat alakult ki, ahány tárgyszó- vagy osztályozási rendszer létezik. Maga a tárgyszókatalógus amúgy is gyűjtő megnevezése minden mellérendelő indexelés alapján készített katalógusnak.

Tartalmi feltárás

- a dokumentum tárgyát írja le valamilyen természetes vagy mesterséges nyelvű osztályozási rendszer segítségével (pl. ETO)

- feladata: - A szöveg egyedi információinak elemzése - A tartalom meghatározása - Tartalmi csoportok kialakítása - Hasonló tartalmú információk együtt tartása - Valamennyi tartalmi információ visszakereshetővé tétele

Page 2: A.9 tartalmi feltárás

- Eredménye a tárgyi katalógus A tartalmi feltárás szintjei

- Regisztrációs szint alapvető adatok: szerző, cím, kiadó, év

- Generalizáló osztályozás Az információk átfogó, generikus tartalmi-tematikus csoportosítása

- Egyedi információk tartalmi leírása Kulcsszó, tárgyszó stb. – a konkrét kérdésre való válaszadást teszi lehetővé

- Annotáció 1-2 mondatnyi információ a tartalomról

- Referátum Rövid, lényegre törő tartalmi kivonat, amely összefüggő szövegbe ágyazva

tartalmazza az eredeti szöveg lényeges megállapításait Indikatív referátum – csak jelzi, hogy milyen témákról szól az eredeti szöveg Informatív referátum – összefoglalja az eredeti mondanivalóját Minőségi szempontok:

Teljesség: Tartalmazza az eredeti dokumentum minden lényeges tartalmi elemét,

Pontosság: Pontosan tükrözze az eredeti szöveg teljes tartalmát és az abban foglalt véleményt,

Objektivitás: Ne értékeljen, Rövidség, Érthetőség

Referátumkészítés: 1. Kihagyás 2. Tömörítés 3. Tisztázás 4. Szövegszervezés 5. Stílus

- Tömörítvény

Az eredetit pótló összefoglalás - Analitikus-szintetikus feltárás

Több dokumentum tartalmi szintézise – szemle, trendtanulmány A tartalmi feltárás folyamata:

- Fogalmazzuk meg a dokumentum tartalmát egy mondatban (esetleg 2-ben). - Ha nem foglalható egy mondatba, több témáról van szó. - Keressük meg az újdonságot. - Keressük meg a cselekvést. Határozzuk meg fogalmakkal. - Keressük meg a cselekvés tárgyát és végrehajtóját. Határozzuk meg fogalmakkal. - Szükség van-e a téma idő- és hely-viszonyainak kifejezésére? Határozzuk meg. - Szükség van-e a dokumentumtípus kifejezésére? Adjuk meg.

Page 3: A.9 tartalmi feltárás

A tartalmi feltárás eszközei

I. Az információkereső nyelvek rendszere Információkereső nyelv: az a nyelv, amely alkalmas az információk és az információkereső kérdések leírására, azaz a természetes nyelven megfogalmazott kérdések szabályozott nyelvre történő lefordítására.

Cél: a kommunikáció az információ forrása és a használója között. IKNY-ek feladatai: - létre kell hozni a feldolgozási egységek vagy dokumentumok tartalmi csoportját - fel kell tárni a feldolgozási egység egyedi tartalmát - szurrogátum együttese létrehozása, amelyekben a hasonlók kerülnek a hasonlókhoz. - Az ismereteket tartalmi – tematikai szerkezetüket tükröző rendszerré kell szervezni

IKNY jellemzői: - szókészlet = jelkészlet - szemantika = jelentés - szintaxis = nyelvtan, használati szabályok Az információkereső nyelvek típusai – a 7 szempont:

1. szabályozottság

Természetes nyelven alapuló IKNY-ek

Az osztályozási kifejezéseket az eredeti szövegből emeljük ki, Pl. kulcsszó

Szabályozott IKNY-ek

Az osztályozási kifejezéseket nyelvi, logikai szabályozásnak vetjük alá, Pl. tárgyszó,

ETO jelzet stb.

2. logikai szerkezet

Hiererachikus IKNY-ek

Az általánostól az egyedi felé haladó logikai felosztás.

Alá-fölérendeltségi és egész-rész relációk alapján jön létre.

Mellérendelő IKNY-ek

Az osztályozó fogalmak egymástól függetlenekű

3. mélység

Generalizáló IKNY-ek

Átfogó témák, nagyobb témacsoportok leírására alkalmas osztályozási rendszerek.

Individualizáló IKNY-ek

Mély tartalmi feltárást biztosítanak.

Az osztályozás az egyedi információk mélységéig elvégezhető

4. szerkezet

Prekoordinált IKNY-ek

osztályozási rendszerekben az osztályok sorrendje, kapcsolatrendszere, az

osztályozási fogalom helye eleve meghatározott, így független a dokumentum

tartalmától.

Page 4: A.9 tartalmi feltárás

Posztkoordinált IKNY-ek

osztályozási rendszerekben a lexikai egységek a dokumentum tartalmától függően

rendelhetők egymás mellé. A fogalmak sorrendje előzetesen nem szabályozott.

5. tartalom

Általános osztályozási rendszerek: felölelik az emberi tudás egészét, az ismeretek

teljes körét. Osztályozásukban a különféle szakterületek fogalmait összehangoltan

rendezik el.

Speciális (szakterületi, autonóm) osztályozási rendszerek: egy-egy tudományterület,

szűkebb szakterület, ágazat ismereteit foglalják magukba. Figyelemmel vannak az

adott szakterületen működő szakemberek, kutatók sajátos igényeire és szokásaira is.

6. automatizáltság

Nem automatikus: az osztályozás munkafolyamataiban nem használnak gépi

megoldásokat.

Félautomatikus: a lexikai egységek megállapítása intellektuális úton történik, míg a

rendezés és a szelektálás számítógéppel.

Automatikus: mind az osztályozási fogalmak meghatározását, mind

csoportosításukat géppel végzik.

7. területiség

Egyetemes: az egész világra kiterjedő

Regionális: egy-egy terület fogalmait rendszerező

Nemzeti: országhoz, nemzethez kötődő

II. Tudományfelosztáson alapuló osztályozási rendszerek

- A felosztás mögött valamilyen tudományrendszertan áll, amelynek alapja filozófiai vagy "általánosan elfogadott" gyakorlat lehet.

- Az ismeretkörökön belül az osztályok, alosztályok stb. kialakítása logikai alapokon történik (alá-fölé rendeltség, egész-rész viszony).

- Az osztályozó ismérveket általában kódokkal is megjelölik, ami mutatja a hierarchiában elfoglalt helyet.

- Az osztályozás feladata, hogy elhelyezze a témát az ismeretkörök között, illetve megadja a helyét a tudomány(ok) rendszerében

PL.: ETO

0 - Általános tartalmú művek

1 – Filozófia, pszichológia

2 - Vallás, teológia

3 - Társadalomtudományok

4 - (1964 óta betöltetlen főosztály, eredetileg Nyelvészet)

5 - Alaptudományok. Matematika. Természettudományok

6 - Alkalmazott tudományok

7 - Szépművészetek. Iparművészetek. Szórakozások, játékok, sport

8 - Nyelvészet. Irodalom

9 - Régészet. Földrajz. Életrajz. Történelem

Page 5: A.9 tartalmi feltárás

III. Tartalomelemzés

- Egy olyan kutatási eljárás, amely az irodalmi szövegeket és a tömegközlés ágait különböző tartalmi és formai elemein keresztül mennyiségi úton, az ún. statisztikai nyomozás eszközeivel vizsgálja.

- Elsősorban a kommunikációs funkció elemzéséről van szó, azon belül is a szimbolikus jelentések feltárásáról.

- A tartalomelemzés módszerével levont következtetések más célokat szolgálnak, mint az információs célú tartalomelemzés

- definíciók: A tartalomelemzés olyan kutatási technika, amelynek segítségével adatokból a

kontextusaikra vonatkozóan megismételhető és érvényes következtetéseket vonhatunk le.

A tartalomelemzés egy kutatási módszer, amely egy sorozat művelet segítségével érvényes következtetéseket von le a szövegből. Ezek a következtetések az üzenet küldőjére, az üzenetre magára, illetve az üzenet befogadójára vonatkoznak.

- célja: A szimbolikus jelentés feltárása

Az adatokat mindig többféle nézőpontból lehet szemügyre venni, különösen akkor, ha szimbolikus jellegűek.

Minden írott közleményben meg lehet számolni a betűket, a szavakat vagy a mondatokat.

Lehet kategorizálni a szókapcsolatokat, leírni a kifejezések logikai szerkezetét, meghatározni az asszociációkat, a konnotációkat, a denotációkat, a szónoki fogásokat, de szó lehet pszichiátriai, szociológiai vagy politikai interpretációkról is.

Mindez egyszerre is érvényes lehet.

Egyvalamely közlés igen sokféle tartalmat hordozhat egy befogadó számára is.

Ilyen körülmények között az a törekvés, amely „a” tartalmat kívánja elemezni a kommunikációban, tudományos szempontból nem állja meg a helyét.

- célja könyvtári szempontból: Ha elfogadjuk Krippendorff érveit, akkor sohasem „a” tartalmat fogjuk közvetíteni,

hanem mindig egy aktuális rendszerben – nevezzük ezt információs rendszernek – tartalomnak tekinthető szövegjelentést.

Abban a pillanatban, hogy más információs rendszerbe kerül a szöveg, adott esetben teljesen más is lehet a „tartalom” tartalma.

Ezen a gondolatmeneten tovább haladva kell tehát meggondolni az információs rendszerek közötti adatcserének, egymás elemzései kölcsönös felhasználásának a problematikáját.

IV. Természetes nyelven alapú osztályozási és indexelési eljárások

- Az ismérvek egyértelmű jelölése a kulcstényező - a nyelvi sokszínűségből eredő

bizonytalanságokat ki kell küszöbölni (homonímia, szinonímia stb.). - A téma egyediségének, újdonságának felmutatására lehetőséget ad.

Page 6: A.9 tartalmi feltárás

- Az ismérvek összefüggéseinek (tematikai, logikai) jelzésére a szótárban kiépített utalórendszer szolgál.

- Az indexelés szolgálja az egyedi ismérvek leírását. - A nyelvi alapú osztályozás során a dokumentumok információtartalmát valamely –

természetes nyelvhez hasonló – nyelv segítségével írják le. - A nyelvi alapú osztályozási rendszer rendelkezik a nyelvre jellemző kritériumokkal:

rendelkeznek a szavaknak, kifejezéseknek, szószerkezeteknek egy halmazával (szókincs-szókészlet), e kifejezésekhez jelentés kötődik (szemantika-jelentés), továbbá e kifejezések használati szabályaival arra vonatkozóan, hogyan lehet ezeket összekötni (szintaxis-nyelvtan, használati szabályok).

- A hierarchikus információkereső nyelvek és az ezekre épülő katalógusok bonyolultsága és bizonyos előképzettséget feltételező használata, valamint a specifikusabb kifejezések szerinti keresési igények folytán szükségszerű elvárásként alakult ki a természetes nyelv használata információkereső nyelvként. A nyelvészeti irányzat legelső, legnagyobb hagyományokkal rendelkező osztályozási eljárásai a tárgyszavas rendszerek.

- Előnye: nem igényelnek előzetes felkészülést, vagyis az ilyen nyelvekre épülő katalógusokban

vagy gépi rendszerekben „mindenki tud keresni”. - Hátránya:

a természetes nyelv eredeti állapotában nem, vagy kevéssé alkalmas információkeresés céljaira. Ezért szükség volt bizonyos megalkuvásokra, másrészt a természetes nyelvet bizonyos mértékig szabályozó vagy legalábbis kiegészítő megoldásokra. Ennek eredményeként létrejövő információkereső nyelveket mellérendelő nyelveknek, a gyakorlatban pedig tárgyszavas nyelveknek nevezik. Fő sajátosságuk a fogalmak közti értelmi, jelentésbeli összefüggések rögzítése, valamint, hogy ABC sorrendben lehet keresni. Negatív hatás: a nyelv sajátossága (sokszínű, változatos nyelv).

Kulcsszó: a cím valamely szava (a névelőt kivéve). Léteznek stop vagy tiltott szavak (például azért, hogy ne lehessen keresni az „és”-re és a „hogy”-ra).

- Kulcsszó problémái: (példák) o angol címe van, de magyarul keresek o nem a keresett témáról szól a könyv o csak szám a címben

Szövegszó: a teljes szövegből (szöveg testből) származó szó. Kulcsszóból szabályozás útján lesz tárgyszó. Tárgyszó: szabályozott nyelvi eszköz (szabályozott információkereső nyelv). A dokumentum, információ, szöveg lényegének leírására kiválasztott tömör és egyértelmű kifejezés. Szabályozott: (formailag és tartalmilag)

Formai: mindig főnév Ragozatlan főnév Egyes számú főnév (kivétel gyűjtőnevek)

Tartalmi: Tárgyszójegyzékbe gyűjtjük a tárgyszavakat Tárgyszócikként jelennek mega szavak Tárgyszó és kapcsolataiból áll

Természetes nyelven alapuló

Page 7: A.9 tartalmi feltárás

Mellérendelő Rugalmas, bővíthető Biztosítja a több szempontú feldolgozás és visszakeresés lehetőségét Elvárások a tárgyszavas osztályozással szemben:

- az adott szakterület teljes egészét lefedje a tárgyszókészlet hézagmentesen, de átfedésesen

- a jelölt (fogalom vagy valóságos dolog) és a jel (szókép, nyelvi alak) között egyértelmű megfeleltetést kell biztosítania (a megnevezés mindenkinek ugyanazt a fogalmat takarja)

A tárgyszavas osztályozás feladatai: - tárgyszavakkal leírja a dokumentumot, objektum lényeges vonásait - tárgyszavak rendje határozza meg a tárolási rendszer szerkezetét - alkalmas a keresőkérdések kifejezésére Szószerkezetek: többletjelentést hordoz az összetétel, mint maguk az elemek. TAUBÉ – UNITERM rendszer: egyszavas tárgyszórendszer: sok rossz összetétel, fölösleges találatok. Szabad tárgyszavazási eljárás: nincs kötött tárgyszójegyzék, 5-6 szóban leírják a tartalmat. Szinonimák esetében egyet kiválasztunk tárgyszónak, a többi nem tárgyszó (a többinél utalunk rá). Egységes szempont alapján döntünk például: hivatalos, többen használják. Kvázi szinonima: a szó nyelvtani értelmében nem szinonima csak hasonló kifejezés (pl.: jogszabály-törvény) Homonima: azonos alakú szavak (pl.: levél). Egy kifejezés hangalakja több jelentést hordoz. Ilyenkor értelmezőt kell használni. (pl.: daru- élőlény, daru- emelőszerkezet) A tárgyszavak közötti lehetséges kapcsolatok: H- helyette L – lásd LM – lásd még Példa Tárgyszó Burgonya H: nem tárgyszó H: krumpli Pityóka Nem tárgyszó Krumpli L: tárgyszó L: burgonya Pityóka Specifikus tárgyszó-elv: azt a kifejezést használjuk, amely az egyedi, specifikus szintet képviseli. A tárgyszó-rendszerekbe hivatkozásokat építenek be, hogy kielégítsék mind az egyedi, mind az átfogóbb témában keresők igényeit. Általában lefelé hivatkoznak, a generikustól a specifikus felé halad (a lásd még utalással, pl.: vallás LM: kereszténység). Specifikustól a generikusig: pl.: pénz LM: fizetőeszköz, pénz LM: hitelügy, pénz LM: hamisítás). A lásd még utalást mindig oda-vissza kell feltűntetni. A tárgyszójegyzék szótári és szakcsoportos részekből áll. A tárgyszójegyzéknek tartalmaznia kell a használati szabályzatot is (gyűjtőkör, felépítés, indexelés, stb.). A tárolási szerkezetét a tárgyszavak sorrendje határozza meg. A dokumentumok a tárgyszavak betűrendjében válnak kereshetővé. A legtöbb tárgyszórendszer igyekszik valamilyen struktúrát is bevinni a tárolási szerkezetébe. A tárgyszókatalógus lehet: tiszta (mechanikus, betűrendes, klasszikus)

Page 8: A.9 tartalmi feltárás

rendszerező (átfogóbb tematikus csoportokból áll) Bokrosító: a tárgyszavak egy részét felbontja részfogalmakra, alárendelt fogalmakra és

ezeket azután ismét formai jegyek alapján betűrendbe rendezi. Alárendelő: a tárgyszavak elrendezése, tárolása fogalmi szintek kiépítésével történik.

A 20. század 50-es éveitől jelentek meg az indexek: számítógéppel előállított tájékoztatási eszközök, valamint az indexművek: a dokumentumok név és tárgymutatóiból fejlődtek ki. A címindexeknél jelent meg először a tisztán természetes nyelvű osztályozás, amit kulcsszavas osztályozásnak nevezzük. Az indexek a dokumentumok tartalmát és egyéb jellemzőit leíró szóláncok- index tételek – rendezett gyűjteményei. Léteznek kulcsszó, ill. tárgyszó-indexek. Kulcsszó származhat a dokumentum címéből (címindex) vagy a dokumentum szövegéből. Utóbbi két legelterjedtebb típusa a KWIC és a KWOC. Kulcsszóindex: a tartalomjegyzékekben szereplő cikk címekből index (a nyomtatott folyóiratok világa) kétféle típusa: 1. KWIC = Key word in context Minden szónál betűrendben lehet keresni. 2. KWOC = Key word out of context Előre ki van emelve a keresett szó. Permutált tárgyi index: a besorolás, elérés kérdését a tárgyszólánc elemeinek ciklikus permutációjával oldják meg. Az első helyen álló tárgyszót mindig követi a tárgyszólánc többi eleme is. Lánceljárásos tárgyi index: a lánc elemei különböző fogalmi szinteken helyezkednek el. A tárgyszavak rendezése a specifikustól a generikus felé haladó sorrendben. Az első helyre kerülő elem után mindig csak az eredetileg is utána következő elemeket adjuk meg. Ma már ritkán alkalmazzák. PRECIS (preserved context indexing system=szövegösszefüggést megtartó indexelési rendszer). D. Austin dolgozta ki. A PRECIS grammatikai szabályok összessége. Első lépésként megalkotják a dokumentum lényegét leíró mondatot. Majd az egyes szavaknak a mondatban betöltött szerepét egy speciális jelrendszer segítségével rögzítjük. Végterméke egy számítógéppel ellátott permutált index. A permutálás során az osztályozási kifejezések sorrendje mindig megtartja a természetes nyelvi mondat szórendjét.

V. Szöveges ismertetők, tartalmi összefoglalók (annotáció, kivonat, referátum stb.)

1) Annotáció

Rövid terjedelmű ismertetés, amely a dokumentumot jellemzi, a mű tartalmára, szerzőjére, rendeltetésére, formájára, keletkezési körülményeire, vagy egyéb sajátosságaira vonatkozik.

Általában a bibliográfiai adatok után következik megjegyzés formájában.

Segíti annak eldöntését, hogy az eredeti dokumentum releváns vagy sem.

Ismertető vagy ajánló jellegű lehet, tartalmazhat ítéletet is.

Nem kell megfelelnie a szövegszerűség valamennyi kritériumának. 2) Recenzió

Röviden leírja a szöveg tartalmát, de kifejezi a recenzor véleményét is.

Page 9: A.9 tartalmi feltárás

Nem kritériuma az objektivitás.

Fontos eleme az értékelés.

Célja elsősorban a figyelemfelkeltés. 3) Kivonat

Az elsődleges dokumentumból vett részek szó szerinti, átalakítás nélküli kiemelése.

Csak olyan mondatokat, kifejezéseket használ, amelyek az elsődleges dokumentumban is előfordulnak.

Előállítása viszonylag könnyen automatizálható.

Az eredeti dokumentummal megegyező nyelven kell készülnie. 4) Összefoglalás

Nem önálló műfaj

Állhat akár az eredeti szöveg végén, mintegy annak részeként, de más szövegekbe ágyazva is.

Célja nem az, hogy az olvasónak segítsen az eredeti szöveg relevanciájának eldöntésében, sokkal inkább az összefoglalás és a szöveg elhelyezése a kutatási eredmények rendszerében.

5) Témadokumentáció

Egy adott témára vonatkozó dokumentumok kivonatainak gyűjteménye.

Válogat a téma irodalmából, és annak minden fontos elemét feldolgozza.

Nem csak az olvasásra, de a keresésre fordított időt is lerövidíti. 6) Szakirodalmi szemle

Önálló szerkezetben foglalja össze a témára vonatkozó valamennyi lényeges információt, több dokumentum együttes feldolgozásával.

A legmagasabb szintű szolgáltatások egyike. 7) Referátum

A dokumentum (vagy része) tartalmának – a legfontosabb adatokra, tényekre és következtetésekre kiterjedő – olyan rövid ismertetése, amely felhívja a figyelmet az új ismeretekre, és lehetővé teszi annak eldöntését, hogy célszerű-e tanulmányozni a dokumentumot.

A referátum természetes nyelvi, önállóan is megálló szöveg, amely megfelel a szövegszerűség kritériumainak (kohézió, koherencia, szándékoltság, elfogadhatóság, hírérték, helyzetszerűség, intertextualitás)

A referátum írott szöveg, amely különféle hordozókon jelenhet meg.

A referátum másodlagos dokumentum.

A referátum információs célokra létrehozott szöveg.

VI. Tezaurusz

- A szemantikai információkereső nyelvek lexikai egységeit („tárgyszavait”), vagyis a valamely fogalom leírására, képviseletére kiválasztott szavakat vagy kifejezéseket deszkriptoroknak, szótáraikat pedig tezauruszoknak nevezzük.

- Az információs tezaurusz, mélyebb feltárást tesz lehetővé. Mely egy-egy szakterület természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható szótára, amely feltünteti a fogalmak közötti legfontosabb logikai kapcsolatokat.

Page 10: A.9 tartalmi feltárás

- Alapvető követelmény a tezaurusszal szemben, hogy az adott szakterület valamennyi lényeges fogalmát tartalmazza, a szakterület teljes lefedését biztosítsa, és bővíthető is legyen.

- A tezaurusz részei: o deszkriptor,(L): A deszkriptor az információk leírására és keresésére közvetlenül

alkalmazható. A deszkriptor általában egyes számú főnév, kivéve gyűjtőnevek, illetve többes számú főnév, ha az jelentésében eltér az egyes számú alaktól. A deszkriptor lehet önmagában álló szó, összetett szó, több szóból álló kifejezés.(Kerüljük az invertálást!)

o o nemdeszkriptor,(H): A nemdeszkriptor a deszkriptor szinonim kifejezése, mely az

információk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe vételével használható.

o reláció: A relációk kimunkálása kötelező (ebben különbözik más osztályozási rendszerektől).

- A tezaurusz felépítése:

o Bevezetés, o Főrész, o Jelentéskörök szerinti rész, o hierarchikus rész, o grafikus rész, o betűrendes mutatókkal kiegészülhet

A Bevezetésben feltüntetjük a tezaurusz célját és felhasználási területét. Leírjuk a készítési módját, a mennyiségi jellemzőit és a javításának, módosításának módját. A főrész deszkriptor- és nemdeszkriptorcikkekből áll betűrendes elrendezésben. A deszkriptorcikk a vezérdeszkriptorból és a vele közvetlen kapcsolatban álló deszkriptorokból épül fel, illetve feltünteti a kapcsolat jellegét is. A nemdeszkriptorcikk a nemdeszkriptorból és a helyette álló deszkriptorból áll. A jelentéskörök szerinti rész kidolgozása azt a célt szolgálja, hogy a tartalmilag összetartozó deszkriptorokat egy helyre gyűjtsük össze. Egy-egy átfogó fogalom alatt betűrendben megadjuk a jelentés szerint hozzátartozó deszkriptorokat. A hierarchikus rész célja, hogy a relációtípusokat kiemelve, kiépítse a deszkriptorok közti teljes hierarchiát az általános fogalomból kiindulva a specifikusig. Épülhet fogalmi hierarchiára (alá-fölérendeltség), de létrehozható az egész-rész szerkezeti reláció alapján. (Tranzitív relációk) A grafikus rész a tezauruszban feltárt ismeretág, szakterület legfontosabb fogalmait és azok relációit grafikus ábrákban mutatja be. Nem kötelező A betűrendes mutatót akkor kell alkalmazni, amikor valami kimaradt a főrészből.) Szinonimának tekinthető az a kifejezés, amely maradéktalanul helyettesíti a másikat. Tezauruszban szinonimaként kezeljük az idegen nyelvű kifejezést és a magyar megfelelőjét, a tudományos és köznapi megnevezéseket, a fogalom különböző alakváltozatait, a fogalom rövid és teljes alakját, illetve a kvázi szinonimákat (a szó nyelvtani értelmében nem szinonimák). Szinonimák jelölése: L (lásd), H (helyettesíti) utalókkal. Homonimák: a többjelentésű szavak jelentésbeli megkülönböztetésére értelmezőt használunk: Pl.: TOLL (íróeszköz) TOLL (madártoll)

Page 11: A.9 tartalmi feltárás

Szócikk:

– a szabványok mögött ott áll mindig egy jegyzék (pl.: ETO mögött a táblázatok) – a szó a hozzá kapcsolódó szavakkal jelenik megtárgyszócikk – a szinonimák közül egyet kell kiválasztani tárgyszónak, a többi nem tárgyszó – egységes szempontot kell találni – attól függ, hogy milyen közönség használja – pl.: Burgonya H: krumpli

Krumpli L: burgonya TEZAURUSZ-RELÁCIÓK: A RELÁCIÓK MINDIG KÉTIRÁNYÚAK!!!

– ALÁ-FÖLÉRENDELTSÉG: Ha A fogalom teljes terjedelmében beletartozik B fogalomba, akkor azt mondjuk, hogy A alárendeltje(a) (faja, speciese) B-nek. Az alárendelt fogalom tartalma gazdagabb, több ismertetőjegyet tartalmaz, mint a fölérendeltje(b), de terjedelme kisebb. Mindig csak a közvetlen alá- ill. fölérendeltet adjuk meg. Egy deszkriptornak lehet több alá- és fölérendeltje különböző szempontok szerint.

– EGÉSZ-RÉSZ: Az egész-rész reláció a fogalmakban általánosított tárgyak, objektumok fizikai, szerkezeti kapcsolata. A rész(p) nem rendelkezik azokkal a tartalmi jegyekkel, mint az egész(T), az egész pedig mindig több mint részeinek összessége. Mindig csak a közvetlen részt ill. egészet adjuk meg. Egy deszkriptornak lehet több része és egésze különböző szempontok szerint.

– OK-OKOZAT, FELTÉTEL ÉS ELŐFELTÉTEL: Az ok, előfeltétel( E), ezt csak olyankor használjuk, mikor egyértelmű a mi a következmény, okozat( R)=rezultáns

– ROKON KAPCSOLATOK (x) Gyűjtőfogalom, több különböző kapcsolattípust foglal magában. Ezek a kapcsolatok lehetnek szimmetrikusak (ellentét, hasonlóság, korreláció, stb.), és asszimetrikusak (rendeltetés, eszköz, produktum, tulajdonság, stb.)

Az adatbázisokról – csak segítség, nem kell szó szerint tudni A jó adatbázis hatóköre

- Ki kell elégítenie egyéni használó, illetve egy könyvtár vagy intézmény használóinak érdeklődését. Pl.: speciális témák: Climbing Database (hegymászók adatbázisa) és a kiváló Biographies of Women Mathematicians (matematikusnők életrajzai)

- El kell róla dönteni, hogy általános vagy sem: Vannak problémák az általános jellegű adatbázisokkal. Mert kiderül, hogy mégsem olyan általános mégsem található benne minden tudomány.

- Megfelelő keresési szűrők lehetnek: o Téma/tárgy szerinti keresés, nyelv és dokumentumtípus szerinti feltártság, feltárt

időtartományt, címindexek, kulcsszó szerinti keresés o Egyáltalán nem mindegy, hogy egy magát informatikai adatbázisnak definiáló

tartalomszolgáltató témáiban, tárgy szavaiban és kulcsszavaiban szerepelnek szakkifejezések vagy csak helyenként, vagy hogy a szakkifejezések elavultak e vagy sem. Ugyancsak figyelni kell az időtartományra, valószínűleg nem lesz kurrens azaz orvostudományi vagy informatikai adatbázis, melyben a publikációk az 1990-es évekből származnak.

o Témák keresése esetében nem mindegy, hogy melyik nyelvterületen, melyik szót használjuk. Az amerikai szerzők elsődlegesen a postpartum depression kifejezést

Page 12: A.9 tartalmi feltárás

használják, európai és brit nemzetközösségből származó szerzők gyakran a puerperal depression kifejezést preferálják. Ebből következően az előbbi kifejezés használata előnyös a MEDLINE számára az EMBASE-zel szemben (amelynek szélesebb az európai forrásbázisa), a második fogalom esetén fordított a helyzet.

Az adatbázis dimenziói Méret: A legnagyobb nem egyenlő a legjobbal. Ami számunkra fontos egy példával lehet elmondani: A legnagyobb orvosi adatbázis, amely nem dolgozza fel Kelet-Ázsia folyóiratait a megfelelő mértékben, nem lehet a legjobb annak a számára, aki ennek a régiónak a fejlődéséről vagy klinikai jelentéseiről keres információt. Időbeliség: Retrospektivitás jó lehet annak, aki humántudományokkal esetleg társadalomtudományokkal foglalkozik, rossz egy természettudósnak, orvosnak, informatikusnak, műszaki szakembernek. Mélység: Pusztán az, hogy egyes folyóiratok jelen vannak az adatbázisban, nem garantálja, hogy megfelelő mértékben fel is tárják azokat. Problémák: elkezdik a feltárását a folyóiratnak, de nem fejezik be. A folyóirat közben nevet vált, de az adatbázis készítői nem jelölik az eredeti nevével történő utolsó kiadását. Hozzájutási nehézségekre való hivatkozás: drága a folyóirat, túl messziről érkezik, késve kapják meg. Frissesség: Az adatbázisok frissessége arra utal, hogy a primer dokumentumok megjelenése után milyen gyorsan válik elérhetővé egy rekord CD-ROM vagy online adatbázisban. Azok a webes adatbázisok, amelyeket közvetlenül a fájlok előállítói szolgáltatnak, drámai módon növelik az adatbázisok naprakészségét, mivel a közvetítő, az adatbázis kiadója kiiktatódik. Napilap adatbázisok teljes szövegű változat valószínűleg közvetlenül bekerül az online szolgáltatásba, mielőtt a nyomtatott változatokat elkezdenék kinyomtatni. Azoknál az adatbázisoknál, amelyek indexkifejezéseket adnak az újságcikkek rekordjaihoz vagy referátumokat szolgáltatnak (mint például a Bell & Howell cég Newspaper Abstracts Daily című szolgáltatása), valószínűleg nagyobb a lemaradás. Frissítések mennyisége Kurrens információ iránti igény Egyéb tényezők Pontosság Az adatbázisból visszakeresett információk pontosságát gyakran természetesnek veszik. A helyesírási hibák és elírások pontatlanságok legáltalánosabb típusai. Pl.: Szerzői nevek és címjegyzékek

Page 13: A.9 tartalmi feltárás

A nevek esetében még a kicsit szokatlan név is problémát okozhat: előtagok (pl. von), szokatlan nevek, az előtagok hátravetése szétszórja nevüket az indexben. Teljesség Egy adott adatbázisban szereplő rekordokról kereshető információk mennyire teljesek vagy hiányosak. Bár a sok adatelem szerint lehet keresni, de a nagyméretű kihagyás nem vezet eredményhez. Basch (1990a) állapítja meg, hogy a kihagyások vagy az üresen hagyott mezők gyakran eredményezik azt, hogy a kereső nem jut hozzá releváns rekordokhoz. Pl.: Az ERIC-ben például nincs figyelmeztetés arra, hogy a dokumentumtípus mezőt a rekordok 28%-ában kihagyták, de van egy megjegyzés arról, hogy a nyelvet csak 1979-től adták meg. Nagyon kevés olyan adatbázis van, amely legalább világossá teszi az adatelemek kihagyását a keresési folyamat során. A formátum és a tartalom következetessége

- Azért fontos a következetesség, mert ha nem mindig ugyan úgy használjuk a rövidítéseket vagy jelzőket, akkor megnehezíthetjük vele a felhasználó keresését és a releváns találatok száma sem lesz egyértelmű.

- Példák o ERIC adatbázis három különböző formát használ U. S. News & World Report

hetilapból felvett 37 cikkhez. (& helyett and, feloldja a U.S.-t stb.) - A következetlenségek abból is származhatnak, hogy a különböző primer forrásoknak

eltérő a gyakorlatuk - például a szerzők második vagy harmadik keresztnevének rövidítésére. Maguk a szerzők is következetlenül használhatták őket a különböző publikációkban.

- A folyóiratcímeket még a szerzői neveknél is következetlenebbül alkalmazzák a változatok sokféle lehetősége miatt.

o Pl.: Ezek a következők: A kiadó testületek rövidítéseinek és teljesen kiírt változatainak

használata, A címben szereplő szavak közül soknak a rövidítése, az alcímek ötletszerű

felvétele és kihagyása, Az and és and of következetlen kihagyása, helyettesítésük az & és a

kötőjel (-) karakterekkel, nem említve a kiadás helyével való kiegészítést, hogy megkülönböztessék egymástól az egyébként teljesen azonos folyóiratcímeket

A referátumok minősége

- A referátum az eredeti cikk rövid (150-250 szavas) összefoglalását jelenti. - A jó referátumok segíthetnek a használóknak annak kiválasztásában, hogy melyik

dokumentumot olvassák el a maga teljességében. - 3 típus: csak ismétlés

o Indikatív referátum: utalhat a forrásdokumentumok (folyóiratcikkek, szabadalmi leírások, kongresszusi meghallgatások, könyvek, filmek) tartalmára.

o Informatív, amely közvetlenül bemutatja a forrás specifikus információinak egy részét, összefoglalja a tartalmat.

Page 14: A.9 tartalmi feltárás

o Kritikai referátum, amely az összefoglalást a referáló, a szakterület specialistája értékelő és kritikai kommentárjaival egészíti ki.

- A jó referátumok kitűnő szűrők lehetnek a keresés folyamatában.

A tartalmi reprezentáció eszközeinek vizsgálati szempontjai

Mennyiség - a tartalmi feltáró eszközök száma Az ismérvek forrása Jelölés A tartalmi feltáró ismérvek specifikussága Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok Mennyiség - a tartalmi feltáró eszközök száma

(A tartalomra utaló információt hordoz- csak magamnak)

Az ismérvek lehetnek:

- Függetlenek, amelyek önállóan szerepelnek (pl. deszkriptorok, osztályozási jelzetek, tárgyszavak, kiemelt tartalmi jellemzők, dokumentumtípusok)

- Függhetnek egy másik ismérvtől - módosítják annak jelentését, illetve további információkat adnak a kontextusra vonatkozóan (pl. súlyozás, minősítők, altárgyszavak).

Az ismérvek forrása A tartalmat reprezentáló ismérvek:

- dokumentum szövegéből (pl. első bekezdés, kulcsszó) - vagy külső forrásból származhatnak.

o Külső forrás lehet: szótárak, tárgyszójegyzékek, tezauruszok, egyéb ellenőrzött listák, referátum

Minél specifikusabb egy adatbázis, annál több ellenőrzött listát alkalmaz. A kemény tudományoknál használják a legtöbb ellenőrzött szótárat. A teljes szövegű adatbázisok is szép számmal alkalmaznak szabályozott jegyzékeket.

Jelölés

Hogyan jelölik az egyes adatbázisok a tartalmi ismérveket?

Kétféle jelölés:

- Természetes nyelv közvetlenül informál a témáról - Kód megmutatja az ismérv rendszerben elfoglalt helyét, s közvetlen, szisztematikus

keresést tesz lehetővé

A tartalmi feltáró ismérvek specifikussága Beszélhetünk generikus (átfogó fogalmi kategóriákat lefedő) és specifikus (a téma egyediségét megadó) eszközökről. A kettő között nehéz meghúzni a határvonalat, csak egy adatbázison belül lehet eldönteni egy-egy ismérvről, hogy generikus-e vagy specifikus.

Page 15: A.9 tartalmi feltárás

Adatbázisokban a tartalmi ismérvek külön adatmezőkben jelenhetnek meg:

- Ilyen kiemelt tartalmi elemek lehetnek például a személynevek, földrajzi nevek, anyagnevek, kémiai elnevezések, speciális jellemzők.

A generikus kategóriák származhatnak osztályozásból, vagy lehetnek tárgyszó jellegűek. Specifikus osztályozást csak ritkán alkalmaznak, ilyeneket leginkább a kemény tudományok adatbázisainak némelyikében találni.

A kemény tudományok adatbázisaiban a specifikus tárgyszavazás és a kiemelt ismérvek a legjellemzőbbek. A puha tudományoknál a specifikus leírás (deszkriptorok, szabad tárgyszavak) bizonyulnak a leghatékonyabb tartalmi feltáró eszközöknek.

Szövegösszefüggés - a tartalmi feltáró eszközök közötti kapcsolatok Hogyan tükrözi az adatbázisok feltáró rendszere az eredeti szövegbeli kontextust?

- A legáltalánosabb a szöveges ismertetők, összefoglalók alkalmazása (pl. referátumok, kivonatok). A téma ismérvei és azok forrásbeli viszonyai természetes nyelvi kontextusban jelennek meg.

- Ugyanezen az elven alapul az az eljárás, amelyben kulcsszóként mondatszerű kifejezéseket adnak meg (key phrase).

- Egy másik lehetőség, hogy az ismérveket aszerint csoportosítjuk, mennyire meghatározóak, mennyire hangsúlyosak az adott forrásban. Az ismérvek súlyozása nagyon kedvelt a bibliográfiai adatbázisokban (pl. major/minor descriptors).

EGY VÁLASZTOTT ADATBÁZIS ELEMZÉSE!!!! Szempontok

1. Milyen témaköröket dolgoz fel az adatbázis?

2. Milyen időhatárok közötti dokumentumok találhatók meg az adatbázisban?

3. Melyek azok az adatmezők, amelyek tartalomra utaló információkat hordoznak? Hogyan

lehet ezekben a mezőkben keresni?

4. Jellemezze az egyes tartalmi feltáró eszközöket az IKNY-ek tanult tipológiája szerint.

Tartalmi

informáci

ót

hordozó

adatmező

Szabályo-

zottság

Osztályozási

módszer

Mélység szerkezet

igen nem hierar-

chikus

mellé-

rendelő

individu-

alizáló

genera-

lizáló

prekoor

-dinált

posztkoo

r-dinált

5. Értékelje az adatbázis tartalmi feltárását saját keresési tapasztalatai alapján.