Problematika velkého indexu

Post on 03-Jan-2016

49 views 3 download

description

Problematika velkého indexu. Martin Vojnar vojnar@multidata.cz. Obsah. předehra: jednotné prostředí velký index vs. metavyhledávání vytváření velkého indexu a jeho vlastnosti velký index a český obsah malá úskalí velkého indexu praktické ukázky otázky / diskuse. 1a: jednotné prostředí. - PowerPoint PPT Presentation

Transcript of Problematika velkého indexu

Problematika velkého indexu

Martin Vojnarvojnar@multidata.cz

2 Problematika velkého indexu, 30.3. 2011

Obsah

• předehra: jednotné prostředí• velký index vs. metavyhledávání• vytváření velkého indexu a jeho vlastnosti• velký index a český obsah• malá úskalí velkého indexu• praktické ukázky

• otázky / diskuse

3 Problematika velkého indexu, 30.3. 2011

1a: jednotné prostředí

4 Problematika velkého indexu, 30.3. 2011

Jednotné prostředí

• pro vyhledávání informací a dokumentů• pro dodávání informací a dokumentů• pro objevení nového

• používáte ho každý den

• ukázka

5 Problematika velkého indexu, 30.3. 2011

Proč ?

• v rámci vyhledávání a dodávání informací zahájily před ca 5 lety nástup nové nástroje

• byly původně označovány jako katalogy nové generace (next-gen OPACs)

• postupně se vyvinuly v tzv. „discovery“ systémy

• jejich hlavní důraz je kladen na koncového uživatele, jeho potřeby a prostředí, samostatnost a spokojenost

• užitečný nástroj v kontextu informační gramotnosti

6 Problematika velkého indexu, 30.3. 2011

Cíle jednotného prostředí

• každý dotaz musí být prováděn ve všech zdrojích knihovny (tištěné, elektronické, digitalizované, …)

• výsledky jsou zobrazeny v jedné výsledkové množině s jednotnou relevancí a s úplnou navigací

• zobrazení plného textu na jedno kliknutí• podpora SSO, integrace objednávání a čtenářského

konta

7 Problematika velkého indexu, 30.3. 2011

Co není jednotné prostředí

• pokud uživatel musí přecházet do jiných systémů• pokud se musí uživatel opakovaně přihlašovat• pokud uživatel ztrácí kontinuitu svého vyhledávání• pokud uživatel musí začínat v „discovery“ systému

(příklad)

• pokud rozhraní nenabízí jednotné výsledky• pokud rozhraní neumožňuje začlenění libovolného

zdroje

8 Problematika velkého indexu, 30.3. 2011

1b: „discovery“ systémy

9 Problematika velkého indexu, 30.3. 2011

Očekávání ze strany uživatelů*

• rychlé, jednoduché, intuitivní používání• jediné rozhraní• navigace pomocí faset• DYM, návrhy/našeptávání• RSS• pokrytí relevantního obsahu

• základní přehled „discovery“ systémůhttp://www.librarytechnology.org/discovery.pl

*Marshall Breeding

10 Problematika velkého indexu, 30.3. 2011

Přidaná hodnota „discovery“

• jedno společné rozhraní = méně práce s lepším výsledkem

• konec informačního přehlcení díky:

• konfigurovatelné relevanci (zlato vs. šum)• personalizaci výpočtu relevance• seskupování výsledků (FRBR)• doporučení

• zapojení uživatelů• integrace s jejich prostředím• komentáře / hodnocení• čtenářské konto• sledování novinek• virtuální knihovnička

11 Problematika velkého indexu, 30.3. 2011

Typické zdroje pro „discovery“

• knihovní fond• licencované databáze• volně dostupné dokumenty a data (open access)• digitální knihovny• institucionální repozitáře … a další dle potřeb

uživatelů

• různé formáty, různé oprávnění, různé instituce, různý význam

• discovery také může být zdrojem pro vyšší třídu vyhledávačů

12 Problematika velkého indexu, 30.3. 2011

UIdiscovery

discovery index

13 Problematika velkého indexu, 30.3. 2011

UI discovery

discovery index obsahuje různé zdroje

14 Problematika velkého indexu, 30.3. 2011

UI discovery

včetně elektronických zdrojů

15 Problematika velkého indexu, 30.3. 2011

16 Problematika velkého indexu, 30.3. 2011

Anatomie vyhledávání

• index lokálních zdrojů• index elektronických zdrojů (tzv. velký index)

• paralelní vyhledávání (tzv. metavyhledávání) – více v kapitole 2

• externí vyhledávání (sám sebe, Solr, API, …)

• zadávání dotazů a jejich typy

17 Problematika velkého indexu, 30.3. 2011

1c: ukázka ~ Primo od Ex Libris

18 Problematika velkého indexu, 30.3. 2011

Ukázka systému Primo (naživo později)

• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost

• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)

• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu

• webové rozhraní pro administrátora

19 Problematika velkého indexu, 30.3. 2011

1d: konec úvodu

20 Problematika velkého indexu, 30.3. 2011

Výzva pro knihovny

• sjednocení vyhledávacího prostředí• sjednocení služeb na něj navázaných

• výsledek:• efektivnější využívání zdrojů knihovny• častější využívání zdrojů knihovny• získání nových uživatelů• opakované využívání zdrojů knihovny

21 Problematika velkého indexu, 30.3. 2011

UI discovery

včetně elektronických zdrojů

ukázka: video

22 Problematika velkého indexu, 30.3. 2011

2: velký index vs. metavyhledávání

23 Problematika velkého indexu, 30.3. 2011

Změna filozofie velkého indexu

• paralelní vyhledávání = ve sbírkách• velký index = v obsahu

• oddělení fáze vyhledávání a dodávání

• nepřihlášeným uživatelům:• povoleno obojí• povoleno jen vyhledávání• není povoleno ani vyhledávání

• dodávání na základě elektronických holdingů (dostupnost)

24 Problematika velkého indexu, 30.3. 2011

Příklad dostupnosti

• např. ve formátu pro Google Scholar

<item type="electronic"> <sfx_id>954921333005</sfx_id> <object_type>JOURNAL</object_type> <title>Abacus</title> <title>ABACUS A JOURNAL OF ACCOUNTING FINANCE AND BUSINESS

STUDIES</title> <title>ABACUS OXFORD</title> <issn>0001-3072</issn> <eissn>1467-6281</eissn> <coverage> <from> <year>1965</year> </from> <to></to> <embargo> <days_not_available>365</days_not_available> </embargo> </coverage> </item>

25 Problematika velkého indexu, 30.3. 2011

Pro uživatele Metalibu

• význam paralelního vyhledávání

• velký index jako cíl v paralelním vyhledávání (obrat 180°)

• paralelní vyhledávání jako doplňková metoda přístupu v UI rozhraní velkého indexu

• příklad

26 Problematika velkého indexu, 30.3. 2011

3: jak vzniká velký index

27 Problematika velkého indexu, 30.3. 2011

Plnění velkého indexu

• Ex Libris vs. tradiční agregátoři• open aktivity v rámci JISC (RDTF, KBART, lis-oss aj.)

• smlouvy s poskytovateli různého typu (typicky na 3 roky)

• rozsah získávaných metadat:• základní metadata• + věcný popis• + abstrakt• + plný text

28 Problematika velkého indexu, 30.3. 2011

Váš obsah ve velkém indexu (dnes)

• sbírky vs. tituly• profil velkého indexu• dostupnost na úrovni instituce

• analýza procentuálního zastoupení titulů• počet elektronických titulů (ISSN/ISBN/název)• počet předplácených titulů• počet recenzovaných titulů

29 Problematika velkého indexu, 30.3. 2011

Váš obsah ve velkém indexu (zítra)

• plnění je nekonečný proces• řídí se podle cestovní mapy (ukázka)

• nikdy nebude 100%-ně úplný• nikdy nebude 100%-ně aktuální

• petice IGELU

30 Problematika velkého indexu, 30.3. 2011

Důraz na otevřenost velkého indexu

• během plnění (open discovery)• jeho obsahu (open access, open data)• jeho dostupnosti (open platform)• zařazení do jiných rozhraní (open source)

• v budoucnu lze očekávat i kombinování více velkých indexů (např. lokální/globální, více globálních apod.), bude-li úspěšně vyřešena normalizace relevance

31 Problematika velkého indexu, 30.3. 2011

Co je nejdůležitější na velkém indexu ?

• pokrytí• relevance• dostupnost• rychlost odezvy• neutralita• možnosti konfigurace (jaké?)

• jak moc je důležité pokrytí lokálního obsahu ?

32 Problematika velkého indexu, 30.3. 2011

4: český obsah ve velkém indexu

33 Problematika velkého indexu, 30.3. 2011

Dvě dimenze obsahu velkého indexu

• (nějaký) obsah je k dispozici online• dostupnost obsahu pro daného uživatele (tj.

instituci)

• jaký český obsah je k dispozici ?

34 Problematika velkého indexu, 30.3. 2011

Potenciál českého obsahu

• SK ČR, ANL, registr digitalizace• oborové bibliografie• národní digitální knihovny (M+K+W)• oborové digitální knihovny (DML-CZ)• NUŠL• placené zdroje

(Anopress IT, Newton Media, Infobanka ČTK, Beck online, ASPI, …)

• nová média: wiki, archivy vysílání, e-knihy• publikační činnost / výstupy VaV• nástroje pro podporu vzdělávání, doporučená

literatura• institucionální repozitáře

(DSpaceCZ, digitalizace KNAV ČR, …)

• a další (?)

35 Problematika velkého indexu, 30.3. 2011

Potenciál českého obsahu – pár čísel

• experiment v testovacím prostředí UK:• katalog + kvalifikační práce ca 1 mil. záznamů• ostatní ca 800 tis. záznamů, v tom:

• cswiki ca 200 tis. záznamů• manuscriptorium ca 200 tis. záznamů• ANL (online) ca 200 tis. záznamů• BMČ (online), BDÚ (online), ZPB (online),

GEOBIBLINE ca 60 tis. záznamů• DML-CZ a NUŠL ca 100 tis. záznamů• různé ca 50 tis. záznamů (Forum, Anopress IT,

Kramerius NKP, …)

36 Problematika velkého indexu, 30.3. 2011

Oborové bibliografie

• hlavní zdroj: oborové bibliografie• týká se ANL• týká se národních digitálních knihoven (K)• týká se institucionálních repozitářů (digitalizace

KNAV ČR)

• ukončení plnění ANL v NK ČR, udržování pro další knihovny

• průzkum stavu oborových bibliografií

37 Problematika velkého indexu, 30.3. 2011

Oborové bibliografie - výběr

38 Problematika velkého indexu, 30.3. 2011

Spojení českého obsahu

• opravdu na jednom místě

• praktické zkušenosti: jednání, vysvětlování, …• licencovaný obsah limitován předchozími smlouvami

• jak a kdo [bude chtít | by měl | může] tuto službu nabízet (knihovny vs. dodavatelé, licence, smlouvy, …)

• bylo by velmi vhodné zahrnout do strategie knihoven

• pár ukázek

39 Problematika velkého indexu, 30.3. 2011

5: ukázka ~ Primo od Ex Libris

40 Problematika velkého indexu, 30.3. 2011

Ukázka systému Primo

• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost

• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)

• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu

• webové rozhraní pro administrátora

41 Problematika velkého indexu, 30.3. 2011

6: shrnutí

42 Problematika velkého indexu, 30.3. 2011

Pár zajímavých odkazů

• přehled nejlepších v analýze „Web Scale Discovery Services“ (Jason Vaughan, obsah není volně dostupný)http://www.alatechsource.org/taxonomy/term/106/web-scale-discovery-services

• Federated Search blog (Sol Lederman)http://federatedsearchblog.com/2011/01/21/must-read-article-on-discovery-services/

• Informační gramotnost uživatelů vs. vyhledávací nástroje nové generace (Vilém Sklenák, ProInflow)http://pro.inflow.cz/informacni-gramotnost-uzivatelu-vs-vyhledavaci-nastroje-nove-generace

43 Problematika velkého indexu, 30.3. 2011

Jedno prostředí pro uživatele

• vyhledávací nástroje nové generace se na Vás tlačí

• velký index je toho součástí (jak moc je důležitý?)

• každý velký index jde svou cestou

• důraz na otevřenost

• jak velká míra kontrola ze strany knihovny je třeba?

44 Problematika velkého indexu, 30.3. 2011

Otázky / diskuze.vojnar@multidata.cz

45 Problematika velkého indexu, 30.3. 2011

Některé z otázek

• je velký index luxus ?• záleží na velikosti indexu ?• jak otestovat rozsah indexu ?• má smysl podpořit Open Discovery ?• co to stojí a kdo to platí ?• proč si to knihovny neudělají samy a lépe ?• jakou míru kontroly chci mít nad velkým indexem ?• jaké z mých sbírek jsou ve velkém indexu ?• jaké zdroje / jaký obsah by tam mí uživatelé rádi viděli ?