EZproxy Seminar Multidata
-
Upload
multidata-praha-sro -
Category
Technology
-
view
758 -
download
2
Transcript of EZproxy Seminar Multidata
Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha Mgr. Petr NovákKnihovna psychologie FF UK6.října 2009
Proč statistický modul?
OCLC (výrobce EZproxy) nabízí výčet různých nástrojů, komerčníchi freeware / OSS
Neposkytují podporu pro skupiny Neposkytují podporu pro různé způsoby
autentizace zdlouhavá práce s logy na pracovní stanici limity, nelze pracovat v dávkách
Statistický modul Autor RNDr. Vladimír Pávek Využívá XSLT procesor Saxon Vyžaduje Java Virtual Machine Otestováno na Windows 2003 server a Linux Testovací demo ke stažení z www.multidata.cz Konfigurace = editace XML souborů práce přímo na serveru EZproxy Generuje výstupy v ČJ a AJ
Skupiny v EZproxy
Jsou využívány: pro korektní autorizaci uživatelů dle součásti
instituce (fakulty a základní součásti na VŠ, zaměstnanci x čtenáři x testeři ve všech knihovnách)
pro generování log souborů využívaných pro statistický modul
předávány jsou různé kombinace skupin
Jak EZproxy ukládá logy Konfigurace v config.txt Ukládání v týdenních intervalech 2 druhy logů:
LogSPU -> spu%Y-%W.log= výchozí URL zdroje
Hlavní log -> ezp%Y-%W.log= kompletní komunikace uživatel-zdroj bez *.jpg a *.gif
Jak EZproxy ukládá logy - co se loguje IP adresa, uživatelské jméno, výčet skupin uživatele oddělený „+“, identifikátor session, datum a čas, kompletní HTTP request (např. GET
http://www.database.com HTTP/1.0), číslelný status HTTP žádosti (200 aj.), přenesená data v bajtech, (v případě hlavního logu ještě user-agent)
Ukázka SPU logu 70.108.162.87 johndoe Default+UNI+MEDICINE+Student
a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] "GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0
18.18.162.117 marysmith Default+UNI+LAW+Student
e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] "GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0
60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff
94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] "GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0
90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff
476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] "GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0
58.128.110.30 tracylong Default+UNI+COMPSCI+Student
6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] "GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0
Způsoby zpřístupnění elektronických inf. zdrojů Autentizace na IP adresu (poskytovatel
zdroje zařadí IP adresu EZproxy serveru na seznam povolených IP adres) = typ 1
Autentizace jménem a heslem (poskytovatel zdroje zašle autentizační data - uživ.jméno a heslo -, ta jsou zadána do EZproxy a uživatel se jimi transparentně autentizuje vůči skrytému formuláři = typ 2
Ukázka SPU logu 70.108.162.87 johndoe Default+UNI+MEDICINE+Student
a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] "GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0
18.18.162.117 marysmith Default+UNI+LAW+Student
e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] "GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0
60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff
94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] "GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0
90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff
476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] "GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0
58.128.110.30 tracylong Default+UNI+COMPSCI+Student
6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] "GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0
typ 1typ 1 typ 2typ 2
Rozdíl v logování
SPU log – srovnatelně zaznamená jak typ 1 (autentizace IP adresou), tak typ 2 (autentizace jménem a heslem)
Hlavní log - zaznamená kompletní komunikaci EZproxy se zdrojem dle typu 1, avšak pouhé otevření zdroje typu 2
-> jako zdroj pro statistiky využívanosti se hodí spíše SPU log, Hlavní log má doplňkovou funkci
Workflow práce se statistickým modulem – generování HTML výstupů Realizováno každý týden
Nakopírování čerstvého souboru LogSPU do /statistika (adresář se statistickým modulem)
Spuštění dávky Nakopírování výstupních HTML souborů do
požadované lokace – např. /docs/public (do této lokace lze obecně umístit jakékoli HTML a grafické soubory ke kterým není třeba ověřovat přístup)
Kontrola errorlog.html
Workflow práce se statistickým modulem - tit-url.xml Editace souboru tit-url.xml tit-url.xml obsahuje seznam zdrojů včetně URL a
výčtu přiřazených skupin Vždy při přidání nového zdroje Konvence pojmenování zdroje Pokud zdroj již není předplácen – nutno
konfiguraci v tit-url ponechat Ukázka záznamu
Workflow práce se statistickým modulem – analýza chybových URL soubor errorlog.html slouží k nalezení chybných konfigurací v tit-
url.xml
Statistika dle zdrojů a měsíců pro celou knihovnu
K čemu může sloužit
Statistika dle zdrojů a měsíců pro celou knihovnupro jednotlivé skupiny
Využití pro marketing:sledování krátkodobých přístupů (trialy)meziměsíční změnycelkové úhrny
Statistika dle skupin
K čemu může sloužit
Statistika dle skupin pro celou knihovnu pro jednotlivé skupiny
Využití pro marketing: rozdíly mezi jednotlivými skupinami (fakultami) zdroj pro přepočet dle počtu reálných uživatelů
(studenti + akademičtí pracovníci, všichni čtenáři / aktivní uživatelé vzdáleného přístupu)
K čemu může sloužit
Statistika dle skupin a dle zdrojůpro jednotlivé skupiny
Využití pro marketing:rozdíly mezi jednotlivými skupinami
(fakultami) pro konkrétní zdrojezdroj pro analýzu využívanosti zdrojů ->
podklad pro akvizici
Další práce s výstupy v Excelu
Všechny prezentované tabulky lze z HTML přes schránku snadno metodou CTRL+C, CTRL+V zkopírovat do Excelu a dále zpracovávat
Výstup např. do CSV se ukázal jako zbytečný
K nabídce statistického modulu
Dodávka zahrnuje budoucí aktualizace Cena mírná , na dotázání
Dotazy ke statistickému modulu?
Čas na švestkovou buchtu
Autentizační modul možnosti autentizace a autorizace EZproxy: built-in by OCLC
:-) textový soubor s hesly LDAP
LDAP dle RFC 2307 (např. OpenLDAP) Active Directory, eDirectory
Shibboleth doména Windows pro ČR exotické knihovní systémy – Voyager, III, …
více viz http://www.oclc.org/us/en/support/documentation/ezproxy/usr/default.htm
ALEPH...? Nativní podpora autentizace a autorizace
uživatelů EZproxy v systému ALEPH chybí Akademické knihovny disponují LDAP adresáři
pro autentizaci k různým informačním procesům v rámci svých informačních systémů
Veřejné a vědecké knihovny LDAP podporu pro čtenáře nemívají
->>> potřeba autentizačního modulu
Autentizační modul
Autoři Jiří Rataj Lukáš Hlůže Martin Vojnar
testován na EZproxy serveru draco.multidata.cz
Výhoda řešení standardizované LDAP rozhraní podporující
EZproxy Shibboleth Identity Provider libovolné další služby (tiskové fronty, autentizace pracovních
stanic, …) aktuální data via LDAP – např.
účet aktivní ihned po vystavení průkazky účet odblokován okamžitě po uhrazení pokuty lze stanovit specifickou skupinu uživatelů pro vzdálený přístup
(nikoli nutně všichni registrovaní čtenáři)
Podrobnosti možné zabezpečení komunikace
EZproxy-LDAP: SSL (ldaps) + fixní IP adresa LDAP-mezivrstva-ALEPH: omezení jen pro localhost komunikaci,
pokud nebude LDAP a ALEPH na jednom serveru – lze implementovat https + fixní IP adresu
propustnost v řádu desítek autentizačních dotazů za minutu mezivrstva LDAP – ALEPH je napsána v perlu vyžaduje ALEPH v.18 a vyšší
s licencí X-services
Obsah datagramu mezivrstvy<?xml version="1.0" encoding="UTF-8"?><bor-auth><bor-id>carovy_kod_uzivatele</bor-id><bor-uid>primarni_id_uzivatele</bor-uid><bor-name>jmeno_uzivatele</bor-name><bor-email>email_uzivatele</bor-email><bor-lang>jazyk_komunikace_s_uzivatelem</bor-lang><bor-auth-ok>vysledek_verifikace</bor-auth-ok><bor-credit>stav_penezniho_uctu</bor-credit><bor-status>kategorie_uzivatele</bor-status><error>textova_zprava_o_vysledku_verifikace_v_pripade_chyby
</error></bor-auth>
Ukázka http://boa.ruk.cuni.cz:8991 ldapsearch -x -D
'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' -W -v -h boa.ruk.cuni.cz -b 'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' uid=333,ou=ezproxy,dc=ruk,dc=cuni,dc=cz
boa.ruk.cuni.cz ou=EZPROXY,dc=ruk,dc=cuni,dc=cz(objectClass=p
erson) uid 333