Indice generale
Introduzione......................................................................................................2
Capitolo 1...........................................................................................................5
Wikipedia e la classificazione gerarchico – enumerativa Dewey......................5
1.1 Le origini dell'enciclopedia collaborativa...................................................................... 5
1.2 Organizzare la conoscenza............................................................................................ 7
1.3 Schemi organizzativi ..................................................................................................... 9
1.4 Strutture organizzative................................................................................................. 121.4.1 Struttura organizzativo - gerarchica di Wikipedia................................................................................... 13
Capitolo 2......................................................................................................... 15
Due schemi di classificazione a confronto...................................................... 15
2.1 La classificazione gerarchico – enumerativa................................................................ 152.1.1 Le classificazioni gerarchica sul Web e la questione dell'incoerenza..................................................... 17
2.2 Classificazione analitico – sintetica ............................................................................ 192.2.1 Il concetto di faccetta................................................................................................................................... 192.2.2 Classificazione Colon .................................................................................................................................. 212.2.3 Ordine di citazione delle faccette............................................................................................................... 252.2.4 Applicare la classificazione a faccette sul Web......................................................................................... 282.2.5 Architettura a faccette in un sito Web....................................................................................................... 30
2.3 Classificazione a Faccette vs. Classificazione Tradizionale.........................................32
Capitolo 3........................................................................................................ 35
Il caso studio: WikiArte e la classificazione a faccette....................................35
3.1 Lo stato dell'arte.......................................................................................................... 353.1.1 Strutturare i dati con Mediawiki................................................................................................................. 37
3.2 Usare una struttura a faccette come sistema di ricerca e navigazione........................40
3.3 Usare le faccette per l'architettura dell'informazione di WikiArte..............................42
3.4 Preparare la collezione di dati per Flamenco.............................................................. 49
Conclusioni......................................................................................................53
Appendice........................................................................................................54
Bibliografia...................................................................................................... 64
1
Introduzione
Introduzione
L'acutezza del pensiero, la chiarezza nell'espressione, l'esattezza nella comunicazione, la prontezza nella risposta, e la precisione nel servizio dipendono in ultima analisi dalla successione conveniente, ovvero dalla Classificazione.
[S. R. Ranganathan 1967]
Sin dalla sua comparsa, l'uomo ha dovuto sempre affrontare l'ostacolo della
comunicazione, per comprendere ed essere compreso. Nei secoli il linguaggio, sia verbale
che scritto, si è evoluto distinguendosi nei diversi idiomi e producendo un ingente quantità
di materiali e documenti che oggi costituiscono il patrimonio dell'umanità. Questa è una
realtà dinamica, un insieme aperto, non definitivo, ma in perenne ampliamento; di cui
vengono a far parte ritrovamenti e acquisizioni continui di dati e materiali.
La sorprendente mole di documenti e manufatti che l'uomo è riuscito a produrre sino ad
oggi porta con se il problema di una comunicazione ottimale. Organizzare questo sistema
aperto di dati, informazioni e conoscenze diventa una particolare sfida da affrontare, per
rispondere all'esigenza di porre ordine al caos dell'informazione. Gestire la conoscenza, al
fine di favorirne la reperibilità è indispensabile per poterla utilizzare, trovando le
informazioni che occorrono al momento della ricerca tra le innumerevoli a disposizione.
Questo è quello di cui si occupa l' Architettura dell'informazione, ossia strutturazione,
organizzazione e catalogazione del sapere.
In qualsiasi ambito e settore è necessario mettere ordine al materiale di cui si dispone,
gestire ed organizzare i dati permettendo così una buona reperibilità degli stessi. Anche
gestire la merce di un magazzino ha bisogno di un sistema ottimale di archiviazione, per
reperire i prodotti in modo semplice e rapido.
Il punto di partenza di qualsiasi ricerca è sapere quali conoscenze sono già note e come
sono strutturate, infatti reperire informazioni da un sistema ben strutturato agevola l'attività
di ricerca, risparmiando tempo prezioso. Per cui, gestire l'architettura dell'informazione, in
2
una società in cui la reperibilità del dato è fondamentale, diventa un lavoro prioritario da
estendere a tutti i settori e ambiti disciplinari.
Già nell'antica Grecia Aristotele aveva affrontato la difficoltà di organizzare il sapere
umano, discutendone in opere separate, raggruppandolo in tre grandi classi: teoretica,
pratica e poetica.
Nell'era in cui viviamo adesso, l'era della digitalizzazione, le informazioni viaggiano per
mezzo di un nuovo canale, ossia quello virtuale di Internet. Il World Wide Web, elidendo le
barriere fisiche e geografiche, ha messo in comunicazione l'intero pianeta con uno scambio
di informazioni senza limiti e ha raccolto in un unico grande contenitore tutto lo scibile
umano. In questo contesto, la progettazione dell'architettura dell'informazione diviene
l'obiettivo primario per soddisfare l'esigenza dell'utente, ossia reperire l'informazione che ci
è utile dal flusso continuo di documenti.
Già da tempo, Internet offre la possibilità, a tutti gli utenti, di reperire, caricare e
pubblicare qualsiasi informazione, che giorno dopo giorno aumenta esponenzialmente. Se
prima la responsabilità di classificare, organizzare e fornire accesso ai dati era
principalmente di bibliotecari o addetti ai lavori, adesso è l'utente a farsi carico di tutto ciò,
nel momento stesso in cui li pubblica. Allora, risulta necessario etichettare i contenuti,
adottare uno schema di classificazione specifico, e gestire nel migliore dei modi
l'amministrazione del perenne flusso di informazioni.
La Tesi vuole dimostrare che è possibile ampliare le potenzialità di un mezzo innovativo
come MediaWiki per un facile reperimento dei beni artistico-culturali, rendendo la
navigazione e la ricerca intuitiva e minuziosa. Il progetto ha lo scopo di dare
all'informazione una struttura a faccette grazie al software Flamenco, al fine di garantire
una ricerca e una navigazione ottimale per arrivare al documento desiderato, passando da
una pluralità di accessi; una volta trovato il manufatto, la pagina di Flamenco che ne
descrive le proprietà rimanderà l'utente alle pagine di MediaWiki, opportunamente
realizzate, che gestiscono le informazioni archiviate nel suo database.
La seguente tesi si articola in tre capitoli:
• il primo capitolo prende in esame l'ormai nota Enciclopedia collaborativa
Wikipedia e la classificazione gerarchico – enumerativa; una breve panoramica
sull’organizzazione dell’informazione, soffermandoci sui sistemi di
3
classificazione maggiormente adottati, sull'importanza delle strutture e dei
sistemi organizzativi.
• Il secondo capitolo mette a confronto i due schemi di classificazione: gerarchico
- enumerativa ed analitico - sintetica, ossia, la Dewey classification contro la
Colon classification; mettendo in evidenza i corrispettivi punti di forza
nell'applicazione.
• Il terzo capitolo tratta del caso studio, vale a dire, la realizzazione di
un'enciclopedia collaborativa, sulla scia di Wikipedia, destinata ad accogliere le
informazioni sul Patrimonio artistico-culturale; migliorando la gestione dei
contenuti mediante l'apporto di una classificazione a faccette. Nel caso specifico
del progetto l'attenzione è stata rivolta alle opere dell'Avanguardia Futurista.
Gestire l'architettura dell'informazione tramite un analisi top-down, dall'alto
verso il basso ci permette di stabilire a priori le classi principali del nostro
schema. Questa metodologia permette una ricerca più accurata, dovuta ad
apposite faccette, che permettono un filtraggio dei documenti archiviati.
4
Capitolo 1
Capitolo 1
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
1.1 Le origini dell'enciclopedia collaborativa.
Wikipedia nella sua accezione più elementare è un database Internet che permette a
chiunque, indipendentemente da competenze o qualifiche, di scrivere e modificare voci su
qualsiasi argomento. L'insieme dei contenuti di diversi autori volontari è autodefinito
“Enciclopedia” dal gestore del servizio (Wikimedia Foundation, Inc., una società no-profit
statunitense) e come tale riconosciuta dai medesimi collaboratori non necessariamente
specialisti.
L'obiettivo di Wikipedia è di creare un'enciclopedia libera e "universale", in termini sia di
ampiezza che di profondità degli argomenti trattati. Wikipedia è stata descritta da uno dei
suoi fondatori, Jimmy Wales, come ''uno sforzo per creare e distribuire un'enciclopedia libera della
più alta qualità possibile ad ogni singola persona sul pianeta nella sua propria l ingua''.
La differenza più evidente con le tradizionali enciclopedie è che in Wikipedia
l'organizzazione dei contenuti fa spazio ad una fitta rete ipertestuale accessibile e
modificabile sul Web, e i riferimenti a fonti interne ed esterne assumono la forma di
altrettanti collegamenti ipertestuali.
Wikipedia ha le sue origini in un progetto complementare, avviato nel 2000 da una
società commerciale statunitense sotto il nome Nupedia, un progetto per la creazione di
un’enciclopedia libera online le cui voci erano scritte da esperti attraverso un processo
formale di revisione.
Wikipedia, autodefinitasi “enciclopedia libera” sceglie il World Wide Web come mezzo
di distribuzione e scrittura delle voci enciclopediche, ed in particolare una tecnologia web
denominata Wiki, da cui prende il nome. Un wiki (un termine in lingua hawaiana che
significa “veloce”, “rapido”) è un software collaborativo per il Web ideato nel 1995
dall'ingegnere informatico statunitense Ward Cunningham per permettere la pubblicazione
di ipertesti direttamente modificabili dagli utenti, che possono scrivervi usando una sintassi
più semplice di HTML. Il termine wiki è usato sia per indicare il software in sé, più
precisamente software wiki o wiki engine, che l'ipertesto modificabile.
5
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
Con la crescita nella consultazione e l'aumento dell'estensione di Wikipedia, diffusasi
nelle varie versioni in lingua, a partire dall'originaria versione in lingua inglese, è aumentato
anche l'interesse degli studiosi che hanno dedicato al modello wiki in generale e a Wikipedia
in particolare saggi ed articoli scientifici inizialmente limitati agli aspetti più informatici e
tecnici per poi integrare recentemente anche le scienze sociali.
Nel giro di dieci anni questa enciclopedia online ha raggiunto il quattordicesimo posto
nella graduatoria mondiale di Alexa1 per richieste, superando fra gli altri il sito della
Biblioteca del Congresso statunitense (dal 2003-12) e dell'Enciclopedia Britannica (dal
2003-06), diventando l'enciclopedia online più consultata al mondo.
1 La Alexa Internet Inc. è un'azienda statunitense sussidiaria di Amazon.com che si occupa di statistiche sul
traffico di Internet. Alexa è anche un motore di ricerca con un servizio di web directory.6
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
1.2 Organizzare la conoscenza
Da secoli gli esseri umani strutturano, organizzano e classificano le informazioni, dando
al sapere un valore aggiunto come quello della sistematizzazione, poiché lo rende
maggiormente comprensibile e consultabile.
Per molti secoli, l’organizzazione aristotelica del sapere, è stato un punto di riferimento
principale, raggruppando tutti i campi della conoscenza in tre classi: teoretica, pratica e
poetica.
Fino a quando, attorno al 1600 il filosofo inglese Francis Bacon distingueva le scienze a
seconda delle facoltà conoscitive che le producono: memoria, immaginazione e ragione.
Tale successione arriverà fino al 1873, quando Mervil Dewey, un bibliotecario di un college
di New York, sviluppò un Sistema Decimale di classificazione, che prese il suo nome. Uno
strumento per classificare e fornire accesso al crescente numero di libri.
[…] Dewey suddivise ogni disciplina in sottoclassi e queste a loro volta in sotto-
sottoclassi e così via, in modo da distinguere anche argomenti molto specifici. Per indicare
ciascuna classe, Dewey utilizzò dei numeri, inizialmente di tre cifre: così 800 significava
Letteratura in genere, ma 810 significava Letteratura Americana, […] potenzialmente
all’infinito, poiché le cifre decimali di un numero possono essere infinite. Il nuovo sistema
prese quindi il nome di Classificazione Decimale di Dewey (Gnoli, Marino, & Rosati,
2006).
La nostra epoca si contraddistingue per una congestione informativa, un sovraccarico
d’informazioni, che pone con urgenza la necessità di archiviare questa mole di dati, in
modo da favorirne un recupero intelligente. Ma se l’era digitale ha amplificato questo
problema, esso non è del tutto nuovo: discipline come le scienze bibliotecarie e la
documentazione si occupano già di classificazione del sapere.
L’esplosione della quantità di conoscenze pubblicate sul Web ha reso più arduo il
reperimento delle informazioni, in particolare trovare quello che ci interessa in breve
tempo. Perciò, occorre una buona Architettura dell’informazione.
Peter Morville (Morville & Rosenfeld, 2002) definisce tale concetto in quattro punti
fondamentali:
7
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
1. la combinazione di organizzazione, categorizzazione e schemi di navigazione
all’interno di un sistema di informazioni.
2. Il design strutturale e di uno spazio informativo atto a facilitare l’esecuzione dei
compiti e l’accesso intuitivo ai contenuti.
3. L’arte e la scienza della strutturazione e classificazione dei siti Web e delle intranet
per assistere gli utenti a trovare e gestire le informazioni.
4. Una disciplina emergente ed un gruppo di pratiche focalizzate a portare i principi
del design e dell’architettura del paesaggio digitale.
Oggi, attraverso l’esperienza di libri, biblioteche ed enciclopedia online, abbiamo
familiarità con il concetti di base dell’organizzazione delle informazioni. Però, La
rivoluzione informatica ha creato l’illusione che si potesse improvvisamente risolvere il
problema dell’organizzazione e della gestione dell’informazione per favorirne la reperibilità.
Oggi si è capito che la tecnologia è sicuramente un supporto per la gestione della
conoscenza ma ciò non elimina il problema dell’organizzazione dei suoi contenuti. Sempre
più persone hanno la libertà di pubblicare informazioni, ma anche la responsabilità di
organizzarle in quanto tali.
Uno degli aspetti che interessano l'architettura dell'informazione è l'organizzazione
ottimale dei contenuti nei documenti, in particolare nei siti web. Per mantenere efficace un
sito Web di grandi dimensioni, specialmente se vi collaborano molte persone, occorre
seguire metodi di lavoro e convenzioni strutturali sostenibili, per le quali le tecniche “da
bibliotecari” possono risultare molto utili (Gnoli, 2002). La possibilità di integrare diverse
forme comunicative e di creare dei collegamenti istantanei da un punto a un altro di un sito,
o anche dell’intera Rete, rende particolarmente importante la progettazione di un efficace
Architettura dell’informazione.
A questo scopo vengono utilizzate, più o meno consapevolmente, varie forme di sistemi
per l'organizzazione della conoscenza (knowledge organization system, KOS), come parole-
chiave, tesauri, stringhe di soggetto, tassonomie, ontologie, schemi di classificazione.
Gli schemi di classificazione sono forse i più classici tra i KOS. Sono stati sviluppati
soprattutto a partire dalla fine dell'Ottocento, per far fronte alla crescente quantità di
documenti da ordinare e gestire nelle biblioteche e nelle bibliografie. La maggior parte degli 8
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
schemi di classificazione sono sostanzialmente enumerativi, ossia si basano sull'elencazione
delle classi nelle quali è possibile ripartire i documenti da classificare. Poiché le possibilità di
combinare fra loro i concetti sono limitate, quasi tutti i concetti da utilizzare devono essere
già previsti dallo schema, che perciò è necessariamente costituito da tavole voluminose.
L'universo della conoscenza viene suddiviso in un certo numero di classi principali, ognuna
di queste in sottoclassi, e così via, sviluppando in questo modo un albero gerarchico, di
profondità teoricamente illimitata. L'esempio più famoso, come abbiamo già detto, è la
Classificazione decimale Dewey (CDD), introdotta dal bibliotecario newyorkese Melvil
Dewey a partire dal 1876, e da allora progressivamente espansa, aggiornata e adottata in
biblioteche di tutto il mondo.
1.3 Schemi organizzativi
Per consentire il facile recupero dei dati, in una quantità notevole di documenti, occorre
organizzarli adoperando un buon metodo di classificazione. Classificare non è però un
compito semplice. Un attività di classificazione non supportata da strategie, metodologie e
competenze adeguate rischia di produrre organizzazioni illogiche degli articoli, poco
scalabili e difficilmente utilizzabili dagli utenti.
Il successo di un sito web è determinato dall’organizzazione delle informazioni. Per
questo i sistemi organizzativi sono composti da: <<schemi organizzativi>> e <<strutture
organizzative>>.
Uno schema organizzativo definisce le caratteristiche condivise nei contenuti ed
influenza il raggruppamento logico di questi contenuti. Una struttura organizzativa
definisce i tipi di relazione tra singoli contenuti e gruppi. […] L’organizzazione è
strettamente correlata alla navigazione, denominazione e indicizzazione. Le strutture di
organizzazione gerarchica dei siti spesso costituiscono il principale sistema di navigazione.
Le denominazioni delle categorie giocano un ruolo significativo nel definire i contenuti di
quelle categorie. L’indicizzazione manuale o la marcatura dei metadati è in ultima analisi
uno strumento per organizzare i singoli contenuti in gruppi a livello estremamente
dettagliato (Morville & Rosenfeld, 2002).
Possiamo avere schemi organizzativi esatti e ambigui.
9
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
Il file system del nostro computer ci da un buon esempio di alcuni schemi esatti di
organizzazione. Quando navighiamo le cartelle del nostro hard disk possiamo ordinarne i
contenuti per nome, data di ultima modifica, tipo di file o dimensione. Un'altro buon
esempio è il client di posta elettronica. Generalmente ordiniamo le mail in entrata in base
alla data di arrivo, ma possiamo ordinarle anche per oggetto o per mittente. Nome, data,
dimensione di un file, oggetto, mittente di una mail sono schemi di ordinamento esatti,
perché sono informazioni che si basano su quantità che possono essere su scala ordinale,
come l'ordine alfabetico, o ad intervalli, come le date, o a rapporti, come la dimensione di
un file. Un altro schema esatto può essere quello geografico. La open directory
www.dmoz.org, ad esempio, presenta anche una categorizzazione per area geografica, e
dunque i siti internet dedicati alla città di Rovereto si trovano sotto il percorso
Regional > Europe > Italy > Trentino Alto Adige > Trento > Rovereto
Il vantaggio degli schemi esatti è che l'ordinamento può essere fatto automaticamente
dall'applicazione. Non è necessario, dunque, ordinare a mano le mail ricevute in base alla
data di arrivo, in quanto è il programma stesso a farlo per noi. Ma soprattutto se si conosce
la data di arrivo di un'e-mail risulta facile trovarla.
A volte, però, gli utenti si trovano in difficoltà nell'usare gli schemi esatti, in quanto le
loro conoscenze in merito a ciò che cercano non sono precise. Se, ad esempio, non ricordo
la data precisa di un'e-mail che sto cercando, né il mittente, né l'oggetto trovare quell’e-mail
in base agli schemi esatti può risultare un'impresa non facile.
In altre circostanze, poi, è l'informazione stessa che non si presta a schemi esatti, in
quanto è per sua natura ambigua. Gli schemi ambigui sono meno semplici da
implementare, ed introducono degli elementi di soggettività. Ciononostante risultano
spesso estremamente utili. C’è un semplice motivo per cui la gente trova i sistemi di
classificazione ambigui così utili: non sempre sappiamo cosa cercare (Morville &
Rosenfeld, 2002).
I responsabili delle biblioteche usano molto spesso schemi ambigui per argomento
come il Dewey Decimal. Vi sono differenti tipologie di schemi ambigui. Un corpus di
informazioni può essere classificato ad esempio per argomento, per compito, per tipologia
di utenza. Immaginiamo, ad esempio, il sito web di una facoltà universitaria. Le risorse
10
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
possono essere raggruppate per argomento, e allora potremo avere le categorie: didattica,
ricerca, servizi. Possono essere raggruppate per tipologia di utente, e allora avremo un
ingresso diverso per studenti, docenti, personale, aziende, persone interessate ad iscriversi ai
corsi di laurea e così via. Nella sezione dedicata alla didattica on line le risorse possono
essere raggruppate per argomento: consultare il programma di un insegnamento, seguire le
lezioni online, iscriversi all'esame. Naturalmente in questo caso la classificazione è soggetta
ad ambiguità e difficoltà. Dove collochiamo, ad esempio, la pagina dedicata alla biblioteca;
nella categoria Ricerca, nella categoria Didattica o nella categoria Servizi?
È proprio nella creazione di questa tipologia di schemi che diviene necessario, in fase di
design, coinvolgere gli utenti utilizzando degli strumenti di conoscenza.
11
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
1.4 Strutture organizzative
Le strutture organizzative si occupano della modalità di immagazzinamento e
presentazione delle informazioni. L'adozione di appropriate strutture organizzative è
soggetta a tre fattori: il fattore tecnologico, la tipologia dei contenuti, gli aspetti di usabilità
legati alla modalità di presentazione dei dati. Rosenfeld e Morville identificano tre tipi di
strutture: gerarchiche, tabellari ed ipertestuali.
Una struttura gerarchica divide il dominio semantico della struttura informativa in
partizioni. Un tipico esempio di struttura gerarchica esatta è la tassonomia Linneana degli
esseri viventi. Su internet vi sono degli esempi estremamente celebri, le directory come
dmoz.org o Yahoo. In questo caso, però, la struttura gerarchica è di tipo ambiguo. Un esempio
di struttura a tabella è costituito dal servizio offerto da librarything.com, un sito che permette
di condividere la propria libreria, inserendo la lista dei libri che si possiede. Chi entra nella
mia libreria virtuale cliccando http://www.librarything.com troverà la lista dei miei
libri, che potrà essere ordinata per autore, per titolo, per punteggio di gradimento.
La struttura ipertestuale costituisce, invece, la più importante caratteristica distintiva del
web. Il web è, dal punto di vista dell'utente, una ragnatela di risorse testuali o multimediali
fra loro collegati attraverso dei collegamenti ipertestuali. Un sito web non è tale se non ha
collegamenti ipertestuali, in quanto questi costituiscono lo strumento universale di
navigazione all'interno del web. Anche le strutture gerarchiche e tabellari usano i
collegamenti ipertestuali per la navigazione. Vi sono però dei sistemi informativi dove i
collegamenti ipertestuali costituiscono e rappresentano la struttura. L'esempio più
importante è costituito da Wikipedia (it.wikipedia.org nella versione italiana), la più
importante enciclopedia elettronica, un progetto open source. Questo tipo di struttura è
particolarmente adatto per le conoscenze di tipo enciclopedico; ad una struttura
ipertestuale non gerarchica manca però la struttura categoriale tipica delle strutture
gerarchiche. (Bussolon)
12
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
1.4.1 Struttura organizzativo - gerarchica di Wikipedia
Nella struttura interna di Wikipedia, le categorie sono raccolte di «indici tematici»
automatizzati e strutturati in un albero che ha come singola radice la
Categoria:Enciclopedia.
Ad esempio, se scriviamo nella barra di ricerca a sinistra la parola “ornitorinco”, in
fondo alla pagina comparirà l'elenco navigabile delle categorie a cui appartiene la voce.
Figura 1. Sistema di navigazione a categorie di Wikipedia.
Le categorie diventano così il secondo metodo di navigazione legato alla voce subito
dopo i link interni, ma il loro utilizzo non è esente da controversie.
L'albero delle categorie di Wikipedia è stato pensato originariamente come uno schema
di classificazione del tipo “dove inserisco questa voce” piuttosto di “come la descrivo” per
cui ogni categoria ha nome univoco, che non è detto sia anche il più rappresentativo. La
catalogazione è però applicata in modo disomogeneo, per cui ognuno finisce per usare le
categorie che preferisce o conosce2.
In soccorso alle carenze delle categorie giungono i template, inclusioni di codice
richiamabili all'interno di altre pagine con il nome del template racchiuso fra doppie
parentesi graffe ed eventuali parametri separati da pipe (“|”, la barra verticale), richiamati in
maniera simile alle funzioni dei linguaggi di programmazione o ai comandi via shell.
Gli utilizzi principali sono tre:
• navigazione contestuale (template di navigazione),
• messaggi (template di avviso)
• strutturazione delle informazioni (template sinottici)3.
2 Essendo integrati semplicemente come link in un namespace differente, ad oggi è possibile categorizzare a piacimento qualsiasi voce, e la classificazione non è sottoposta ad alcun controllo semantico automatico prima della pubblicazione, che impedirebbe ad esempio l'inserimento della medesima voce in più categorie collegate in linea retta.
13
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
Ritornando all'esempio dell'ornitorinco, scorrendo il testo leggerò che è un piccolo
mammifero e selezionando il termine “mammifero” sarò rimandato alla relativa voce,
selezionando la data “1799” otterrò una lista delle ricorrenze di quel periodo, e così via per
tutti le Hots Words sparse nel testo che rimandano ad altri documenti collegati secondo una
logica ipertestuale.
Diversi studi hanno affrontato il problema dell'architettura dell'informazione su
Wikipedia, oltre all'acceso dibattito in seno alla comunità. Una relazione presentata a
Wikimania 2005 proponeva di aggiornare i sorprendentemente primitivi strumenti di
ricerca di Wikipedia, introducendo un sistema di collegamenti tipizzati che sia per i
collegamenti ipertestuali ciò che le categorie sono per le voci esprimendo il tipo di relazione
fra la voce da cui parte il link e quella di destinazione.
3 Sulla navigazione contestuale, cfr. Rosenfeld – Morville 2002, 116-118. I template di navigazione forniscono una serie di link contestuali comuni ad un gruppo di voci.
14
Capitolo 2
Capitolo 2
Due schemi di classificazione a confronto
2.1 La classificazione gerarchico – enumerativa
Alla base di quasi tutte le architetture dell’informazione ben riuscite c’è una gerarchia o
tassonomia ben progettata […]. Da sempre le informazioni sono state organizzate in modo
gerarchico. Gli alberi genealogici sono gerarchici. La suddivisione di libri in capitoli,
sottocapitoli, paragrafi, frasi, parole, lettere. La gerarchia è ovunque nella nostra vita. A
causa di tale pervasività delle strutture gerarchiche, gli utenti sono in grado di comprendere
facilmente e rapidamente quei siti che utilizzano modelli organizzativi gerarchici […]
(Morville & Rosenfeld, 2002).
Nei sistemi di classificazione tradizionale (struttura gerarchico - enumerativa) ogni
elemento è classificato sotto un’unica categoria. Nella classificazione tradizionale gli
elementi hanno una collocazione corretta e univoca in uno schema ampio e
gerarchicamente profondo che può essere reso attraverso un percorso a gradini, partendo
da una categoria padre si arriva alla categoria figlio.
La struttura gerarchico - enumerativa è l’organizzazione più diffusa nel web: essa
prevede categorie-padre che contengono categorie-figlie come in un gioco di scatole cinesi.
Figura 2. Esempio di modello gerarchico semplice
15
Due schemi di classificazione a confronto
Questo approccio, che potremmo definire top-down, consente di dotarsi rapidamente di
un punto di partenza per comprendere la portata del sito senza dover attivare un processo
estensivo di rilevazione dei contenuti (Morville & Rosenfeld, 2002). Il processo top-down è
un processo deduttivo, dall’alto verso il basso, che permette di ricavare le classi di un
dominio operando raggruppamenti di dettaglio via via crescente.
Ogni giorno abbiamo a che fare con procedure simili, anche quando usiamo il computer
domestico. Se vogliamo memorizzare un file nello spazio fisico riservato ai documenti non
facciamo altro che assegnare un nome significativo, che ricordi il suo contenuto, in modo
da trovarlo facilmente in mezzo agli altri. Ma dopo qualche tempo i documenti cominciano
ad essere così numerosi che scorrerli solo per nome diventa scomodo. Per risolvere il
problema è consuetudine creare delle cartelle che ordineranno i documenti affini. In questo
modo si viene a creare una “gerarchia”, ossia per arrivare al file desiderato è necessario
compiere più passaggi (aprire la cartella giusta e scorrere i file ivi contenuti per trovare il
documento). In questo caso le cartelle rappresentano le “classi”, in cui disporre unità di
conoscenza affini. Raggruppando le singole unità in classi, siamo partiti dal basso verso
l’alto (Bottom-up), ossia abbiamo adottato un approccio a posteriori.
Nel caso in cui dobbiamo progettare uno schema è necessario farci un’idea iniziale di
quale sarà la sua struttura generale, sin dall’inizio ci immaginiamo l’insieme delle
conoscenze da organizzare e ci chiediamo come dovranno essere suddivise. In questo
modo, stiamo adottando un approccio dall'alto verso il basso (Top-down), ossia a priori.
Possiamo stabilire di suddividere i nostri oggetti secondo una prima caratteristica, per
esempio la data, quindi tutti i documenti del 2006, quelli riguardanti il 2005, e così via.
Queste saranno quindi le classi principali del nostro schema. A loro volta esse potranno
essere divise secondo un’altra caratteristica.
Stabilendo una serie di classi, sottoclassi e così via, possiamo formare un albero
gerarchico, ramificato quanto vogliamo. Con la Classificazione Decimale Dewey possiamo
contrassegnare ogni nodo dell’albero con una notazione decimale, potenzialmente
all’infinito.
16
Due schemi di classificazione a confronto
2.1.1 Le classificazioni gerarchica sul Web e la questione dell'incoerenzaL'uso più evidente sul Web dei
principi della classificazione si può
riscontrare negli indici sistematici,
cioè in quei siti che fungono da
cataloghi organizzati delle risorse
presenti on-line. Yahoo!, Virgilio, Open
Directory, Virtual Library sono tutti
esempi di questa tipologia di siti alla
quale spesso ci si riferisce anche con i
termini di “directory”, “indici
ragionati”, “indici di ricerca per
categorie”, “subject guide”, “subject gateway”. Gli indici sistematici consentono il recupero
dell'informazione attraverso la compilazione di un unico schema di classificazione
gerarchico - enumerativo e la successiva indicizzazione, sulla base di questo, delle risorse del
Web selezionate dagli indicizzatori o proposte per l'inserimento dai responsabili stessi del
sito.
Generalmente tali indici sistematici hanno ripreso dalle classificazioni bibliografiche
anche l'approccio semantico: i siti sono infatti raggruppati prevalentemente a seconda dei
loro contenuti. La directory di Yahoo! esplicita persino tale scelta: “sites organized by subject”.
Tuttavia, nonostante tale dichiarazione, l'homepage di Yahoo!
integra l'approccio strettamente per contenuti, di fatto
dominante, con principi di divisione di tutt'altra specie. Il caso
lampante è dato dalla categoria “Regional”, in cui i siti sono
raggruppati non rispetto al contenuto, ma a seconda della loro
collocazione geografica. Nel livello successivo inizia infatti una
tassonomia geografica. È evidente che lo schema di
classificazione impiegato è emblematico. Il problema di un top-
level realizzato in questo modo è che la violazione della regola
dell'unico fundamentum divisionis per ogni nodo della
17
Figura 3. I primi livelli della classificazione di Yahoo!
Figura 4. La categoria “Regional” in Yahoo!
Due schemi di classificazione a confronto
classificazione produce categorie non mutuamente esclusive e, quindi, uno schema
organizzativo ibrido (più principi di divisione operano contemporaneamente) che è, per sua
natura, anche incoerente. Una classificazione ancora più ibrida e incoerente si può ritrovare
nell'homepage di Open Directory.
Oltre alla categoria “Regional”, sono infatti presenti classi come “Kids and Teens”,
“World” o “Shopping”. Se un utente vuole acquistare on-line un gioco per bambini, da
quale categoria del top-level di Open Directory deve cominciare? È probabile che siano previsti
rinvii tra i vari rami di Open Directory e che quindi si riesca ugualmente ad arrivare alla
categoria desiderata partendo da tutti e quattro i top-level possibili, ma l'effetto labirinto dello
schema ibrido rimane.
È ancora aperta la questione sul Web, se impiegare un principio di divisione alla volta, o
rispettare la mutua esclusività delle categorie al fine di rendere gli schemi di classificazione
coerenti. Vizine-Goetz (1996) dimostra come la Classificazione della Library of Congress e
la Classificazione decimale Dewey prevedano una copertura di argomenti sufficientemente
ampia per classificare le risorse di Internet. Nel proporre le classificazioni bibliografiche per
il Web, i bibliotecari sono consapevoli del fatto che l'impianto tradizionale deve essere
opportunamente modificato per la sostanziale differenza tra la fisicità del libro e la virtualità
del Web. Ma le classificazioni bibliografiche classiche, in quanto enumerative e condivise,
sono di fatto strutturalmente chiuse, istituzionalizzate e centralizzate. Gli schemi
tradizionali non consentono in fase di indicizzazione l'inserimento, da parte del
classificatore, di una nuova categoria. Solo il compilatore può modificare la classificazione,
redigendo un foglio di revisione ufficiale o pubblicando un'edizione successiva dello
schema. Ciò può avvenire anche a distanza di molti anni: tempi troppo lunghi per il Web.
La soluzione per il Web, a questa chiusura, è la classificazione home-grown (creata e
mantenuta localmente da una singola istituzione), ma anche in questa classificazione, il
classificatore continua a non avere alcuna autonomia in fase di indicizzazione e il ricorso a
un compilatore che modifichi lo schema è indispensabile. Il loro impianto di base rimane
assolutamente tradizionale, quindi strettamente enumerativo, gerarchico e chiuso. Il
vantaggio sta nella maggiore rapidità dei cambiamenti, rispetto alle classificazioni
18
Due schemi di classificazione a confronto
bibliografiche condivise, ma ciò è dovuto solo alla loro natura home-grown, che permette ai
compilatori di modificare la gerarchia in qualsiasi momento.
2.2 Classificazione analitico – sintetica
Ben diverso è il caso delle classificazioni analitico - sintetiche (o a faccette), le quali
consentono un'effettiva apertura grazie a innovazioni sostanziali nel procedimento stesso di
classificazione. Tali sistemi, dichiaratamente alternativi agli schemi gerarchico - enumerativi
tradizionali, sono infatti frutto di un ripensamento radicale delle tecniche di classificazione.
Si abbandona l'idea di un'enumerazione a priori di tutte le classi a favore di una
metodologia che consente di creare le categorie "on the Fly" partendo da alcuni elementi
preventivamente decisi (faccette e foci). Si assicura finalmente anche al classificatore, in fase
di indicizzazione del materiale, la possibilità di generare le classi di cui ha bisogno. In un
sistema on-line la classificazione a faccette può essere una soluzione, potendoci affidare su
schemi flessibili e
velocemente adattabili,
in quanto effettivamente
aperto. Prima di andare
avanti diamo una
definizione più chiara e
dettagliata del concetto
di faccetta e dei relativi
foci.
2.2.1 Il concetto di faccetta
Negli anni ’30 il bibliotecario indiano S. R. Ranganathan creò un nuovo tipo di sistema
di classificazione. Nella concezione di Ranganathan uno schema di classificazione deve
essere utilizzato non solo per realizzare un catalogo da consultare, ma anche per disporre i
volumi negli scaffali secondo un ordine adeguato, che permetta agli utenti di localizzare
direttamente quelli che trattano gli argomenti di loro interesse.
19
Figura 5: schema a faccette
Due schemi di classificazione a confronto
Perciò, egli dedicò molto del suo lavoro a identificare dei principi fondanti per la
classificazione, per risolvere il problema di rappresentare le sfumature del sapere umano. In
alternativa agli schemi di classificazione già esistenti da diversi decenni, come la tradizionale
Classificazione Decimale Dewey, Ranganathan studiò un sistema meno rigido e più
articolato, che definì classificazione a faccette.
Riconoscendo problemi e limiti delle soluzioni a singola tassonomia top-down,
Ranganathan costruì il suo sistema sulla nozione che documenti ed oggetti hanno
molteplici dimensioni o facets, faccette. Il vecchio modello, che poneva la questione “dove lo
metto?”, è più strettamente legato alla nostra esperienza nel mondo fisico, un posto per
ogni cosa. Per contro, l’approccio a faccette pone la domanda, “come lo posso descrivere?”
(Morville & Rosenfeld, 2002).
La classificazione a faccette (Faceted Classification) è un metodo di classificazione
dell’informazione il cui valore distintivo consiste, appunto, nell’essere un sistema aperto e
adattivo, in grado cioè di adattarsi a una pluralità di esigenze di archiviazione e/o
interrogazione. Faccetta è un termine utilizzato da Ranganathan per denotare qualsiasi
componente di un soggetto composto, è un vocabolo comune nella lingua inglese che
significa ad esempio “aspetto”.
Considerando che l’analisi a faccette consiste nella scomposizione di un soggetto in
diverse coordinate, ciascuna delle quali esprime un aspetto, si potrebbe tradurre “faceted
classification” anche con “classificazione multidimensionale”. In questo senso, il soggetto
composto può essere immaginato come ubicato all’intersezione delle coordinate-faccette, in
uno spazio a tante dimensioni quante sono le faccette (Gnoli, Classificazione a faccette,
2004). La classificazione mediante faccette sfrutta un sistema di attributi (metadati)
mutuamente esclusivi rappresentanti ciascuno un aspetto o proprietà persistente
dell’oggetto e capaci, nel loro insieme, di descrivere esaustivamente l’oggetto stesso. Tali
attributi sono le faccette contraddistinti da alcune peculiarità:
• sono invariabili dal punto di vista semantico (ad es. la proprietà “colore” di un
oggetto può variare in termini di valori che può assumere – giallo, rosso etc. – ma è
invariabile come concetto; cioè quell’oggetto avrà sempre un colore).
20
Due schemi di classificazione a confronto
• costituiscono un insieme aperto, per cui è sempre possibile aggiungere nuove
faccette a quelle già esistenti.
• sono utilizzabili come attributi di ricerca sia singolarmente sia in combinazione.
• Tali caratteristiche rendono particolarmente efficace l’adozione di questo sistema in
ambienti digitali, per un più veloce ed efficiente ritrovamento dell’informazione.
Assodato che la classificazione a faccette non si preoccupa di collocare un oggetto in
una gerarchia, ma di descriverlo in termini di sue proprietà o caratteristiche mutuamente
esclusive, il contenuto dei documenti è analizzato in una serie di aspetti fra loro
complementari e quindi espresso per combinazione dei codici corrispondenti a ciascuna
faccetta. Poiché le tavole di uno schema a faccette devono elencare solo i possibili valori
(foci) di ogni faccetta, lasciando le loro possibili combinazioni al classificatore, esse
risultano molto più compatte di quelle di uno schema enumerativo.
Per cui le peculiarità e i vantaggi di questo metodo sono:
• pluridimensionalità: inversamente ai sistemi tradizionali, nei sistemi a faccette, ogni
oggetto è classificato secondo una pluralità di attributi.
• persistenza: tali attributi/faccette costituiscono proprietà essenziali e persistenti
dell'oggetto; in questo modo l'impatto (sullo schema di classificazione) di eventuali
cambiamenti (di nomenclatura, di workflow etc.) è fortemente ridotto o nullo.
• scalarità: è sempre possibile aggiungere una nuova faccetta descrittiva di un nuovo
aspetto dell'oggetto.
• flessibilità: esistono una pluralità di chiavi di accesso parallele (faccette); ogni
oggetto può essere reperito utilizzando un singolo attributo di ricerca (o faccetta)
alla volta, oppure più attributi insieme in combinazione.
2.2.2 Classificazione Colon
La classificazione a faccette realizzata da Ranganathan è nota come Colon Classification,
per la frequenza con cui ricorre nella sua notazione il simbolo di due punti (in inglese
"colon"). Lo schema presenta due piani separati attraverso i quali il soggetto viene 21
Due schemi di classificazione a confronto
analizzato, scisso e sintetizzato: quello verbale e quello notazionale. Il piano verbale
permette un'analisi del soggetto attraverso la sua scomposizione in categorie: ogni
fenomeno, ogni realtà, ogni modo dell'essere può essere rapportato a cinque categorie
fondamentali che permettono di individuarne l'essenza. Ranganathan scelse queste 5
categorie fondamentali:
• personalità • materia • energia • spazio • tempo
Esse possono essere immaginate come dei binari sui quali l'oggetto viene scomposto e
attraverso i quali è possibile individuare la singola manifestazione, ovvero la faccetta. Le
faccette sono dunque le molteplici espressioni della realtà, dei modi di essere, individuati
dalle categorie che a loro volta possono essere espresse da concetti elementari, gli isolati,
contenuti in quella certa area concettuale individuata dalla faccetta. (Lavazza, 2003).
Es.:
Storia delle religioni (categoria)
Storia del cristianesimo (faccetta)
Patristica (isolato)
Veniamo all'analisi delle cinque categorie.
La personalità (l’oggetto centrale di un discorso) è la più complessa e misteriosa, che
per ammissione dello stesso Ranganathan si ottiene con ciò che rimane dopo aver separato
tutte le altre faccette. Essa rappresenta l’oggetto principale considerato in quel contesto, il
contenuto centrale di un documento o di un settore, indipendentemente dalla sua natura:
non soltanto quindi una persona umana, ma qualsiasi entità anche inanimata o astratta
Il Classification Research Group (CRG) che ancora oggi continua ad approfondire la ricerca
inaugurata da Ranganathan ha preferito usare il termine entità al posto di personalità. Ad
esempio, in un testo sul trattamento in medicina dei polmoni affetti da tubercolosi con i
raggi X, alla categoria personalità corrisponderà il concetto di polmoni:
22
Due schemi di classificazione a confronto
Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X
Polmoni = personalità
La materia (i componenti e le proprietà dell’oggetto) rappresenta, più che le altre
categorie, le manifestazioni dell'oggetto nel reale; il CRG ha preferito usare il termine
proprietà ovvero le caratteristiche contingenti che quel fenomeno possiede. Nell'analisi del
soggetto essa può assumere varie caratteristiche a seconda del ruolo che riveste nella
stringa: matter material, matter property o matter method. Questi che rappresentano gli aspetti
materiali della materia, le proprietà o i mezzi possono coesistere in un'unica stringa. Sulla
base dell'esempio precedente:
Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X
Tubercolosi = materia/proprietà
Raggi X = materia/metodo
L'energia (le caratteristiche dinamiche dei processi che lo interessano) , o attività secondo
il CRG, rappresenta l'azione che quel certo soggetto con quelle date caratteristiche compie.
Secondo lo stesso Ranganathan le difficoltà di focalizzazione che questa categoria presenta
potevano essere ovviate attraverso l'esperienza classificatoria: componendo ogni frase del
linguaggio naturale era possibile individuare volta per volta il concetto di energia.
Spazio (i suoi elementi geografici o spaziali).
Tempo (le sue fasi cronologiche).
Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X
Trattamento = energia
Infine abbiamo le categorie di spazio e tempo che sono le meno difficili da definire:
Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X -- India
-- 1950
India = spazio
1950 = tempo
Una volta individuate le categorie del soggetto le singole faccette vengono messe in
relazione tra di loro attraverso segni d'interpunzione che rimangono anche nella sequenza
numerica: 23
Due schemi di classificazione a confronto
P = , (virgola) M = ; (punto e virgola) E = : (due punti) S = . (punto) T = . (punto)*
* In seguito nel 1959 venne sostituito dall'apostrofo (').
Sulla base del precedente esempio avremo la seguente stringa:
Medicina , polmoni : tubercolosi : trattamento ; raggi X : ricerca ' India nel 1950
La scomposizione in faccette e le loro relazioni permettono nella Colon un tipo di
indicizzazione molto specifica, con la possibilità di mettere più termini in relazione
biunivoca:
Classificazione dei libri di medicina (2;51)
Classificazione dei libri di medicina secondo la Colon (2;51 N3)
Vocali chiuse nella lingua inglese (P,111,11)
Storia dell'India fino al 1894 (V,2;1'M94)
Storia dell'India dal 1894 al 1894 (V,2;1'M92<-94)
Religione e filosofia antica (Q & R*Z)
Una volta individuate le faccette e gli isolati il soggetto analizzato viene sintetizzato
numericamente. Il piano notazionale della Colon prevede numerose tavole indicate da
lettere maiuscole e minuscole e da numeri. Si scompone la stringa individuando i settori di
interesse: per "tubercolosi" si vede la faccetta "medicina". Ecco dunque che il soggetto
presenta il seguente risultato:
medicina -- polmoni -- tubercolosi -- trattamento -- raggi X -- India -- 1950
faccetta base personalità
proprietà materia energia
materia metodo spazio tempo
L 0,45 ; 421 : 6 ; 253 . f ' N5
Il procedimento di classificazione della Colon può essere sintetizzato nello schema
seguente:
• 1: Piano verbale o Categorie (PMEST) o Faccette o Isolati
24
Due schemi di classificazione a confronto
• 2: Analisi e sintesi • 3: Piano notazionale
o Sequenza alfanumerica
In altre parole, la classificazione a faccette consiste sostanzialmente nella scomposizione
(analisi) di concetti composti nelle loro parti semplici, dette isolati. […] I diversi frammenti
vengono ricomposti (sintesi), secondo un ordine di citazione stabilito. Perciò il metodo è
detto anche analitico-sintetico. (Gnoli, 2004)
2.2.3 Ordine di citazione delle faccette
Dopo aver analizzato e scomposto il contenuto di un documento abbiamo due
prospettive: utilizzare gli isolati così come sono, limitandoci a elencarli, oppure ricombinarli
secondo un ordine significativo. Nel primo caso gli isolati funzioneranno come semplici
parole-chiave, che non vengono combinate da noi a priori, ma solo nel momento della
ricerca da parte dell'utente, quindi avremo una indicizzazione post-coordinata (soltanto nel
momento della ricerca la richiesta di più parole-chiave restringe la gamma delle possibili
risposte). Nel secondo caso, possiamo specificare sin dall'inizio che i termini sono
coordinati in un preciso rapporto sintattico, scegliamo, cioè, una pre-coordinazione, ossia si
specifica sin dall'inizio quali rapporti sussistono tra gli isolati e dobbiamo anche adottare un
ordine convenzionale.
Le ricerche di Ranganathan e del CRG hanno confermato la convenienza nell'elencare
per prima la faccetta dell'oggetto o della persona che subisce l'azione, seguita dalle sue
eventuali proprietà e specificazioni, poi dall'azione, ossia dalle faccette dei Processi e
Operazioni, quindi dai soggetti delle azioni, ossia gli Agenti, e per ultimo dal contesto
spazio-temporale. Dunque, le categorie corrispondenti alle nostre faccette devono
succedersi secondo l'ordine di citazione standard seguente:
Categorie fondamentali di Ranganathan (PMEST)
Personalità Materia Energia Spazio Tempo
Oppure adottando le 13 categorie individuate dal CRG
Categorie fondamentali del Classification Research Group
Oggetto Tipi Parte Proprietà Materiali Processi Operazioni Prodotti Sottoprodotti
25
Due schemi di classificazione a confronto
Pazienti Agenti Spazio Tempo
Secondo Ranganathan tale ordine corrisponde a una concretezza decrescente, ovvero
l'oggetto principale di interesse è la cosa più concreta, seguita dalle azioni, dagli agenti e dal
contesto spazio-temporale (PMEST). Supponendo di avere due documenti con soggetti
quasi uguali, ma in cui la faccetta del luogo non è specificata nel secondo documento; a
parità di tutto il resto il posto di tale faccetta è immediatamente prima, poiché il generico
deve precedere lo specifico. Il che significa che un soggetto composto, che consista di
termini tratti da più di una categoria, li combinerà in tale ordine. Un esempio ipotetico può
essere il seguente:
titolo documento:
Raccolta del riso in India nella stagione secca
analisi concettuale:
Agricoltura: raccolta (E): riso (P): India (S): Stagione secca (T)
categorie:
Raccolta (Operazione/Energia/azione) Riso (Oggetto/Personalità) India (Spazio)
Stagione (Tempo)
ordine di citazione standard:
Personalità -- Entità -- Spazio -- Tempo
stringa di citazione:
riso - raccolta - India – Stagione X
Come si può notare, non tutte le faccette vengono sempre espresse in ogni documento.
Se dovessimo avere un documento sulla raccolta del riso in genere, poiché
nell'organizzazione della conoscenza il niente equivale a generalità, secondo il principio
della gradazione della specificità, lo elencheremo prima degli altri:
riso: raccolta: India
riso: raccolta: India: stagione x
riso: raccolta: India: stagione y
…
26
Due schemi di classificazione a confronto
questo significa che all'interno di una singola voce (stringa) in orizzontale le proprietà
precedono le azioni, mentre elencando diverse voci, le azioni precedono le proprietà. Tale
sottile, ma importante, principio è chiamato principio di inversione.
Il contributo di Ranganathan nel campo della scienza della classificazione può essere
sintetizzato attraverso gli elementi fondamentali che caratterizzano l'impianto della Colon:
• il disegno, lo sviluppo e l'applicazione di una classificazione analitico-sintetica;
• la preoccupazione di far operare i bibliotecari in totale autonomia nei confronti
dell'oggetto e dell'approccio;
• lo sviluppo di una guida per la classificazione delle materie che prevede 5 elementi
principali, 15 postulati, 21 canoni e 20 principi;
• la partizione del lavoro di classificazione in tre piani: quello dell'idea, quello della
parola (piano verbale) e quello della notazione (piano notazionale) specificando
dipendenza ed interdipendenza fra di essi;
• lo sviluppo dell'idea di categoria, faccetta, isolato, ordine e catena;
• lo sviluppo di un sistema notazionale molto versatile composto da elementi quali il
numero del soggetto (substantive digits), il numero degli indicatori (indicator digits), gli
empty digits, gli emptying digits e gli empty-emptying digits;
• lo stabilire una struttura per lo sviluppo della teoria e della pratica della
classificazione.
Oggi la Colon è caduta in quasi totale disuso, eppure ha generato sistemi di
indicizzazione complessi e diffusi quali PRECIS e POPSI. Questi sono sistemi di
indicizzazione pre-coordinati che sfruttano il linguaggio naturale e prevedono l'uso
dell'elaboratore, e forse va ricordato a riguardo che Ranganathan fu convinto sostenitore
dei primi tabulatori elettronici. Anche se la Colon non viene più applicata i sistemi che ne
seguono la logica sono l'eredità più evidente del lavoro e dell'impegno di S. R. Ranganathan.
Malgrado sia stata accolta dagli esperti di tutto il mondo in maniera entusiasta, la Colon
classification è stata poi abbandonata ovunque in favore della Dewey. Le indubbie difficoltà
di applicazione potevano in qualche modo essere ovviate qualora il sistema si fosse rivelato
rivoluzionario, come si era preannunciato. Rispetto alla Dewey, la Colon prevedeva uno
27
Due schemi di classificazione a confronto
schema facilmente memorizzabile e lo prova il fatto che quando il direttore dell'Università
di Delhi, S. Dasgupta, sperimentò la facilità di ricerca con alcuni studenti mettendo a
confronto le due classificazioni, quella indiana vinse di gran lunga.
2.2.4 Applicare la classificazione a faccette sul Web
Un sistema on-line basato su una classificazione a faccette, in quanto effettivamente
aperto, è quindi una soluzione interessante per andare incontro alla necessità, così urgente
sul Web, di fare affidamento su schemi di classificazione flessibili e velocemente adattabili.
Non si deve però cadere nell'errore di considerare tale apertura assoluta. È infatti chiaro
che il numero di categorie potenziali previste ha un limite che, sebbene molto elevato,
rappresenta in ogni caso un vincolo nelle capacità rappresentative del sistema. Ma gli
schemi a faccette rimediano a questo problema attraverso un alto livello di scalabilità, assai
maggiore rispetto alle classificazioni gerarchico - enumerative classiche. Queste ultime sono
infatti difficilmente scalabili: l'aggiunta di una nuova categoria rende spesso necessaria la
modifica delle classi dello stesso livello (per assicurarne la mutua esclusività) e/o di una
grossa parte della struttura ad albero dello schema. La colpa di tale imperfezione delle
classificazioni gerarchico - enumerative è da imputare anche alla loro struttura gerarchica.
In uno schema ad albero tradizionale ci sono infatti forti relazioni per ogni ramo: le classi
inferiori dipendono da quelle superiori. Negli schemi a faccette è, invece, sempre possibile
aggiungere una nuova faccetta descrittiva di un nuovo aspetto dell'oggetto (Rosati, 2003) e
non si avranno ripercussioni di alcun tipo sulle altre faccette. In una classificazione analitico
- sintetica ogni faccetta è infatti autonoma dalle altre: determina una proprietà
("sfaccettatura") dell'oggetto da classificare indipendentemente dalle proprietà descritte
dalle altre faccette.
Però se il sistema può accogliere nuove faccette senza doversi “aggiustare” globalmente,
ed è quindi intrinsecamente scalabile, si ripropone tuttavia anche in questo caso, così come
per le classificazioni gerarchico - enumerative, la questione della riclassificazione. L'aggiunta
di una faccetta rende infatti necessaria la riclassificazione di tutte le entità secondo la nuova
faccetta e, quando gli oggetti già classificati sono migliaia, il lavoro non è certo di poco
conto. Tale riclassificazione assume connotati ancora più gravi persino di quelli causati nelle
28
Due schemi di classificazione a confronto
classificazioni gerarchico - enumerative: l'inserimento di una nuova categoria in uno schema
gerarchico richiede generalmente la riclassificazione solo di una zona circoscritta della
struttura ad albero. È però evidente come l'aggiunta di una faccetta abbia vantaggi di gran
lunga superiori rispetto all'inserimento o alla modifica di una o più categorie in uno schema
gerarchico. Una faccetta in più determina, infatti, un aumento esponenziale del numero
delle combinazioni possibili e, quindi, un livello di specificazione maggiore del carattere
descrittivo delle classi.
È consigliabile allora prestare sempre molta attenzione alla preliminare analisi a faccette:
tale fase è infatti di strategica importanza nello sviluppo di un sistema di classificazione
analitico - sintetico e, se compiuta con cura, evita poi problemi di riclassificazione.
Alcuni autori non parlano di “faccette”, ma di “proprietà” e di “matrici”, come per
esempio Jeffrey Veen, famoso Web designer, responsabile di Wired Digital ed esperto di
pubblicazioni elettroniche presso il W3C. Altri parlano di classificazione «orientata agli
oggetti», ma il senso è sempre lo stesso: classificare il prodotto, la notizia, l’informazione,
secondo diverse categorie, che nel complesso lo descrivono. Si tratta di una classificazione
utile per trovare l’informazione più velocemente, ma non sempre strettamente
indispensabile per la sua reperibilità. Luca Rosati (Rosati, 2003) nella classificazione dei vini,
così spesso citata per la classificazione a faccette, si immagina delle diverse categorie relative
a:
• Colore (rosso, bianco, rosato)
• Tipo (secco, frizzante, dolce)
• Origine (regione, stato)
• Vitigno
• Abbinamento a cibi
• Produttore
• Fascia di prezzo
È ovvio che con questa
impostazione si può cercare in
modo più rapido e preciso, ma
29
Due schemi di classificazione a confronto
anche una navigazione per approfondimenti (scegliendo prima il colore, poi il tipo, poi
l’origine e così via) consente comunque all’utente di trovare il prodotto, anche se con più
fatica e in modo non ottimale, rispetto alle sue esigenze, che potrebbero, per esempio, voler
privilegiare il prezzo come punto di inizio della ricerca. In altri casi, la classificazione a
faccette è l’unico modo per rendere disponibile l’informazione a diverse categorie di utenti.
2.2.5 Architettura a faccette in un sito Web
La classificazione multidimensionale a faccette è attualmente un metodo da tenere in
considerazione, in quanto consente la coesistenza di logiche di ricerca diverse, livelli diversi
di competenza dell’utente, motivazioni diverse, senza sacrificare troppo le esigenze di
nessuno.
Il prezzo da pagare per un’architettura a faccette è rinunciare all’immagine tradizionale
della struttura e della navigazione del sito. La mappa del sito semplicemente non esiste più,
perché la struttura del sito non è più tassonomica, cioè gerarchica. I menu e relativi
sottomenu possono esserci o meno e più che navigare in senso tradizionale, si effettuano
delle ricerche. L’interfaccia di un sito con classificazione a faccette richiede grande
precisione, grande attenzione all’usabilità ed estremo rigore. La decisione di fondo da
prendere è se privilegiare una delle faccette e basare la tassonomia su quella, offrendo la
possibilità di ricercare le informazioni anche in altro modo. Ciascuna informazione verrà
categorizzata secondo tutti i parametri che possono essere
attinenti e verrà successivamente estratta sulla base della
ricerca dell’utente (Sofia Postai, 2004). Sinora siti di questo
tipo sono perlopiù dedicati all’e-commerce, come per
esempio wine.com (www.wine.com/search/default.asp) o
Yoox (www.yoox.com). In questi casi la classificazione a
faccette e la relativa ricerca tramite selezione di parametri
multipli ha lo scopo di affinare la query e ridurre il numero di
articoli trovati. Yoox (figura 8) ha centinaia di migliaia di
articoli di capi di abbigliamento e l’unica maniera per non
disorientare l’utente con un numero di pagine esagerato è di
fargli scegliere la firma, la tipologia e magari anche la taglia.
30
Figura 6: Menu a faccette del sito Wine.com
Due schemi di classificazione a confronto
Anche il sito Elastic lists (figura 8) rende il principio di navigazione e di lettura molto rapido,
migliora la presentazione delle informazioni riguardo ai primi Nobel.
Il freno a questi tipi di approccio è la difficoltà a
immaginare interfacce adeguate a rendere facile la ricerca
anche da parte di un pubblico non particolarmente evoluto.
In altre parole: i responsabili non sentono l’esigenza di
affrontare questo investimento (la classificazione costa)
proprio perché non riescono a immaginare come potrebbe
poi l’utente sfruttarla con vantaggio. In realtà è solo un
problema di progettazione d’interfaccia, che sarà abbastanza
diversa dall’abituale navigazione.
31
Figura 8: Yoox: classificazione multidimensionale per categorie
Figura 7: Schermata di “Elastic List Demo”: classificazione a faccette dei premi Nobel
Due schemi di classificazione a confronto
2.3 Classificazione a Faccette vs. Classificazione Tradizionale
Nei sistemi di classificazione tradizionali (detti
anche tassonomie tradizionali o sistemi
enumerativi), ogni elemento è classificato sotto
una e una sola categoria. Esso possiede una
corretta e univoca collocazione all’interno di un
unico schema, ampio e gerarchicamente molto
profondo, e può essere ritrovato attraverso un
percorso a gradini categoria padre > categoria
figlio. Ne sono un esempio il sistema di Linneo
(figura 9), il sistema decimale Dewey e quello
della Library of Congress (va tuttavia osservato che i sistemi Dewey e Library of Congress,
dopo il 1960 sulla scorta dell’influenza di Ranganathan furono ritoccati, accogliendo, se
pure limitatamente, parte della logica delle faccette). Un sistema di questo tipo è quindi
monodimensionale (il criterio di catalogazione è unico), e molto esteso in verticale
(essenzialmente, titolo, soggetto, autore). Essi costituiscono una sorta di ‘recipienti’ chiusi,
disposti in sequenza, e concepiti in forma di matriosca.
Alla verticalità dei sistemi di catalogazione tradizionali, e alla loro rigidità, la
classificazione a faccette contrappone un sistema di classi (faccette) orizzontale e aperto
(laddove ciascuna faccetta è descrittiva di una proprietà o aspetto dell’oggetto).
Le applicazioni basate su sistemi di classificazione a faccette hanno dimostrato di essere
molto più veloci da consultare e di garantire percentuali più alte di successo rispetto a
quelle più tradizionali. I vantaggi di una classificazione a faccette dipendono dalle
caratteristiche già indicate precedentemente con le etichette di pluridimensionalità,
persistenza, scalarità e flessibilità. Phil Murray nel suo Faceted Classification of Information (Phil
Murray, 2002) sintetizza così i vantaggi della adozione di un sistema di classificazione a
faccette per la gestione della conoscenza aziendale:
32
Figura 9. Sistema di Linneo
Due schemi di classificazione a confronto
• pur non conoscendo il nome o la collocazione di un oggetto, è possibile
nondimeno renderlo comprensibile e raggiungerlo, descrivendolo attraverso un
insieme di categorie (faccette) mutuamente esclusive;
• possibilità di aggiungere nuove faccette a quelle già stabilite in una fase
precedente (carattere aperto del sistema);
• possibilità di combinare fra loro i valori delle diverse faccette o per fornire una
descrizione più precisa dell’oggetto o per limitare i risultati di una ricerca o per
descrivere relazioni esistenti fra vari oggetti (rappresentazione della conoscenza
contenuta nel sistema).
Per esemplificare meglio tale differenza di impostazione vediamo in pratica come le due
classificazioni, Colon e Dewey, affrontano lo stesso argomento.
Esempio:
Possiamo riportare come esempio un documento sulla prevenzione del virus della pianta del riso in Giappone nel 1970.
Secondo la Colon classification l'impostazione è questa:
Agricoltura -- prevenzione -- malattia da virus
-- pianta di riso
-- Giappone -- 1970
J , 381 ; 421 : 5 . 42 , NT
risultato: J,381;421:5.42,NT
Secondo la Dewey classification l'impostazione è:
630 agricoltura e tecnologie ammesse 633 colture da pieno campo 18 riso 189 danni e malattie da infestazioni 8 virosi e rickettosi 09 (storia e geografia del soggetto) 52 Giappone 09 (storia e geografia del soggetto) 046 tra il 1960 e il 1969
risultato: 633.189 809 520 904 6
33
Due schemi di classificazione a confronto
Come si è potuto notare la sequenza alfanumerica delle due stringhe presenta la stessa
forma rappresentativa insita nella logica delle due differenti classificazioni: la Dewey appare
il prodotto di una elencazione/enumerazione, la Colon come una frase scomponibile
frutto di una sintesi analitica.
Figura 10. Confronto tra i due tipi di classificazione
34
Capitolo 3
Capitolo 3
Il caso studio: WikiArte e la classificazione a faccette.
3.1 Lo stato dell'arte
Con la locuzione stato dell'arte si intende il più alto livello di sviluppo finora raggiunto
da una tecnologia o un campo scientifico, sinonimo de “all'avanguardia”, “dell'ultima
generazione”. Il fine del progetto è quello di realizzare un enciclopedia sull'arte, avvalendosi
di strumenti, come il software libero Mediawiki4, messo a disposizione dalla “Wikimedia
foundation 5”, permettendo di ridurre i tempi di lavoro.
Un wiki è un sito web (o comunque una collezione di documenti ipertestuali) che viene
aggiornato dai suoi utilizzatori e i cui contenuti sono sviluppati in collaborazione da tutti
coloro che vi hanno accesso. La modifica dei contenuti è aperta, nel senso che il testo può
essere modificato da tutti gli utenti (a volte soltanto se registrati, altre volte anche anonimi)
procedendo non solo per aggiunte, ma anche cambiando e cancellando ciò che hanno
scritto gli autori precedenti. Ogni modifica è registrata in una cronologia che permette in
caso di necessità di riportare il testo alla versione precedente; lo scopo è quello di
condividere, scambiare, immagazzinare e ottimizzare la conoscenza in modo collaborativo.
Spesso sul Web ci si avvale di sistemi automatici di gestione dei contenuti per rendere
più semplice la realizzazione di un sito e la manutenzione dei sui documenti. Questo
strumento software non è altro che un CMS (content management system).
Letteralmente l'acronimo significa “sistema di amministrazione dei contenuti”, un
software studiato per facilitare la gestione dei contenuti di siti web, svincolando
l'amministratore da conoscenze tecniche di programmazione web. Esistono CMS
specializzati, cioè appositamente progettati per un tipo preciso di contenuti
(un'enciclopedia on-line, un blog, un forum, ecc.) e CMS generici, che tendono ad essere
più flessibili per consentire la pubblicazione di diversi tipi di contenuti.
Tecnicamente un CMS si appoggia su un database per la gestione dei contenuti ed è
suddiviso in due parti: la sezione di amministrazione (back end), che serve ad organizzare e
4 http://www.mediawiki.org/wiki/MediaWiki5 http://wikimediafoundation.org/wiki/Home
35
Il caso studio: WikiArte e la classificazione a faccette.
supervisionare la produzione dei contenuti, e la sezione applicativa (front end), che l'utente
web usa per fruire dei contenuti e delle applicazioni del sito. Date queste caratteristiche
comuni Mediawiki può essere considerato un CMS.
L'organizzazione alfabetica dei contenuti dell'enciclopedia in Wikipedia fa spazio ad una
fitta rete ipertestuale accessibile e modificabile sul World Wide Web, mentre i riferimenti a
testi interni ed esterni all'ipertesto assumono la forma di altrettanti collegamenti
ipertestuali. Se ciò non introduce alcuna innovazione rivoluzionaria alle tecnologie
assimilabili, che sono state già utilizzate nelle enciclopedie digitali su disco e da altre
enciclopedie disponibili su Internet, è il metodo usato da Wikipedia per produrre e gestire
le voci enciclopediche a meritare maggiore attenzione.
36
Il caso studio: WikiArte e la classificazione a faccette.
3.1.1 Strutturare i dati con Mediawiki
Facendo uso del software open source messo a disposizione dalla Wikimedia Foundation,
abbiamo realizzato “WikiArte”, un enciclopedia libera finalizzata alla raccolta di tutte le
informazioni, dati, documenti che riguardano il Patrimonio artistico-culturale, nel caso
specifico: il Futurismo. Una volta creati, i Wiki sono un mezzo completamente ipertestuale,
con una struttura di navigazione non lineare. Tipicamente ogni pagina contiene un gran
numero di link ad altre pagine; nei wiki di dimensioni notevoli esiste comunque una
navigazione gerarchica, ma non deve essere necessariamente usata. I collegamenti vengono
creati usando una sintassi particolare, la cosiddetta “link pattern”. Solitamente in un wiki le
nuove pagine sono create semplicemente inserendo il link appropriato partendo da una
pagina che tratta un argomento correlato. Se la pagina non esiste, il link è evidenziato
normalmente come rosso (broken link). Cercando di seguire questo link viene aperta una
finestra di modifica, che permette all'utente di inserire il testo della nuova pagina. Una volta
create le pagine che ospiteranno i contenuti dell'enciclopedia è possibile collegarle con i
link, come se si trattasse di una maglia reticolare. Questo crea una struttura flessibile,
37
Figura 11: Screenshot schermata principale WikiArte
Il caso studio: WikiArte e la classificazione a faccette.
potenzialmente infinita, che permette all'utente di aggiungere, di volta in volta, pagine e
documenti nuovi.
WikiArte offre una ricerca per
titolo, e spesso è presente anche
una ricerca full text che analizza il
testo dei contenuti. La scalabilità
della ricerca dipende dall'utilizzo o meno di un database per i contenuti: un accesso a un
database indicizzato è indispensabile per ottenere ricerche rapide su wiki di grandi
dimensioni. Su Wikipedia, il cosiddetto pulsante "Vai" permette al lettore di visualizzare
direttamente la pagina che si avvicina il più possibile ai criteri della ricerca. Ma il limite, in
qualche modo, di WikiArte e quindi di Wikipedia sta proprio in questo, nella modalità di
ricerca e indicizzazione dei dati. Nel momento in cui l'utente immette una parola-chiave
nell'apposita casella e clicca per cercare il documento, il motore di ricerca su cui è fondato
Mediawiki riporterà non la singola pagina che desideriamo ma tutte le occorrenze e pagine
in cui compare la parola-chiave.
38
Figura 13: tutte le corrispondenze trovate dopo la ricerca.
Figura 12: Barra di ricerca di WikiArte
Il caso studio: WikiArte e la classificazione a faccette.
Questo tipo di navigazione non agevola la ricerca nel momento in cui si vuole
consultare un documento in particolare, poiché costringe l'utente a scorrere tutti i risultati
sino a trovare quello giusto. Volendo fare un esempio pratico su WikiArte, alla luce di
quello che è stato detto, possiamo cercare tutte le opere di Marinetti che fanno parte di
“Parole in libertà”. In questo caso non basta digitare la stringa “parole+libertà+marinetti”,
poiché il software troverà tutte le pagine che contengono i termini su citati non
consentendo una ricerca mirata e minuziosa delle opere in questione, ossia Dune (parole in
libertà, 1914), Zang Tumb Tumb (Adrianopoli ottobre 1912. Parole in libertà), ecc...
Per un ritrovamento veloce ed efficiente del documento gli architetti dell'informazione
prediligono la classificazione a faccette per le caratteristiche già discusse. Per tale motivo, al
fine di estendere le potenzialità di WikiArte e
permettere più interrogazioni possibili, risulta
utile adottare una struttura multidimensionale.
L’architettura a faccette offre a tutti uno
strumento adeguato al reperimento
dell’informazione in un sito Web. Classificare il
prodotto, la notizia, secondo diverse categorie,
che nel complesso lo descrivono è utile per
trovare l’informazione più velocemente.
Probabilmente la classificazione a faccette è, al
momento, un metodo da tenere in considerazione in quanto consente la coesistenza di
diverse logiche di ricerca, diversi livelli di competenza e motivazioni dell'utente, senza
sacrificare le esigenze di nessuno.
Se si applica una navigazione multidimensionale all'architettura di WikiArte si dà
all'utente la possibilità di accedere, sulla base di diversi bisogni informativi, da più parti;
soddisfare varie esigenze senza troppi click; portando avanti una classificazione coerente,
intuitiva e autoesplicativa.
39
Figura 14: Struttura multidimensionale
Il caso studio: WikiArte e la classificazione a faccette.
3.2 Usare una struttura a faccette come sistema di ricerca e navigazione
Ai fini del progetto, gli esempi esplicativi sono applicati al solo movimento del
Futurismo, poiché come avanguardia ha abbracciato più discipline, dalla Letteratura
all'Architettura, con un corollario di artisti poliedrici che ci permettono di rivolgere il
progetto a tutto il Patrimonio artistico-culturale. Nella figura 15 viene presentata la logica
multidimensionale delle faccette, in cui ogni elemento è associato ad una serie di
caratteristiche che lo identificano da vari punti di vista. In questo caso in particolare, sono
state selezionate due faccette che hanno raffinato la ricerca, ottenendo come risultato solo
gli oggetti che corrispondono a quelle proprietà.
Quindi, seguendo la logica multidimensionale, ogni blocco informativo può essere
identificato con una faccetta, in modo da soddisfare un'esigenza di ricerca dell'utente. Le
faccette, se prese singolarmente o combinate, possono aiutare chi cerca la stessa
informazione partendo da motivazioni diverse. Il sistema prevede, quindi, la possibilità di
percorsi multipli sulla base dei diversi bisogni informativi e delle differenti tipologie di
40
Figura 15: risultati della ricerca dopo la selezione di alcuni criteri
Il caso studio: WikiArte e la classificazione a faccette.
utenti. Il vantaggio consiste nel poter incrociare facilmente più caratteristiche dello stesso
oggetto, ottenendo risultati mirati e soddisfacenti. L'utente può intraprendere percorsi
diversi per arrivare al medesimo risultato.
Questa struttura multidimensionale rende lo stile di navigazione interattivo, dal
momento che l'utente filtra un insieme di articoli, selezionandoli progressivamente solo da
una serie di valori di un sistema di classificazione. La figura 16 mostra lo schema
concettuale di una navigazione a faccette, in cui è possibile effettuare un primo filtraggio
degli articoli per ottenere un sottoinsieme dei documenti, seguito da altre fasi di filtraggio,
se occorre, per affinare la ricerca ed arrivare al documento desiderato. Il lato positivo
consiste nello sviluppare un'interfaccia di ricerca innovatrice, che permette agli utenti non
esperti di muoversi attraverso i grandi spazi informativi in modo flessibile, senza cadere nel
labirinto dell'architettura.
41
Figura 16: Schema concettuale di ricerca del documento in un sistema di navigazione faccette
Il caso studio: WikiArte e la classificazione a faccette.
3.3 Usare le faccette per l'architettura dell'informazione di WikiArte
Al fine di rendere il processo di organizzazione della conoscenza meno casuale e più
maneggevole, si è cercato di strutturare l'architettura dell'enciclopedia sull'arte (figura 17)
mediante il software “Flamenco”, progettato dall'Università di Berkeley.
La figura 17 illustra la mappa concettuale dell'architettura del progetto, vale a dire,
l'integrazione di due database, quello di Wikiarte e quello di Flamenco, per la formazione di
un'unica Knowledge organization, che permetterà la ricerca dei documenti sia in modo
42
Figura 17: Mappa concettuale dell'architettura dell'informazione
Il caso studio: WikiArte e la classificazione a faccette.
generico che multidimensionale (a faccette); il documento ricavato dalla navigazione a
faccette ci rimanderà ad una pagina wiki, appositamente creata, contenente tutte le
informazioni desiderate.
Flamenco (FLexible information Access using MEtadata in Novel Combinations) è un
progetto curato dall'Università di Berkeley, scritto in Python6, che consiste in un motore di
ricerca e directory organizzati con il criterio delle faccette, disponibile open source con
licenza BSD7. E’ uno strumento concepito per guidare gli utenti attraverso la vastità delle
architetture delle informazioni presenti sul web. L'interfaccia guida i suoi esploratori
attraverso categorie di scelta e parole chiave in un'organizzazione strutturale fondata sul
meta-dato. Consente quindi un'amplificazione delle tradizionali pratiche di catalogazione
bibliografica in ambiente elettronico.
Come si può osservare nella figura 18 la
directory di link si presenta graficamente
simile a quella di Yahoo o Google dando
l’impressione che ogni riquadro colorato
sia l’insieme di oggetti diversi. In realtà la
logica della directory è molto diversa:
ciascun ramo rappresenta un percorso di
accesso alternativo alla stessa collezione
di documenti, ma parallelo agli altri; ogni
riquadro è quindi una faccetta della
medesima collezione, rappresentato
visivamente con un colore diverso.
6 Python è un linguaggio di programmazione ad alto livello, orientato agli oggetti, adatto, tra gli altri usi, per sviluppare applicazioni distribuite, scripting, computazione numerica e system testing. Python è spesso paragonato a Tcl, Perl, Java, JavaScript, Visual Basic o Scheme[1]. Ideato da Guido van Rossum all'inizio degli anni novanta. Sito ufficiale: http://www.python.org/
7Le licenze BSD sono una famiglia di licenze permissive per software. Molte sono considerate libere ed open source. Il loro nome deriva dal fatto che la licenza BSD originale (detta anche licenza BSD con 4 clausole) fu usata originariamente per distribuire il sistema operativo Unix Berkeley Software Distribution (BSD), una revisione libera di UNIX sviluppata presso l'Università di Berkeley.
43
Figura 18: Interfaccia per la ricerca di informazioni in Flamenco
Il caso studio: WikiArte e la classificazione a faccette.
E’ necessario notare che le faccette rappresentano non tanto un contenitore dei dati a
nostra disposizione ma un loro descrittore semantico (proprietà o aspetto dei dati stessi). E’
possibile effettuare, sfogliando la directory, una selezione progressiva, in pratica un
filtraggio. Una volta operata una prima selezione è sempre possibile raffinare ulteriormente
la ricerca all'interno del sottoinsieme estratto utilizzando le altre faccette che vengono
sempre ripresentate assieme ai risultati.
Inoltre, per ogni insieme di risultati vengono specificate le sue coordinate semantiche
rispetto a tutte le faccette del sistema: oltre a mostrare l’insieme dei risultati, Flamenco
rende visibile la collocazione di tali risultati rispetto alle varie faccette. Quando si opera una
ricerca diretta, esso non esegue una semplice ricerca full-text, ma si appoggia al sistema di
classificazione a faccette per estrarre i risultati. L’utente, impiegando in modo combinato e
complementare searching e browsing, può:
• scegliere se cercare un’informazione mediante ricerca diretta o sfogliando una
directory;
• raffinare o espandere i risultati della propria ricerca;
• esplorare risorse correlate in maniera semantica a quelle trovate;
• scegliere punti di vista alternativi in ogni momento.
44
Figura 19: Home page Flamenco Fine Arts: Fine Arts Museums of San Francisco
Il caso studio: WikiArte e la classificazione a faccette.
Per la costruzione effettiva del sistema di classificazione possiamo individuare i seguenti
criteri fondamentali:
1. raccolta di un campione sufficientemente rappresentativo del dominio che si
intende classificare;
2. isolamento dei concetti o delle proprietà costitutive di ciascun oggetto;
3. individuazione dei termini più appropriati per descriverli ed elencarli in una lista;
4. definizione delle faccette e dei relativi foci sulla base della lista.
William Denton sostiene questi principi:
• differenziazione : quando dividiamo un'entità nelle sue componenti, è importante
utilizzare criteri di divisione (ossia faccette) capaci di distinguere chiaramente le
componenti stesse;
• rilevanza : quando scegliamo le faccette attraverso cui dividere le entità, è
importante assicurarsi che tali faccette riflettano lo scopo, l'argomento
(soggetto) e l'ambito del sistema di classificazione;
• certezza : è importante scegliere faccette ben definite e che possono essere
accertate con facilità;
• permanenza : le faccette dovrebbero rappresentare qualità permanenti
dell'oggetto da classificare;
• omogeneità : le faccette dovrebbero essere omogenee;
• mutua esclusione : le faccette devono essere mutuamente esclusive, poiché
ognuna deve rappresentare soltanto un criterio di divisione.
Bisogna sempre tenere presente lo scopo della classificazione e il target a cui ci si
riferisce, ossia chi la utilizzerà. Per un sistema di classificazione funzionale è indispensabile
una buona notazione, al fine di garantire un ordine di citazione conveniente. La notazione
non è utile solo in uno spazio fisico (biblioteche) per il collocamento o il reperimento di un
oggetto, ma anche in contesti digitali. Infatti, una corretta notazione è in grado di garantire
una presentazione delle risorse secondo un ordine conveniente (dal generale al particolare,
come stabilito dalla teoria della classificazione), più efficace del semplice criterio alfabetico
o cronologico.
45
Il caso studio: WikiArte e la classificazione a faccette.
Conviene sempre eseguire dei test con utenti per controllare la coerenza dello schema
architetturale, la sua chiarezza, le etichette scelte per faccette e foci. Inoltre, è opportuno
tenere aggiornato lo schema, affinché sia possibile rispondere a eventuali difetti che il
comportamento degli utenti può manifestare, adeguare la terminologia al cambiamento o
alle nuove esigenze e adattare lo schema per l'introduzione di nuovi elementi non previsti al
momento della costruzione.
Riferendoci al modello di Ranganathan a 5 categorie fondamentali e a quello del CRG a
13 categorie, potremmo abbozzare uno schema di questo tipo:
5 Categorie di Ranganathan
13 Categorie del CRG Faccette
PersonalitàOggetti Manufatti
Tipi
Materia
Parti Temi, Soggetti e Generi
Proprietà
Materiale Materiale
EnergiaProcessi Stile e Movimento
Operazioni Discipline
Prodotto
Sottoprodotto
Pazienti
Agenti Realizzatori
Spazio Spazio Luoghi
Tempo Tempo Periodo
Questo può essere un buon punto di partenza per riflettere su come realizzare una
classificazione a faccette, le quali possono essere rinominate e riadattate per ogni
circostanza particolare.
I criteri adottati per la definizione di queste faccette sono legati all'usabilità di un sito
Web, ossia dare la possibilità ai visitatori d'interrogare il sistema e ricevere delle risposte
sensate e veloci, senza rimanere intrappolati nel labirinto della rete. Il punto di partenza è 46
Il caso studio: WikiArte e la classificazione a faccette.
stato quello di ideare un sistema centrato sull'utente. Poiché il Web e le faccette si fondono
bene insieme, è necessario mostrare all'utente una lista di faccette sotto forma di menù da
cui selezionare e scegliere ciò che gli interessa maggiormente. Tali faccette rappresentano
un descrittore semantico delle proprietà o degli aspetti dei dati immagazzinati, che
agevolano l'operazione di ricerca dell'utente rendendola mirata ed efficace.
William Denton (2003) affermò che:
“[...]The user can make quick choices, thinking, "I'd like to see something
with that, and that, and a bit of that, and I don't care about the rest,[...]”
In un Portale Web, che racchiude un enciclopedia sull'arte, è importante pensare ad un
metodo di ricerca intuitivo, con parole-chiave che permettono il facile reperimento dei
documenti per un ampio spettro di utenza, anche per chi non conosce la terminologia del
settore. L'utente può operare delle scelte rapide senza preoccuparsi del resto, rendendo la
navigazione e la ricerca particolarmente mirata.
Il sistema di navigazione comprende un totale di otto faccette, precedentemente citate,
che definiscono un opera d'arte in tutte le sue proprietà, a partire dal tipo di manufatto, il
materiale, da chi è stato realizzato, dove e quando. Naturalmente a completare le faccette vi
sono i relativi foci e sottocategorie (dove necessario), che permettono di approfondire con
accuratezza la ricerca.
Di seguito, la tabella 1 riporta le faccette con la relativa definizione e alcuni dei propri
foci (in Appendice viene riportato il file di riferimento di ogni faccetta con la lista completa
dei foci).
47
Il caso studio: WikiArte e la classificazione a faccette.
Faccette Definizione Foci
Manufatti
La faccetta “Manufatti” si riferisce a tutte le entità che sono state riconosciute come bene artistico-culturale.
Affresco, Ceramica, Dipinto, Disegno, Fotografia, Installazione, Libro, Murale, Mosaico, Rilievo, Scultura, Stampa,Video
Temi Soggetti e Generi
La faccetta “Temi, Soggetti e Generi” si riferisce alle Tematiche affrontate nei secoli dagli artisti, i soggetti rappresentati e i Generi dell'arte.
Amore, Bellezza, Dinamismo, Dolore, Donna, Elettricità, Forza, Gioia, Macchina, Musica...
Materiali
La faccetta “Materiali” si riferisce a ciò che compone il manufatto. La maggior parte dei termini raggruppati in questa faccetta rappresentano il materiale basato sulla loro composizione.
Argilla, Avorio, Bronzo, Carta, Cartone, Ceramica, Ferro, Gesso, Inchiostro, Legno, Marmo, Pietra, Plastica, Sabbia, Seta, Stoffa, Tavola, Tela, Terracotta, Vetro...
Stile e Movimenti
La faccetta “Stile e Movimenti” fornisce i nomi dei vari stili e movimenti dell'architettura e dell'arte; gruppi e scuole che sono stati rappresentati nel lavoro di classificazione.
Art Deco, Art Nouveau, Barocco, Bauhaus, Blaue Reiter, Classicismo, Cubismo, Cubismo, orfico, Dada, Dadaismo, Decadentismo, Divisionismo, Espressionismo, Espressionismo astratto, Fauvismo, Futurismo...
Discipline
La faccetta “Discipline” contiene i principali ambiti disciplinari che l'arte abbraccia, sottolineando l'appartenenza di un manufatto alla Letteratura o alla Pittura, ecc.
Scultura, Pittura, Letteratura, Architettura, Musica, Cinema, Teatro, Danza, Giornalismo, Videoarte, Medicina, Grafica pubblicitaria
Realizzatori La faccetta “Realizzatori” si riferisce all'entità che crea o produce l'oggetto o il lavoro.
Paolo Buzzi Aldo Palazzeschi, Giuseppe Carrieri, Auro D'alba,
48
Il caso studio: WikiArte e la classificazione a faccette.
Francesco Cangiullo, Giovanni Papini, Carlo Belloli, Carlo Dalmazzo Carrà, Federico De Maria, Piero Bellanova, Ardengo Soffici, Filippo Tommaso Marinetti, Fortunato Depero
Luoghi
La faccetta “Luoghi” contiene il nome dei continenti, delle regioni, dei paesi e delle province generali in cui l'oggetto è stato creato.
Africa, Asia, America, Europa, Oceania...
Periodi
La faccetta “Periodi” elenca i diversi periodi storici, raggruppati in secoli e decadi.
Dal 1900 al 2010
Tabella 1: Tabella di definizione delle faccette e dei foci.
3.4 Preparare la collezione di dati per Flamenco
Per fare in modo che Flamenco carichi la vostra collezione di dati, i metadati relativi alla
raccolta devono essere forniti in file delimitati da tabulazioni (noto anche come file TSV,
con estensione “.tsv”). I file TSV possono essere facilmente manipolati utilizzando un
semplice editor di testo. Una raccolta, in Flamenco, consiste in un set di articoli tutti dello
stesso tipo (per esempio, tutti gli elementi sono libri, o tutti gli elementi sono canzoni, e
così via). Il metadato di un
qualsiasi articolo consiste nei
valori delle faccette e i valori
degli attributi. Il primo passo
per preparare la collezione è
quello di decidere quali
informazioni saranno nelle
faccette e quali negli attributi. I
valori delle faccette vengono
utilizzati per organizzare gli
49
Figura 20: Faccette
Il caso studio: WikiArte e la classificazione a faccette.
elementi in categorie, mentre i valori degli attributi sono visualizzati solo con i singoli
elementi.
Per esempio, nella nostra collezione “Manufatti” è la faccetta che indica il tipo di oggetto,
(bene artistico) che è stato raccolto, mentre “titolo” è l'attributo per il titolo del manufatto.
Questo perché, ha senso raggruppare i manufatti in categorie in base al tipo di oggetto, ma
non per il suo titolo.
I valori delle faccette sono associati a numeri ID, mentre i valori degli attributi sono
stringhe.
I file TSV che bisogna fornire sono:
• attrs.tsv
• facets.tsv
• items.tsv
• facet_terms.tsv (per ogni faccetta)
• facet_map.tsv (per ogni faccetta)
50
Figura 21: valori degli Attributi
Il caso studio: WikiArte e la classificazione a faccette.
Il file attrs.tsv racchiude la lista degli attributi. Ogni linea rappresenta un attributo.
Campo 1 Campo 2
attribute identifier displayable name
Il campo attribute identifier deve essere un nome corto e univoco che contiene solo
lettere e “_” (no spazi o punteggiatura) mentre displayable name è ciò che viene
visualizzato dall’utente.
Il file facets.tsv contiene la lista delle faccette. Il campo facet identifier deve essere un
nome corto e univoco (anche rispetto agli attributi) che contiene solo lettere o underscores ,
displayable name è ciò che viene visualizzato dall’interfaccia utente e long description
fornisce una descrizione dettagliata della faccetta.
Campo 1 Campo 2 Campo 3
facet identifier displayable name long description
Il file items.tsv fornisce ID e attributi per tutti gli oggetti.
Campo 1 Campo 2 Campo 3 ... Campo n + 1item
identifierValue for
attribute 1Value for attribute 1
... Value for attribute n
Ogni oggetto ha un suo ID univoco che può essere una stringa o un numero. Il campo item
identifier è seguito dai valori degli attributi per l’oggetto nell’ordine in cui gli attributi sono
inseriti nel file attrs.tsv.
Il file facet_terms.tsv ( dove facet è il “facet identifier” specificato nella prima
colonna di facet.tsv) fornisce, per ogni faccetta, l’albero dei termini delle categorie nella
faccetta.
Campo 1 Campo 2 ... Campo d - 1 Campo d Campo d + 1
term identifier top-level term ... grandparent
term parent term category term
E’ l’unico file che, in ogni riga, può avere un diverso numero di campi. Ogni linea
rappresenta una categoria e fornisce l’intera catena di categorie “padre”. Il campo term
identfer deve essere un numero univoco all’interno della faccetta.
51
Il caso studio: WikiArte e la classificazione a faccette.
Il file facet_map.tsv collega, per ogni faccetta, gli oggetti ai termini della categoria. Ogni
linea in questo file ha 2 campi:
Campo 1 Campo 2
item identifier term identifier
Il Campo 1 contiene l'ID del file item.tsv il Campo 2 contiene l'ID del file facet_terms.tsv.
52
Conclusioni
ConclusioniLungi da voler intraprendere una classificazione di tutto il Patrimonio Artistico-culturale,
il progetto vuole dimostrare la possibilità e l'efficacia di acquisire informazioni da fonti
strutturate e non strutturate e presentarli all'utente in forma semplice e facilmente
consultabile.
I risultati vengono infatti raggruppati per categorie e visualizzati con il sistema “a
faccette”, che permette di raffinare la ricerca secondo la direzione voluta, avendo, al
contempo, una visione d'insieme delle informazioni disponibili.
Il lavoro è stato svolto su due fronti :
• La realizzazione di un enciclopedia Wiki sul mondo dell'arte, con particolare
attenzione al movimento del Futurismo, per dare struttura all'informazione non
strutturata, ma semplicemente archiviata in un database.
• la pubblicazione sul web di un ambiente con interfaccia a faccette, realizzato
grazie al software Flamenco.
Tutti i vantaggi di una classificazione a faccette possono essere realizzati in pieno sul
web, a partire dal lavoro dei designer ed architetti dell'informazione che possono affidarsi
ad un sistema aperto, facilmente scalabile e flessibile; sino ad arrivare al miglioramento
sensibile dell'esperienza dell'utente in diverse situazioni di navigazione e ricerca. Gli utenti
possono iniziare la ricerca dalla faccetta che interessa maggiormente. Ognuno può trovare i
documenti che rispondono alla caratteristica selezionata, senza l'obbligo di effettuare un
unico percorso che parta da una faccetta specifica e senza dover controllare diverse sotto
categorie. Infatti, il sistema garantisce una pluralità di accessi, modalità di ricerca e
navigazione differenti, che rispondono ai bisogni informativi dei vari utenti, permettendo la
coesistenza di diversi livelli di competenza e migliorando la reperibilità dell'informazione.
53
Appendice
AppendiceElenco dei file .tsv necessari a Flamenco
Attr.tsv Facets.tsv
artista nome artista
nascita data di nascita
morte data di morte
realizzazione data di realizzazione
titolo titolo dell' oggetto
fotografia Fotografia
biografia Biografia dell'artista
manufatti Manufatti tipo di oggetto
temiSoggettiGeneri
Temi Soggetti e Generi
Tematiche artistiche
materiali Materiali materiale usato
stileMovimenti Stile e Movimenti
stile e Movimento Artistico
disciplina Disciplina Ambito disciplinare di riferimento
realizzatori Realizzatori chi ha realizzato il bene culturale
luoghi Luoghi luogo in cui il bene è stato prodotto
periodo Periodo periodo storico e anno di riferimento
Gli articoli che contengono le descrizioni dei manufatti e le biografie degli artisti sono
contenuti nel file item.tsv, una tabella che fornisce ID e attributi per tutti gli oggetti. Di
seguito un esempio del modo in cui è strutturato il file, per ogni attributo corrisponde un
campo della tabella.
Attr.tsv Item.tsv
Artista nome artista
nascita data di nascita
morte data di morte
realizzazione data di realizzazione
titolo titolo dell' oggetto
fotografia Fotografia
Ardengo Soffici
1879
1964
1914
Natura morta con uovo rosso
http://192.168.1.2:8888/mediawiki/images/thumb/8/83/1469_Ardengo_Soffici_Coi_Natura_morta_con_uovo_rosso.jpg/350px-1469_Ardengo_Soffici_Coi_Natura_morta_con_uovo_rosso.jpg
http://192.168.1.2:8888/mediawiki/index.
54
Appendice
biografia Biografia dell'artista php/Ardengo_Soffici
MANUFATTI_TERM MANUFATTI_MAP
1 Affresco2 Ceramica3 Ceramica Porcellana4 Ceramica Ceramica dipinta5 Ceramica Maiolica6 Ceramica Terracotta7 Ceramica Terraglia8 Dipinto9 Dipinto Pittura a olio10 Dipinto Pittura a tempera11 Disegno12 Disegno acquerello13 Disegno carbone14 Disegno gesso15 Disegno grafite16 Disegno Inchiostro17 Disegno pastello18 Fotografia19 Installazione20 Libro21 Murale22 Mosaico23 Rilievo24 Rilievo Altorilievo25 Rilievo Bassorilievo26 Scultura27 SculturaAvorio28 SculturaBronzo29 SculturaLegno 30 SculturaMarmo 31 SculturaOttone32 SculturaPietra33 SculturaTerracotta34 Stampa35 Stampa Acquaforte36 Stampa Acquatinta37 Stampa Fotoincisione38 Stampa Incisione
ID-item ID-Manufatti_term
Esempio
1 9
Ardengo Soffici – Natura morta con
uovo rosso
Pitura a olio
55
Appendice
39 Stampa Litografia40 Stampa Manifesto41 Stampa Mezzotinto42 Stampa Puntasecca43 Stampa Serigrafia44 Stampa Xilografia45 Video
TEMISOGGETTIGENERI_TERM TEMISOGGETTIGENERI_MAP
1 Amore2 Bellezza3 Dinamismo4 Dolore5 Donna6 Elettricita7 Forza8 Gioia9 Macchina10 Musica11 Natura morta12 Paesaggio13 Pericolo14 Ritratto15 Ritratto Autoritratto16 Treno17 Velocità18 Viaggio19 Madre
ID-item ID-temiSoggettiGeneri_term
Esempio
1 11
Ardengo Soffici – Natura morta con
uovo rosso
Natura morta
MATERIALI_TERM MATERIALI_MAP
1 Argilla
2 Avorio
3 Bronzo
4 Carta
5 Cartone
6 Cera
7 Ceramica
8 Ferro
9 Inchiostro
10 Legno
11 Marmo
ID-item ID-materiali_term
Esempio
1 18
Ardengo Soffici – Natura morta con
uovo rosso
Tela
56
Appendice
12 Pietra
13 Plastica
14 Sabbia
15 Seta
16 Stoffa
17 Tavola
18 Tela
19 Terracotta
20 Vetro
STILEMOVIMENTI_TERM STILEMOVIMENTI_MAP
1 Art Deco 2 Art Nouveau3 Barocco4 Bauhaus5 Blaue Reiter 6 Die Brücke7 Classicismo8 Cubismo9 Cubismo10 Dada11 Dadaismo12 Decadentismo13 Divisionismo14 Espressionismo15 Espressionismo astratto 16 Fauvismo17 Futurismo18 Gotico19 Impressionismo20 Luminismo21 Macchiaioli22 Manierismo23 Minimalismo24 Neo-Plasticismo25 Neo-Romanticismo26 Neoclassica pittura27 Nucleare Arte28 Optical Art29 Orfismo30 Pop Art31 Preraffaelliti32 Primitivismo
ID-item ID-stileMovimenti_term
Esempio
1 17
Ardengo Soffici – Natura morta con
uovo rosso
Futurismo
57
Appendice
33 Purismo34 Realismo35 Realismo cubista36 Realismo magico37 Realismo sociale38 Rinascimento39 Rococò40 Romanisto41 Romanticismo42 Scuola di Parigi43 Simbolismo44 Sintetismo45 Suprematismo46 Surrealismo47 Umanesimo48 Valori Plastici49 Verismo50 Vorticismo
DISCIPLINE_TERM DISCIPLINE_MAP
1 Scultura2 Pittura3 Letteratura4 Architettura5 Musica6 Cinema7 Teatro8 Danza9 Giornalismo10 Videoarte11 Medicina12 Grafica pubblicitaria13 Arte Musiva
ID-item ID-discipline_term
Esempio
1 2
Ardengo Soffici – Natura morta con uovo rosso
Pittura
REALIZZATORI_TERM REALIZZATORI_MAP
1 Architetto2 Architetto Antonio Sant'Elia3 Avvocato4 Avvocato Giuseppe Carrieri5 Collezioni6 Collezionisti7 Compositore8 Compositore Luigi Russolo9 Critico d' arte10 Critico d' arte Carlo Belloli11 Critico d' arte Carlo Carrà12 Critico d' arte Federico De Maria
ID-item ID-realizzatori_term
Esempio
1 32
Ardengo Soffici – Natura morta con
uovo rosso
Pittore Ardengo Soffici
58
Appendice
13 Drammaturgo14 Drammaturgo Filippo Tommaso Marinetti15 Drammaturgo Paolo Buzzi16 Fondazioni17 Giornalista18 Giornalista Paolo Buzzi19 Giornalista Enrico Cavacchioli20 Giornalista Gesualdo Manzella Frontini21 Giornalista Federico De Maria22 Medico23 Medico Piero Bellanova24 Mercanti d'arte25 Mosaicista26 Mosaicista Gino Severini27 Musei28 Pittore29 Pittore Francesco Cangiullo30 Pittore Carlo Dalmazzo Carrà31 Pittore Giacomo Balla32 Pittore Ardengo Soffici33 Pittore Uberto Boccioni34 Pittore Fortunato Depero35 Pittore Enrico Prampolini36 Pittore Luigi Russolo37 Pittore Gino Severini38 Poeta39 Poeta Paolo Buzzi40 Poeta Enrico Cavacchioli41 Poeta Corrado Govoni42 Poeta Libero Altomare43 Poeta Luciano Folgore44 Poeta Gesualdo Manzella Frontini45 Poeta Auro D'alba46 Poeta Francesco Cangiullo47 Poeta Federico De Maria48 Poeta Ardengo Soffici49 Poeta Filippo Tommaso Marinetti50 Pubblicitario51 Pubblicitario Fortunato Depero52 Scenografo53 Scenografo Giacomo Balla54 Scenografo Enrico Prampolini55 Scenografo Fortunato Depero56 Scrittore57 Scrittore Paolo Buzzi58 Scrittore Aldo Palazzeschi59 Scrittore Giuseppe Carrieri60 Scrittore Auro D'alba61 Scrittore Francesco Cangiullo62 Scrittore Giovanni Papini
59
Appendice
63 Scrittore Carlo Belloli64 Scrittore Carlo Dalmazzo Carrà65 Scrittore Federico De Maria66 Scrittore Piero Bellanova67 Scrittore Ardengo Soffici68 Scrittore Filippo Tommaso Marinetti69 Scrittore Fortunato Depero70 Scultore71 ScultoreGiacomo Balla72 ScultoreUmberto Boccioni73 ScultoreFortunato Depero74 ScultoreEnrico Prampolini75 Grafico pubblicitario76 Grafico pubblicitario Fortunato Depero
LUOGHI_TERM LUOGHI_MAP
1 Africa2 Africa Angola3 Africa Benin4 Africa Burkina Faso5 Africa Camerun6 Africa Congo7 Africa Costa d' avorio8 Africa Egitto9 Africa Gabon10 Africa Gana11 Africa Madagascar12 Africa Mali13 Africa Nigeria14 Africa Repubblica di Liberia15 Africa Sierra Leone16 Africa Sud Africa17 Africa Zaire18 Asia19 Asia Afghanistan20 Asia Asia Centrale21 Asia Assiria22 Asia Cina23 Asia Giappone24 Asia India25 Asia Persia26 Asia Russia27 Asia Tailandia28 Asia Tibet29 Asia Turchia30 Asia Turkmenistan31 Asia Uzbekistan32 Australia
ID-item ID-luoghi_term
Esempio
1 45
Ardengo Soffici – Natura morta con
uovo rosso
Italia
60
Appendice
33 Europa34 Europa Austria35 Europa Belgio36 Europa Boemia37 Europa Cecoslovacchia38 Europa Cipro39 Europa Danimarca40 Europa Francia41 Europa Germania42 Europa Gran Bretagna43 Europa Grecia44 Europa Irlanda45 Europa Italia46 Europa Norvegia47 Europa Olanda48 Europa Paesi Bassi49 Europa Polonia50 Europa Portogallo51 Europa Scozia52 Europa Spagna53 Europa Svezia54 Europa Svizzera55 Europa Ungheria56 America57 America58 Oceania59 Oceania Australia60 Oceania New Zelanda61 Oceania Polinesia62 Oceania Micronesia63 Oceania Melanesia
PERIODO_TERM PERIODO_MAP
1 1900s2 1900s 19013 1900s 19024 1900s 19035 1900s 19046 1900s 19057 1900s 19068 1900s 19079 1900s 190810 1900s 190911 1910s12 1910s 191013 1910s 191114 1910s 191215 1910s 191316 1910s 1914
ID-item ID-periodo_term
Esempio
1 16
Ardengo Soffici – Natura morta con uovo rosso
1914
61
Appendice
17 1910s 191518 1910s 191619 1910s 191720 1910s 191821 1910s 191922 1920s23 1920s 192024 1920s 192125 1920s 192226 1920s 192327 1920s 192428 1920s 192529 1920s 192630 1920s 192731 1920s 192832 1920s 192933 1930s34 1930s 193035 1930s 193136 1930s 193237 1930s 193338 1930s 193439 1930s 193540 1930s 193641 1930s 193742 1930s 193843 1930s 193944 1940s45 1940s 194346 1940s 194447 1940s 194548 1940s 194649 1940s 194750 1940s 194851 1940s 194952 1950s53 1950s 195054 1950s 195155 1950s 195256 1950s 195357 1950s 195458 1950s 195559 1950s 195660 1950s 195761 1950s 195862 1950s 195963 1960s64 1960s 196065 1960s 196166 1960s 1962
62
Appendice
67 1960s 196368 1960s 196469 1960s 196570 1960s 196671 1960s 196772 1960s 196873 1960s 196974 1970s75 1970s 197076 1970s 197177 1970s 197278 1970s 197379 1970s 197480 1970s 197581 1970s 197682 1970s 197783 1970s 197884 1970s 197985 1980s86 1980s 198087 1980s 198188 1980s 198289 1980s 198390 1980s 198491 1980s 198592 1980s 198693 1980s 198794 1980s 198895 1980s 198996 1990s97 1990s 199098 1990s 199199 1990s 1992100 1990s 1993101 1990s 1994102 1990s 1995103 1990s 1996104 1990s 1997105 1990s 1998106 1990s 1999107 2000s108 2000s 2000109 2000s 2001110 2000s 2002111 2000s 2003112 2000s 2004
63
Bibliografia
Broughton,V. (2004, Gennaio 26), Una classificazione per il 21' secolo. Tratto il giorno Giugno
13, 2010 da AIB-WEB: <http://www.aib.it/aib/contr/broughton1.htm>
Bussolon, S. (s.d.). Organizzazione - Schemi organizzativi. Tratto il giorno Marzo 17, 2010 da
Hyperlabs <http://www.cardsorting.info/it/architettura/03.html>
Denton, W. (2003). How to Make a Faceted Classification and Put It On the Web. Tratto il giorno
10 Giugno, 2010 da Miskatonic university press,
<http://www.miskatonic.org/library/facet-web-howto.html>
Gnoli, C. (2000, Novembre 03). Il tavolino di Ranganathan. Tratto il giorno Giugno 14, 2010
da <http://didattica.spbo.unibo.it/bibliotime/num-iii-3/gnoli.htm>
Gnoli, C. (2002, Ottobre 17). Indicizzazione semantica nell'era digitale, ESB forum. Tratto il
giorno Marzo 22, 2010 da <http://www.burioni.it/forum/gnoli-sem.htm>
Gnoli, C. (2004). Classificazione a faccette. Roma: Associazione italiana Biblioteche.
Gnoli, C., Marino, V., & Rosati, L. (2006). Organizzare la conoscenza - Dalle biblioteche
all'architettura dell'informazione per il Web. Milano: Tecniche Nuove.
Hearst M. , English J., Sinha R., Swearingen K., & Yee K.-P. (Settembre 2002). Finding the
flow in web site search. Communications of the ACM.
Hearst M. A., Smalley P., & Chandler C., (2006, Aprile 26) Faceted Metadata for Information
Architecture and Search. New York: Association for Computing Machinery.
Instone, K. (2004, Luglio 8), Faceted Browsing - How User Interfaces Represent and Benefit from a
Faceted Classification System, SOASIST meeting, Dayton, Ohio
Jacob, Elin (1999). Utilizing Faceted Structures for Information Systems Design , Proceedings of the
62st Annual Meeting of ASIS. Uta Priss
Lavazza, C., Fiacchi, A., & Lauro, B. (2006, Novembre 06). Breve guida alla classificazione.
Tratto il giorno Marzo 18, 2010 da Trovabile <http://trovabile.org/articoli/guida-
alla-classificazione>
64
Marino, V. (2004, Febbraio 12). Classificazioni per il Web - I vantaggi dell'adozione di schemi a
faccette. Tratto il giorno Marzo 09, 2010 da AIB-WEB:
<http://www.aib.it/aib/contr/marino1.htm>
Ménard E., Mas S., & Alberts I., (2010) Faceted Classification for Museum Artefacts: A
Methodology to Support Web Site Development of Large Cultural Organizations tratto il
giorno 15 Giugno, 2010 da <www.cais-
acsi.ca/proceedings/2010/CAIS045_MenardMasAlbert_Final.pdf>
Morville, P., & Rosenfeld, L. (2002). Architettura dell'informazione per il World Wide Web.
Milano: Hops Libri.
Murray Phil, 2002, Conventional categorization: a complement to faceted classification, Knowledge
management connection, <http://www.kmconnection.com/Popularity-
based_classification.htm>
Postai, S. (Ottobre 2004) Facilitare la reperibilità dell’informazione: la classificazione a faccette tratto
il giorno Marzo 2010, 20 da Internet.pro <http://www.internet-
pro.typepad.com/aaaaArchFaccetteF.pdf>
Rosati, L. (2003). La classificazione a faccette fra Knowledge Management e Information Architecture
(parte I). Tratto il giorno Marzo 2010, 16 da itConsult:
<http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM.pdf>
-(2003). La classificazione a faccette fra Knowledge Management e Information Architecture (parte II).
Tratto il giorno Marzo 2010, 16 da itConsult:
<http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM_2.pdf>
Rosati, L. (2007). Architettura dell'informazione - Trovabilità: dagli oggetti quotidiani al Web. Milano:
Apogeo.
Spiteri L. (Aprile-Luglio 1998). A simplified model for facet analysis: Ranganathan 101. Canadian
Journal of Information and Library Science 23.
Vickery, B.C. (1972.) La classificazione a faccette. Guida per la costruzione e la utilizzazione di schemi
speciali. Roma, Consiglio nazionale delle ricerche.
65
Top Related