Download - Classificazione a Faccette

Transcript

Indice generale

Introduzione......................................................................................................2

Capitolo 1...........................................................................................................5

Wikipedia e la classificazione gerarchico – enumerativa Dewey......................5

1.1 Le origini dell'enciclopedia collaborativa...................................................................... 5

1.2 Organizzare la conoscenza............................................................................................ 7

1.3 Schemi organizzativi ..................................................................................................... 9

1.4 Strutture organizzative................................................................................................. 121.4.1 Struttura organizzativo - gerarchica di Wikipedia................................................................................... 13

Capitolo 2......................................................................................................... 15

Due schemi di classificazione a confronto...................................................... 15

2.1 La classificazione gerarchico – enumerativa................................................................ 152.1.1 Le classificazioni gerarchica sul Web e la questione dell'incoerenza..................................................... 17

2.2 Classificazione analitico – sintetica ............................................................................ 192.2.1 Il concetto di faccetta................................................................................................................................... 192.2.2 Classificazione Colon .................................................................................................................................. 212.2.3 Ordine di citazione delle faccette............................................................................................................... 252.2.4 Applicare la classificazione a faccette sul Web......................................................................................... 282.2.5 Architettura a faccette in un sito Web....................................................................................................... 30

2.3 Classificazione a Faccette vs. Classificazione Tradizionale.........................................32

Capitolo 3........................................................................................................ 35

Il caso studio: WikiArte e la classificazione a faccette....................................35

3.1 Lo stato dell'arte.......................................................................................................... 353.1.1 Strutturare i dati con Mediawiki................................................................................................................. 37

3.2 Usare una struttura a faccette come sistema di ricerca e navigazione........................40

3.3 Usare le faccette per l'architettura dell'informazione di WikiArte..............................42

3.4 Preparare la collezione di dati per Flamenco.............................................................. 49

Conclusioni......................................................................................................53

Appendice........................................................................................................54

Bibliografia...................................................................................................... 64

Introduzione

L'acutezza del pensiero, la chiarezza nell'espressione, l'esattezza nella comunicazione, la prontezza nella risposta, e la precisione nel servizio dipendono in ultima analisi dalla successione conveniente, ovvero dalla Classificazione.

[S. R. Ranganathan 1967]

Sin dalla sua comparsa, l'uomo ha dovuto sempre affrontare l'ostacolo della

comunicazione, per comprendere ed essere compreso. Nei secoli il linguaggio, sia verbale

che scritto, si è evoluto distinguendosi nei diversi idiomi e producendo un ingente quantità

di materiali e documenti che oggi costituiscono il patrimonio dell'umanità. Questa è una

realtà dinamica, un insieme aperto, non definitivo, ma in perenne ampliamento; di cui

vengono a far parte ritrovamenti e acquisizioni continui di dati e materiali.

La sorprendente mole di documenti e manufatti che l'uomo è riuscito a produrre sino ad

oggi porta con se il problema di una comunicazione ottimale. Organizzare questo sistema

aperto di dati, informazioni e conoscenze diventa una particolare sfida da affrontare, per

rispondere all'esigenza di porre ordine al caos dell'informazione. Gestire la conoscenza, al

fine di favorirne la reperibilità è indispensabile per poterla utilizzare, trovando le

informazioni che occorrono al momento della ricerca tra le innumerevoli a disposizione.

Questo è quello di cui si occupa l' Architettura dell'informazione, ossia strutturazione,

organizzazione e catalogazione del sapere.

In qualsiasi ambito e settore è necessario mettere ordine al materiale di cui si dispone,

gestire ed organizzare i dati permettendo così una buona reperibilità degli stessi. Anche

gestire la merce di un magazzino ha bisogno di un sistema ottimale di archiviazione, per

reperire i prodotti in modo semplice e rapido.

Il punto di partenza di qualsiasi ricerca è sapere quali conoscenze sono già note e come

sono strutturate, infatti reperire informazioni da un sistema ben strutturato agevola l'attività

di ricerca, risparmiando tempo prezioso. Per cui, gestire l'architettura dell'informazione, in

una società in cui la reperibilità del dato è fondamentale, diventa un lavoro prioritario da

estendere a tutti i settori e ambiti disciplinari.

Già nell'antica Grecia Aristotele aveva affrontato la difficoltà di organizzare il sapere

umano, discutendone in opere separate, raggruppandolo in tre grandi classi: teoretica,

pratica e poetica.

Nell'era in cui viviamo adesso, l'era della digitalizzazione, le informazioni viaggiano per

mezzo di un nuovo canale, ossia quello virtuale di Internet. Il World Wide Web, elidendo le

barriere fisiche e geografiche, ha messo in comunicazione l'intero pianeta con uno scambio

di informazioni senza limiti e ha raccolto in un unico grande contenitore tutto lo scibile

umano. In questo contesto, la progettazione dell'architettura dell'informazione diviene

l'obiettivo primario per soddisfare l'esigenza dell'utente, ossia reperire l'informazione che ci

è utile dal flusso continuo di documenti.

Già da tempo, Internet offre la possibilità, a tutti gli utenti, di reperire, caricare e

pubblicare qualsiasi informazione, che giorno dopo giorno aumenta esponenzialmente. Se

prima la responsabilità di classificare, organizzare e fornire accesso ai dati era

principalmente di bibliotecari o addetti ai lavori, adesso è l'utente a farsi carico di tutto ciò,

nel momento stesso in cui li pubblica. Allora, risulta necessario etichettare i contenuti,

adottare uno schema di classificazione specifico, e gestire nel migliore dei modi

l'amministrazione del perenne flusso di informazioni.

La Tesi vuole dimostrare che è possibile ampliare le potenzialità di un mezzo innovativo

come MediaWiki per un facile reperimento dei beni artistico-culturali, rendendo la

navigazione e la ricerca intuitiva e minuziosa. Il progetto ha lo scopo di dare

all'informazione una struttura a faccette grazie al software Flamenco, al fine di garantire

una ricerca e una navigazione ottimale per arrivare al documento desiderato, passando da

una pluralità di accessi; una volta trovato il manufatto, la pagina di Flamenco che ne

descrive le proprietà rimanderà l'utente alle pagine di MediaWiki, opportunamente

realizzate, che gestiscono le informazioni archiviate nel suo database.

La seguente tesi si articola in tre capitoli:

• il primo capitolo prende in esame l'ormai nota Enciclopedia collaborativa

Wikipedia e la classificazione gerarchico – enumerativa; una breve panoramica

sull’organizzazione dell’informazione, soffermandoci sui sistemi di

classificazione maggiormente adottati, sull'importanza delle strutture e dei

sistemi organizzativi.

• Il secondo capitolo mette a confronto i due schemi di classificazione: gerarchico

- enumerativa ed analitico - sintetica, ossia, la Dewey classification contro la

Colon classification; mettendo in evidenza i corrispettivi punti di forza

nell'applicazione.

• Il terzo capitolo tratta del caso studio, vale a dire, la realizzazione di

un'enciclopedia collaborativa, sulla scia di Wikipedia, destinata ad accogliere le

informazioni sul Patrimonio artistico-culturale; migliorando la gestione dei

contenuti mediante l'apporto di una classificazione a faccette. Nel caso specifico

del progetto l'attenzione è stata rivolta alle opere dell'Avanguardia Futurista.

Gestire l'architettura dell'informazione tramite un analisi top-down, dall'alto

verso il basso ci permette di stabilire a priori le classi principali del nostro

schema. Questa metodologia permette una ricerca più accurata, dovuta ad

apposite faccette, che permettono un filtraggio dei documenti archiviati.

Capitolo 1

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1.1 Le origini dell'enciclopedia collaborativa.

Wikipedia nella sua accezione più elementare è un database Internet che permette a

chiunque, indipendentemente da competenze o qualifiche, di scrivere e modificare voci su

qualsiasi argomento. L'insieme dei contenuti di diversi autori volontari è autodefinito

“Enciclopedia” dal gestore del servizio (Wikimedia Foundation, Inc., una società no-profit

statunitense) e come tale riconosciuta dai medesimi collaboratori non necessariamente

specialisti.

L'obiettivo di Wikipedia è di creare un'enciclopedia libera e "universale", in termini sia di

ampiezza che di profondità degli argomenti trattati. Wikipedia è stata descritta da uno dei

suoi fondatori, Jimmy Wales, come ''uno sforzo per creare e distribuire un'enciclopedia libera della

più alta qualità possibile ad ogni singola persona sul pianeta nella sua propria l ingua''.

La differenza più evidente con le tradizionali enciclopedie è che in Wikipedia

l'organizzazione dei contenuti fa spazio ad una fitta rete ipertestuale accessibile e

modificabile sul Web, e i riferimenti a fonti interne ed esterne assumono la forma di

altrettanti collegamenti ipertestuali.

Wikipedia ha le sue origini in un progetto complementare, avviato nel 2000 da una

società commerciale statunitense sotto il nome Nupedia, un progetto per la creazione di

un’enciclopedia libera online le cui voci erano scritte da esperti attraverso un processo

formale di revisione.

Wikipedia, autodefinitasi “enciclopedia libera” sceglie il World Wide Web come mezzo

di distribuzione e scrittura delle voci enciclopediche, ed in particolare una tecnologia web

denominata Wiki, da cui prende il nome. Un wiki (un termine in lingua hawaiana che

significa “veloce”, “rapido”) è un software collaborativo per il Web ideato nel 1995

dall'ingegnere informatico statunitense Ward Cunningham per permettere la pubblicazione

di ipertesti direttamente modificabili dagli utenti, che possono scrivervi usando una sintassi

più semplice di HTML. Il termine wiki è usato sia per indicare il software in sé, più

precisamente software wiki o wiki engine, che l'ipertesto modificabile.

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

Con la crescita nella consultazione e l'aumento dell'estensione di Wikipedia, diffusasi

nelle varie versioni in lingua, a partire dall'originaria versione in lingua inglese, è aumentato

anche l'interesse degli studiosi che hanno dedicato al modello wiki in generale e a Wikipedia

in particolare saggi ed articoli scientifici inizialmente limitati agli aspetti più informatici e

tecnici per poi integrare recentemente anche le scienze sociali.

Nel giro di dieci anni questa enciclopedia online ha raggiunto il quattordicesimo posto

nella graduatoria mondiale di Alexa1 per richieste, superando fra gli altri il sito della

Biblioteca del Congresso statunitense (dal 2003-12) e dell'Enciclopedia Britannica (dal

2003-06), diventando l'enciclopedia online più consultata al mondo.

1 La Alexa Internet Inc. è un'azienda statunitense sussidiaria di Amazon.com che si occupa di statistiche sul

traffico di Internet. Alexa è anche un motore di ricerca con un servizio di web directory.6

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1.2 Organizzare la conoscenza

Da secoli gli esseri umani strutturano, organizzano e classificano le informazioni, dando

al sapere un valore aggiunto come quello della sistematizzazione, poiché lo rende

maggiormente comprensibile e consultabile.

Per molti secoli, l’organizzazione aristotelica del sapere, è stato un punto di riferimento

principale, raggruppando tutti i campi della conoscenza in tre classi: teoretica, pratica e

poetica.

Fino a quando, attorno al 1600 il filosofo inglese Francis Bacon distingueva le scienze a

seconda delle facoltà conoscitive che le producono: memoria, immaginazione e ragione.

Tale successione arriverà fino al 1873, quando Mervil Dewey, un bibliotecario di un college

di New York, sviluppò un Sistema Decimale di classificazione, che prese il suo nome. Uno

strumento per classificare e fornire accesso al crescente numero di libri.

[…] Dewey suddivise ogni disciplina in sottoclassi e queste a loro volta in sotto-

sottoclassi e così via, in modo da distinguere anche argomenti molto specifici. Per indicare

ciascuna classe, Dewey utilizzò dei numeri, inizialmente di tre cifre: così 800 significava

Letteratura in genere, ma 810 significava Letteratura Americana, […] potenzialmente

all’infinito, poiché le cifre decimali di un numero possono essere infinite. Il nuovo sistema

prese quindi il nome di Classificazione Decimale di Dewey (Gnoli, Marino, & Rosati,

2006).

La nostra epoca si contraddistingue per una congestione informativa, un sovraccarico

d’informazioni, che pone con urgenza la necessità di archiviare questa mole di dati, in

modo da favorirne un recupero intelligente. Ma se l’era digitale ha amplificato questo

problema, esso non è del tutto nuovo: discipline come le scienze bibliotecarie e la

documentazione si occupano già di classificazione del sapere.

L’esplosione della quantità di conoscenze pubblicate sul Web ha reso più arduo il

reperimento delle informazioni, in particolare trovare quello che ci interessa in breve

tempo. Perciò, occorre una buona Architettura dell’informazione.

Peter Morville (Morville & Rosenfeld, 2002) definisce tale concetto in quattro punti

fondamentali:

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1. la combinazione di organizzazione, categorizzazione e schemi di navigazione

all’interno di un sistema di informazioni.

2. Il design strutturale e di uno spazio informativo atto a facilitare l’esecuzione dei

compiti e l’accesso intuitivo ai contenuti.

3. L’arte e la scienza della strutturazione e classificazione dei siti Web e delle intranet

per assistere gli utenti a trovare e gestire le informazioni.

4. Una disciplina emergente ed un gruppo di pratiche focalizzate a portare i principi

del design e dell’architettura del paesaggio digitale.

Oggi, attraverso l’esperienza di libri, biblioteche ed enciclopedia online, abbiamo

familiarità con il concetti di base dell’organizzazione delle informazioni. Però, La

rivoluzione informatica ha creato l’illusione che si potesse improvvisamente risolvere il

problema dell’organizzazione e della gestione dell’informazione per favorirne la reperibilità.

Oggi si è capito che la tecnologia è sicuramente un supporto per la gestione della

conoscenza ma ciò non elimina il problema dell’organizzazione dei suoi contenuti. Sempre

più persone hanno la libertà di pubblicare informazioni, ma anche la responsabilità di

organizzarle in quanto tali.

Uno degli aspetti che interessano l'architettura dell'informazione è l'organizzazione

ottimale dei contenuti nei documenti, in particolare nei siti web. Per mantenere efficace un

sito Web di grandi dimensioni, specialmente se vi collaborano molte persone, occorre

seguire metodi di lavoro e convenzioni strutturali sostenibili, per le quali le tecniche “da

bibliotecari” possono risultare molto utili (Gnoli, 2002). La possibilità di integrare diverse

forme comunicative e di creare dei collegamenti istantanei da un punto a un altro di un sito,

o anche dell’intera Rete, rende particolarmente importante la progettazione di un efficace

Architettura dell’informazione.

A questo scopo vengono utilizzate, più o meno consapevolmente, varie forme di sistemi

per l'organizzazione della conoscenza (knowledge organization system, KOS), come parole-

chiave, tesauri, stringhe di soggetto, tassonomie, ontologie, schemi di classificazione.

Gli schemi di classificazione sono forse i più classici tra i KOS. Sono stati sviluppati

soprattutto a partire dalla fine dell'Ottocento, per far fronte alla crescente quantità di

documenti da ordinare e gestire nelle biblioteche e nelle bibliografie. La maggior parte degli 8

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

schemi di classificazione sono sostanzialmente enumerativi, ossia si basano sull'elencazione

delle classi nelle quali è possibile ripartire i documenti da classificare. Poiché le possibilità di

combinare fra loro i concetti sono limitate, quasi tutti i concetti da utilizzare devono essere

già previsti dallo schema, che perciò è necessariamente costituito da tavole voluminose.

L'universo della conoscenza viene suddiviso in un certo numero di classi principali, ognuna

di queste in sottoclassi, e così via, sviluppando in questo modo un albero gerarchico, di

profondità teoricamente illimitata. L'esempio più famoso, come abbiamo già detto, è la

Classificazione decimale Dewey (CDD), introdotta dal bibliotecario newyorkese Melvil

Dewey a partire dal 1876, e da allora progressivamente espansa, aggiornata e adottata in

biblioteche di tutto il mondo.

1.3 Schemi organizzativi

Per consentire il facile recupero dei dati, in una quantità notevole di documenti, occorre

organizzarli adoperando un buon metodo di classificazione. Classificare non è però un

compito semplice. Un attività di classificazione non supportata da strategie, metodologie e

competenze adeguate rischia di produrre organizzazioni illogiche degli articoli, poco

scalabili e difficilmente utilizzabili dagli utenti.

Il successo di un sito web è determinato dall’organizzazione delle informazioni. Per

questo i sistemi organizzativi sono composti da: <<schemi organizzativi>> e <<strutture

organizzative>>.

Uno schema organizzativo definisce le caratteristiche condivise nei contenuti ed

influenza il raggruppamento logico di questi contenuti. Una struttura organizzativa

definisce i tipi di relazione tra singoli contenuti e gruppi. […] L’organizzazione è

strettamente correlata alla navigazione, denominazione e indicizzazione. Le strutture di

organizzazione gerarchica dei siti spesso costituiscono il principale sistema di navigazione.

Le denominazioni delle categorie giocano un ruolo significativo nel definire i contenuti di

quelle categorie. L’indicizzazione manuale o la marcatura dei metadati è in ultima analisi

uno strumento per organizzare i singoli contenuti in gruppi a livello estremamente

dettagliato (Morville & Rosenfeld, 2002).

Possiamo avere schemi organizzativi esatti e ambigui.

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

Il file system del nostro computer ci da un buon esempio di alcuni schemi esatti di

organizzazione. Quando navighiamo le cartelle del nostro hard disk possiamo ordinarne i

contenuti per nome, data di ultima modifica, tipo di file o dimensione. Un'altro buon

esempio è il client di posta elettronica. Generalmente ordiniamo le mail in entrata in base

alla data di arrivo, ma possiamo ordinarle anche per oggetto o per mittente. Nome, data,

dimensione di un file, oggetto, mittente di una mail sono schemi di ordinamento esatti,

perché sono informazioni che si basano su quantità che possono essere su scala ordinale,

come l'ordine alfabetico, o ad intervalli, come le date, o a rapporti, come la dimensione di

un file. Un altro schema esatto può essere quello geografico. La open directory

www.dmoz.org, ad esempio, presenta anche una categorizzazione per area geografica, e

dunque i siti internet dedicati alla città di Rovereto si trovano sotto il percorso

Regional > Europe > Italy > Trentino Alto Adige > Trento > Rovereto

Il vantaggio degli schemi esatti è che l'ordinamento può essere fatto automaticamente

dall'applicazione. Non è necessario, dunque, ordinare a mano le mail ricevute in base alla

data di arrivo, in quanto è il programma stesso a farlo per noi. Ma soprattutto se si conosce

la data di arrivo di un'e-mail risulta facile trovarla.

A volte, però, gli utenti si trovano in difficoltà nell'usare gli schemi esatti, in quanto le

loro conoscenze in merito a ciò che cercano non sono precise. Se, ad esempio, non ricordo

la data precisa di un'e-mail che sto cercando, né il mittente, né l'oggetto trovare quell’e-mail

in base agli schemi esatti può risultare un'impresa non facile.

In altre circostanze, poi, è l'informazione stessa che non si presta a schemi esatti, in

quanto è per sua natura ambigua. Gli schemi ambigui sono meno semplici da

implementare, ed introducono degli elementi di soggettività. Ciononostante risultano

spesso estremamente utili. C’è un semplice motivo per cui la gente trova i sistemi di

classificazione ambigui così utili: non sempre sappiamo cosa cercare (Morville &

Rosenfeld, 2002).

I responsabili delle biblioteche usano molto spesso schemi ambigui per argomento

come il Dewey Decimal. Vi sono differenti tipologie di schemi ambigui. Un corpus di

informazioni può essere classificato ad esempio per argomento, per compito, per tipologia

di utenza. Immaginiamo, ad esempio, il sito web di una facoltà universitaria. Le risorse

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

possono essere raggruppate per argomento, e allora potremo avere le categorie: didattica,

ricerca, servizi. Possono essere raggruppate per tipologia di utente, e allora avremo un

ingresso diverso per studenti, docenti, personale, aziende, persone interessate ad iscriversi ai

corsi di laurea e così via. Nella sezione dedicata alla didattica on line le risorse possono

essere raggruppate per argomento: consultare il programma di un insegnamento, seguire le

lezioni online, iscriversi all'esame. Naturalmente in questo caso la classificazione è soggetta

ad ambiguità e difficoltà. Dove collochiamo, ad esempio, la pagina dedicata alla biblioteca;

nella categoria Ricerca, nella categoria Didattica o nella categoria Servizi?

È proprio nella creazione di questa tipologia di schemi che diviene necessario, in fase di

design, coinvolgere gli utenti utilizzando degli strumenti di conoscenza.

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1.4 Strutture organizzative

Le strutture organizzative si occupano della modalità di immagazzinamento e

presentazione delle informazioni. L'adozione di appropriate strutture organizzative è

soggetta a tre fattori: il fattore tecnologico, la tipologia dei contenuti, gli aspetti di usabilità

legati alla modalità di presentazione dei dati. Rosenfeld e Morville identificano tre tipi di

strutture: gerarchiche, tabellari ed ipertestuali.

Una struttura gerarchica divide il dominio semantico della struttura informativa in

partizioni. Un tipico esempio di struttura gerarchica esatta è la tassonomia Linneana degli

esseri viventi. Su internet vi sono degli esempi estremamente celebri, le directory come

dmoz.org o Yahoo. In questo caso, però, la struttura gerarchica è di tipo ambiguo. Un esempio

di struttura a tabella è costituito dal servizio offerto da librarything.com, un sito che permette

di condividere la propria libreria, inserendo la lista dei libri che si possiede. Chi entra nella

mia libreria virtuale cliccando http://www.librarything.com troverà la lista dei miei

libri, che potrà essere ordinata per autore, per titolo, per punteggio di gradimento.

La struttura ipertestuale costituisce, invece, la più importante caratteristica distintiva del

web. Il web è, dal punto di vista dell'utente, una ragnatela di risorse testuali o multimediali

fra loro collegati attraverso dei collegamenti ipertestuali. Un sito web non è tale se non ha

collegamenti ipertestuali, in quanto questi costituiscono lo strumento universale di

navigazione all'interno del web. Anche le strutture gerarchiche e tabellari usano i

collegamenti ipertestuali per la navigazione. Vi sono però dei sistemi informativi dove i

collegamenti ipertestuali costituiscono e rappresentano la struttura. L'esempio più

importante è costituito da Wikipedia (it.wikipedia.org nella versione italiana), la più

importante enciclopedia elettronica, un progetto open source. Questo tipo di struttura è

particolarmente adatto per le conoscenze di tipo enciclopedico; ad una struttura

ipertestuale non gerarchica manca però la struttura categoriale tipica delle strutture

gerarchiche. (Bussolon)

http://www.librarything.com/

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1.4.1 Struttura organizzativo - gerarchica di Wikipedia

Nella struttura interna di Wikipedia, le categorie sono raccolte di «indici tematici»

automatizzati e strutturati in un albero che ha come singola radice la

Categoria:Enciclopedia.

Ad esempio, se scriviamo nella barra di ricerca a sinistra la parola “ornitorinco”, in

fondo alla pagina comparirà l'elenco navigabile delle categorie a cui appartiene la voce.

Figura 1. Sistema di navigazione a categorie di Wikipedia.

Le categorie diventano così il secondo metodo di navigazione legato alla voce subito

dopo i link interni, ma il loro utilizzo non è esente da controversie.

L'albero delle categorie di Wikipedia è stato pensato originariamente come uno schema

di classificazione del tipo “dove inserisco questa voce” piuttosto di “come la descrivo” per

cui ogni categoria ha nome univoco, che non è detto sia anche il più rappresentativo. La

catalogazione è però applicata in modo disomogeneo, per cui ognuno finisce per usare le

categorie che preferisce o conosce2.

In soccorso alle carenze delle categorie giungono i template, inclusioni di codice

richiamabili all'interno di altre pagine con il nome del template racchiuso fra doppie

parentesi graffe ed eventuali parametri separati da pipe (“|”, la barra verticale), richiamati in

maniera simile alle funzioni dei linguaggi di programmazione o ai comandi via shell.

Gli utilizzi principali sono tre:

• navigazione contestuale (template di navigazione),

• messaggi (template di avviso)

• strutturazione delle informazioni (template sinottici)3.

2 Essendo integrati semplicemente come link in un namespace differente, ad oggi è possibile categorizzare a piacimento qualsiasi voce, e la classificazione non è sottoposta ad alcun controllo semantico automatico prima della pubblicazione, che impedirebbe ad esempio l'inserimento della medesima voce in più categorie collegate in linea retta.

Wikipedia e la classificazione gerarchico – enumerativa Dewey.

Ritornando all'esempio dell'ornitorinco, scorrendo il testo leggerò che è un piccolo

mammifero e selezionando il termine “mammifero” sarò rimandato alla relativa voce,

selezionando la data “1799” otterrò una lista delle ricorrenze di quel periodo, e così via per

tutti le Hots Words sparse nel testo che rimandano ad altri documenti collegati secondo una

logica ipertestuale.

Diversi studi hanno affrontato il problema dell'architettura dell'informazione su

Wikipedia, oltre all'acceso dibattito in seno alla comunità. Una relazione presentata a

Wikimania 2005 proponeva di aggiornare i sorprendentemente primitivi strumenti di

ricerca di Wikipedia, introducendo un sistema di collegamenti tipizzati che sia per i

collegamenti ipertestuali ciò che le categorie sono per le voci esprimendo il tipo di relazione

fra la voce da cui parte il link e quella di destinazione.

3 Sulla navigazione contestuale, cfr. Rosenfeld – Morville 2002, 116-118. I template di navigazione forniscono una serie di link contestuali comuni ad un gruppo di voci.

Capitolo 2

Due schemi di classificazione a confronto

2.1 La classificazione gerarchico – enumerativa

Alla base di quasi tutte le architetture dell’informazione ben riuscite c’è una gerarchia o

tassonomia ben progettata […]. Da sempre le informazioni sono state organizzate in modo

gerarchico. Gli alberi genealogici sono gerarchici. La suddivisione di libri in capitoli,

sottocapitoli, paragrafi, frasi, parole, lettere. La gerarchia è ovunque nella nostra vita. A

causa di tale pervasività delle strutture gerarchiche, gli utenti sono in grado di comprendere

facilmente e rapidamente quei siti che utilizzano modelli organizzativi gerarchici […]

(Morville & Rosenfeld, 2002).

Nei sistemi di classificazione tradizionale (struttura gerarchico - enumerativa) ogni

elemento è classificato sotto un’unica categoria. Nella classificazione tradizionale gli

elementi hanno una collocazione corretta e univoca in uno schema ampio e

gerarchicamente profondo che può essere reso attraverso un percorso a gradini, partendo

da una categoria padre si arriva alla categoria figlio.

La struttura gerarchico - enumerativa è l’organizzazione più diffusa nel web: essa

prevede categorie-padre che contengono categorie-figlie come in un gioco di scatole cinesi.

Figura 2. Esempio di modello gerarchico semplice

Due schemi di classificazione a confronto

Questo approccio, che potremmo definire top-down, consente di dotarsi rapidamente di

un punto di partenza per comprendere la portata del sito senza dover attivare un processo

estensivo di rilevazione dei contenuti (Morville & Rosenfeld, 2002). Il processo top-down è

un processo deduttivo, dall’alto verso il basso, che permette di ricavare le classi di un

dominio operando raggruppamenti di dettaglio via via crescente.

Ogni giorno abbiamo a che fare con procedure simili, anche quando usiamo il computer

domestico. Se vogliamo memorizzare un file nello spazio fisico riservato ai documenti non

facciamo altro che assegnare un nome significativo, che ricordi il suo contenuto, in modo

da trovarlo facilmente in mezzo agli altri. Ma dopo qualche tempo i documenti cominciano

ad essere così numerosi che scorrerli solo per nome diventa scomodo. Per risolvere il

problema è consuetudine creare delle cartelle che ordineranno i documenti affini. In questo

modo si viene a creare una “gerarchia”, ossia per arrivare al file desiderato è necessario

compiere più passaggi (aprire la cartella giusta e scorrere i file ivi contenuti per trovare il

documento). In questo caso le cartelle rappresentano le “classi”, in cui disporre unità di

conoscenza affini. Raggruppando le singole unità in classi, siamo partiti dal basso verso

l’alto (Bottom-up), ossia abbiamo adottato un approccio a posteriori.

Nel caso in cui dobbiamo progettare uno schema è necessario farci un’idea iniziale di

quale sarà la sua struttura generale, sin dall’inizio ci immaginiamo l’insieme delle

conoscenze da organizzare e ci chiediamo come dovranno essere suddivise. In questo

modo, stiamo adottando un approccio dall'alto verso il basso (Top-down), ossia a priori.

Possiamo stabilire di suddividere i nostri oggetti secondo una prima caratteristica, per

esempio la data, quindi tutti i documenti del 2006, quelli riguardanti il 2005, e così via.

Queste saranno quindi le classi principali del nostro schema. A loro volta esse potranno

essere divise secondo un’altra caratteristica.

Stabilendo una serie di classi, sottoclassi e così via, possiamo formare un albero

gerarchico, ramificato quanto vogliamo. Con la Classificazione Decimale Dewey possiamo

contrassegnare ogni nodo dell’albero con una notazione decimale, potenzialmente

all’infinito.

Due schemi di classificazione a confronto

2.1.1 Le classificazioni gerarchica sul Web e la questione dell'incoerenzaL'uso più evidente sul Web dei

principi della classificazione si può

riscontrare negli indici sistematici,

cioè in quei siti che fungono da

cataloghi organizzati delle risorse

presenti on-line. Yahoo!, Virgilio, Open

Directory, Virtual Library sono tutti

esempi di questa tipologia di siti alla

quale spesso ci si riferisce anche con i

termini di “directory”, “indici

ragionati”, “indici di ricerca per

categorie”, “subject guide”, “subject gateway”. Gli indici sistematici consentono il recupero

dell'informazione attraverso la compilazione di un unico schema di classificazione

gerarchico - enumerativo e la successiva indicizzazione, sulla base di questo, delle risorse del

Web selezionate dagli indicizzatori o proposte per l'inserimento dai responsabili stessi del

sito.

Generalmente tali indici sistematici hanno ripreso dalle classificazioni bibliografiche

anche l'approccio semantico: i siti sono infatti raggruppati prevalentemente a seconda dei

loro contenuti. La directory di Yahoo! esplicita persino tale scelta: “sites organized by subject”.

Tuttavia, nonostante tale dichiarazione, l'homepage di Yahoo!

integra l'approccio strettamente per contenuti, di fatto

dominante, con principi di divisione di tutt'altra specie. Il caso

lampante è dato dalla categoria “Regional”, in cui i siti sono

raggruppati non rispetto al contenuto, ma a seconda della loro

collocazione geografica. Nel livello successivo inizia infatti una

tassonomia geografica. È evidente che lo schema di

classificazione impiegato è emblematico. Il problema di un top-

level realizzato in questo modo è che la violazione della regola

dell'unico fundamentum divisionis per ogni nodo della

Figura 3. I primi livelli della classificazione di Yahoo!

Figura 4. La categoria “Regional” in Yahoo!

Due schemi di classificazione a confronto

classificazione produce categorie non mutuamente esclusive e, quindi, uno schema

organizzativo ibrido (più principi di divisione operano contemporaneamente) che è, per sua

natura, anche incoerente. Una classificazione ancora più ibrida e incoerente si può ritrovare

nell'homepage di Open Directory.

Oltre alla categoria “Regional”, sono infatti presenti classi come “Kids and Teens”,

“World” o “Shopping”. Se un utente vuole acquistare on-line un gioco per bambini, da

quale categoria del top-level di Open Directory deve cominciare? È probabile che siano previsti

rinvii tra i vari rami di Open Directory e che quindi si riesca ugualmente ad arrivare alla

categoria desiderata partendo da tutti e quattro i top-level possibili, ma l'effetto labirinto dello

schema ibrido rimane.

È ancora aperta la questione sul Web, se impiegare un principio di divisione alla volta, o

rispettare la mutua esclusività delle categorie al fine di rendere gli schemi di classificazione

coerenti. Vizine-Goetz (1996) dimostra come la Classificazione della Library of Congress e

la Classificazione decimale Dewey prevedano una copertura di argomenti sufficientemente

ampia per classificare le risorse di Internet. Nel proporre le classificazioni bibliografiche per

il Web, i bibliotecari sono consapevoli del fatto che l'impianto tradizionale deve essere

opportunamente modificato per la sostanziale differenza tra la fisicità del libro e la virtualità

del Web. Ma le classificazioni bibliografiche classiche, in quanto enumerative e condivise,

sono di fatto strutturalmente chiuse, istituzionalizzate e centralizzate. Gli schemi

tradizionali non consentono in fase di indicizzazione l'inserimento, da parte del

classificatore, di una nuova categoria. Solo il compilatore può modificare la classificazione,

redigendo un foglio di revisione ufficiale o pubblicando un'edizione successiva dello

schema. Ciò può avvenire anche a distanza di molti anni: tempi troppo lunghi per il Web.

La soluzione per il Web, a questa chiusura, è la classificazione home-grown (creata e

mantenuta localmente da una singola istituzione), ma anche in questa classificazione, il

classificatore continua a non avere alcuna autonomia in fase di indicizzazione e il ricorso a

un compilatore che modifichi lo schema è indispensabile. Il loro impianto di base rimane

assolutamente tradizionale, quindi strettamente enumerativo, gerarchico e chiuso. Il

vantaggio sta nella maggiore rapidità dei cambiamenti, rispetto alle classificazioni

Due schemi di classificazione a confronto

bibliografiche condivise, ma ciò è dovuto solo alla loro natura home-grown, che permette ai

compilatori di modificare la gerarchia in qualsiasi momento.

2.2 Classificazione analitico – sintetica

Ben diverso è il caso delle classificazioni analitico - sintetiche (o a faccette), le quali

consentono un'effettiva apertura grazie a innovazioni sostanziali nel procedimento stesso di

classificazione. Tali sistemi, dichiaratamente alternativi agli schemi gerarchico - enumerativi

tradizionali, sono infatti frutto di un ripensamento radicale delle tecniche di classificazione.

Si abbandona l'idea di un'enumerazione a priori di tutte le classi a favore di una

metodologia che consente di creare le categorie "on the Fly" partendo da alcuni elementi

preventivamente decisi (faccette e foci). Si assicura finalmente anche al classificatore, in fase

di indicizzazione del materiale, la possibilità di generare le classi di cui ha bisogno. In un

sistema on-line la classificazione a faccette può essere una soluzione, potendoci affidare su

schemi flessibili e

velocemente adattabili,

in quanto effettivamente

aperto. Prima di andare

avanti diamo una

definizione più chiara e

dettagliata del concetto

di faccetta e dei relativi

foci.

2.2.1 Il concetto di faccetta

Negli anni ’30 il bibliotecario indiano S. R. Ranganathan creò un nuovo tipo di sistema

di classificazione. Nella concezione di Ranganathan uno schema di classificazione deve

essere utilizzato non solo per realizzare un catalogo da consultare, ma anche per disporre i

volumi negli scaffali secondo un ordine adeguato, che permetta agli utenti di localizzare

direttamente quelli che trattano gli argomenti di loro interesse.

Figura 5: schema a faccette

Due schemi di classificazione a confronto

Perciò, egli dedicò molto del suo lavoro a identificare dei principi fondanti per la

classificazione, per risolvere il problema di rappresentare le sfumature del sapere umano. In

alternativa agli schemi di classificazione già esistenti da diversi decenni, come la tradizionale

Classificazione Decimale Dewey, Ranganathan studiò un sistema meno rigido e più

articolato, che definì classificazione a faccette.

Riconoscendo problemi e limiti delle soluzioni a singola tassonomia top-down,

Ranganathan costruì il suo sistema sulla nozione che documenti ed oggetti hanno

molteplici dimensioni o facets, faccette. Il vecchio modello, che poneva la questione “dove lo

metto?”, è più strettamente legato alla nostra esperienza nel mondo fisico, un posto per

ogni cosa. Per contro, l’approccio a faccette pone la domanda, “come lo posso descrivere?”

(Morville & Rosenfeld, 2002).

La classificazione a faccette (Faceted Classification) è un metodo di classificazione

dell’informazione il cui valore distintivo consiste, appunto, nell’essere un sistema aperto e

adattivo, in grado cioè di adattarsi a una pluralità di esigenze di archiviazione e/o

interrogazione. Faccetta è un termine utilizzato da Ranganathan per denotare qualsiasi

componente di un soggetto composto, è un vocabolo comune nella lingua inglese che

significa ad esempio “aspetto”.

Considerando che l’analisi a faccette consiste nella scomposizione di un soggetto in

diverse coordinate, ciascuna delle quali esprime un aspetto, si potrebbe tradurre “faceted

classification” anche con “classificazione multidimensionale”. In questo senso, il soggetto

composto può essere immaginato come ubicato all’intersezione delle coordinate-faccette, in

uno spazio a tante dimensioni quante sono le faccette (Gnoli, Classificazione a faccette,

2004). La classificazione mediante faccette sfrutta un sistema di attributi (metadati)

mutuamente esclusivi rappresentanti ciascuno un aspetto o proprietà persistente

dell’oggetto e capaci, nel loro insieme, di descrivere esaustivamente l’oggetto stesso. Tali

attributi sono le faccette contraddistinti da alcune peculiarità:

• sono invariabili dal punto di vista semantico (ad es. la proprietà “colore” di un

oggetto può variare in termini di valori che può assumere – giallo, rosso etc. – ma è

invariabile come concetto; cioè quell’oggetto avrà sempre un colore).

Due schemi di classificazione a confronto

• costituiscono un insieme aperto, per cui è sempre possibile aggiungere nuove

faccette a quelle già esistenti.

• sono utilizzabili come attributi di ricerca sia singolarmente sia in combinazione.

• Tali caratteristiche rendono particolarmente efficace l’adozione di questo sistema in

ambienti digitali, per un più veloce ed efficiente ritrovamento dell’informazione.

Assodato che la classificazione a faccette non si preoccupa di collocare un oggetto in

una gerarchia, ma di descriverlo in termini di sue proprietà o caratteristiche mutuamente

esclusive, il contenuto dei documenti è analizzato in una serie di aspetti fra loro

complementari e quindi espresso per combinazione dei codici corrispondenti a ciascuna

faccetta. Poiché le tavole di uno schema a faccette devono elencare solo i possibili valori

(foci) di ogni faccetta, lasciando le loro possibili combinazioni al classificatore, esse

risultano molto più compatte di quelle di uno schema enumerativo.

Per cui le peculiarità e i vantaggi di questo metodo sono:

• pluridimensionalità: inversamente ai sistemi tradizionali, nei sistemi a faccette, ogni

oggetto è classificato secondo una pluralità di attributi.

• persistenza: tali attributi/faccette costituiscono proprietà essenziali e persistenti

dell'oggetto; in questo modo l'impatto (sullo schema di classificazione) di eventuali

cambiamenti (di nomenclatura, di workflow etc.) è fortemente ridotto o nullo.

• scalarità: è sempre possibile aggiungere una nuova faccetta descrittiva di un nuovo

aspetto dell'oggetto.

• flessibilità: esistono una pluralità di chiavi di accesso parallele (faccette); ogni

oggetto può essere reperito utilizzando un singolo attributo di ricerca (o faccetta)

alla volta, oppure più attributi insieme in combinazione.

2.2.2 Classificazione Colon

La classificazione a faccette realizzata da Ranganathan è nota come Colon Classification,

per la frequenza con cui ricorre nella sua notazione il simbolo di due punti (in inglese

"colon"). Lo schema presenta due piani separati attraverso i quali il soggetto viene 21

Due schemi di classificazione a confronto

analizzato, scisso e sintetizzato: quello verbale e quello notazionale. Il piano verbale

permette un'analisi del soggetto attraverso la sua scomposizione in categorie: ogni

fenomeno, ogni realtà, ogni modo dell'essere può essere rapportato a cinque categorie

fondamentali che permettono di individuarne l'essenza. Ranganathan scelse queste 5

categorie fondamentali:

• personalità • materia • energia • spazio • tempo

Esse possono essere immaginate come dei binari sui quali l'oggetto viene scomposto e

attraverso i quali è possibile individuare la singola manifestazione, ovvero la faccetta. Le

faccette sono dunque le molteplici espressioni della realtà, dei modi di essere, individuati

dalle categorie che a loro volta possono essere espresse da concetti elementari, gli isolati,

contenuti in quella certa area concettuale individuata dalla faccetta. (Lavazza, 2003).

Es.:

Storia delle religioni (categoria)

Storia del cristianesimo (faccetta)

Patristica (isolato)

Veniamo all'analisi delle cinque categorie.

La personalità (l’oggetto centrale di un discorso) è la più complessa e misteriosa, che

per ammissione dello stesso Ranganathan si ottiene con ciò che rimane dopo aver separato

tutte le altre faccette. Essa rappresenta l’oggetto principale considerato in quel contesto, il

contenuto centrale di un documento o di un settore, indipendentemente dalla sua natura:

non soltanto quindi una persona umana, ma qualsiasi entità anche inanimata o astratta

Il Classification Research Group (CRG) che ancora oggi continua ad approfondire la ricerca

inaugurata da Ranganathan ha preferito usare il termine entità al posto di personalità. Ad

esempio, in un testo sul trattamento in medicina dei polmoni affetti da tubercolosi con i

raggi X, alla categoria personalità corrisponderà il concetto di polmoni:

Due schemi di classificazione a confronto

Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X

Polmoni = personalità

La materia (i componenti e le proprietà dell’oggetto) rappresenta, più che le altre

categorie, le manifestazioni dell'oggetto nel reale; il CRG ha preferito usare il termine

proprietà ovvero le caratteristiche contingenti che quel fenomeno possiede. Nell'analisi del

soggetto essa può assumere varie caratteristiche a seconda del ruolo che riveste nella

stringa: matter material, matter property o matter method. Questi che rappresentano gli aspetti

materiali della materia, le proprietà o i mezzi possono coesistere in un'unica stringa. Sulla

base dell'esempio precedente:

Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X

Tubercolosi = materia/proprietà

Raggi X = materia/metodo

L'energia (le caratteristiche dinamiche dei processi che lo interessano) , o attività secondo

il CRG, rappresenta l'azione che quel certo soggetto con quelle date caratteristiche compie.

Secondo lo stesso Ranganathan le difficoltà di focalizzazione che questa categoria presenta

potevano essere ovviate attraverso l'esperienza classificatoria: componendo ogni frase del

linguaggio naturale era possibile individuare volta per volta il concetto di energia.

Spazio (i suoi elementi geografici o spaziali).

Tempo (le sue fasi cronologiche).

Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X

Trattamento = energia

Infine abbiamo le categorie di spazio e tempo che sono le meno difficili da definire:

Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X -- India

-- 1950

India = spazio

1950 = tempo

Una volta individuate le categorie del soggetto le singole faccette vengono messe in

relazione tra di loro attraverso segni d'interpunzione che rimangono anche nella sequenza

numerica: 23

Due schemi di classificazione a confronto

P = , (virgola) M = ; (punto e virgola) E = : (due punti) S = . (punto) T = . (punto)*

* In seguito nel 1959 venne sostituito dall'apostrofo (').

Sulla base del precedente esempio avremo la seguente stringa:

Medicina , polmoni : tubercolosi : trattamento ; raggi X : ricerca ' India nel 1950

La scomposizione in faccette e le loro relazioni permettono nella Colon un tipo di

indicizzazione molto specifica, con la possibilità di mettere più termini in relazione

biunivoca:

Classificazione dei libri di medicina (2;51)

Classificazione dei libri di medicina secondo la Colon (2;51 N3)

Vocali chiuse nella lingua inglese (P,111,11)

Storia dell'India fino al 1894 (V,2;1'M94)

Storia dell'India dal 1894 al 1894 (V,2;1'M92<-94)

Religione e filosofia antica (Q & R*Z)

Una volta individuate le faccette e gli isolati il soggetto analizzato viene sintetizzato

numericamente. Il piano notazionale della Colon prevede numerose tavole indicate da

lettere maiuscole e minuscole e da numeri. Si scompone la stringa individuando i settori di

interesse: per "tubercolosi" si vede la faccetta "medicina". Ecco dunque che il soggetto

presenta il seguente risultato:

medicina -- polmoni -- tubercolosi -- trattamento -- raggi X -- India -- 1950

faccetta base personalità

proprietà materia energia

materia metodo spazio tempo

L 0,45 ; 421 : 6 ; 253 . f ' N5

Il procedimento di classificazione della Colon può essere sintetizzato nello schema

seguente:

• 1: Piano verbale o Categorie (PMEST) o Faccette o Isolati

Due schemi di classificazione a confronto

• 2: Analisi e sintesi • 3: Piano notazionale

o Sequenza alfanumerica

In altre parole, la classificazione a faccette consiste sostanzialmente nella scomposizione

(analisi) di concetti composti nelle loro parti semplici, dette isolati. […] I diversi frammenti

vengono ricomposti (sintesi), secondo un ordine di citazione stabilito. Perciò il metodo è

detto anche analitico-sintetico. (Gnoli, 2004)

2.2.3 Ordine di citazione delle faccette

Dopo aver analizzato e scomposto il contenuto di un documento abbiamo due

prospettive: utilizzare gli isolati così come sono, limitandoci a elencarli, oppure ricombinarli

secondo un ordine significativo. Nel primo caso gli isolati funzioneranno come semplici

parole-chiave, che non vengono combinate da noi a priori, ma solo nel momento della

ricerca da parte dell'utente, quindi avremo una indicizzazione post-coordinata (soltanto nel

momento della ricerca la richiesta di più parole-chiave restringe la gamma delle possibili

risposte). Nel secondo caso, possiamo specificare sin dall'inizio che i termini sono

coordinati in un preciso rapporto sintattico, scegliamo, cioè, una pre-coordinazione, ossia si

specifica sin dall'inizio quali rapporti sussistono tra gli isolati e dobbiamo anche adottare un

ordine convenzionale.

Le ricerche di Ranganathan e del CRG hanno confermato la convenienza nell'elencare

per prima la faccetta dell'oggetto o della persona che subisce l'azione, seguita dalle sue

eventuali proprietà e specificazioni, poi dall'azione, ossia dalle faccette dei Processi e

Operazioni, quindi dai soggetti delle azioni, ossia gli Agenti, e per ultimo dal contesto

spazio-temporale. Dunque, le categorie corrispondenti alle nostre faccette devono

succedersi secondo l'ordine di citazione standard seguente:

Categorie fondamentali di Ranganathan (PMEST)

Personalità Materia Energia Spazio Tempo

Oppure adottando le 13 categorie individuate dal CRG

Categorie fondamentali del Classification Research Group

Oggetto Tipi Parte Proprietà Materiali Processi Operazioni Prodotti Sottoprodotti

Due schemi di classificazione a confronto

Pazienti Agenti Spazio Tempo

Secondo Ranganathan tale ordine corrisponde a una concretezza decrescente, ovvero

l'oggetto principale di interesse è la cosa più concreta, seguita dalle azioni, dagli agenti e dal

contesto spazio-temporale (PMEST). Supponendo di avere due documenti con soggetti

quasi uguali, ma in cui la faccetta del luogo non è specificata nel secondo documento; a

parità di tutto il resto il posto di tale faccetta è immediatamente prima, poiché il generico

deve precedere lo specifico. Il che significa che un soggetto composto, che consista di

termini tratti da più di una categoria, li combinerà in tale ordine. Un esempio ipotetico può

essere il seguente:

titolo documento:

Raccolta del riso in India nella stagione secca

analisi concettuale:

Agricoltura: raccolta (E): riso (P): India (S): Stagione secca (T)

categorie:

Raccolta (Operazione/Energia/azione) Riso (Oggetto/Personalità) India (Spazio)

Stagione (Tempo)

ordine di citazione standard:

Personalità -- Entità -- Spazio -- Tempo

stringa di citazione:

riso - raccolta - India – Stagione X

Come si può notare, non tutte le faccette vengono sempre espresse in ogni documento.

Se dovessimo avere un documento sulla raccolta del riso in genere, poiché

nell'organizzazione della conoscenza il niente equivale a generalità, secondo il principio

della gradazione della specificità, lo elencheremo prima degli altri:

riso: raccolta: India

riso: raccolta: India: stagione x

riso: raccolta: India: stagione y

…

Due schemi di classificazione a confronto

questo significa che all'interno di una singola voce (stringa) in orizzontale le proprietà

precedono le azioni, mentre elencando diverse voci, le azioni precedono le proprietà. Tale

sottile, ma importante, principio è chiamato principio di inversione.

Il contributo di Ranganathan nel campo della scienza della classificazione può essere

sintetizzato attraverso gli elementi fondamentali che caratterizzano l'impianto della Colon:

• il disegno, lo sviluppo e l'applicazione di una classificazione analitico-sintetica;

• la preoccupazione di far operare i bibliotecari in totale autonomia nei confronti

dell'oggetto e dell'approccio;

• lo sviluppo di una guida per la classificazione delle materie che prevede 5 elementi

principali, 15 postulati, 21 canoni e 20 principi;

• la partizione del lavoro di classificazione in tre piani: quello dell'idea, quello della

parola (piano verbale) e quello della notazione (piano notazionale) specificando

dipendenza ed interdipendenza fra di essi;

• lo sviluppo dell'idea di categoria, faccetta, isolato, ordine e catena;

• lo sviluppo di un sistema notazionale molto versatile composto da elementi quali il

numero del soggetto (substantive digits), il numero degli indicatori (indicator digits), gli

empty digits, gli emptying digits e gli empty-emptying digits;

• lo stabilire una struttura per lo sviluppo della teoria e della pratica della

classificazione.

Oggi la Colon è caduta in quasi totale disuso, eppure ha generato sistemi di

indicizzazione complessi e diffusi quali PRECIS e POPSI. Questi sono sistemi di

indicizzazione pre-coordinati che sfruttano il linguaggio naturale e prevedono l'uso

dell'elaboratore, e forse va ricordato a riguardo che Ranganathan fu convinto sostenitore

dei primi tabulatori elettronici. Anche se la Colon non viene più applicata i sistemi che ne

seguono la logica sono l'eredità più evidente del lavoro e dell'impegno di S. R. Ranganathan.

Malgrado sia stata accolta dagli esperti di tutto il mondo in maniera entusiasta, la Colon

classification è stata poi abbandonata ovunque in favore della Dewey. Le indubbie difficoltà

di applicazione potevano in qualche modo essere ovviate qualora il sistema si fosse rivelato

rivoluzionario, come si era preannunciato. Rispetto alla Dewey, la Colon prevedeva uno

Due schemi di classificazione a confronto

schema facilmente memorizzabile e lo prova il fatto che quando il direttore dell'Università

di Delhi, S. Dasgupta, sperimentò la facilità di ricerca con alcuni studenti mettendo a

confronto le due classificazioni, quella indiana vinse di gran lunga.

2.2.4 Applicare la classificazione a faccette sul Web

Un sistema on-line basato su una classificazione a faccette, in quanto effettivamente

aperto, è quindi una soluzione interessante per andare incontro alla necessità, così urgente

sul Web, di fare affidamento su schemi di classificazione flessibili e velocemente adattabili.

Non si deve però cadere nell'errore di considerare tale apertura assoluta. È infatti chiaro

che il numero di categorie potenziali previste ha un limite che, sebbene molto elevato,

rappresenta in ogni caso un vincolo nelle capacità rappresentative del sistema. Ma gli

schemi a faccette rimediano a questo problema attraverso un alto livello di scalabilità, assai

maggiore rispetto alle classificazioni gerarchico - enumerative classiche. Queste ultime sono

infatti difficilmente scalabili: l'aggiunta di una nuova categoria rende spesso necessaria la

modifica delle classi dello stesso livello (per assicurarne la mutua esclusività) e/o di una

grossa parte della struttura ad albero dello schema. La colpa di tale imperfezione delle

classificazioni gerarchico - enumerative è da imputare anche alla loro struttura gerarchica.

In uno schema ad albero tradizionale ci sono infatti forti relazioni per ogni ramo: le classi

inferiori dipendono da quelle superiori. Negli schemi a faccette è, invece, sempre possibile

aggiungere una nuova faccetta descrittiva di un nuovo aspetto dell'oggetto (Rosati, 2003) e

non si avranno ripercussioni di alcun tipo sulle altre faccette. In una classificazione analitico

- sintetica ogni faccetta è infatti autonoma dalle altre: determina una proprietà

("sfaccettatura") dell'oggetto da classificare indipendentemente dalle proprietà descritte

dalle altre faccette.

Però se il sistema può accogliere nuove faccette senza doversi “aggiustare” globalmente,

ed è quindi intrinsecamente scalabile, si ripropone tuttavia anche in questo caso, così come

per le classificazioni gerarchico - enumerative, la questione della riclassificazione. L'aggiunta

di una faccetta rende infatti necessaria la riclassificazione di tutte le entità secondo la nuova

faccetta e, quando gli oggetti già classificati sono migliaia, il lavoro non è certo di poco

conto. Tale riclassificazione assume connotati ancora più gravi persino di quelli causati nelle

Due schemi di classificazione a confronto

classificazioni gerarchico - enumerative: l'inserimento di una nuova categoria in uno schema

gerarchico richiede generalmente la riclassificazione solo di una zona circoscritta della

struttura ad albero. È però evidente come l'aggiunta di una faccetta abbia vantaggi di gran

lunga superiori rispetto all'inserimento o alla modifica di una o più categorie in uno schema

gerarchico. Una faccetta in più determina, infatti, un aumento esponenziale del numero

delle combinazioni possibili e, quindi, un livello di specificazione maggiore del carattere

descrittivo delle classi.

È consigliabile allora prestare sempre molta attenzione alla preliminare analisi a faccette:

tale fase è infatti di strategica importanza nello sviluppo di un sistema di classificazione

analitico - sintetico e, se compiuta con cura, evita poi problemi di riclassificazione.

Alcuni autori non parlano di “faccette”, ma di “proprietà” e di “matrici”, come per

esempio Jeffrey Veen, famoso Web designer, responsabile di Wired Digital ed esperto di

pubblicazioni elettroniche presso il W3C. Altri parlano di classificazione «orientata agli

oggetti», ma il senso è sempre lo stesso: classificare il prodotto, la notizia, l’informazione,

secondo diverse categorie, che nel complesso lo descrivono. Si tratta di una classificazione

utile per trovare l’informazione più velocemente, ma non sempre strettamente

indispensabile per la sua reperibilità. Luca Rosati (Rosati, 2003) nella classificazione dei vini,

così spesso citata per la classificazione a faccette, si immagina delle diverse categorie relative

• Colore (rosso, bianco, rosato)

• Tipo (secco, frizzante, dolce)

• Origine (regione, stato)

• Vitigno

• Abbinamento a cibi

• Produttore

• Fascia di prezzo

È ovvio che con questa

impostazione si può cercare in

modo più rapido e preciso, ma

Due schemi di classificazione a confronto

anche una navigazione per approfondimenti (scegliendo prima il colore, poi il tipo, poi

l’origine e così via) consente comunque all’utente di trovare il prodotto, anche se con più

fatica e in modo non ottimale, rispetto alle sue esigenze, che potrebbero, per esempio, voler

privilegiare il prezzo come punto di inizio della ricerca. In altri casi, la classificazione a

faccette è l’unico modo per rendere disponibile l’informazione a diverse categorie di utenti.

2.2.5 Architettura a faccette in un sito Web

La classificazione multidimensionale a faccette è attualmente un metodo da tenere in

considerazione, in quanto consente la coesistenza di logiche di ricerca diverse, livelli diversi

di competenza dell’utente, motivazioni diverse, senza sacrificare troppo le esigenze di

nessuno.

Il prezzo da pagare per un’architettura a faccette è rinunciare all’immagine tradizionale

della struttura e della navigazione del sito. La mappa del sito semplicemente non esiste più,

perché la struttura del sito non è più tassonomica, cioè gerarchica. I menu e relativi

sottomenu possono esserci o meno e più che navigare in senso tradizionale, si effettuano

delle ricerche. L’interfaccia di un sito con classificazione a faccette richiede grande

precisione, grande attenzione all’usabilità ed estremo rigore. La decisione di fondo da

prendere è se privilegiare una delle faccette e basare la tassonomia su quella, offrendo la

possibilità di ricercare le informazioni anche in altro modo. Ciascuna informazione verrà

categorizzata secondo tutti i parametri che possono essere

attinenti e verrà successivamente estratta sulla base della

ricerca dell’utente (Sofia Postai, 2004). Sinora siti di questo

tipo sono perlopiù dedicati all’e-commerce, come per

esempio wine.com (www.wine.com/search/default.asp) o

Yoox (www.yoox.com). In questi casi la classificazione a

faccette e la relativa ricerca tramite selezione di parametri

multipli ha lo scopo di affinare la query e ridurre il numero di

articoli trovati. Yoox (figura 8) ha centinaia di migliaia di

articoli di capi di abbigliamento e l’unica maniera per non

disorientare l’utente con un numero di pagine esagerato è di

fargli scegliere la firma, la tipologia e magari anche la taglia.

Figura 6: Menu a faccette del sito Wine.com

Due schemi di classificazione a confronto

Anche il sito Elastic lists (figura 8) rende il principio di navigazione e di lettura molto rapido,

migliora la presentazione delle informazioni riguardo ai primi Nobel.

Il freno a questi tipi di approccio è la difficoltà a

immaginare interfacce adeguate a rendere facile la ricerca

anche da parte di un pubblico non particolarmente evoluto.

In altre parole: i responsabili non sentono l’esigenza di

affrontare questo investimento (la classificazione costa)

proprio perché non riescono a immaginare come potrebbe

poi l’utente sfruttarla con vantaggio. In realtà è solo un

problema di progettazione d’interfaccia, che sarà abbastanza

diversa dall’abituale navigazione.

Figura 8: Yoox: classificazione multidimensionale per categorie

Figura 7: Schermata di “Elastic List Demo”: classificazione a faccette dei premi Nobel

Due schemi di classificazione a confronto

2.3 Classificazione a Faccette vs. Classificazione Tradizionale

Nei sistemi di classificazione tradizionali (detti

anche tassonomie tradizionali o sistemi

enumerativi), ogni elemento è classificato sotto

una e una sola categoria. Esso possiede una

corretta e univoca collocazione all’interno di un

unico schema, ampio e gerarchicamente molto

profondo, e può essere ritrovato attraverso un

percorso a gradini categoria padre > categoria

figlio. Ne sono un esempio il sistema di Linneo

(figura 9), il sistema decimale Dewey e quello

della Library of Congress (va tuttavia osservato che i sistemi Dewey e Library of Congress,

dopo il 1960 sulla scorta dell’influenza di Ranganathan furono ritoccati, accogliendo, se

pure limitatamente, parte della logica delle faccette). Un sistema di questo tipo è quindi

monodimensionale (il criterio di catalogazione è unico), e molto esteso in verticale

(essenzialmente, titolo, soggetto, autore). Essi costituiscono una sorta di ‘recipienti’ chiusi,

disposti in sequenza, e concepiti in forma di matriosca.

Alla verticalità dei sistemi di catalogazione tradizionali, e alla loro rigidità, la

classificazione a faccette contrappone un sistema di classi (faccette) orizzontale e aperto

(laddove ciascuna faccetta è descrittiva di una proprietà o aspetto dell’oggetto).

Le applicazioni basate su sistemi di classificazione a faccette hanno dimostrato di essere

molto più veloci da consultare e di garantire percentuali più alte di successo rispetto a

quelle più tradizionali. I vantaggi di una classificazione a faccette dipendono dalle

caratteristiche già indicate precedentemente con le etichette di pluridimensionalità,

persistenza, scalarità e flessibilità. Phil Murray nel suo Faceted Classification of Information (Phil

Murray, 2002) sintetizza così i vantaggi della adozione di un sistema di classificazione a

faccette per la gestione della conoscenza aziendale:

Figura 9. Sistema di Linneo

Due schemi di classificazione a confronto

• pur non conoscendo il nome o la collocazione di un oggetto, è possibile

nondimeno renderlo comprensibile e raggiungerlo, descrivendolo attraverso un

insieme di categorie (faccette) mutuamente esclusive;

• possibilità di aggiungere nuove faccette a quelle già stabilite in una fase

precedente (carattere aperto del sistema);

• possibilità di combinare fra loro i valori delle diverse faccette o per fornire una

descrizione più precisa dell’oggetto o per limitare i risultati di una ricerca o per

descrivere relazioni esistenti fra vari oggetti (rappresentazione della conoscenza

contenuta nel sistema).

Per esemplificare meglio tale differenza di impostazione vediamo in pratica come le due

classificazioni, Colon e Dewey, affrontano lo stesso argomento.

Esempio:

Possiamo riportare come esempio un documento sulla prevenzione del virus della pianta del riso in Giappone nel 1970.

Secondo la Colon classification l'impostazione è questa:

Agricoltura -- prevenzione -- malattia da virus

-- pianta di riso

-- Giappone -- 1970

J , 381 ; 421 : 5 . 42 , NT

risultato: J,381;421:5.42,NT

Secondo la Dewey classification l'impostazione è:

630 agricoltura e tecnologie ammesse 633 colture da pieno campo 18 riso 189 danni e malattie da infestazioni 8 virosi e rickettosi 09 (storia e geografia del soggetto) 52 Giappone 09 (storia e geografia del soggetto) 046 tra il 1960 e il 1969

risultato: 633.189 809 520 904 6

Due schemi di classificazione a confronto

Come si è potuto notare la sequenza alfanumerica delle due stringhe presenta la stessa

forma rappresentativa insita nella logica delle due differenti classificazioni: la Dewey appare

il prodotto di una elencazione/enumerazione, la Colon come una frase scomponibile

frutto di una sintesi analitica.

Figura 10. Confronto tra i due tipi di classificazione

Capitolo 3

Il caso studio: WikiArte e la classificazione a faccette.

3.1 Lo stato dell'arte

Con la locuzione stato dell'arte si intende il più alto livello di sviluppo finora raggiunto

da una tecnologia o un campo scientifico, sinonimo de “all'avanguardia”, “dell'ultima

generazione”. Il fine del progetto è quello di realizzare un enciclopedia sull'arte, avvalendosi

di strumenti, come il software libero Mediawiki4, messo a disposizione dalla “Wikimedia

foundation 5”, permettendo di ridurre i tempi di lavoro.

Un wiki è un sito web (o comunque una collezione di documenti ipertestuali) che viene

aggiornato dai suoi utilizzatori e i cui contenuti sono sviluppati in collaborazione da tutti

coloro che vi hanno accesso. La modifica dei contenuti è aperta, nel senso che il testo può

essere modificato da tutti gli utenti (a volte soltanto se registrati, altre volte anche anonimi)

procedendo non solo per aggiunte, ma anche cambiando e cancellando ciò che hanno

scritto gli autori precedenti. Ogni modifica è registrata in una cronologia che permette in

caso di necessità di riportare il testo alla versione precedente; lo scopo è quello di

condividere, scambiare, immagazzinare e ottimizzare la conoscenza in modo collaborativo.

Spesso sul Web ci si avvale di sistemi automatici di gestione dei contenuti per rendere

più semplice la realizzazione di un sito e la manutenzione dei sui documenti. Questo

strumento software non è altro che un CMS (content management system).

Letteralmente l'acronimo significa “sistema di amministrazione dei contenuti”, un

software studiato per facilitare la gestione dei contenuti di siti web, svincolando

l'amministratore da conoscenze tecniche di programmazione web. Esistono CMS

specializzati, cioè appositamente progettati per un tipo preciso di contenuti

(un'enciclopedia on-line, un blog, un forum, ecc.) e CMS generici, che tendono ad essere

più flessibili per consentire la pubblicazione di diversi tipi di contenuti.

Tecnicamente un CMS si appoggia su un database per la gestione dei contenuti ed è

suddiviso in due parti: la sezione di amministrazione (back end), che serve ad organizzare e

4 http://www.mediawiki.org/wiki/MediaWiki5 http://wikimediafoundation.org/wiki/Home

Il caso studio: WikiArte e la classificazione a faccette.

supervisionare la produzione dei contenuti, e la sezione applicativa (front end), che l'utente

web usa per fruire dei contenuti e delle applicazioni del sito. Date queste caratteristiche

comuni Mediawiki può essere considerato un CMS.

L'organizzazione alfabetica dei contenuti dell'enciclopedia in Wikipedia fa spazio ad una

fitta rete ipertestuale accessibile e modificabile sul World Wide Web, mentre i riferimenti a

testi interni ed esterni all'ipertesto assumono la forma di altrettanti collegamenti

ipertestuali. Se ciò non introduce alcuna innovazione rivoluzionaria alle tecnologie

assimilabili, che sono state già utilizzate nelle enciclopedie digitali su disco e da altre

enciclopedie disponibili su Internet, è il metodo usato da Wikipedia per produrre e gestire

le voci enciclopediche a meritare maggiore attenzione.

Il caso studio: WikiArte e la classificazione a faccette.

3.1.1 Strutturare i dati con Mediawiki

Facendo uso del software open source messo a disposizione dalla Wikimedia Foundation,

abbiamo realizzato “WikiArte”, un enciclopedia libera finalizzata alla raccolta di tutte le

informazioni, dati, documenti che riguardano il Patrimonio artistico-culturale, nel caso

specifico: il Futurismo. Una volta creati, i Wiki sono un mezzo completamente ipertestuale,

con una struttura di navigazione non lineare. Tipicamente ogni pagina contiene un gran

numero di link ad altre pagine; nei wiki di dimensioni notevoli esiste comunque una

navigazione gerarchica, ma non deve essere necessariamente usata. I collegamenti vengono

creati usando una sintassi particolare, la cosiddetta “link pattern”. Solitamente in un wiki le

nuove pagine sono create semplicemente inserendo il link appropriato partendo da una

pagina che tratta un argomento correlato. Se la pagina non esiste, il link è evidenziato

normalmente come rosso (broken link). Cercando di seguire questo link viene aperta una

finestra di modifica, che permette all'utente di inserire il testo della nuova pagina. Una volta

create le pagine che ospiteranno i contenuti dell'enciclopedia è possibile collegarle con i

link, come se si trattasse di una maglia reticolare. Questo crea una struttura flessibile,

Figura 11: Screenshot schermata principale WikiArte

Il caso studio: WikiArte e la classificazione a faccette.

potenzialmente infinita, che permette all'utente di aggiungere, di volta in volta, pagine e

documenti nuovi.

WikiArte offre una ricerca per

titolo, e spesso è presente anche

una ricerca full text che analizza il

testo dei contenuti. La scalabilità

della ricerca dipende dall'utilizzo o meno di un database per i contenuti: un accesso a un

database indicizzato è indispensabile per ottenere ricerche rapide su wiki di grandi

dimensioni. Su Wikipedia, il cosiddetto pulsante "Vai" permette al lettore di visualizzare

direttamente la pagina che si avvicina il più possibile ai criteri della ricerca. Ma il limite, in

qualche modo, di WikiArte e quindi di Wikipedia sta proprio in questo, nella modalità di

ricerca e indicizzazione dei dati. Nel momento in cui l'utente immette una parola-chiave

nell'apposita casella e clicca per cercare il documento, il motore di ricerca su cui è fondato

Mediawiki riporterà non la singola pagina che desideriamo ma tutte le occorrenze e pagine

in cui compare la parola-chiave.

Figura 13: tutte le corrispondenze trovate dopo la ricerca.

Figura 12: Barra di ricerca di WikiArte

Il caso studio: WikiArte e la classificazione a faccette.

Questo tipo di navigazione non agevola la ricerca nel momento in cui si vuole

consultare un documento in particolare, poiché costringe l'utente a scorrere tutti i risultati

sino a trovare quello giusto. Volendo fare un esempio pratico su WikiArte, alla luce di

quello che è stato detto, possiamo cercare tutte le opere di Marinetti che fanno parte di

“Parole in libertà”. In questo caso non basta digitare la stringa “parole+libertà+marinetti”,

poiché il software troverà tutte le pagine che contengono i termini su citati non

consentendo una ricerca mirata e minuziosa delle opere in questione, ossia Dune (parole in

libertà, 1914), Zang Tumb Tumb (Adrianopoli ottobre 1912. Parole in libertà), ecc...

Per un ritrovamento veloce ed efficiente del documento gli architetti dell'informazione

prediligono la classificazione a faccette per le caratteristiche già discusse. Per tale motivo, al

fine di estendere le potenzialità di WikiArte e

permettere più interrogazioni possibili, risulta

utile adottare una struttura multidimensionale.

L’architettura a faccette offre a tutti uno

strumento adeguato al reperimento

dell’informazione in un sito Web. Classificare il

prodotto, la notizia, secondo diverse categorie,

che nel complesso lo descrivono è utile per

trovare l’informazione più velocemente.

Probabilmente la classificazione a faccette è, al

momento, un metodo da tenere in considerazione in quanto consente la coesistenza di

diverse logiche di ricerca, diversi livelli di competenza e motivazioni dell'utente, senza

sacrificare le esigenze di nessuno.

Se si applica una navigazione multidimensionale all'architettura di WikiArte si dà

all'utente la possibilità di accedere, sulla base di diversi bisogni informativi, da più parti;

soddisfare varie esigenze senza troppi click; portando avanti una classificazione coerente,

intuitiva e autoesplicativa.

Figura 14: Struttura multidimensionale

Il caso studio: WikiArte e la classificazione a faccette.

3.2 Usare una struttura a faccette come sistema di ricerca e navigazione

Ai fini del progetto, gli esempi esplicativi sono applicati al solo movimento del

Futurismo, poiché come avanguardia ha abbracciato più discipline, dalla Letteratura

all'Architettura, con un corollario di artisti poliedrici che ci permettono di rivolgere il

progetto a tutto il Patrimonio artistico-culturale. Nella figura 15 viene presentata la logica

multidimensionale delle faccette, in cui ogni elemento è associato ad una serie di

caratteristiche che lo identificano da vari punti di vista. In questo caso in particolare, sono

state selezionate due faccette che hanno raffinato la ricerca, ottenendo come risultato solo

gli oggetti che corrispondono a quelle proprietà.

Quindi, seguendo la logica multidimensionale, ogni blocco informativo può essere

identificato con una faccetta, in modo da soddisfare un'esigenza di ricerca dell'utente. Le

faccette, se prese singolarmente o combinate, possono aiutare chi cerca la stessa

informazione partendo da motivazioni diverse. Il sistema prevede, quindi, la possibilità di

percorsi multipli sulla base dei diversi bisogni informativi e delle differenti tipologie di

Figura 15: risultati della ricerca dopo la selezione di alcuni criteri

Il caso studio: WikiArte e la classificazione a faccette.

utenti. Il vantaggio consiste nel poter incrociare facilmente più caratteristiche dello stesso

oggetto, ottenendo risultati mirati e soddisfacenti. L'utente può intraprendere percorsi

diversi per arrivare al medesimo risultato.

Questa struttura multidimensionale rende lo stile di navigazione interattivo, dal

momento che l'utente filtra un insieme di articoli, selezionandoli progressivamente solo da

una serie di valori di un sistema di classificazione. La figura 16 mostra lo schema

concettuale di una navigazione a faccette, in cui è possibile effettuare un primo filtraggio

degli articoli per ottenere un sottoinsieme dei documenti, seguito da altre fasi di filtraggio,

se occorre, per affinare la ricerca ed arrivare al documento desiderato. Il lato positivo

consiste nello sviluppare un'interfaccia di ricerca innovatrice, che permette agli utenti non

esperti di muoversi attraverso i grandi spazi informativi in modo flessibile, senza cadere nel

labirinto dell'architettura.

Figura 16: Schema concettuale di ricerca del documento in un sistema di navigazione faccette

Il caso studio: WikiArte e la classificazione a faccette.

3.3 Usare le faccette per l'architettura dell'informazione di WikiArte

Al fine di rendere il processo di organizzazione della conoscenza meno casuale e più

maneggevole, si è cercato di strutturare l'architettura dell'enciclopedia sull'arte (figura 17)

mediante il software “Flamenco”, progettato dall'Università di Berkeley.

La figura 17 illustra la mappa concettuale dell'architettura del progetto, vale a dire,

l'integrazione di due database, quello di Wikiarte e quello di Flamenco, per la formazione di

un'unica Knowledge organization, che permetterà la ricerca dei documenti sia in modo

Figura 17: Mappa concettuale dell'architettura dell'informazione

Il caso studio: WikiArte e la classificazione a faccette.

generico che multidimensionale (a faccette); il documento ricavato dalla navigazione a

faccette ci rimanderà ad una pagina wiki, appositamente creata, contenente tutte le

informazioni desiderate.

Flamenco (FLexible information Access using MEtadata in Novel Combinations) è un

progetto curato dall'Università di Berkeley, scritto in Python6, che consiste in un motore di

ricerca e directory organizzati con il criterio delle faccette, disponibile open source con

licenza BSD7. E’ uno strumento concepito per guidare gli utenti attraverso la vastità delle

architetture delle informazioni presenti sul web. L'interfaccia guida i suoi esploratori

attraverso categorie di scelta e parole chiave in un'organizzazione strutturale fondata sul

meta-dato. Consente quindi un'amplificazione delle tradizionali pratiche di catalogazione

bibliografica in ambiente elettronico.

Come si può osservare nella figura 18 la

directory di link si presenta graficamente

simile a quella di Yahoo o Google dando

l’impressione che ogni riquadro colorato

sia l’insieme di oggetti diversi. In realtà la

logica della directory è molto diversa:

ciascun ramo rappresenta un percorso di

accesso alternativo alla stessa collezione

di documenti, ma parallelo agli altri; ogni

riquadro è quindi una faccetta della

medesima collezione, rappresentato

visivamente con un colore diverso.

6 Python è un linguaggio di programmazione ad alto livello, orientato agli oggetti, adatto, tra gli altri usi, per sviluppare applicazioni distribuite, scripting, computazione numerica e system testing. Python è spesso paragonato a Tcl, Perl, Java, JavaScript, Visual Basic o Scheme[1]. Ideato da Guido van Rossum all'inizio degli anni novanta. Sito ufficiale: http://www.python.org/

7Le licenze BSD sono una famiglia di licenze permissive per software. Molte sono considerate libere ed open source. Il loro nome deriva dal fatto che la licenza BSD originale (detta anche licenza BSD con 4 clausole) fu usata originariamente per distribuire il sistema operativo Unix Berkeley Software Distribution (BSD), una revisione libera di UNIX sviluppata presso l'Università di Berkeley.

Figura 18: Interfaccia per la ricerca di informazioni in Flamenco

Il caso studio: WikiArte e la classificazione a faccette.

E’ necessario notare che le faccette rappresentano non tanto un contenitore dei dati a

nostra disposizione ma un loro descrittore semantico (proprietà o aspetto dei dati stessi). E’

possibile effettuare, sfogliando la directory, una selezione progressiva, in pratica un

filtraggio. Una volta operata una prima selezione è sempre possibile raffinare ulteriormente

la ricerca all'interno del sottoinsieme estratto utilizzando le altre faccette che vengono

sempre ripresentate assieme ai risultati.

Inoltre, per ogni insieme di risultati vengono specificate le sue coordinate semantiche

rispetto a tutte le faccette del sistema: oltre a mostrare l’insieme dei risultati, Flamenco

rende visibile la collocazione di tali risultati rispetto alle varie faccette. Quando si opera una

ricerca diretta, esso non esegue una semplice ricerca full-text, ma si appoggia al sistema di

classificazione a faccette per estrarre i risultati. L’utente, impiegando in modo combinato e

complementare searching e browsing, può:

• scegliere se cercare un’informazione mediante ricerca diretta o sfogliando una

directory;

• raffinare o espandere i risultati della propria ricerca;

• esplorare risorse correlate in maniera semantica a quelle trovate;

• scegliere punti di vista alternativi in ogni momento.

Figura 19: Home page Flamenco Fine Arts: Fine Arts Museums of San Francisco

Il caso studio: WikiArte e la classificazione a faccette.

Per la costruzione effettiva del sistema di classificazione possiamo individuare i seguenti

criteri fondamentali:

1. raccolta di un campione sufficientemente rappresentativo del dominio che si

intende classificare;

2. isolamento dei concetti o delle proprietà costitutive di ciascun oggetto;

3. individuazione dei termini più appropriati per descriverli ed elencarli in una lista;

4. definizione delle faccette e dei relativi foci sulla base della lista.

William Denton sostiene questi principi:

• differenziazione : quando dividiamo un'entità nelle sue componenti, è importante

utilizzare criteri di divisione (ossia faccette) capaci di distinguere chiaramente le

componenti stesse;

• rilevanza : quando scegliamo le faccette attraverso cui dividere le entità, è

importante assicurarsi che tali faccette riflettano lo scopo, l'argomento

(soggetto) e l'ambito del sistema di classificazione;

• certezza : è importante scegliere faccette ben definite e che possono essere

accertate con facilità;

• permanenza : le faccette dovrebbero rappresentare qualità permanenti

dell'oggetto da classificare;

• omogeneità : le faccette dovrebbero essere omogenee;

• mutua esclusione : le faccette devono essere mutuamente esclusive, poiché

ognuna deve rappresentare soltanto un criterio di divisione.

Bisogna sempre tenere presente lo scopo della classificazione e il target a cui ci si

riferisce, ossia chi la utilizzerà. Per un sistema di classificazione funzionale è indispensabile

una buona notazione, al fine di garantire un ordine di citazione conveniente. La notazione

non è utile solo in uno spazio fisico (biblioteche) per il collocamento o il reperimento di un

oggetto, ma anche in contesti digitali. Infatti, una corretta notazione è in grado di garantire

una presentazione delle risorse secondo un ordine conveniente (dal generale al particolare,

come stabilito dalla teoria della classificazione), più efficace del semplice criterio alfabetico

o cronologico.

Il caso studio: WikiArte e la classificazione a faccette.

Conviene sempre eseguire dei test con utenti per controllare la coerenza dello schema

architetturale, la sua chiarezza, le etichette scelte per faccette e foci. Inoltre, è opportuno

tenere aggiornato lo schema, affinché sia possibile rispondere a eventuali difetti che il

comportamento degli utenti può manifestare, adeguare la terminologia al cambiamento o

alle nuove esigenze e adattare lo schema per l'introduzione di nuovi elementi non previsti al

momento della costruzione.

Riferendoci al modello di Ranganathan a 5 categorie fondamentali e a quello del CRG a

13 categorie, potremmo abbozzare uno schema di questo tipo:

5 Categorie di Ranganathan

13 Categorie del CRG Faccette

PersonalitàOggetti Manufatti

Tipi

Materia

Parti Temi, Soggetti e Generi

Proprietà

Materiale Materiale

EnergiaProcessi Stile e Movimento

Operazioni Discipline

Prodotto

Sottoprodotto

Pazienti

Agenti Realizzatori

Spazio Spazio Luoghi

Tempo Tempo Periodo

Questo può essere un buon punto di partenza per riflettere su come realizzare una

classificazione a faccette, le quali possono essere rinominate e riadattate per ogni

circostanza particolare.

I criteri adottati per la definizione di queste faccette sono legati all'usabilità di un sito

Web, ossia dare la possibilità ai visitatori d'interrogare il sistema e ricevere delle risposte

sensate e veloci, senza rimanere intrappolati nel labirinto della rete. Il punto di partenza è 46

Il caso studio: WikiArte e la classificazione a faccette.

stato quello di ideare un sistema centrato sull'utente. Poiché il Web e le faccette si fondono

bene insieme, è necessario mostrare all'utente una lista di faccette sotto forma di menù da

cui selezionare e scegliere ciò che gli interessa maggiormente. Tali faccette rappresentano

un descrittore semantico delle proprietà o degli aspetti dei dati immagazzinati, che

agevolano l'operazione di ricerca dell'utente rendendola mirata ed efficace.

William Denton (2003) affermò che:

“[...]The user can make quick choices, thinking, "I'd like to see something

with that, and that, and a bit of that, and I don't care about the rest,[...]”

In un Portale Web, che racchiude un enciclopedia sull'arte, è importante pensare ad un

metodo di ricerca intuitivo, con parole-chiave che permettono il facile reperimento dei

documenti per un ampio spettro di utenza, anche per chi non conosce la terminologia del

settore. L'utente può operare delle scelte rapide senza preoccuparsi del resto, rendendo la

navigazione e la ricerca particolarmente mirata.

Il sistema di navigazione comprende un totale di otto faccette, precedentemente citate,

che definiscono un opera d'arte in tutte le sue proprietà, a partire dal tipo di manufatto, il

materiale, da chi è stato realizzato, dove e quando. Naturalmente a completare le faccette vi

sono i relativi foci e sottocategorie (dove necessario), che permettono di approfondire con

accuratezza la ricerca.

Di seguito, la tabella 1 riporta le faccette con la relativa definizione e alcuni dei propri

foci (in Appendice viene riportato il file di riferimento di ogni faccetta con la lista completa

dei foci).

Il caso studio: WikiArte e la classificazione a faccette.

Faccette Definizione Foci

Manufatti

La faccetta “Manufatti” si riferisce a tutte le entità che sono state riconosciute come bene artistico-culturale.

Affresco, Ceramica, Dipinto, Disegno, Fotografia, Installazione, Libro, Murale, Mosaico, Rilievo, Scultura, Stampa,Video

Temi Soggetti e Generi

La faccetta “Temi, Soggetti e Generi” si riferisce alle Tematiche affrontate nei secoli dagli artisti, i soggetti rappresentati e i Generi dell'arte.

Amore, Bellezza, Dinamismo, Dolore, Donna, Elettricità, Forza, Gioia, Macchina, Musica...

Materiali

La faccetta “Materiali” si riferisce a ciò che compone il manufatto. La maggior parte dei termini raggruppati in questa faccetta rappresentano il materiale basato sulla loro composizione.

Argilla, Avorio, Bronzo, Carta, Cartone, Ceramica, Ferro, Gesso, Inchiostro, Legno, Marmo, Pietra, Plastica, Sabbia, Seta, Stoffa, Tavola, Tela, Terracotta, Vetro...

Stile e Movimenti

La faccetta “Stile e Movimenti” fornisce i nomi dei vari stili e movimenti dell'architettura e dell'arte; gruppi e scuole che sono stati rappresentati nel lavoro di classificazione.

Art Deco, Art Nouveau, Barocco, Bauhaus, Blaue Reiter, Classicismo, Cubismo, Cubismo, orfico, Dada, Dadaismo, Decadentismo, Divisionismo, Espressionismo, Espressionismo astratto, Fauvismo, Futurismo...

Discipline

La faccetta “Discipline” contiene i principali ambiti disciplinari che l'arte abbraccia, sottolineando l'appartenenza di un manufatto alla Letteratura o alla Pittura, ecc.

Scultura, Pittura, Letteratura, Architettura, Musica, Cinema, Teatro, Danza, Giornalismo, Videoarte, Medicina, Grafica pubblicitaria

Realizzatori La faccetta “Realizzatori” si riferisce all'entità che crea o produce l'oggetto o il lavoro.

Paolo Buzzi Aldo Palazzeschi, Giuseppe Carrieri, Auro D'alba,

Il caso studio: WikiArte e la classificazione a faccette.

Francesco Cangiullo, Giovanni Papini, Carlo Belloli, Carlo Dalmazzo Carrà, Federico De Maria, Piero Bellanova, Ardengo Soffici, Filippo Tommaso Marinetti, Fortunato Depero

Luoghi

La faccetta “Luoghi” contiene il nome dei continenti, delle regioni, dei paesi e delle province generali in cui l'oggetto è stato creato.

Africa, Asia, America, Europa, Oceania...

Periodi

La faccetta “Periodi” elenca i diversi periodi storici, raggruppati in secoli e decadi.

Dal 1900 al 2010

Tabella 1: Tabella di definizione delle faccette e dei foci.

3.4 Preparare la collezione di dati per Flamenco

Per fare in modo che Flamenco carichi la vostra collezione di dati, i metadati relativi alla

raccolta devono essere forniti in file delimitati da tabulazioni (noto anche come file TSV,

con estensione “.tsv”). I file TSV possono essere facilmente manipolati utilizzando un

semplice editor di testo. Una raccolta, in Flamenco, consiste in un set di articoli tutti dello

stesso tipo (per esempio, tutti gli elementi sono libri, o tutti gli elementi sono canzoni, e

così via). Il metadato di un

qualsiasi articolo consiste nei

valori delle faccette e i valori

degli attributi. Il primo passo

per preparare la collezione è

quello di decidere quali

informazioni saranno nelle

faccette e quali negli attributi. I

valori delle faccette vengono

utilizzati per organizzare gli

Figura 20: Faccette

Il caso studio: WikiArte e la classificazione a faccette.

elementi in categorie, mentre i valori degli attributi sono visualizzati solo con i singoli

elementi.

Per esempio, nella nostra collezione “Manufatti” è la faccetta che indica il tipo di oggetto,

(bene artistico) che è stato raccolto, mentre “titolo” è l'attributo per il titolo del manufatto.

Questo perché, ha senso raggruppare i manufatti in categorie in base al tipo di oggetto, ma

non per il suo titolo.

I valori delle faccette sono associati a numeri ID, mentre i valori degli attributi sono

stringhe.

I file TSV che bisogna fornire sono:

• attrs.tsv

• facets.tsv

• items.tsv

• facet_terms.tsv (per ogni faccetta)

• facet_map.tsv (per ogni faccetta)

Figura 21: valori degli Attributi

Il caso studio: WikiArte e la classificazione a faccette.

Il file attrs.tsv racchiude la lista degli attributi. Ogni linea rappresenta un attributo.

Campo 1 Campo 2

attribute identifier displayable name

Il campo attribute identifier deve essere un nome corto e univoco che contiene solo

lettere e “_” (no spazi o punteggiatura) mentre displayable name è ciò che viene

visualizzato dall’utente.

Il file facets.tsv contiene la lista delle faccette. Il campo facet identifier deve essere un

nome corto e univoco (anche rispetto agli attributi) che contiene solo lettere o underscores ,

displayable name è ciò che viene visualizzato dall’interfaccia utente e long description

fornisce una descrizione dettagliata della faccetta.

Campo 1 Campo 2 Campo 3

facet identifier displayable name long description

Il file items.tsv fornisce ID e attributi per tutti gli oggetti.

Campo 1 Campo 2 Campo 3 ... Campo n + 1item

identifierValue for

attribute 1Value for attribute 1

... Value for attribute n

Ogni oggetto ha un suo ID univoco che può essere una stringa o un numero. Il campo item

identifier è seguito dai valori degli attributi per l’oggetto nell’ordine in cui gli attributi sono

inseriti nel file attrs.tsv.

Il file facet_terms.tsv ( dove facet è il “facet identifier” specificato nella prima

colonna di facet.tsv) fornisce, per ogni faccetta, l’albero dei termini delle categorie nella

faccetta.

Campo 1 Campo 2 ... Campo d - 1 Campo d Campo d + 1

term identifier top-level term ... grandparent

term parent term category term

E’ l’unico file che, in ogni riga, può avere un diverso numero di campi. Ogni linea

rappresenta una categoria e fornisce l’intera catena di categorie “padre”. Il campo term

identfer deve essere un numero univoco all’interno della faccetta.

Il caso studio: WikiArte e la classificazione a faccette.

Il file facet_map.tsv collega, per ogni faccetta, gli oggetti ai termini della categoria. Ogni

linea in questo file ha 2 campi:

Campo 1 Campo 2

item identifier term identifier

Il Campo 1 contiene l'ID del file item.tsv il Campo 2 contiene l'ID del file facet_terms.tsv.

Conclusioni

ConclusioniLungi da voler intraprendere una classificazione di tutto il Patrimonio Artistico-culturale,

il progetto vuole dimostrare la possibilità e l'efficacia di acquisire informazioni da fonti

strutturate e non strutturate e presentarli all'utente in forma semplice e facilmente

consultabile.

I risultati vengono infatti raggruppati per categorie e visualizzati con il sistema “a

faccette”, che permette di raffinare la ricerca secondo la direzione voluta, avendo, al

contempo, una visione d'insieme delle informazioni disponibili.

Il lavoro è stato svolto su due fronti :

• La realizzazione di un enciclopedia Wiki sul mondo dell'arte, con particolare

attenzione al movimento del Futurismo, per dare struttura all'informazione non

strutturata, ma semplicemente archiviata in un database.

• la pubblicazione sul web di un ambiente con interfaccia a faccette, realizzato

grazie al software Flamenco.

Tutti i vantaggi di una classificazione a faccette possono essere realizzati in pieno sul

web, a partire dal lavoro dei designer ed architetti dell'informazione che possono affidarsi

ad un sistema aperto, facilmente scalabile e flessibile; sino ad arrivare al miglioramento

sensibile dell'esperienza dell'utente in diverse situazioni di navigazione e ricerca. Gli utenti

possono iniziare la ricerca dalla faccetta che interessa maggiormente. Ognuno può trovare i

documenti che rispondono alla caratteristica selezionata, senza l'obbligo di effettuare un

unico percorso che parta da una faccetta specifica e senza dover controllare diverse sotto

categorie. Infatti, il sistema garantisce una pluralità di accessi, modalità di ricerca e

navigazione differenti, che rispondono ai bisogni informativi dei vari utenti, permettendo la

coesistenza di diversi livelli di competenza e migliorando la reperibilità dell'informazione.

Appendice

AppendiceElenco dei file .tsv necessari a Flamenco

Attr.tsv Facets.tsv

artista nome artista

nascita data di nascita

morte data di morte

realizzazione data di realizzazione

titolo titolo dell' oggetto

fotografia Fotografia

biografia Biografia dell'artista

manufatti Manufatti tipo di oggetto

temiSoggettiGeneri

Temi Soggetti e Generi

Tematiche artistiche

materiali Materiali materiale usato

stileMovimenti Stile e Movimenti

stile e Movimento Artistico

disciplina Disciplina Ambito disciplinare di riferimento

realizzatori Realizzatori chi ha realizzato il bene culturale

luoghi Luoghi luogo in cui il bene è stato prodotto

periodo Periodo periodo storico e anno di riferimento

Gli articoli che contengono le descrizioni dei manufatti e le biografie degli artisti sono

contenuti nel file item.tsv, una tabella che fornisce ID e attributi per tutti gli oggetti. Di

seguito un esempio del modo in cui è strutturato il file, per ogni attributo corrisponde un

campo della tabella.

Attr.tsv Item.tsv

Artista nome artista

nascita data di nascita

morte data di morte

realizzazione data di realizzazione

titolo titolo dell' oggetto

fotografia Fotografia

Ardengo Soffici

1879

1964

1914

Natura morta con uovo rosso

http://192.168.1.2:8888/mediawiki/images/thumb/8/83/1469_Ardengo_Soffici_Coi_Natura_morta_con_uovo_rosso.jpg/350px-1469_Ardengo_Soffici_Coi_Natura_morta_con_uovo_rosso.jpg

http://192.168.1.2:8888/mediawiki/index.

Appendice

biografia Biografia dell'artista php/Ardengo_Soffici

MANUFATTI_TERM MANUFATTI_MAP

1 Affresco2 Ceramica3 Ceramica Porcellana4 Ceramica Ceramica dipinta5 Ceramica Maiolica6 Ceramica Terracotta7 Ceramica Terraglia8 Dipinto9 Dipinto Pittura a olio10 Dipinto Pittura a tempera11 Disegno12 Disegno acquerello13 Disegno carbone14 Disegno gesso15 Disegno grafite16 Disegno Inchiostro17 Disegno pastello18 Fotografia19 Installazione20 Libro21 Murale22 Mosaico23 Rilievo24 Rilievo Altorilievo25 Rilievo Bassorilievo26 Scultura27 SculturaAvorio28 SculturaBronzo29 SculturaLegno 30 SculturaMarmo 31 SculturaOttone32 SculturaPietra33 SculturaTerracotta34 Stampa35 Stampa Acquaforte36 Stampa Acquatinta37 Stampa Fotoincisione38 Stampa Incisione

ID-item ID-Manufatti_term

Esempio

1 9

Ardengo Soffici – Natura morta con

uovo rosso

Pitura a olio

Appendice

39 Stampa Litografia40 Stampa Manifesto41 Stampa Mezzotinto42 Stampa Puntasecca43 Stampa Serigrafia44 Stampa Xilografia45 Video

TEMISOGGETTIGENERI_TERM TEMISOGGETTIGENERI_MAP

1 Amore2 Bellezza3 Dinamismo4 Dolore5 Donna6 Elettricita7 Forza8 Gioia9 Macchina10 Musica11 Natura morta12 Paesaggio13 Pericolo14 Ritratto15 Ritratto Autoritratto16 Treno17 Velocità18 Viaggio19 Madre

ID-item ID-temiSoggettiGeneri_term

Esempio

1 11

Ardengo Soffici – Natura morta con

uovo rosso

Natura morta

MATERIALI_TERM MATERIALI_MAP

1 Argilla

2 Avorio

3 Bronzo

4 Carta

5 Cartone

6 Cera

7 Ceramica

8 Ferro

9 Inchiostro

10 Legno

11 Marmo

ID-item ID-materiali_term

Esempio

1 18

Ardengo Soffici – Natura morta con

uovo rosso

Tela

Appendice

12 Pietra

13 Plastica

14 Sabbia

15 Seta

16 Stoffa

17 Tavola

18 Tela

19 Terracotta

20 Vetro

STILEMOVIMENTI_TERM STILEMOVIMENTI_MAP

1 Art Deco 2 Art Nouveau3 Barocco4 Bauhaus5 Blaue Reiter 6 Die Brücke7 Classicismo8 Cubismo9 Cubismo10 Dada11 Dadaismo12 Decadentismo13 Divisionismo14 Espressionismo15 Espressionismo astratto 16 Fauvismo17 Futurismo18 Gotico19 Impressionismo20 Luminismo21 Macchiaioli22 Manierismo23 Minimalismo24 Neo-Plasticismo25 Neo-Romanticismo26 Neoclassica pittura27 Nucleare Arte28 Optical Art29 Orfismo30 Pop Art31 Preraffaelliti32 Primitivismo

ID-item ID-stileMovimenti_term

Esempio

1 17

Ardengo Soffici – Natura morta con

uovo rosso

Futurismo

Appendice

33 Purismo34 Realismo35 Realismo cubista36 Realismo magico37 Realismo sociale38 Rinascimento39 Rococò40 Romanisto41 Romanticismo42 Scuola di Parigi43 Simbolismo44 Sintetismo45 Suprematismo46 Surrealismo47 Umanesimo48 Valori Plastici49 Verismo50 Vorticismo

DISCIPLINE_TERM DISCIPLINE_MAP

1 Scultura2 Pittura3 Letteratura4 Architettura5 Musica6 Cinema7 Teatro8 Danza9 Giornalismo10 Videoarte11 Medicina12 Grafica pubblicitaria13 Arte Musiva

ID-item ID-discipline_term

Esempio

1 2

Ardengo Soffici – Natura morta con uovo rosso

Pittura

REALIZZATORI_TERM REALIZZATORI_MAP

1 Architetto2 Architetto Antonio Sant'Elia3 Avvocato4 Avvocato Giuseppe Carrieri5 Collezioni6 Collezionisti7 Compositore8 Compositore Luigi Russolo9 Critico d' arte10 Critico d' arte Carlo Belloli11 Critico d' arte Carlo Carrà12 Critico d' arte Federico De Maria

ID-item ID-realizzatori_term

Esempio

1 32

Ardengo Soffici – Natura morta con

uovo rosso

Pittore Ardengo Soffici

Appendice

13 Drammaturgo14 Drammaturgo Filippo Tommaso Marinetti15 Drammaturgo Paolo Buzzi16 Fondazioni17 Giornalista18 Giornalista Paolo Buzzi19 Giornalista Enrico Cavacchioli20 Giornalista Gesualdo Manzella Frontini21 Giornalista Federico De Maria22 Medico23 Medico Piero Bellanova24 Mercanti d'arte25 Mosaicista26 Mosaicista Gino Severini27 Musei28 Pittore29 Pittore Francesco Cangiullo30 Pittore Carlo Dalmazzo Carrà31 Pittore Giacomo Balla32 Pittore Ardengo Soffici33 Pittore Uberto Boccioni34 Pittore Fortunato Depero35 Pittore Enrico Prampolini36 Pittore Luigi Russolo37 Pittore Gino Severini38 Poeta39 Poeta Paolo Buzzi40 Poeta Enrico Cavacchioli41 Poeta Corrado Govoni42 Poeta Libero Altomare43 Poeta Luciano Folgore44 Poeta Gesualdo Manzella Frontini45 Poeta Auro D'alba46 Poeta Francesco Cangiullo47 Poeta Federico De Maria48 Poeta Ardengo Soffici49 Poeta Filippo Tommaso Marinetti50 Pubblicitario51 Pubblicitario Fortunato Depero52 Scenografo53 Scenografo Giacomo Balla54 Scenografo Enrico Prampolini55 Scenografo Fortunato Depero56 Scrittore57 Scrittore Paolo Buzzi58 Scrittore Aldo Palazzeschi59 Scrittore Giuseppe Carrieri60 Scrittore Auro D'alba61 Scrittore Francesco Cangiullo62 Scrittore Giovanni Papini

Appendice

63 Scrittore Carlo Belloli64 Scrittore Carlo Dalmazzo Carrà65 Scrittore Federico De Maria66 Scrittore Piero Bellanova67 Scrittore Ardengo Soffici68 Scrittore Filippo Tommaso Marinetti69 Scrittore Fortunato Depero70 Scultore71 ScultoreGiacomo Balla72 ScultoreUmberto Boccioni73 ScultoreFortunato Depero74 ScultoreEnrico Prampolini75 Grafico pubblicitario76 Grafico pubblicitario Fortunato Depero

LUOGHI_TERM LUOGHI_MAP

1 Africa2 Africa Angola3 Africa Benin4 Africa Burkina Faso5 Africa Camerun6 Africa Congo7 Africa Costa d' avorio8 Africa Egitto9 Africa Gabon10 Africa Gana11 Africa Madagascar12 Africa Mali13 Africa Nigeria14 Africa Repubblica di Liberia15 Africa Sierra Leone16 Africa Sud Africa17 Africa Zaire18 Asia19 Asia Afghanistan20 Asia Asia Centrale21 Asia Assiria22 Asia Cina23 Asia Giappone24 Asia India25 Asia Persia26 Asia Russia27 Asia Tailandia28 Asia Tibet29 Asia Turchia30 Asia Turkmenistan31 Asia Uzbekistan32 Australia

ID-item ID-luoghi_term

Esempio

1 45

Ardengo Soffici – Natura morta con

uovo rosso

Italia

Appendice

33 Europa34 Europa Austria35 Europa Belgio36 Europa Boemia37 Europa Cecoslovacchia38 Europa Cipro39 Europa Danimarca40 Europa Francia41 Europa Germania42 Europa Gran Bretagna43 Europa Grecia44 Europa Irlanda45 Europa Italia46 Europa Norvegia47 Europa Olanda48 Europa Paesi Bassi49 Europa Polonia50 Europa Portogallo51 Europa Scozia52 Europa Spagna53 Europa Svezia54 Europa Svizzera55 Europa Ungheria56 America57 America58 Oceania59 Oceania Australia60 Oceania New Zelanda61 Oceania Polinesia62 Oceania Micronesia63 Oceania Melanesia

PERIODO_TERM PERIODO_MAP

1 1900s2 1900s 19013 1900s 19024 1900s 19035 1900s 19046 1900s 19057 1900s 19068 1900s 19079 1900s 190810 1900s 190911 1910s12 1910s 191013 1910s 191114 1910s 191215 1910s 191316 1910s 1914

ID-item ID-periodo_term

Esempio

1 16

Ardengo Soffici – Natura morta con uovo rosso

1914

Appendice

17 1910s 191518 1910s 191619 1910s 191720 1910s 191821 1910s 191922 1920s23 1920s 192024 1920s 192125 1920s 192226 1920s 192327 1920s 192428 1920s 192529 1920s 192630 1920s 192731 1920s 192832 1920s 192933 1930s34 1930s 193035 1930s 193136 1930s 193237 1930s 193338 1930s 193439 1930s 193540 1930s 193641 1930s 193742 1930s 193843 1930s 193944 1940s45 1940s 194346 1940s 194447 1940s 194548 1940s 194649 1940s 194750 1940s 194851 1940s 194952 1950s53 1950s 195054 1950s 195155 1950s 195256 1950s 195357 1950s 195458 1950s 195559 1950s 195660 1950s 195761 1950s 195862 1950s 195963 1960s64 1960s 196065 1960s 196166 1960s 1962

Appendice

67 1960s 196368 1960s 196469 1960s 196570 1960s 196671 1960s 196772 1960s 196873 1960s 196974 1970s75 1970s 197076 1970s 197177 1970s 197278 1970s 197379 1970s 197480 1970s 197581 1970s 197682 1970s 197783 1970s 197884 1970s 197985 1980s86 1980s 198087 1980s 198188 1980s 198289 1980s 198390 1980s 198491 1980s 198592 1980s 198693 1980s 198794 1980s 198895 1980s 198996 1990s97 1990s 199098 1990s 199199 1990s 1992100 1990s 1993101 1990s 1994102 1990s 1995103 1990s 1996104 1990s 1997105 1990s 1998106 1990s 1999107 2000s108 2000s 2000109 2000s 2001110 2000s 2002111 2000s 2003112 2000s 2004

Bibliografia

Broughton,V. (2004, Gennaio 26), Una classificazione per il 21' secolo. Tratto il giorno Giugno

13, 2010 da AIB-WEB: <http://www.aib.it/aib/contr/broughton1.htm>

Bussolon, S. (s.d.). Organizzazione - Schemi organizzativi. Tratto il giorno Marzo 17, 2010 da

Hyperlabs <http://www.cardsorting.info/it/architettura/03.html>

Denton, W. (2003). How to Make a Faceted Classification and Put It On the Web. Tratto il giorno

10 Giugno, 2010 da Miskatonic university press,

<http://www.miskatonic.org/library/facet-web-howto.html>

Gnoli, C. (2000, Novembre 03). Il tavolino di Ranganathan. Tratto il giorno Giugno 14, 2010

da <http://didattica.spbo.unibo.it/bibliotime/num-iii-3/gnoli.htm>

Gnoli, C. (2002, Ottobre 17). Indicizzazione semantica nell'era digitale, ESB forum. Tratto il

giorno Marzo 22, 2010 da <http://www.burioni.it/forum/gnoli-sem.htm>

Gnoli, C. (2004). Classificazione a faccette. Roma: Associazione italiana Biblioteche.

Gnoli, C., Marino, V., & Rosati, L. (2006). Organizzare la conoscenza - Dalle biblioteche

all'architettura dell'informazione per il Web. Milano: Tecniche Nuove.

Hearst M. , English J., Sinha R., Swearingen K., & Yee K.-P. (Settembre 2002). Finding the

flow in web site search. Communications of the ACM.

Hearst M. A., Smalley P., & Chandler C., (2006, Aprile 26) Faceted Metadata for Information

Architecture and Search. New York: Association for Computing Machinery.

Instone, K. (2004, Luglio 8), Faceted Browsing - How User Interfaces Represent and Benefit from a

Faceted Classification System, SOASIST meeting, Dayton, Ohio

Jacob, Elin (1999). Utilizing Faceted Structures for Information Systems Design , Proceedings of the

62st Annual Meeting of ASIS. Uta Priss

Lavazza, C., Fiacchi, A., & Lauro, B. (2006, Novembre 06). Breve guida alla classificazione.

Tratto il giorno Marzo 18, 2010 da Trovabile <http://trovabile.org/articoli/guida-

alla-classificazione>

Marino, V. (2004, Febbraio 12). Classificazioni per il Web - I vantaggi dell'adozione di schemi a

faccette. Tratto il giorno Marzo 09, 2010 da AIB-WEB:

<http://www.aib.it/aib/contr/marino1.htm>

Ménard E., Mas S., & Alberts I., (2010) Faceted Classification for Museum Artefacts: A

Methodology to Support Web Site Development of Large Cultural Organizations tratto il

giorno 15 Giugno, 2010 da <www.cais-

acsi.ca/proceedings/2010/CAIS045_MenardMasAlbert_Final.pdf>

Morville, P., & Rosenfeld, L. (2002). Architettura dell'informazione per il World Wide Web.

Milano: Hops Libri.

Murray Phil, 2002, Conventional categorization: a complement to faceted classification, Knowledge

management connection, <http://www.kmconnection.com/Popularity-

based_classification.htm>

Postai, S. (Ottobre 2004) Facilitare la reperibilità dell’informazione: la classificazione a faccette tratto

il giorno Marzo 2010, 20 da Internet.pro <http://www.internet-

pro.typepad.com/aaaaArchFaccetteF.pdf>

Rosati, L. (2003). La classificazione a faccette fra Knowledge Management e Information Architecture

(parte I). Tratto il giorno Marzo 2010, 16 da itConsult:

<http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM.pdf>

-(2003). La classificazione a faccette fra Knowledge Management e Information Architecture (parte II).

Tratto il giorno Marzo 2010, 16 da itConsult:

<http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM_2.pdf>

Rosati, L. (2007). Architettura dell'informazione - Trovabilità: dagli oggetti quotidiani al Web. Milano:

Apogeo.

Spiteri L. (Aprile-Luglio 1998). A simplified model for facet analysis: Ranganathan 101. Canadian

Journal of Information and Library Science 23.

Vickery, B.C. (1972.) La classificazione a faccette. Guida per la costruzione e la utilizzazione di schemi

speciali. Roma, Consiglio nazionale delle ricerche.

Top Related

Classificazione - profpalumbo.altervista.org

Classificazione (aka Cluster Analysis). Classificazione non gerarchica –es. k-means Classificazione gerarchica divisiva Classificazione gerarchica agglomerativa.

Clinica estetica dentale faccette-dentali

Classificazione acciai

Classificazione dell’Architettura Proteicadigidownload.libero.it/Daerlic/Chimca ForumFree/biochimica mod a... · Classificazione dell’Architettura Proteica struttura Primaria

CAPITOLO 14 La Clusterizzazione e La Classificazione non supervisionata CLASSIFICAZIONE A. Dermanis, L. Biagi.

Classificazione strumenti

ECM...La tecnica delle “faccette estetiche”: LE FACCETTE Materiali e tecniche per il restauro conservativo realizzato mediante tecniche indirette. 1. Indicazioni e controindicazioni