Librerie digitali Alcune considerazioni...
Transcript of Librerie digitali Alcune considerazioni...
1
Librerie digitali
Gestione di immagini e foto di oggetti
2
Digitalizzazione di immagini� Alcune considerazioni generali
� Determinare gli scopi� Requisiti degli utenti� Requisiti di chi conversa il dato
� Acquisire una volta, usare più volte� Creare una versione master dell’immagini ottenuta
dalla prima scansione dell’immagine� Creare nuove versioni, partendo da quella master,
in funzione dell’uso che si farà dell’immagine
3
Immagini vettoriali� Insiemi di percorsi (path)� Coordinate� Informazioni sui colori� SVG coding
� http://www.tasi.ac.uk/advice/vector/svg_code.txt� Usate generalmente per� Font� Disegni� Grafici� Mappe Immagine vettoriale
4
Esempio
5
Immagini Raster/Bitmap� Immagini raster/bitmap� Una griglia di punti individuali� Ogni pixel è caratterizzato da un differente colore
� Usate generalmente per� Immagini� Foto
Immagine Bitmap6
Fotografie
� Formati � Stampe� Negativi
� Requisiti� “Fedeltà” dei colori� Contrasto� Rendering
2
7
Immagini che ritraggono documenti� Possono essere in
bianco e nero o a colori
� Requisiti� É necessario che le
scritte siano leggibili� Utile anche per le
fasi successive di OCR
8
Mappe� Possono essere
� Scansioni di materiale cartaceo
� Immagini digitali� Ci sono requisiti
maggiori� Possibilità di fare
zoom� Panoramiche� Centramento rispetto
a delle coordinate
9
Mappe� Ci sono requisiti maggiori
� Possibilità di fare zoom� Immagini, relative a zone diverse, con un livello di
dettaglio maggiore rispetto all’immagine della mappa completa
� Centramento rispetto a delle coordinate� Necessità di dati sulle coordinate della zona
rappresentata� Necessità di strumenti appositi per navigare le
immagini
10
I cinque fattori fondamentali� Risoluzione� Bit Depth� Tecnica di rappresentazione del colore� Compressione� Formato
11
Risoluzione� Unità di misura solitamente utilizzate
� dpi (Dots per inch)� ppi (Pixels per inch)
� Risoluzione� Numero di pixel per inch dell’immagine
scansionata� Esempio: � immagine da 8x10 inch scansionata a 300ppi = 2400 x
3000 pixels
12
Risoluzione e scansione� Ottica vs. interpolata� Ottica
� Numero di sensori dello scanner = cosa vede lo scanner
� Interpolata� Numero di pixel che il software può ottenere
partendo da cosa “vede” lo scanner� Risoluzione più alta di quella ottica
3
13
Scelta della risoluzione adatta� Generalmente
conviene usare una risoluzione che soddisfa, come qualità, le esigenze dell’utente
� Non usare una risoluzione (molto) più alta� Spreco di spazio
Cornell’s online digital imaging tutorial: <http://www.library.cornell.edu/preservation/tutorial/conversion/conversion-03.html>
14
Confronto tra risoluzioni diverse
15
600dpi vs. 300dpi
16
Bit Depth� Numero di bit usati per rappresentare le
informazioni sul colore di ogni pixel� 1 bit (1) = 21 = 2 colori/tonalità (bianco e nero)� 2 bit (01) = 22 = 4 colori/tonalità� 4 bit (0010) = 24 = 16 colori/tonalità� 8 bit (11010001) = 28 = 256 colori/tonalità
17
Confronto tra bit depth diversi
1 bit 2 bit (4 colori)
4 bit (16 colori) 8 bit (256 colori)18
Tecnica di rappresentazione del colore� RGB� Gli scanner e le telecamere solitamente hanno
sensori per rilevare rosso, verde e blu� Ognuno dei tre canali è memorizzato in modo
separato� 8 bit per ogni canale = 24 bit color
� CMYK � Ciano, magenta, giallo e nero� Solitamente usato per “pre-press” printing di alta
qualità
4
19
Approccio consigliato per l’acquisizione delle immagini� Confrontare la foto corrente e la scena
originale (se possibile)� L’immagine master dovrebbe essere 8 bit
per canale (8-bit grayscale, 24-bit RGB)� Di più solo per progetto particolari
� Gli aggiustamenti di colore devrebbero essere fatti tramite il software dello scanner prima di fare la scansione dell’immagine
� Usare tutti i toni di colore possibili20
Gestione dei colori in presenza di più strumenti� International Color Consortium� Standard per la traduzione dei colori tra strumenti
o sistemi diversi� Tutti gli strumenti dovrebbero essere
caratterizzati da profili ICC� video� scanner� stampanti
21
Gestione dei colori in presenza di più strumenti� Includere nelle immagini master i profili ICC
profiles in master images
22
Compressione� Compressione � Senza perdita d’informazione (Lossless
compression)� Con perdita d’informazione (Losy compression)
� Utile per ridurre la dimensione dei file� Svantaggi� Alcuni formati sono propritari
� Problema per l’interoperabilità tra strumenti e sistemi
23
Compressione senza perdita� Riduzione dello spazio occupato senza
perdere nessun dato� Il file originale, e quindi l’mmagine, può essere
ricreato senza perdite partendo dal file compresso� Riduzione basata sulle ridondanze� Codifiche dei dati più efficienti� LZW (Lempei, Ziv, and Welch)� Sostituzione di pattern con codici� I codici più corti sono usati per i pattern più
frequenti24
Compressione con perdita� Riduzione dello spazio occupato tramite
l’eliminazione di parte dei dati� Il file originale, e quindi l’mmagine, non può
essere ricreato senza perdite partendo dal file compresso
� Riduzioni irrilevanti� Eliminazione di informazioni che sono non
percettibili da parte di chi vede l’immagine� Esempio� Compressione JPEG
5
25
Compressione� Immagine a dimensione originale, 8x e 16x
Senza compressione
Compressione con perdita
Massima compressione JPEG
(Photo: TASI training © Technical Advisory Service f or Images) 26
Compressione� Alcune tecniche di compressione
comunemente usate� Fractal
� Immagini rappresentate tramite formule matematiche� Wavelet
� Immagini viste come segnali
27
TIFF - Tag Image File Format� Formato solitamente prescelto per
l’archiviazione delle immagini� I dati sono etichettati� http://partners.adobe.com/public/developer/en/
tiff/TIFF6.pdf� Supporto di diversi “color spaces”� Supporto di molte tecniche di compressione� LZW, G3 and G4
28
JPEG2000� Standard di compressione ISO che include
più metodi di compressione� Sia metodi di compressione senza perdita� Sia metodi con perdita
� Le immagini vengono sezionate il blocchi (di dimensione fissa) nel momento della creazione del file JPEG2000� Ciò permette in seguito di decodificare in modo
indipendente e selettivo solo i blocchi di interesse� Utile ad esempio per gli zoom sulle mappe
29
JPEG2000� Possibile includere dei metadati nel file
dell’immagine� Esempio di applicazione che usa immagini
salvate nel formato JPEG2000� http://lids.hul.harvard.edu:8080/lids/lids?id=83956
7&buttons=y
30
JPEG� Il formato JPEG non è sempre uguale al
metodo di compressione JPEG (spesso lo è)� Usato solitamente per � Fotografie
6
31
GIF� Sviluppato nel 1987 per video CompuServ� Usato solitamente per � Monitor
� Non adatto per le stampe� Usa la tecnica di compressione LZW
32
PNG� Pensato per sostituire lo standard GIF a
causa di alcuni problemi legati a LZW� Usa la tecnica di compressione senza perdita
LZ77� Poco accettato� La compressione e la decompressione sono
operazioni intense dal punto di vista della CPU� Tempi di risposta lenti da parte dei programmi di
visualizzazione� Poco supportato dai browser
33
PNG� Compressione migliore rispetto a TIFF LZW� Può diventare lo standard per le immagini master
34
Confronto tra le dimensioni dei file generati� Immagine 1943x1702 pixel, 24-bit RGB
4MB (lossless)JPEG2000
1.0MBJPG
6.5MBPNG
8.4MBTIFF LZW
9.9MBTIFF
Dimensione (MB)Tipo file
35
Metadati caratteristici dei vari formati� Ogni formato include al suo interno una serie
di metadati sulle caratteristiche tecniche dell’immagine� Dimensione� Tipo di codifica usata� ...
� Elenco di metadati (tag) per alcuni formati comunemente usati� http://owl.phy.queensu.ca/~phil/exiftool/TagNam
es/index.html 36
Quali formati usare� Best practice attuale� Immagine master
� TIFF (non compresso)� Derivate
� JPEG (per il web)
7
37
Metadati tecnici per le immagini� MIX – Metadata for Still Images in XML� Sviluppato da� The Library of Congress' Network Development e
MARC Standards Office� NISO Technical Metadata for Digital Still Images
Standards Committee� http://www.niso.org/standards/resources/Z39_87_
trial_use.pdf
38
Workflow per il processo di digitalizzazione delle immagini� Fase di pianificazione� Fase di produzione
39
Fase di pianificazione� Definire gli obiettivi del progetto nel quale si
useranno le immagini� Definire le specifiche per le immagini master� Definire le specifiche per le immagini
consegnabili/trasferibili� Selezionare lo strumento per le scansioni� Sviluppare e testare le procedure di
digitalizzazione
40
Fase di pianificazione� Sviluppare e testare le procedure per la
verifica della qualità� Determinare quali metadati memorizzare� Documentare il processo di acquisizione
41
Fase di produzione� Controllo degli oggetti da digitalizzare� Dove si trova l’oggetto?� Ho digitalizzato tutti gli oggetti?� Ho restituito tutti gli oggetti al suo proprietario?
� Control flow� Quanti oggetti posso digitalizzare oggi?� I file sono stati validati e verificati?� I file sono stati sottoposti al processo di backup?
42
Fase di produzione� Alcuni riferimeti� http://hul.harvard.edu/ois/services/digproj/LDI_Im
aging_Projects_Workflow.pdf� http://www.law.harvard.edu/library/collections/spe
cial/online-collections/portraits/workplan.php� http://www.dlib.indiana.edu/internal/dmic/old/wylie
8
43
Revisione della qualità� Un processo di revisione della qualità è
essenziale� Caratteristiche oggettive
� Dimensione in pixel� Risoluzione� Bit depth
� Caratteristiche soggettive� Artefatti in fase di scansione� Orientamento� ....
Librerie digitali
Geographic Information System (GIS) e Mappe
45
Differenza tra dati spaziali egeografici � I dati “geografici” si riferiscono alla terra
� Spazio a due dimensioni� Superficie della terra
� Spazio a tre dimensioni� Terra rappresentata in tre dimensioni
� Tutte le coordinate sono referenziate rispetto alla terra
46
Differenza tra dati spaziali e geografici� I dati “spaziali” si riferiscono ad un qualunque
sistema multidimensionale in cui sono rappresentati punti, linee, superfici, ..� Le coordinate sono referenziate rispetto ad un
oggetto che varia in funzione del dominio� Le immagine mediche sono referenziate rispetto al
corpo dell’uomo� I disegni tecnici sono referenziati rispetto all’oggetto
meccanico che si sta rappresentando� I dati geografici sono un sottoinsieme di quelli
spaziali� Anche se spesso i due termini sono usati in modo
intercambiabile
47
Definizione di Geographic Information System (GIS)� Definizione data dall’agenzia United States
Geological Survey (USGS)� "In the strictest sense, a GIS is a computer
system capable of assembling, storing, manipulating, and displaying geographically referenced information, i.e. data identified according to their locations. Practitioners also regard the total GIS as including operating personnel and the data that go into the system."
48
GIS: concetti di base� I sistemi GIS gestiscono le relazioni tra dati in
base alla loro collocazione geografica� La collocazione geografica è effettuata
tramite diversi sistemi di riferimento� Coordinate in uno spazio a tre dimensioni (X,Y,Z)� Latitudine, longitudine� Codici di avviamento postale� ....
9
49
GIS: concetti di base� Punti� Linee� Poligoni� Layer� Attributi (caratteristiche)
50
Layer� Ogni livello rappresenta
una tipologia specifica di informazioni
� Esempi� Strade� Disposizione degli
edifici� Confini degli stati� Fiumi e laghi
51
Mappe (immagini) diverse per obiettivi diversi
Strade Fiumi
Curve di livello Digital elevation model (DEM)
52
Rappresentazioni raster e vettoriali� Raster (bitmap)
� Versione matriciale (a griglia) della mappa� Il valore di ogni cella è associato ad un particolare
significato semantico� Esempio: 1=pianura, 2=montagna, ..
� Rappresentazione vettoriale� Insieme di
� Punti� Linee (insiemi di punti)� Aree (sagome delimitate da linee)� Ad ogni area è associato un significato semantico
53
Raster vs. Vettoriale
Rappresentazione raster
Rappresentazione vettoriale
54
Raster vs. Vettoriale
Rappresentazione raster
Rappresentazione vettoriale
10
55
Rappresentazioni raster vs. vettoriali� Alcuni vantaggi della rappresentazione
vettoriale rispetto a quella raster� Possibilità di rappresentare in modo più compatto
le informazioni fondamentali di interesse� A scapito di una perdita minima di dettagli rispetto alla
rappresentazione raster� Sono già disponibili delle informazioni sugli
oggetti presenti nell’immagine e sulla loro forma� Semplificazione dell’operazione di ricerca di oggetti
56
Cartografia� La cartografia di
un’area geografica non è composta solo da immagini e layer
� Ci sono altre informazioni aggiuntive� Legende� Scala� ...
57
GIS Metadata� Il comitato Federal Geographic Data
Committee (FGDC) ha definito dei metadati standard per il GIS
� Content Standard for Digital Geospatial Metadata (CSDGM)� Descrizione del contenuto
� Spatial Data Transfer Standard (SDTS)� Standard per il trasferimento di dati tra software
per la gestione di dati spaziali