La rappresentazione delle informazioni

43
Insegnamento di Informatica – a.a. 2016-17 La rappresentazione delle informazioni INSEGNAMENTO DI INFORMATICA – A.A. 2016-17 Francesco Ciclosi Macerata, AA. 2016-2017

Transcript of La rappresentazione delle informazioni

Page 1: La rappresentazione delle informazioni

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione delle informazioni

INSEGNAMENTO DI INFORMATICA – A.A. 2016-17

Francesco Ciclosi

Macerata, AA. 2016-2017

Page 2: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La comunicazione tra uomo e macchina

Affinché gli esseri umani possano interagire con

gli elaboratori è necessario operare una traduzione

tra i differenti linguaggi utilizzati da entrambi

Gli elaboratori utilizzano un codice semplice e

disambiguo (il linguaggio binario)

Gli esseri umani utilizzano un codice complesso e

ambiguo

Page 3: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Avviene una conversione delle informazioni

scambiate con l’elaboratore

In tale processo si utilizzano le tabelle dei codici

La comunicazione uomo-macchina

può avvenire con successo se e solo se

Page 4: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione delle informazioni

Le informazioni possono essere codificate come

pattern di bit

Esistono metodologie differenti per codificare:

• Testo

• Numeri

• Immagini

• Suono

Page 5: La rappresentazione delle informazioni

Insegnamento di Informatica – a.a. 2016-17

Rappresentazione del testo

Page 6: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Il carattere

È un’unità minima di informazione

Corrisponde a un grafema, o a un simbolo, della

forma scritta di una lingua naturale

Esempi di carattere sono:

• lettere

• numeri

• segni di interpunzione

• caratteri di controllo (es: carriage return, line feed)

Page 7: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Rappresentazione del testo

Le informazioni testuali sono rappresentate

tramite un codice che assegna a ogni carattere un

pattern univoco di bit

Esistono vari codici di questo tipo e non tutti i

dispositivi li sanno interpretare

Per risolvere i problemi di standardizzazione

l’ANSI ha adottato il codice ASCII

Page 8: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

ASCII

ASCII (American Standard Code for Information

Interchange) è un codice per la codifica dei caratteri

Lo standard è stato pubblicato da ANSI nel 1968

Il sistema originario US-ASCII codificava i caratteri

a 7 bit e è ora standard ISO (ISO/IEC 646)

Nei PC si usa la versione extended ASCII che

utilizza 8 bit per la codifica

Page 9: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica US-ASCII

Page 10: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

ASCII esteso Utilizza l’ottavo bit di ogni byte per rappresentare

altri 128 caratteri aggiuntivi

Ciò ha prodotto notevoli problemi di compatibilità

dovuti anche all’utilizzo di estensioni proprietarie

ISO ha rilasciato uno standard (ISO 8859)

contenente un’estensione a 8 bit del set ASCII

• ISO 8859-1 (Latin1): caratteri lingue Europa Occidentale

• ISO 8859-2: caratteri linguaggi Europa Orientale

• ISO 8859-5: caratteri cirillici

Page 11: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica Latin1

Page 12: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Un esempio di codifica ASCII

B U O N

0100 0010 0101 0101 0100 1111 0100 1110

G I O R N O

0100 0111 0100 1001 0100 1111 0101 0010 0100 1110 0100 1111

Page 13: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Criticità di ASCII

Anche nella versione estesa è troppo ridotto per

ospitare gli alfabeti di alcune lingue

• Come a esempio quelle asiatiche

Poiché un documento può utilizzare un solo

standard, nello stesso documento non sono

supportate lingue appartenenti a gruppi

linguistici differenti

Per ovviare a tali criticità nasce UNICODE

Page 14: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Lo standard Unicode

Assegna un numero univoco ad ogni carattere usato

per la scrittura di testi, in maniera indipendente

• dalla lingua

• dalla piattaforma informatica

• dal programma utilizzato

È compilato e aggiornato dall’Unicode Consortium che

opera per garantire l’interoperabilità nel trattamento

informatico di testi in lingue diverse

Page 15: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Unicode + UTF-8

Se il set di caratteri Unicode è combinato con lo

standard Unicode Transformation Format 8-bit

(UTF-8):

• I caratteri ASCII originali sono rappresentati con 8 bit

• I caratteri di altre lingue (come cinese, giapponese e

ebraico) sono rappresentati con 16 bit

• Sono disponibili pattern a 24 e 32 bit per rappresentare

altri simboli insoliti e per future espansioni

Page 16: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Differenza tra file di testo Un file di testo è un file composto da una lunga

sequenza di simboli codificati in ASCII o Unicode

Esistono file di testo semplici

• Manipolati da editor di testo (come Blocco Note)

• Che contengono solo una codifica carattere per carattere

Esistono file di testo più elaborati

• Manipolati dai word processor (come Microsoft Word)

• Contengono oltre alla codifica carattere per carattere,

molti codici proprietari rappresentanti la formattazione

Page 17: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Esempio di differenze tra file di testo

Page 18: La rappresentazione delle informazioni

Insegnamento di Informatica – a.a. 2016-17

Rappresentazione dei valori numerici

Page 19: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Alcune problematiche di rappresentazione

Se i dati da registrare sono solo numerici,

rappresentarli come caratteri non è efficiente

• Utilizzando un byte per simbolo, la rappresentazione di

un numero in ASCII richiede sempre un byte

In tal caso utilizzeremo la notazione binaria

• ASCII: 1 byte 10 numeri | 2 byte 100 numeri

• Binario: 1 byte 256 numeri | 2 byte 65536 numeri

Page 20: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La notazione binaria

Nella notazione binaria i numeri sono

rappresentati utilizzando solo le cifre: 0, 1

Nella notazione decimale i numeri sono

rappresentati utilizzando le cifre: 0, 1, 2, 3, 4, 5,

6, 7, 8, 9

Page 21: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

1

0

1

0

1

0

0

1

1

0

1

0

0

1

1

0

1

0

1

1

1

1

0

0

0 1 0

1

1

1 10

9

8

7

6

5

4

3

2

1

0

Nu

meri

decim

ali

Nu

meri

bin

ari

Page 22: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Tecniche di memorizzazione numerica

I numeri interi sono memorizzati utilizzando il

sistema della notazione in complemento a due

• Consente di rappresentare sia i numeri negativi che

quelli positivi

I numeri che presentano una parte frazionaria

sono memorizzati utilizzando la notazione in

virgola mobile

Page 23: La rappresentazione delle informazioni

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione delle immagini

Page 24: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

L’immagine come insieme di puntini

L’immagine può essere descritta come una

collezione di punti

Ogni punto è detto pixel (picture element)

Una collezione di pixel codificati viene

denominata bitmap (mappa di bit)

Stampanti e monitor operano con il concetto di

pixel

Page 25: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica di un pixel

Per rappresentare un pixel serve un numero di

bit variabile con la quantità di informazione

presente

• Immagine in b/n (fax) 1 bit

• Immagine a toni di grigio (255) 1 byte

• Immagine a colori in true color (circa 16 milioni di

colori) 3 byte

Page 26: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica di un’immagine a colori

Ci sono due differenti approcci per codificare ciascun

pixel:

• RGB

o Ogni pixel è rappresentato come combinazione di 3 colori

(rosso, verde, blu)

o Per rappresentare ogni colore si utilizza un byte

• Luminosità + colore

o La luminosità (o luminanza) è la quantità di luce bianca nel pixel

o La crominanza blu/rossa è, rispettivamente, la differenza tra la

luminanza e la quantità di luce blu/rossa

Page 27: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Problematiche delle bitmap

L’immagine non è

ingrandibile se non

aumentando la

dimensione dei singoli

pixel che la

compongono

Il risultato ottenuto è

un’immagine sgranata

Page 28: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione vettoriale

Consiste nel descrivere l’immagine come

insieme di strutture geometriche codificabili

utilizzando tecniche di geometria analitica

Il dispositivo che visualizzerà l’immagine potrà

scegliere come rappresentare le strutture

geometriche

• Non sarà quindi richiesta la riproduzione di un

pattern di pixel particolare

Page 29: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

I font bitmap Sono un particolare tipo di font che prevede la

memorizzazione dei caratteri come matrice di punti

Utilizzano le mappe di bit

Occupano una grossa porzione di memoria

Sono usati nelle stampanti

Page 30: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

I font scalabili Sono memorizzati come

una serie di formule che

descrivono la struttura dei

caratteri

Sono ridimensionabili

Occupano poco spazio in

memoria

In sede di stampa sono

convertiti in mappa di bit

(rasterizzazione)

Page 31: La rappresentazione delle informazioni

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione dei suoni

Page 32: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale analogico

È molto sensibile alle

interferenze

Può assumere infiniti

stati

Presenta di fatto una

minore risoluzione

∞ stati possibili

Page 33: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale digitale

Poco sensibile alle interferenze

Può assumere due soli stati: 0 e 1

Presenta una maggiore risoluzione

2 soli stati

possibili

Page 34: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Digitale vs analogico: interferenze I segnali digitali sono più resistenti alle

interferenze di quelli analogici

• È più semplice riconoscere tra due soli stati anche in

base al «principio di prossimità»

Segnale digitale «pulito»

Segnale analogico «pulito»

Segnale digitale con interferenze

Segnale analogico con interferenze

Page 35: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale continuo

È una grandezza fisica variabile nel tempo in

modo continuo

Non è funzione di una variabile discreta

Il valore della grandezza può essere misurato in

qualsiasi istante

Può essere studiato sia nel dominio del tempo

che in quello della frequenza

Page 36: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale discreto: definizione

È una successione di valori di una grandezza in

corrispondenza di una serie di valori discreti nel

tempo

È una funzione con valori forniti in

corrispondenza a una serie di tempi scelti nel

dominio dei numeri interi

Ciascun valore della successione è chiamato

campionamento

Page 37: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale discreto: campionamento

Non è in funzione di una variabile continua

ma è ottenuto campionando un valore continuo

Page 38: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

«Risoluzione» di un segnale

A parità di durata, la quantità di informazione

trasportata da un segnale continuo è maggiore

rispetto a quella trasportata da un segnale discreto

Page 39: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale digitale

Un segnale digitale è un segnale discreto che può

assumere soltanto valori appartenenti ad un

insieme discreto

È ottenuto campionando un segnale analogico

(continuo)

Ha una determinata frequenza di campionamento

• Durata dell’intervallo temporale uniforme in

corrispondenza del quale si misurano i valori della

serie

Page 40: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica classica delle informazioni audio

Per codificare delle informazioni audio si

procede:

1. campionamento dell’ampiezza dell’onda sonora a

intervalli regolari

2. Registrazione delle serie di valori numerici ottenuti

Page 41: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Alcuni esempi

Conversazione telefonica

• 8000 campioni al secondo

• Si effettua una codifica ogni otto millesimi di secondo

CD audio

• 44100 campioni al secondo

• I dati sono ottenuti sono rappresentati con 16 o 32 bit

(stereo)

• Ogni secondo di musica richiede più di un milione di bit

Page 42: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

MIDI: un’altra forma di codifica audio

Il MIDI (Musical Instrument Digital Interface) è un

sistema di codifica più economico

Non prevede la codifica del suono

Prevede la codifica delle istruzioni necessarie per

produrre la musica su di un sintetizzatore

La qualità dell’esecuzione del brano dipende dal

sintetizzatore utilizzato per la riproduzione

Il numero di bit necessario per la codifica è ridotto

Page 43: La rappresentazione delle informazioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

I miei contatti

linkedin

http://it.linkedin.com/pub/francesco-ciclosi/62/680/a06/

facebook

https://www.facebook.com/francesco.ciclosi

twitter

@francyciclosi

www

http://docenti.unimc.it/f.ciclosi

http://www.francescociclosi.it