Grafici e tabelle permettono di fare valutazioni ... · Indici di dispersione • Campo di...
Transcript of Grafici e tabelle permettono di fare valutazioni ... · Indici di dispersione • Campo di...
Grafici e tabelle permettono di fare valutazioni qualitative,
non quantitative. E’ necessario poter
sintetizzare i dati attraverso due importanti indici :
Indici di posizione Indici di variazione
Indici di posizione
Numeri che sono rappresentativi dei dati e forniscono indicazioni sull’ordine di grandezza del fenomeno in studio.
La tendenza centrale
• Una tendenza centrale è una misura statistica che consente di riassumere un’intera distribuzione di frequenza in un solo numero
• La tendenza centrale è un tentativo di identificare gli aspetti “tipici”, “medi” di una distribuzione
Difficoltà
• Qual è il valore tipico nelle tre rappresentazioni?
1 2 3 4 5 6 7 8 90
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
5,5
6
f
Voto
Casi
1 2 3 4 5 6 7 8 90
1
2
3
4
5
6
7
8
9
10
11
12
Voto
Una parentesi: il segno sigma
• La sommatoria dei valori di X per tutte le osservazioni prese in considerazione
∑ X i
La media aritmetica
La media di una distribuzione è la somma dei valori osservati diviso il numero delle osservazioni
NX∑=µ
Popolazione
N: La grandezza della popolazione
nXX ∑=
Campione
n: La grandezza del campione
i i
ESEMPIO
• La media aritmetica dell’età di 10 studenti si calcola:
9,2610269
10)30292927272626252525(
==
+++++++++=X
Esempio Determinare l’età media di 50 giovani presenti in una pizzeria un sabato sera:
1.Costruire una tabella che riporti in una colonna l’età (Variabile X) e in un’altra colonna il numero di giovani (frequenza assoluta).
2.Moltiplicare il valore della variabile X per la frequenza e sommare.
3. Dividere per il numero delle osservazioni.
La formula della media di una distribuzione di frequenza assumerà pertanto questo
aspetto
∑∑∑ ==
fXf
nXf
X
Proprietà della media
• Dati un insieme di valori possiamo calcolare una sola media aritmetica.
• E’ facile da calcolare. • E’ sempre compresa tra il valore più
piccolo e quello più grande.
Proprietà della media
La media aritmetica, molto duttile nelle elaborazioni statistiche, in quanto ottenuta con calcoli matematici, ha un unico grosso inconveniente, quello che può essere influenzata notevolmente dai valori estremi.
Attenzione: se abbiamo utilizzato la media aritmetica per l’analisi dei dati dobbiamo riferirci a test di significatività della media (test parametrici)
Esempio
Come cambia il valore della media se ai dati dell’esempio precedente aggiungiamo un valore molto piccolo ? ovvero un valore molto grande?
Esempio
Età : 25,25,25,26,26,27,27,29,29,30 Media aritmetica : 26,9 Aggiungendo un soggetto con età 6 Media aritmetica : 25 Aggiungendo un soggetto con età 61 Media aritmetica : 30
• La media è una buona misura di tendenza di misura centrale per le distribuzioni “normalmente” distribuite
1 2 3 4 5 6 7 8 90
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
f
Voto
Casi
21,5=X
• La media è una misura inadatta per le distribuzioni che contengono un numero esiguo di dati e valori estremi
1 2 3 4 5 6 7 8 90
1
2
3
4
5
6
7
8
9
10
11
12
Voto
42,5=X
mediana La mediana è una media di posizione e rappresenta il valore
centrale della distribuzione quando i dati sono ordinati. Si definisce mediana il valore che bipartisce la distribuzione,
ossia il valore non inferiore a metà dei valori e non superiore all’altra metà.
Dato un insieme di valori ordinati se n è dispari la mediana è il valore centrale, se n è pari è la semisomma dei due valori centrali. :
∑ xi 1+ ∑ xi — se n è pari ――― se n è dispari 2 2
Proprietà della mediana
• Dati un insieme di dati possiamo individuare una sola mediana.
• E’ facile da calcolare. • Non è influenzata da valori estremi
Proprietà della mediana
La mediana, in quanto ottenuta senza calcoli matematici non si presta per le le più comuni elaborazioni statistiche.
Attenzione : se abbiamo utilizzato la mediana come misura di posizione centrale, dobbiamo riferirci a test di significatività della mediana (test non parametrici)
Esempio
Età : 25,25,25,26,26,27,27,29,29,30 Mediana : (26+27)/2 = 26,5 Aggiungendo un soggetto con età 6 6,25,25,25,26,26,27,27,29,29,30 Mediana : 26 Aggiungendo un soggetto con età 61 25,25,25,26,26,27,27,29,29,30,61 Mediana : 27
Uso della mediana
Utile quando le distribuzioni dei dati sono fortemente asimmetriche. Utile quando le distribuzioni dei dati contengono un numero esiguo di valori estremi.
MODA
La moda o valore modale è una media di posizione.
Si definisce moda o valore modale di una distribuzione il valore della variabile al quale corrisponde la massima frequenza
Moda numero di posti letto secondo il reparto di ricovero
REPARTO N°posti lettocardiochirurgia 24cardiologia 37chirurgia 50chirurgia plastica 2chir.vascolare 19gastroenterologia 46medicina 96nefrologia 24neurochirurgia 30neurologia 40oculistica 21ortopedia 20ostetricia 52pediatria 34terapia intensiva 12unità coronarica 12urologia 28TOTALE 547
La moda di una distribuzione è data da
quel valore che compare più
frequentemente nella distribuzione stessa
Proprietà della moda • Facile da calcolare • La moda puo' essere assente (specie se le osservazioni sono poche) • Puo' essere plurima (es. distribuzioni bimodali con 2 picchi). • La moda è l’unica misura che possiamo ottenere da dati riferiti a variabili qualitative.
Indici di dispersione
Numeri che forniscono informazioni sulla variabilità (eterogeneità del fenomeno in studio)
Gli indici di posizione non dicono tutto…….
Esempio : dati due campioni A : 5,5,5,1,9 media aritmetica : 5 B : 5,5,5,4,6 media aritmetica : 5 Potremmo concludere sulla base della media ottenuta che i due campioni sono uguali?
Indici di dispersione
• Campo di variazione (range) • Differenza interquartile • Deviazione standard • Coefficiente di variazione
Campo di variazione
E’ la differenza tra il valore più grande e il valore più piccolo della serie di osservazioni. Nell’esempio precedente: A : 9 - 1 = 8 B : 6 - 4 = 2
Proprietà
• Facile da calcolare. • Dipende solo dai due valori estremi,
non dà alcuna informazione sulla distribuzione degli altri dati.
• Si utilizza per dati asimmetrici. • E’ la misura di variazione da utilizzare
con la mediana.
Deviazione standard
• Misura la “dispersione” di tutti i dati rispetto alla media aritmetica.
• Tiene conto di tutti i valori. • E’ la misura di variazione da utilizzare
con la media aritmetica
Formula della deviazione standard
σ = ( Σxi-µ)2 per dati di popolazione
s = ( Σxi- x)2 per dati campionari N
N-1