STATISTICA MEDICA - med.unipg.it Didattico... · dopo aver raccolto i dati e prodotto...
Transcript of STATISTICA MEDICA - med.unipg.it Didattico... · dopo aver raccolto i dati e prodotto...
STATISTICA MEDICA
Prof.ssa Donatella Siepi
tel: 075 5853525
UNIVERSITA’ DEGLI
STUDI DI PERUGIA
Statistica descrittiva
C
Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati
STATISTICA DESCRITTIVA
piano tabelle grafici Medie e indici di
variabilitàA
D
E
B
C
A
D
E
B
In seguito
Tavola riassuntiva delle caratteristiche
delle scale di misura StevensNominale Ordinale Intervalli Rapporti
Tipo di
variabile
Qualitativa Qualitativa
rettilinea o
ciclica
Quantitativa Quantitativa
Proprietà Classificazione
Non c’è
ordinamento
tra le modalità
Ordinamento
Le modalità
presentano un
ordinamento
Conservazione
delle relazioni
tra le distanze
Esiste un unità
di misura
Costanza del
rapporto tra i valori
utilizzati
Zero non Arbitrario
Operazioni
matematiche
di base
Uguaglianza
/Disuguaglianz
a
=;
Maggiore di /
Minore di
>; <; =;
Somma e
Sottrazione
+; -
Moltiplicazione e
Divisione
Indicatori
statistici
Numero dei
casi
Frequenze
Moda
Mediana
Percentili
Quartili
Media
Varianza
Correlazione
Coeff. di
Variazione
Concentrazione
Statistica descrittiva
C
Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati
STATISTICA DESCRITTIVA
piano tabelle grafici Medie e indici di
variabilitàA
D
E
B
C
A
D
E
B
In seguito
E’ una particolare ed efficace rappresentazione grafica della strutturaper età e sesso di un dato collettivo o popolazione.
E’ rappresentata da due istogrammi rovesciati, corrispondenti ai duesessi, sul cui asse verticale comune sono indicate le modalità delcarattere età (in classi) e sul cui asse orizzontale sono riportate lefrequenze (assolute o relative) sia dei maschi che delle femmine,corrispondenti a ciascuna classe di età considerata.
Piramide delle età
Dalla forma assunta dalla piramide è possibile trarre indicazioni siasui fattori che caratterizzano la struttura per età e sesso attualeche sull’evoluzione passata nonché previsioni per un arco di temponon superiore a un secolo.
Tali indicazioni possono essere tratte analizzando, in particolare:
- La base, che fornisce indicazioni circa il flusso delle nascite. Se èmolto larga, si ha un flusso di nascite in forte aumento; se èsufficientemente larga, le nascite sono costanti o in lieveaumento; se è stretta significa che il flusso delle nascite è indiminuzione.
- L’inclinazione dei lati, che fornisce indicazioni circa il livellogenerale di eliminazione per morte. Se l’obliquità dei lati è forte,si ha un’alta mortalità; se è debole, si ha una bassa mortalità.
- La presenza di rigonfiamenti o strozzature per particolari classid’età, che fornisce indicazione dell’intervento di particolari fattoridi perturbazione (es. Prima Guerra Mondiale).
Piramide delle età
????????????• Matrice dei dati o
serie di dati
• Tabelle semplici
• Tabelle a doppia
entrata
• Curve di frequenza
• Grafici a dispersione
• Areogrammi
• Cartogrammi
• Istogrammi
• Grafici a barre
• Poligoni
Frequenze
assolute
Frequenze
relative
Frequenze
assolute
Frequenze
relative
14-19 650 3,1 494 15,5
20-24 1.953 9,2 969 30,3
25-29 3.062 14,5 699 21,9
30 e
oltre15.461 73,2 1.032 32,3
Totale 21.126 100 3.194 100
CLASSI
DI
ETA’
OCCUPATI
PERSONE IN
CERCA DI
OCCUPAZIONE
Forze di lavoro per condizione e classe di età. Ottobre 1992
Fonte:ISTAT. Dati in migliaia e in percentuale
Tabella a doppia entrata (mista)
Come presentare i dati: le tabelle
La tabella è uno schema che consente di presentare i dati in modo
ordinato e sintetico; quindi rende l’informazione statistica
rapidamente leggibile.
La tabella è un'immagine semplificata del fenomeno osservato.
Essa può contenere una distribuzione semplice, doppia, tripla,
oppure più distribuzioni semplici giustapposte. Può contenere
anche risultati di elaborazioni sui dati raccolti: rapporti, differenze,
valori medi eccetera.
La tabella dovrebbe essere chiara e di facile comprensione.
Qualche volta, invece, le tabelle sono complicate e difficili da
leggere poiché raccolgono in poco spazio molte informazioni.
Inoltre, i termini utilizzati sono spesso basati su definizioni
minuziose, oppure sono poco chiari.
Le tabelle, come i grafici, si utilizzano per dare visibilità ai
dati dopo che sono stati raccolti individualmente ed
elaborati.
Tabelle e grafici si completano a vicenda e concorrono a
descrivere il fenomeno che costituisce l’oggetto
dell'indagine.
La tabella è la prima sintesi sistematica a cui si perviene
dopo aver raccolto i dati e prodotto l’informazione statistica
ed è il punto di partenza per la rappresentazione, la lettura,
l’interpretazione e l’elaborazione successiva.
Il ricorso alle tabelle è appropriato per presentare tra una
ventina e un centinaio di dati. Al di sopra di questo numero,
è di solito più indicato un grafico o una figura.
Quando utilizzare le tabelle
Ogni tabella deve essere autoesplicativa. A questo scopo è necessario
che la tabella abbia un titolo che renda evidente il suo contenuto. Il titolo
deve indicare l’insieme (popolazione) degli elementi (unità statistiche) su
cui è stata effettuata la rilevazione; che cosa è stato rilevato
(caratteristica o carattere); il riferimento temporale e territoriale della
rilevazione; le eventuali elaborazioni effettuate sui dati.
La tabella è organizzata per colonne. Ogni colonna deve portare la
propria intestazione. L’insieme delle intestazioni forma la testata. La
prima colonna (dettacolonna madre) riporta le modalità del carattere
rispetto alle quali è stata fatta la classificazione, oppure le occasioni
nelle quali i dati sono stati rilevati.
Gli elementi delle tabelle
Frequenze
assolute
Frequenze
relative
Frequenze
assolute
Frequenze
relative
14-19 650 3,1 494 15,5
20-24 1.953 9,2 969 30,3
25-29 3.062 14,5 699 21,9
30 e
oltre15.461 73,2 1.032 32,3
Totale 21.126 100 3.194 100
CLASSI
DI
ETA’
OCCUPATI
PERSONE IN
CERCA DI
OCCUPAZIONE
Forze di lavoro per condizione e classe di età. Ottobre 1992
Fonte:ISTAT. Dati in migliaia e in percentuale
Tabella a doppia entrata (mista)
Statistica descrittiva
C
Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati
STATISTICA DESCRITTIVA
piano tabelle grafici Medie e indici di
variabilitàA
D
E
B
C
A
D
E
B
• Rispetto alle cifre, le figure
forniscono impressioni che
sono percepite con maggiore
facilità; ma nel contempo hanno il
limite di essere meno precise e
meno ricche di particolari.
• Per i caratteri qualitativi, la tabella e le
rappresentazioni grafiche esauriscono
quasi completamente gli aspetti descrittivi,
quando sia possibile leggere con esattezza le
frequenze delle varie classi.
• Per i caratteri quantitativi, si pone il
problema di sintesi oggettive che possano
essere elaborate matematicamente e quindi
che siano numeriche, al fine di un'analisi
obiettiva che deve condurre tutti i
ricercatori, con gli stessi dati, alle
medesime conclusioni.
Indici Statistici
Per sintetizzare i dati ed evidenziare una
certa caratteristica:
• Indici di tendenza centrale
• Indici di dispersione
• La forma
• Le misure di tendenza centrale o
posizione servono per individuare il
valore intorno al quale i dati sono
raggruppati; la tendenza centrale è la
misura più appropriata per sintetizzare
l'insieme delle osservazioni, se una
distribuzione di dati dovesse essere
descritta con un solo valore; è la prima
indicazione della dimensione del
fenomeno.
• Le misure proposte sono essenzialmente 3: la
media, la moda e la mediana.
• La scelta della misura di tendenza centrale di
una serie di dati dipende dalle caratteristiche
della distribuzione e dal tipo di scala.
La media
Gli obiettivi che ci si prefigge nel calcolo di una
media sono sostanzialmente due:
1) sostituire a più dati rilevati un solo numero
che dia però una efficace rappresentazione
del fenomeno dato;
2) esprimere l’ordine di grandezza o tendenza
centrale dell’insieme dei dati relativi a un
fenomeno. Tale ordine di grandezza può a
volte sfuggire perché i dati sono spesso
differenti fra loro.
La Media
A questo punto bisogna dare dei criteri pratici
per calcolare tale valor medio; i più
importanti, quindi quelli più usati, sono i
seguenti:
a) si può calcolare il valor medio come
funzione matematica dei dati rilevati e in tal
caso si parla di media analitica;
b) si possono ordinare i dati rilevati e ottenere la
media in relazione alla posizione che occupa
fra essi e in tal caso si parla di media di
posizione.
La media aritmetica
64
24
4
6585
6,5,8,5:
...,...,, 21
21
M
valoriseguentiiDati
n
xxxxxxM n
n
La media aritmetica semplice M di n valori è il
rapporto fra la loro somma e il loro numero n:
La media aritmetica di distribuzioni di
frequenza raggruppate in classi, è detta
media aritmetica ponderata
Calcolo della media ponderata
624
3857865534
M
Voto
(modalità)
Allievi
(frequenza)
4 3
5 5
6 8
7 5
8 3
Esempio
Se all’esame finale di un corso si attribuisce un peso
tre volte superiore a quello attribuito ad un
questionario, ed uno studente ottiene come voto
finale 85 e come voto per i questionari 70 e 90 la
medieadei voti è
X = (1)(70)+(1)(90)+ (3)(85) = 415 = 83
1 + 1 + 3 5
Media geometrica sempliceLa media geometrica semplice è utilizzata quando
le variabili non sono rappresentate da valori
lineari, ma ottenuti da prodotti o da rapporti di valori
lineari.
Serve per il confronto di superfici o volumi, di tassi di
accrescimento o di sopravvivenza, per quei valori
appunto che sono espressi da rapporti.
La media geometrica di n dati è uguale alla radice
di ordine n (solo positiva) del prodotto degli n dati
MEDIA ARMONICA
La media armonica H di un insieme
di N numeri X 1, X2 ecc è il
reciproco della media aritmetica dei
reciproci dei numeri stessi
H = _____________3___________= 3 = 3,43
½ + 1/4 + 1/8 7/8
Quale è la media armonica dei numeri 2,4 ,8