Vrste i prikaz podataka u biomedicinskim...
Transcript of Vrste i prikaz podataka u biomedicinskim...
Vrste i prikaz podataka u biomedicinskim istraživanjima
www.illustrationsof.com
Seminar Dan 5, Seminar 5
© Lucasfilm
Dijelovi istraživanja
Istraživačko pitanje Značenje Dizajn (tip istraživanja) Ispitanici Varijable Statistička obrada podataka
Varijable u istraživanju
Prediktorske varijable (engl. predictors)
Varijable ishoda (engl. outcome)
Varijable posredne povezanosti (engl. confounding)
Tip varijable Obilježja varijable
Primjer Opisna statistika
Informativnost
Kategorijske Nominalne
Neuređene kategorije
Spol, urbanizacija
Broj, proporcija
Niska
Ordinalne Uređene kategorije
Ocjene, skale Medijan Srednja
Diskretne (numeričke)
Bez decimalnog mjesta
Broj djece u obitelji
Medijan ili aritmetička
sredina
Visoka
Kontinuirane (numeričke)
Decimalno mjesto
Visina, težina Aritmetička sredina ili medijan
Visoka
Oblici mjerenja / tipovi varijabli
Tip varijable?
Visina Prosjek ocjena Starost u godinama Koncentracija inzulina u serumu Težina Koncentracija glukoze u krvi Broj zuba s ispunom Broj sunčanih dana na Visu
Tip varijable?
Koliko cigareta dnevno pušite? 1-5 6-10 11-15 16-20 21 i više
Tip varijable?
Jeste li ikada preboljeli srčani udar? Da Ne
Imate li povišeni krvni tlak? Da Ne ?
Tip varijable?
Spol Muški Ženski
Tip varijable?
Bračni status Oženjen Rastavljen Udovac Samac živi sam ?
Tip varijable?
Obrazovanje osnovna škola srednja škola viša škola visoka škola ?
Tip varijable?
Likertova skala Tvrdnja: Nasilje među mladima postaje sve veći
problem u Hrvatskoj.
Potpuno se slažem Slažem se Neopredijeljen Ne slažem se Oštro se protivim
1 2 3 4 5
Tip varijable?
Vizualno analogna skala
Npr. razina boli koju ispitanik osjeća
Ne osjećam bol
Osjećam nepodnošljivu bol
Opis podataka
Prikaz podataka – grafički i/ili numerički
Mjere srednje vrijednosti
Rasap
Razdioba
Opis podataka – deskriptivna statistika
Ovisi o vrsti varijable i razdiobi podataka (za numeričke podatke):
kategorijske i ordinalne varijable: apsolutni i/ili relativni brojevi, najčešće %
numeričke varijable: Razdioba Mjere srednje vrijednosti Rasap
Kategorijske varijable
Kategorijske varijable
Kolcic I, et al. Croat Med J. 2005;46:88-95.
Kategorijske varijable – kružni grafikon
Kategorijske varijable – stupičasti grafikon
Kategorijske varijable - histogram
???
Numeričke varijable
Razdioba
Razdioba koja odstupa od normalne
Pozitivna asimetrija (engl. positively skewed)
Mjere srednje vrijednosti
Aritmetička sredina (mean) izračunava se kao omjer zbroja svih vrijednosti i
broja analiziranih ispitanika jedna od najčešće korištenih mjera opisne
statistike Samo za normalnu razdiobu!
Mjere srednje vrijednosti
Mjere srednje vrijednosti
Medijan (median) vrijednost koja dijeli cijeli uzorak podataka na dva
jednaka dijela pola uzorka manje od vrijednosti medijana, a druga
polovica je veća od vrijednosti medijana možemo definirati i centile, koje su postotne
vrijednosti
Mod – najčešća izmjerena vrijednost
Mjere srednje vrijednosti
Medijan (50’)
75’ 25’
Mjere srednje vrijednosti - razdioba
http://www.southalabama.edu/coe/bset/johnson/lectures/lec15.htm
Mjere rasapa
Standardna devijacija – uvijek uz aritmetičku sredinu!
Medijan i jedna od mjera rasapa: Minimum i maksimum Raspon (max-min) Interkvartilni raspon (75’-25’)
1
)( 2
−
−∑=
n
xxSD
ii
s2 = varijanca
Mjere srednje vrijednosti i mjere rasapa
Kolcic I, et al. Croat Med J. 2005;46:88-95.
Ferenczi E, Muirhead N (ur). Doktor u jednom potezu - Statistika i epidemiologija. Medicinska naklada, Zagreb, 2012. 1 – Diii, 2 – Ei, 3 – Aii, 4 – Cv, 5 – Biv
http://www.southalabama.edu/coe/bset/johnson/lectures/lec15.htm
VAŽNO!!!
Prikaz rezultata opisne statistike uvijek MORA sadržavati jednu mjeru srednje vrijednosti i pripadajuću mjeru rasapa (prikaz samo mjere srednje vrijednosti nije dovoljno)
Deskriptivna statistika
Npr. tablični prikaz visine ispitanika
Način prikaza
Aritmetička sredina i standardna devijacija
Medijan (najmanja i najveća vrijednost)
Medijan (raspon)
Medijan (interkvartilni
raspon)
Prikaz 183,4±12,7 cm 184,0 (138,0-213,0) 184,0 (75,0) 184,0 (31,0)
Značenje Normalna raspodjela podataka
Raspodjela numeričkih podataka koja odstupa od normalne
Testiranje hipoteze
P vrijednost <0,05 (ili <0,01) Provedeno 20 statističkih testova? Odabir statističkog testa ovisno o istraživačkom
pitanju, obilježjima analiziranih varijabli i strukturi istraživanja
TIP PODATKA
Kvalitativni (kategorijski)
1 neovisna varijabla
2 neovisne varijable
Kvantitativni
Povezanost
Razlika
2 skupine
Više skupina
Neparametrijske
Parametrijske
2 ovisne varijable
Goodness of fit x 2
Hi kvadrat (x 2)
1 prediktor
Više prediktora
Kontinuirana varijabla
Rangovi
Multipla regresija
Spearman r
Pearson r
Regresija
neovisne
ovisne
t test
Mann-Whitney
t test za povezane uzorke
Wilcoxon
neovisne
ovisne
One-way ANOVA
Kruskal-Wallis
ANOVA za ponavljane uzorke
Friedman
McNemar test
Testiranje hipoteze
Prikaz podataka
Grafički Tablično
Grafički prikaz podataka
???
26,7
54,1
16,4
2,8
Grafički prikaz podataka
Kružni graf, primjeren način prikaza
26,7
54,1
16,4
2,8
Osnovna škola
Srednja škola
Viša škola i fakultet
Nepoznato
Slika 1. Stupanj obrazovanja među muškim ispitanicima koji su bili hospitalizirani zbog nesreće 2008. godine
Kolčić I, Vorko Jović A (ur). Epidemiologija. Medicinska naklada, Zagreb, 2012.
Grafički prikaz podataka
???
31 28,5
34,5
6
19,4
11,5
57,7
11,5
0
10
20
30
40
50
60
70
Kolčić I, Vorko Jović A (ur). Epidemiologija. Medicinska naklada, Zagreb, 2012.
Grafički prikaz podataka
histogram, primjeren način prikaza
31 28,5
34,5
6
19,4
11,5
57,7
11,5
0
10
20
30
40
50
60
70
pušač bivši pušač nepušač nepoznato
Prev
alen
cija
(%)
muškarci
žene
Slika 2. Prevalencija pušenja (%) prema spolu ispitanika koji su bili hospitalizirani zbog nesreće
Kolčić I, Vorko Jović A (ur). Epidemiologija. Medicinska naklada, Zagreb, 2012.
Grafički prikaz podataka
???
0
100
200
300
400
500
600
700
800
900
1985 1988 1991 1994 1997 2000 2003 2006 2009Godina
Kolčić I, Vorko Jović A (ur). Epidemiologija. Medicinska naklada, Zagreb, 2012.
Grafički prikaz podataka
Linijski grafikon - primjeren način prikaza
0
100
200
300
400
500
600
700
800
900
1985 1988 1991 1994 1997 2000 2003 2006 2009
Stan
dard
izira
na s
topa
mor
talit
eta
Godina
HrvatskaEur regija (SZO)EU 15EU 27
Izvor podataka: WHO. Detailed Mortality Database (Health for all database), 2010. EU 15 – zemlje članice Europske unije prije 2004. godine, EU 27 – zemlje članice Europske unije nakon 2004. g.
Kolčić I, Vorko Jović A (ur). Epidemiologija. Medicinska naklada, Zagreb, 2012.
Grafički prikaz podataka
???
0
10
20
30
40
50
60
70
80
90
100
18-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99
Kolčić I, Vorko Jović A (ur). Epidemiologija. Medicinska naklada, Zagreb, 2012.
Grafički prikaz podataka
linijski grafikon - neprimjeren način prikaza*
0
10
20
30
40
50
60
70
80
90
100
18-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99
Prev
alen
cija
(%)
Desetljeće života
Slika 3. Prikaz rezultata presječnog istraživanja o prevalenciji (%) povišenog krvnog tlaka (≥130/85 mmHg) među stanovnicima otoka Visa ženskog spola
Kolčić I, Vorko Jović A (ur). Epidemiologija. Medicinska naklada, Zagreb, 2012.
Korelacija – točkasti prikaz
http://www.southalabama.edu/coe/bset/johnson/lectures/lec15.htm
Vitart V, et al. Nat Genet. 2008;40:437-42.
Tablični prikaz podataka
Kolcić I, Polasek O, Mihalj H, Gombac E, Kraljević V, Kraljević I, Krakar G. Research involvement, specialty choice, and emigration preferences of final year medical students in croatia. Croat Med J. 2005;46:88-95.
Tablični prikaz podataka
Polasek O, Kolcić I, Smoljanović A, Stojanović D, Grgić M, Ebling B, Klarić M, Milas J, Puntarić D. Demonstrating reduced environmental and genetic diversity in human isolates by analysis of blood lipid levels. Croat Med J. 2006;47:649-55.
Tablični prikaz podataka
Polasek O, Mavrinac M, Jović A, Dzono Boban A, Biocina-Lukenda D, Glivetić T, Vasilj I, Petrovecki M. Undergraduate grade point average is a poor predictor of scientific productivity later in career. Coll Antropol. 2010 Mar;34 Suppl 1:1-5.
Vitart V, et al. Nat Genet. 2008;40:437-42.