Analiza podatkov - ffa.uni-lj.si · PDF fileNačrtovanje, analiza in interpretacija raziskav...
Transcript of Analiza podatkov - ffa.uni-lj.si · PDF fileNačrtovanje, analiza in interpretacija raziskav...
Analiza podatkov
Nartovanje, analiza in interpretacija raziskav
Asist. dr. Igor Locatelli, mag. farm.
Ljubljana, 7. 1. 2011
Potek raziskav
Idejno nartovanje (oblikovanje zasnove) raziskave (designing).
Nartovanje izvedbe raziskave (planninig).
Organiziranje izvedbe raziskave oziroma priprave na njeno izvedbo (organizing).
Izvajanje raziskave (implementing, conducting) zbiranje podatkov in njihova analiza.
Predstavitev izsledkov (presentation of the results)
2
Potek statistine analize podatkov
Postavitev raziskovalnega vpraanja/problema
Plan analize raziskave: Namen? Vrsta statistine analize? Kakne podatke potrebujemo? Nart (design) raziskave
Zbiranje podatkov
Kodiranje podatkov, vnos in ienje podatkov
Izvedba analize
Interpretacija rezultatov
Refeksija Kaj novega smo odkrili?
Kaj so nai predlogi/nasveti?
Kakne so omejitve nae analize?
4
Vrste podatkov
Kvalitativni podatki
Npr. pridobljeni iz vpraalnikov, intervjujev.
Lahko jih predstavimo numerino ali opisno
Kategorine spremenljivke -> zvezne spremenljivke (npr. Likertova lestvica)
Kvantitativni podatki (meritve) Ordinalne kategorine spremenljivke (dihotomne ali politomne)
Zvezne spremenljivke
5
6
Numerien opis spremenljivke
Frekvence (relativna, kumulativna), frekvenna tabela
Kontingenna tabela
Delei
Srednja vrednosti (modus, mediana, kvartili, povpreje, geometrino povpreje)
Mere variabilnosti (razpon, standardni odklon, varianca, interkvartilni razpon)
7
Grafina predstavitev
Stolpni diagram
tortni grafikon
Histogram, poligon
Kvantilni diagram
XY razsevni diagram
...
8
Podatkovna baza
Vnos podatkov (rono, s programom) 1 stolpec ena spremenljivka 1 vrsta ena statistina enota Definicija kategorije Preveriti vnos podatkov (ienje podatkovne
baze, iskanje nemogoih podatkov) Oznaiti manjkajoe podatke Izloiti nepotrebne podatke Upotevanje dodatnih opomb oz. dogodkov ki
niso bili predvideni, izkljuitev doloenih podatkov?
Transformacija spremenljivke
9
Odvisni in neodvisni vzorec Neodvisna vzorca
Bolnik Zdravilo A Zdravilo B
1 1.9 /
2 0.8 /
3 1.1 /
4 0.1 /
5 -0.1 /
6 4.4 /
7 5.5 /
8 1.6 /
9 4.6 /
10 3.4 /
11 / 0.7
12 / 2.0
13 / -0.2
14 / -1.2
15 / -0.1
16 / 3.4
17 / 3.7
18 / 0.8
19 / 0.0
20 / -1.6
Odvisna vzorca
Bolnik Zdravilo A Zdravilo B
1 1.9 0.7
2 0.8 2.0
3 1.1 -0.2
4 0.1 -1.2
5 -0.1 -0.1
6 4.4 3.4
7 5.5 3.7
8 1.6 0.8
9 4.6 0.0
10 3.4 -1.6
10
Izstopajoi podatki (osamelci)
Posledica napake (preiskovalca, prostovoljca, meritve (!), oznake, vnosa ali izrauna) e to potrdimo potem tak podatke izkljuimo, ker je podatek pristranski BIAS.
Posledica variabilnosti biolokega parametra v populaciji ali nakljune napake meritve potem izstopajoega podatka ne smemo izkljuiti
Pristranskost in nakljuna napaka
Razlikovati moramo med pristranskostjo oz. sistematino napako, ki vodi do neveljavnosti rezultatov in nakljunimi napakami, ki vodijo v manjo natannost ocene vrednosti opazovanih pojavov.
11
Vrste pristranskosti
1. Pristranskost izbire: napaka zaradi sistematinih razlik v znailnostih med izbranimi in neizbranimi v raziskavo oziroma pristranskost, ki nastane zato, ker opazovane osebe niso reprezentativne za preuevano prebivalstvo; sem sodijo pristranskost nabora, pristranskost samoizbire (nesodelovanje v raziskavah) in pristranskost zaradi izgube iz sledenja. 2. Pristranskost razvranja: vse tiste sistematine napake, ki se pripetijo ob merjenju pojava. Sem sodijo pristranskosti, kot so: subjektivnost izvajalca raziskave, anamnestina pristranskost in pristranskost napane razvrstitve.
12
Reevanje pristranskosti
Pristranskosti ne moremo popravljati v fazi analiziranja podatkov, prav tako praviloma tudi ne z veanjem tevila opazovancev. Kako pa? z jasno opredeljeno raziskovano populacijo z jasnimi vkljuitvenimi in izkljuitvenimi kriteriji z jasno opredeljenimi vzroki in posledicami, z zagotavljanjem objektivnosti meritev, z izobraevanjem izvajalcev raziskave, z jasno napisanim nartom raziskave (protokolom), z randomizacijo, e je potrebna, s preverjanjem orodij in instrumentov za zbiranje podatkov (umerjanje laboratorijskih aparatur, preverjanje vpraalnika s pilotno tudijo...).
13
Motee spremenljivke
e opazujemo povezanost med enim vzrokom in posledico, se lahko zgodi, da je lahko povezanost, ki jo zasledimo, pomeana z uinkovanjem neke druge izpostavljenosti na isti izid.
14
Motee spremenljivke - primer
RAZISKOVALNO VPRAANJE:
Ali uivanje ezmernih koliin alkohola vea tveganje za nastanek pljunega raka?
Alkohol Pljuni rak
vzrok posledica
PREDPOSTAVKA:
raziskovalec opazi, da se pljuni rak pojavi pogosteje pri pivcih alkohola.
15
Motee spremenljivke - primer
PREDPOSTAVKA:
raziskovalec opazi, da se pljuni rak pojavi pogosteje pri pivcih alkohola.
Alkohol Pljuni rak
vzrok posledica
Kajenje
motei dejavnik
16
?
17
Inferenna (sklepna) statistika
Sklepanje rezultatov iz vzorca na celotno populacijo
Uporaba statistinih hipotez
18
Potek testiranja hipotez
Izbor ustreznega statistinega testa
Postavimo nielno hipotezo: H0 Postavimo alternativno hipotezo: H1 oz. Ha Izberemo stopnjo tveganja oz. kritino mejo
Iz podatkov vzorca izraunamo testno statistiko (z, t, 2 odvisno od tipa spremenljivk)
Skuamo zavrei H0:
Zavremo H0, potem lahko sprejmemo H1
Ne moremo zavrei H0, tudi sprejmemo jo NE!
Vrednosti nesignifikatne
Interpretacija v okviru preizkusa, velikosti vzorca, stopnje tveganja
19
Shema podaja le osnovni nabor statistinih parametrinih testov in velja ob
predpostavki, da se prouevana spremenljivka porazdeljuje normalno!
Primerjava povpreij dveh vzorcev
a= b
Odvisna vzorca Neodvisna vzorca
Enakost varianc?
t-test (skupna
varianca)
Fisher-
Behrenov
t-test
a b Parni t-test
F- test
Relacija med vzorcema?
Velik >30 ali
poznana
Z-test
Poznana populacijska varianca ?
Velikost vzorca?
Primerjava povpreja
enega vzorca z neko vrednostjo
T-test za
en vzorec
Majhen
20
Spremenljivke
Kontingenne tabele
2 test
df: (s-1)(v-1)
df: k-2
Atributivne
Shema podaja le osnovni nabor statistinih testov!
Numerine
Test normalnosti?
Kolmogorov-
Smirnovov
test
Shapiro-
Wilkov
test
21
Neparametrini testi
Parni t-test > Wilcoxon test vsote rangov
T-test za neodvisna vzorca -> Mann-Whitney test
ANOVA -> Kruskall-Wallis test, Friedmanov test
Pearsonova korelacija -> Spearmanova korelacija
Test proporcev -> Chi2 test,
Mo preizkusa je manja.
Ne slonijo na predpostavki o normalnosti porazdelitve
Izraun temelji na rangih odvisne spremenljivke
Kategorine spremenljivke
22
Linearna regresija in ANOVA
Parametrini testi (zahteva o normalnosti porazdelitve spremenljivke)
Testiranje vpliva enega ali ve dejavnikov in njihovih medsebojnih interakcij
tevilo enot/tevilo dejavnikov > 10
Transformacija kategorinih spremenljivk
23
Programi za statistino analizo
MS Excel
SPSS
SAS
R
SigmaPlot
...
Primer raziskave: KAVA-AJ
Gustav III vedski kralj (174692)
Raziskovalna domneva: Pitje kave povzroa smrt.
Obravnavanji: pitje kave oz. aja 3x na dan
Izvedba: dva na smrt obsojena enojajna dvojka pomilosti, eden pije kavo, drugi aj obsojenec pije kavo oz. aj do smrti; smrt naj ugotovita dva neodvisna zdravnika.
Rezultati: Pivec aja je umrl prvi, eprav za tedanje ase pri astitljivi starosti 83 let.
Sklep: Kraljevi zdravniki so sklepali, da je aj bolj kodljiv kot kava.
24
Primer raziskave: skorbut
Ladijski zdravnik James Lind:Skorbut povzroi ve smrti angleki kraljevi mornarici kot panska in francoska mornarica skupaj. Izvede poskus leta 1747, to je prvi zabeleeni klinini poskus.
Raziskovalna domneva: ustrezen dodatek prehrani zdravi skorbut.
25
Primer raziskave: skorbut
Obravnavanja: dodatki osnovni prehrani
jabolnik
kapljice vitriol (na osnovi veplove kisline)
pitje slane vode
meanica esen + gorica + redkvice
kis
2 pomarani + 1 limona
Izvedba: Izbere 12 podobnih mornarjev, ki so oboleli za skorbutom. Razdeli jih v 6 skupin, po 2 mornarja na obravnavanje.
Rezultati: po 1 tednu zmanjka citrusov, stanje teh dveh mornarjev se izjemno izbolja. Nekaj pozitivnega vpliva tudi pri jabolniku.
26
27
Interim analysis vmesna analiza
Ali je smiselno nadaljevati z raziskavo samo zato, ker je bilo tako nartovano?
Od podatkov (a