Analiza podatkov - ffa.uni-lj.si · PDF fileNačrtovanje, analiza in interpretacija raziskav...

download Analiza podatkov - ffa.uni-lj.si · PDF fileNačrtovanje, analiza in interpretacija raziskav Asist. dr. Igor Locatelli, mag. farm. Ljubljana, 7. 1. ... podatkov (umerjanje laboratorijskih

If you can't read please download the document

Transcript of Analiza podatkov - ffa.uni-lj.si · PDF fileNačrtovanje, analiza in interpretacija raziskav...

  • Analiza podatkov

    Nartovanje, analiza in interpretacija raziskav

    Asist. dr. Igor Locatelli, mag. farm.

    Ljubljana, 7. 1. 2011

  • Potek raziskav

    Idejno nartovanje (oblikovanje zasnove) raziskave (designing).

    Nartovanje izvedbe raziskave (planninig).

    Organiziranje izvedbe raziskave oziroma priprave na njeno izvedbo (organizing).

    Izvajanje raziskave (implementing, conducting) zbiranje podatkov in njihova analiza.

    Predstavitev izsledkov (presentation of the results)

    2

  • Potek statistine analize podatkov

    Postavitev raziskovalnega vpraanja/problema

    Plan analize raziskave: Namen? Vrsta statistine analize? Kakne podatke potrebujemo? Nart (design) raziskave

    Zbiranje podatkov

    Kodiranje podatkov, vnos in ienje podatkov

    Izvedba analize

    Interpretacija rezultatov

    Refeksija Kaj novega smo odkrili?

    Kaj so nai predlogi/nasveti?

    Kakne so omejitve nae analize?

  • 4

    Vrste podatkov

    Kvalitativni podatki

    Npr. pridobljeni iz vpraalnikov, intervjujev.

    Lahko jih predstavimo numerino ali opisno

    Kategorine spremenljivke -> zvezne spremenljivke (npr. Likertova lestvica)

    Kvantitativni podatki (meritve) Ordinalne kategorine spremenljivke (dihotomne ali politomne)

    Zvezne spremenljivke

  • 5

  • 6

    Numerien opis spremenljivke

    Frekvence (relativna, kumulativna), frekvenna tabela

    Kontingenna tabela

    Delei

    Srednja vrednosti (modus, mediana, kvartili, povpreje, geometrino povpreje)

    Mere variabilnosti (razpon, standardni odklon, varianca, interkvartilni razpon)

  • 7

    Grafina predstavitev

    Stolpni diagram

    tortni grafikon

    Histogram, poligon

    Kvantilni diagram

    XY razsevni diagram

    ...

  • 8

    Podatkovna baza

    Vnos podatkov (rono, s programom) 1 stolpec ena spremenljivka 1 vrsta ena statistina enota Definicija kategorije Preveriti vnos podatkov (ienje podatkovne

    baze, iskanje nemogoih podatkov) Oznaiti manjkajoe podatke Izloiti nepotrebne podatke Upotevanje dodatnih opomb oz. dogodkov ki

    niso bili predvideni, izkljuitev doloenih podatkov?

    Transformacija spremenljivke

  • 9

    Odvisni in neodvisni vzorec Neodvisna vzorca

    Bolnik Zdravilo A Zdravilo B

    1 1.9 /

    2 0.8 /

    3 1.1 /

    4 0.1 /

    5 -0.1 /

    6 4.4 /

    7 5.5 /

    8 1.6 /

    9 4.6 /

    10 3.4 /

    11 / 0.7

    12 / 2.0

    13 / -0.2

    14 / -1.2

    15 / -0.1

    16 / 3.4

    17 / 3.7

    18 / 0.8

    19 / 0.0

    20 / -1.6

    Odvisna vzorca

    Bolnik Zdravilo A Zdravilo B

    1 1.9 0.7

    2 0.8 2.0

    3 1.1 -0.2

    4 0.1 -1.2

    5 -0.1 -0.1

    6 4.4 3.4

    7 5.5 3.7

    8 1.6 0.8

    9 4.6 0.0

    10 3.4 -1.6

  • 10

    Izstopajoi podatki (osamelci)

    Posledica napake (preiskovalca, prostovoljca, meritve (!), oznake, vnosa ali izrauna) e to potrdimo potem tak podatke izkljuimo, ker je podatek pristranski BIAS.

    Posledica variabilnosti biolokega parametra v populaciji ali nakljune napake meritve potem izstopajoega podatka ne smemo izkljuiti

  • Pristranskost in nakljuna napaka

    Razlikovati moramo med pristranskostjo oz. sistematino napako, ki vodi do neveljavnosti rezultatov in nakljunimi napakami, ki vodijo v manjo natannost ocene vrednosti opazovanih pojavov.

    11

  • Vrste pristranskosti

    1. Pristranskost izbire: napaka zaradi sistematinih razlik v znailnostih med izbranimi in neizbranimi v raziskavo oziroma pristranskost, ki nastane zato, ker opazovane osebe niso reprezentativne za preuevano prebivalstvo; sem sodijo pristranskost nabora, pristranskost samoizbire (nesodelovanje v raziskavah) in pristranskost zaradi izgube iz sledenja. 2. Pristranskost razvranja: vse tiste sistematine napake, ki se pripetijo ob merjenju pojava. Sem sodijo pristranskosti, kot so: subjektivnost izvajalca raziskave, anamnestina pristranskost in pristranskost napane razvrstitve.

    12

  • Reevanje pristranskosti

    Pristranskosti ne moremo popravljati v fazi analiziranja podatkov, prav tako praviloma tudi ne z veanjem tevila opazovancev. Kako pa? z jasno opredeljeno raziskovano populacijo z jasnimi vkljuitvenimi in izkljuitvenimi kriteriji z jasno opredeljenimi vzroki in posledicami, z zagotavljanjem objektivnosti meritev, z izobraevanjem izvajalcev raziskave, z jasno napisanim nartom raziskave (protokolom), z randomizacijo, e je potrebna, s preverjanjem orodij in instrumentov za zbiranje podatkov (umerjanje laboratorijskih aparatur, preverjanje vpraalnika s pilotno tudijo...).

    13

  • Motee spremenljivke

    e opazujemo povezanost med enim vzrokom in posledico, se lahko zgodi, da je lahko povezanost, ki jo zasledimo, pomeana z uinkovanjem neke druge izpostavljenosti na isti izid.

    14

  • Motee spremenljivke - primer

    RAZISKOVALNO VPRAANJE:

    Ali uivanje ezmernih koliin alkohola vea tveganje za nastanek pljunega raka?

    Alkohol Pljuni rak

    vzrok posledica

    PREDPOSTAVKA:

    raziskovalec opazi, da se pljuni rak pojavi pogosteje pri pivcih alkohola.

    15

  • Motee spremenljivke - primer

    PREDPOSTAVKA:

    raziskovalec opazi, da se pljuni rak pojavi pogosteje pri pivcih alkohola.

    Alkohol Pljuni rak

    vzrok posledica

    Kajenje

    motei dejavnik

    16

    ?

  • 17

    Inferenna (sklepna) statistika

    Sklepanje rezultatov iz vzorca na celotno populacijo

    Uporaba statistinih hipotez

  • 18

    Potek testiranja hipotez

    Izbor ustreznega statistinega testa

    Postavimo nielno hipotezo: H0 Postavimo alternativno hipotezo: H1 oz. Ha Izberemo stopnjo tveganja oz. kritino mejo

    Iz podatkov vzorca izraunamo testno statistiko (z, t, 2 odvisno od tipa spremenljivk)

    Skuamo zavrei H0:

    Zavremo H0, potem lahko sprejmemo H1

    Ne moremo zavrei H0, tudi sprejmemo jo NE!

    Vrednosti nesignifikatne

    Interpretacija v okviru preizkusa, velikosti vzorca, stopnje tveganja

  • 19

    Shema podaja le osnovni nabor statistinih parametrinih testov in velja ob

    predpostavki, da se prouevana spremenljivka porazdeljuje normalno!

    Primerjava povpreij dveh vzorcev

    a= b

    Odvisna vzorca Neodvisna vzorca

    Enakost varianc?

    t-test (skupna

    varianca)

    Fisher-

    Behrenov

    t-test

    a b Parni t-test

    F- test

    Relacija med vzorcema?

    Velik >30 ali

    poznana

    Z-test

    Poznana populacijska varianca ?

    Velikost vzorca?

    Primerjava povpreja

    enega vzorca z neko vrednostjo

    T-test za

    en vzorec

    Majhen

  • 20

    Spremenljivke

    Kontingenne tabele

    2 test

    df: (s-1)(v-1)

    df: k-2

    Atributivne

    Shema podaja le osnovni nabor statistinih testov!

    Numerine

    Test normalnosti?

    Kolmogorov-

    Smirnovov

    test

    Shapiro-

    Wilkov

    test

  • 21

    Neparametrini testi

    Parni t-test > Wilcoxon test vsote rangov

    T-test za neodvisna vzorca -> Mann-Whitney test

    ANOVA -> Kruskall-Wallis test, Friedmanov test

    Pearsonova korelacija -> Spearmanova korelacija

    Test proporcev -> Chi2 test,

    Mo preizkusa je manja.

    Ne slonijo na predpostavki o normalnosti porazdelitve

    Izraun temelji na rangih odvisne spremenljivke

    Kategorine spremenljivke

  • 22

    Linearna regresija in ANOVA

    Parametrini testi (zahteva o normalnosti porazdelitve spremenljivke)

    Testiranje vpliva enega ali ve dejavnikov in njihovih medsebojnih interakcij

    tevilo enot/tevilo dejavnikov > 10

    Transformacija kategorinih spremenljivk

  • 23

    Programi za statistino analizo

    MS Excel

    SPSS

    SAS

    R

    SigmaPlot

    ...

  • Primer raziskave: KAVA-AJ

    Gustav III vedski kralj (174692)

    Raziskovalna domneva: Pitje kave povzroa smrt.

    Obravnavanji: pitje kave oz. aja 3x na dan

    Izvedba: dva na smrt obsojena enojajna dvojka pomilosti, eden pije kavo, drugi aj obsojenec pije kavo oz. aj do smrti; smrt naj ugotovita dva neodvisna zdravnika.

    Rezultati: Pivec aja je umrl prvi, eprav za tedanje ase pri astitljivi starosti 83 let.

    Sklep: Kraljevi zdravniki so sklepali, da je aj bolj kodljiv kot kava.

    24

  • Primer raziskave: skorbut

    Ladijski zdravnik James Lind:Skorbut povzroi ve smrti angleki kraljevi mornarici kot panska in francoska mornarica skupaj. Izvede poskus leta 1747, to je prvi zabeleeni klinini poskus.

    Raziskovalna domneva: ustrezen dodatek prehrani zdravi skorbut.

    25

  • Primer raziskave: skorbut

    Obravnavanja: dodatki osnovni prehrani

    jabolnik

    kapljice vitriol (na osnovi veplove kisline)

    pitje slane vode

    meanica esen + gorica + redkvice

    kis

    2 pomarani + 1 limona

    Izvedba: Izbere 12 podobnih mornarjev, ki so oboleli za skorbutom. Razdeli jih v 6 skupin, po 2 mornarja na obravnavanje.

    Rezultati: po 1 tednu zmanjka citrusov, stanje teh dveh mornarjev se izjemno izbolja. Nekaj pozitivnega vpliva tudi pri jabolniku.

    26

  • 27

    Interim analysis vmesna analiza

    Ali je smiselno nadaljevati z raziskavo samo zato, ker je bilo tako nartovano?

    Od podatkov (a