Download - Pengolahan Data Statistik

Transcript

1/4/2013

1

Pengolahan data

Endang Lestari

Kompetensi biostatistik yang harus dimiliki oleh

seorang peneliti

Kemampuan peneliti untuk memilih uji statistik

yang paling tepat sesuai dengan data yang akan

dianalisis

Pemahaman peneliti mengenai potensi dan

keterbatasan uji statistik yang digunakan

Kemampuan peneliti untuk menafsirkan hasil uji

statistik yang dilakukan, termasuk didalamnya

kemampuan memedakan pengertian kemaknaan

statistik dan kemaknaan aplikatif
1/4/2013

2

Macam statistik

STATISTIK DESKRIPTIF, yang berkaitan dengan pencatatan dan peringkasan data, dengan tujuan menggambarkan hal-hal penting pada sekelompok data, seperti berapa rata-ratanya, variasi data dan sebagainya.

Statistik yang digunakan untuk menggambarkan atau menganalisa karakteristik data hasil penelitian, tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas (generalisasi/inferensi).

Statistik deskriptif harus selalu mendahului statistik inferensial

STATISTIK INFERENSIAL, Suatu proses atau

prosedur penarikan kesimpulan terhadap

karakter populasi yang didasarkan pada data

yang diperoleh dari observasi pada sampel
1/4/2013

3

ANALISIS DESKRIPTIF

Biasa disebut dengan analisis univariat

Tujuannya adalah untuk menjelaskan ataumendeskripsikan karakteristik masing-masingvariabel yang diteliti

Fungsinya adalah untuk menyedrhanakan ataumeringkas kumpulan data sedemikian rupa sehinggakumpulan tersebut dapat berubah menjadi informasisederhana yang dapat dibaca dengan cepat

Peringkasan tersebut dapat berupa ukuran-ukuranstatistik, tabel dab grafik

Hal-hal yang perlu diperhatikan

Jenis peringkasan yang dikehendaki:

a. ukuran tengah (central tendency)

b. ukuran variasi

Jenis data:

a. numerik

b. atau kategorik

Bentuk tampilan yang dikehendaki: tabel, grafik, dll.
1/4/2013

4

Peringkasan untuk data numerik dengan

ukuran tengah

Mean

mean atau average adalah ukuran rata-rata yang merupakan hasil bagi dari jumlah semua nilai pengukuran dibagi oleh banyaknya pengukuran

keuntungan:

a. mudah menghitungnya

b. sudah melibatkan seluruh data dalam

penghitungannya

kelemahannya:

nilai mean sangat dipengaruhi oleh nilai

ekstrim, baik ekstrim tinggi maupun ekstrim

rendah. Kelompok data yang memiliki nilai

ekstrim (sering dikenal dengan distribusi data

yang menceng ke kiri atau ke kanan) mean

tidak dapat mewakili rata-rata kumpulan nilai

pengamatan.
1/4/2013

5

Contoh histogram menceng kanan

Median

median adalah nilai tengah. Setengah

banyaknya pengamatan mempunyai nilai di

bawahnya dan setengah nilai pengamatan

berada di atasnya.

penghitungan median hanya didasarkan pada

urutan nilai hasil pengukuran, besar beda nilai

diabaikan.
1/4/2013

6

Mode/modus

mode atau modus adalah data yang memiliki

frekuensi terbanyak.

contoh:

data umur mahasiswa:

18 th, 22 th, 21 th, 20 th, 23 th, 20 th

maka modusnya adalah 20 th.

Hubungan mean, median dan modus

Hubungan mean, median dan modus akan menentukan sebaran atau distribusi data

Jika mean, median dan modus sama, maka bentuk distribusi data adalah normal

Jika mean > median>modus, maka bentuk distribusi menceng /miring kanan

Jika mean
1/4/2013

7

Hitung mean, median, modus data berikut,

dan tentukan bentuk histogramnya

Berikut adalah 30 data usia mahasiswa FK

Unissula angkatan 2007

19,19,20,20,19,20,20,18,20,20,21,22,25,24,

20, 19,20,20,19,19,18, 20,19,19, 19,20,18,

18,24,23

Contoh hasil uji statistik:

Tentukan bentuk sebarannya (miring ke kiri atau

ke kanan?????
1/4/2013

8

Miring ke kanan, Data lebih banyak di sebelah kiri
1/4/2013

9

Ukuran-ukuran variasi

Untuk mengetahui seberapa jauh data

bervariasi digunakan ukuran penyebaran atau

ukuran variasi.

Ukuran penyebaran atara lain:

- range

- jarak inter kuartil

- standar deviasi

Range

merupakan ukuran variasi paling dasar,

dihitung dari selisih nilai terbesar di kurangi

nilai terkecil.

keuntungan:

penghitungan dapat dilakukan dengan cepat

kelemahan:

range sangat dipengaruhi oleh nilai ekstrim

baik bawah maupun atas
1/4/2013

10

Jarak inter kuartil

nilai observasi disusun berurutan dari nilai kecil ke nilai besar, kemudian ditentukan kuartil bawah dan kuartil atas. Kuartil merupakan pembagian data menjadi 4, yang dibatasi oleh tiga kuartil.

- Kuartil I mencakup 25% data berada di bawahnya dan 75% berada di atasnya

- kuartil II (median) mencakup 50% data berada di atasnya dan 50% berada di bawahnya

- kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya.

Jarak interkuartil adalah selisih antara kuartil III dan kuartil I.
1/4/2013

11

Statistics

sistolik

50

0

78.4000

70.0000

70.00

70.0000

70.0000

80.0000

Valid

Missing

N

Mean

Median

Mode

25

50

75

Percentiles

120.00110.00100.0090.0080.0070.0060.00

sistolik

30

25

20

15

10

5

0

Frequency

Mean = 78.40Std. Dev. = 12.0136N = 50

Histogram

Standar deviasi

adalah variasi data yang diukur melalui penyimpangan/ deviasi dari nilai-nilai pengamatan terhadap nilai mean-nya.

SD dihitung dengan rumus:

semakin besar SD semakin besar variasinya.

n

xxSD

2)1( =
1/4/2013

12

simpulan

Statistik deskriptif untuk data numerik digunakan:

mean, median, setandar deviasi dan interquartil range.

Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal) maka analisis univariat (deskriptif) yang baik adalah dengan menggunakan nilai mean dan standar deviasi.

Bila data yang terkumpul menunjukkan adanya nilai ekstrim (distribusi tidak normal) maka gunakan nilai median dan interquartil range (IQR) minimal-maksimal.

Peringkasan data kategorik

Hanya menggunakan distribusi frekuensi

dengan ukuran persentase dan proporsi

Contoh:

Distribusi responden menurut tingkat pendidikan

pendidikan jumlah persentase

SD 60 60.0
1/4/2013

13

Analisis sebaran dataparameter Kreteria normal

Koefisien varians Jika >30%

Rasio skweenes Dihitung dari nilai skweenes/standard error skweenes

= -2 sd 2

Rasio kurtosis Dihitung dari nilai kurtosis/standard error kurtosis =

-2 sd 2

histogram Simetris, tidak miring ke kiri maupun ke kanan

Box plot Simetris, median tepat di tengah, tidak ada outlier

dan nilai ekstrim

Normal Q-Q plots Data menyebar sekitar garis

Detrended QQ plots Data menyebar sekitar garis pada nilai 0

Kolmogorov smirnov

Shapiro-wilk

> 0.05

STATISTIK INFERENSIAL

Suatu proses atau prosedur penarikan

kesimpulan terhadap karakter populasi yang

didasarkan pada data yang diperoleh dari

observasi pada sampel

Digunakan untuk:

Penaksiran parameter populasi apakah suatu

kelompok termasuk dalam populasi tertentu

Pengujian kebenaran hipotesis
1/4/2013

14

Jenis uji statistik inferensial

Parametrik : Didasarkan pada asumsi parameter

Memiliki persyaratan2 uji

Lebih powerful

Hasil uji statistiknya dapat digeneralisasi untukkeseluruhan populasi

Non parametrik: Tidak didasarkan pada asumsi parameter

hasil uji statistiknya hanya berlaku bagi sampel yang diuji, tidak bisa digeneralisasi

Persyaratan uji statistik parametrik

Sampel harus diambil secara bebas (random)

Data yang diolah mempunyai skala interval atau

ratio

Populasi berdistribusi (atau mendekati) normal

Variasi data homogen

Mean populasi merupakan kombinasi liniar

(khusus untuk analisis varians)
1/4/2013

15

Random?

Normal

Ada 2 cara untuk menguji set data mempunyai

sebaran normal atau tidak

Metode deskriptif yaitu menghitung koefisien

varians, ratio skewness, ratio kurtoris,

histogram dan plot)

Metode analitik : uji Kolmogorov-Smirnov atau

Shapiro-Wilk
1/4/2013

16

Jika nilai kolmogorov-smorniv (untuk sampel

besar) atau nilai Shapiro-Wilk (untuk sampel

kecil) > 0.05, maka sebaran data dinyatakan

normal

Tests of Normality

,171 9 ,200* ,927 9 ,458

,143 9 ,200* ,979 9 ,957

,214 9 ,200* ,939 9 ,542

,222 9 ,200* ,899 9 ,313

DOSIS

kontrol

20%

30%

40%

JUMLAH

Statistic df Sig. Statistic df Sig.

Kolmogorov-Smirnova

Shapiro-Wilk

This is a lower bound of the true significance.*.

Lilliefors Significance Correctiona.

Jika nilai sig. pada levene satatistik > 0.05 maka

varian data dinyatakan homogen

Test of Homogeneity of Variances

JUMLAH

1,256 3 32 ,306

Levene

Statistic df1 df2 Sig.
1/4/2013

17

Hal-hal yang harus diperhatikan dalam

memilih uji statistik

Apakah Skala variabel

uji hipotesis yang dikehendaki peneliti (korelasi, asosiasi atau perbedaan)

berapakah kelompok observasi ( satu, dua, tiga atau lebih)

adakah dalam rancangan penelitian ada pengamatan ulang terhadap suatu variabel

apakah pada uji yang dikehendaki dilakukan pengendalian terhadap variabel tertentu (berapa variabel)
1/4/2013

18

contoh soal

Seorang peneliti ingin membuktikan hipotesis

bahwa pemberian ekstrak meniran dapat

memperbaiki hepar tikus yang dirusak dengan

CCl4. Jika data sebagai berikut, tentukan

apakah hipotesis bahwa meniran efektif

menurunkan kadar SGPT terbukti? Gunakan

uji statstik yang tepat untuk menguji data

tersebut.

Rusak

(ccl4) +

aqua

SGPT Rusak (CCl4)

+ meniran1

SGPT

1 33.99 1 29.23

2 33.79 2 28.16

3 33.5 3 28.35

4 34.28 4 29.13

5 33.6 5 28.45

6 33.69 6 30.59

7 34.47 7 28.06
1/4/2013

19

Peneliti ingin mengetahui efek proteksi ekstrak

meniran pada tikus jantan galur wistar yang

diinduksi CCl4. desain penelitian adalah pre

post test desaign. Hasil uji kadar SGPT tikus

sebelum dan sesudah perlakuan adalah

sebagai berikut. Tentukan apakah terdapat

perbedaan kadar SGPT sebelum dan sesudah

perlakuan?

No.

Tikus

SGPT

sebelum

SGPT

sesudah

1 33.99 31.07

2 33.79 31.36

3 33.5 30.97

4 34.28 30.78

5 33.6 31.27

6 33.69 30.88
1/4/2013

20

Pengolahan data

penelitian observasional Cross sectional

Studi cross sectional merupakan salah satu studi epidemiologi untuk menemukan hubungan antara factor risiko dan penyakit

Untuk rancangan cross sectional, risiko relatif dicerminkandengan angka rasio prevalensi (prevalence ratio, RP)

Rasio prevalensi adalah jumlah subjek dengan efek positif(prevalensi penyakit) pada semua subjek dengan faktorrisiko positif dibagi jumlah subjek dengan efek positif padasemua subjek dengan faktor risiko negatif. Dengandemikian risiko relative adalah angka yang menggambarkan prevalensi penyakit dalam populasiterkait dengan factor risiko yang dipelajari, atau prevalensipenyakit yang timbul akibat factor risiko tertentu

RP = A : C IK=

A+B C+D

Atau gunakan SPSS

Faktor risiko

efek

ya tidak jumlah

YaA B A+B

tidak C D C+D

Jumlah A+C B+D A+B+C+D

)()(96.1ln

dbb

b

caa

aRP

EXP+

++
1/4/2013

21

Interpretasi hasil: Bila nilai Rasio prevalensi = 1 berarti variabel yang diduga sebagai faktor

risiko tidak ada pengaruhnya terhadap terjadinya efek, atau dengan kata lain, dia bersifat netral.

Bila rasio prevalensi > 1, dan rentang interval kepercayaan tidak mencakup angka 1, maka berarti variabel tersebut merupakan faktor risiko timbulnya penyakit. Akan tetapi jika interval kepercayaannya mencakup angka 1, maka nilai rasio prevalensi tidak diperhitungkan.

apabila rasio prevalensi < 1, dan rentang kepercayaannya tidak mencakup angka 1, maka berarti faktor yang diteliti justru menjadi faktor yang mengurangi terjadinya penyakit, dan menjadi faktor protektif. Jika interval kepercayaan lebih dari 1, maka nilai RP tidak diperhitungkan.

Bila nilai interval kepercayaan mencakup angka 1, maka berarti pada populasi yang diwakili oleh sampel tersebut mungkin terdapat nilai prevalen yang sama dengan 1, sehingga belum dapat disimpulkan bahwa faktor yang dikaji tersebut merupakan faktor risiko atau faktor proteksi, karena interval kepercayaan pada dalam konteks ini adalah nilai IK adalah rentang nilai RP pada populasi yang mungkin ditemukan. Jadi jika dalam rentang tersebut terdapat nilai 1, maka dalam populasi kemungkinan terdapat nilai RP = 1, sehingga ada anggota populasi yang memiliki variabel yang diduga sebagai faktor risiko tidak berpengaruh pada efek.

CASE CONTROL

Penelitian case control atau case-comparison study merupakan penelitian epidemiologis yang menelaah hubungan antara efek (penyakit) tertentu dengan factor risiko tertentu.

Pada penelitian case control, kelompok kasus (pasien yang menderita efek) dibandingkan dengan kelompok control (mereka yang tidak menderita penyakit atau efek).

Dalam desain penelitian ini ingin diketahui apakah suatu factor risiko tertentu benar berpengaruh terhadap terjadinya efek dengan membandingkan kekerapan pejanan factor risiko tersebut pada kelompok kasus dan kelompok control.

Risiko relative dinyatakan dalam rasio Odds (OR).
1/4/2013

22

RUMUS OR

IK=

BxC

AxDOR =

dcbaOR

EXP

111196.1ln +++

COHORT

penelitian epidemiologi yang mempelajari hubungan antara faktor risiko dan efek atau penyakit.

Pada penelitian kohort, kausa atau faktor risiko diidentifikasi terlebih dahulu, kemudian subjek diikuti sampai periode tertentu untuk melihat terjadinya efek atau penyakit yang diteliti pada kelompok subjek dengan faktor risiko dan subjek tanpa faktor risiko.

Perbandingan insiden penyakit antara kelompok dengan faktor risiko dan kelompok tanpa faktor risiko disebut dengan risiko relatif atau rasio risiko (RR)
1/4/2013

23

RUMUS RR

RR=

IK =

DC

C

BA

A

++:

)()(96.1ln

dbb

b

caa

aRP

EXP+

++

Seorang peneliti ingin mengetahui anemi ibu

hamil sebagai factor risiko kejadian BBLR di RSI

Sultan Agung. Berikut adalah data yang dia

kumpulkan dari rekam medis. Jika desain

penelitian yang dia pergunakan adalah Cross

sectional, maka hitunglah factor risikonya, dan

tentukan apakah nilai tersebut bermakna atau

tidak. Hitunglah dengan menggunakan SPSS.
1/4/2013

24

No. ibu hamil berat bayi

1 anemi BBLR

2 anemi BBLR

3 tdk anemi Normal

4 tdk anemi Normal

5 tdk anemi Normal

6 tdk anemi Normal

7 tdk anemi Normal

8 anemi BBLR

9 anemi BBLR

10 anemi BBLR

11 anemi BBLR

12 anemi BBLR

13 anemi BBLR

14 tdk anemi Normal

15 tdk anemi Normal

15 tdk anemi Normal

16 tdk anemi Normal

17 anemi Normal

18 anemi Normal

19 anemi BBLR

20 anemi BBLR

21 tdk anemi BBLR

22 anemi BBLR

23 tdk anemi Normal

24 tdk anemi Normal

25 tdk anemi Normal

26 tdk anemi Normal

27 anemi BBLR

28 anemi BBLR

29 anemi BBLR

30 anemi Normal

JIKA PENELITIAN TERSEBUT DILAKUKAN

DENGAN DESAIN CASE CONTROL, HITUNG

NILAI OR NYA