1/4/2013
1
Pengolahan data
Endang Lestari
Kompetensi biostatistik yang harus dimiliki oleh
seorang peneliti
Kemampuan peneliti untuk memilih uji statistik
yang paling tepat sesuai dengan data yang akan
dianalisis
Pemahaman peneliti mengenai potensi dan
keterbatasan uji statistik yang digunakan
Kemampuan peneliti untuk menafsirkan hasil uji
statistik yang dilakukan, termasuk didalamnya
kemampuan memedakan pengertian kemaknaan
statistik dan kemaknaan aplikatif
1/4/2013
2
Macam statistik
STATISTIK DESKRIPTIF, yang berkaitan dengan pencatatan dan peringkasan data, dengan tujuan menggambarkan hal-hal penting pada sekelompok data, seperti berapa rata-ratanya, variasi data dan sebagainya.
Statistik yang digunakan untuk menggambarkan atau menganalisa karakteristik data hasil penelitian, tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas (generalisasi/inferensi).
Statistik deskriptif harus selalu mendahului statistik inferensial
STATISTIK INFERENSIAL, Suatu proses atau
prosedur penarikan kesimpulan terhadap
karakter populasi yang didasarkan pada data
yang diperoleh dari observasi pada sampel
1/4/2013
3
ANALISIS DESKRIPTIF
Biasa disebut dengan analisis univariat
Tujuannya adalah untuk menjelaskan ataumendeskripsikan karakteristik masing-masingvariabel yang diteliti
Fungsinya adalah untuk menyedrhanakan ataumeringkas kumpulan data sedemikian rupa sehinggakumpulan tersebut dapat berubah menjadi informasisederhana yang dapat dibaca dengan cepat
Peringkasan tersebut dapat berupa ukuran-ukuranstatistik, tabel dab grafik
Hal-hal yang perlu diperhatikan
Jenis peringkasan yang dikehendaki:
a. ukuran tengah (central tendency)
b. ukuran variasi
Jenis data:
a. numerik
b. atau kategorik
Bentuk tampilan yang dikehendaki: tabel, grafik, dll.
1/4/2013
4
Peringkasan untuk data numerik dengan
ukuran tengah
Mean
mean atau average adalah ukuran rata-rata yang merupakan hasil bagi dari jumlah semua nilai pengukuran dibagi oleh banyaknya pengukuran
keuntungan:
a. mudah menghitungnya
b. sudah melibatkan seluruh data dalam
penghitungannya
kelemahannya:
nilai mean sangat dipengaruhi oleh nilai
ekstrim, baik ekstrim tinggi maupun ekstrim
rendah. Kelompok data yang memiliki nilai
ekstrim (sering dikenal dengan distribusi data
yang menceng ke kiri atau ke kanan) mean
tidak dapat mewakili rata-rata kumpulan nilai
pengamatan.
1/4/2013
5
Contoh histogram menceng kanan
Median
median adalah nilai tengah. Setengah
banyaknya pengamatan mempunyai nilai di
bawahnya dan setengah nilai pengamatan
berada di atasnya.
penghitungan median hanya didasarkan pada
urutan nilai hasil pengukuran, besar beda nilai
diabaikan.
1/4/2013
6
Mode/modus
mode atau modus adalah data yang memiliki
frekuensi terbanyak.
contoh:
data umur mahasiswa:
18 th, 22 th, 21 th, 20 th, 23 th, 20 th
maka modusnya adalah 20 th.
Hubungan mean, median dan modus
Hubungan mean, median dan modus akan menentukan sebaran atau distribusi data
Jika mean, median dan modus sama, maka bentuk distribusi data adalah normal
Jika mean > median>modus, maka bentuk distribusi menceng /miring kanan
Jika mean
1/4/2013
7
Hitung mean, median, modus data berikut,
dan tentukan bentuk histogramnya
Berikut adalah 30 data usia mahasiswa FK
Unissula angkatan 2007
19,19,20,20,19,20,20,18,20,20,21,22,25,24,
20, 19,20,20,19,19,18, 20,19,19, 19,20,18,
18,24,23
Contoh hasil uji statistik:
Tentukan bentuk sebarannya (miring ke kiri atau
ke kanan?????
1/4/2013
8
Miring ke kanan, Data lebih banyak di sebelah kiri
1/4/2013
9
Ukuran-ukuran variasi
Untuk mengetahui seberapa jauh data
bervariasi digunakan ukuran penyebaran atau
ukuran variasi.
Ukuran penyebaran atara lain:
- range
- jarak inter kuartil
- standar deviasi
Range
merupakan ukuran variasi paling dasar,
dihitung dari selisih nilai terbesar di kurangi
nilai terkecil.
keuntungan:
penghitungan dapat dilakukan dengan cepat
kelemahan:
range sangat dipengaruhi oleh nilai ekstrim
baik bawah maupun atas
1/4/2013
10
Jarak inter kuartil
nilai observasi disusun berurutan dari nilai kecil ke nilai besar, kemudian ditentukan kuartil bawah dan kuartil atas. Kuartil merupakan pembagian data menjadi 4, yang dibatasi oleh tiga kuartil.
- Kuartil I mencakup 25% data berada di bawahnya dan 75% berada di atasnya
- kuartil II (median) mencakup 50% data berada di atasnya dan 50% berada di bawahnya
- kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya.
Jarak interkuartil adalah selisih antara kuartil III dan kuartil I.
1/4/2013
11
Statistics
sistolik
50
0
78.4000
70.0000
70.00
70.0000
70.0000
80.0000
Valid
Missing
N
Mean
Median
Mode
25
50
75
Percentiles
120.00110.00100.0090.0080.0070.0060.00
sistolik
30
25
20
15
10
5
0
Frequency
Mean = 78.40Std. Dev. = 12.0136N = 50
Histogram
Standar deviasi
adalah variasi data yang diukur melalui penyimpangan/ deviasi dari nilai-nilai pengamatan terhadap nilai mean-nya.
SD dihitung dengan rumus:
semakin besar SD semakin besar variasinya.
n
xxSD
2)1( =
1/4/2013
12
simpulan
Statistik deskriptif untuk data numerik digunakan:
mean, median, setandar deviasi dan interquartil range.
Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal) maka analisis univariat (deskriptif) yang baik adalah dengan menggunakan nilai mean dan standar deviasi.
Bila data yang terkumpul menunjukkan adanya nilai ekstrim (distribusi tidak normal) maka gunakan nilai median dan interquartil range (IQR) minimal-maksimal.
Peringkasan data kategorik
Hanya menggunakan distribusi frekuensi
dengan ukuran persentase dan proporsi
Contoh:
Distribusi responden menurut tingkat pendidikan
pendidikan jumlah persentase
SD 60 60.0
1/4/2013
13
Analisis sebaran dataparameter Kreteria normal
Koefisien varians Jika >30%
Rasio skweenes Dihitung dari nilai skweenes/standard error skweenes
= -2 sd 2
Rasio kurtosis Dihitung dari nilai kurtosis/standard error kurtosis =
-2 sd 2
histogram Simetris, tidak miring ke kiri maupun ke kanan
Box plot Simetris, median tepat di tengah, tidak ada outlier
dan nilai ekstrim
Normal Q-Q plots Data menyebar sekitar garis
Detrended QQ plots Data menyebar sekitar garis pada nilai 0
Kolmogorov smirnov
Shapiro-wilk
> 0.05
STATISTIK INFERENSIAL
Suatu proses atau prosedur penarikan
kesimpulan terhadap karakter populasi yang
didasarkan pada data yang diperoleh dari
observasi pada sampel
Digunakan untuk:
Penaksiran parameter populasi apakah suatu
kelompok termasuk dalam populasi tertentu
Pengujian kebenaran hipotesis
1/4/2013
14
Jenis uji statistik inferensial
Parametrik : Didasarkan pada asumsi parameter
Memiliki persyaratan2 uji
Lebih powerful
Hasil uji statistiknya dapat digeneralisasi untukkeseluruhan populasi
Non parametrik: Tidak didasarkan pada asumsi parameter
hasil uji statistiknya hanya berlaku bagi sampel yang diuji, tidak bisa digeneralisasi
Persyaratan uji statistik parametrik
Sampel harus diambil secara bebas (random)
Data yang diolah mempunyai skala interval atau
ratio
Populasi berdistribusi (atau mendekati) normal
Variasi data homogen
Mean populasi merupakan kombinasi liniar
(khusus untuk analisis varians)
1/4/2013
15
Random?
Normal
Ada 2 cara untuk menguji set data mempunyai
sebaran normal atau tidak
Metode deskriptif yaitu menghitung koefisien
varians, ratio skewness, ratio kurtoris,
histogram dan plot)
Metode analitik : uji Kolmogorov-Smirnov atau
Shapiro-Wilk
1/4/2013
16
Jika nilai kolmogorov-smorniv (untuk sampel
besar) atau nilai Shapiro-Wilk (untuk sampel
kecil) > 0.05, maka sebaran data dinyatakan
normal
Tests of Normality
,171 9 ,200* ,927 9 ,458
,143 9 ,200* ,979 9 ,957
,214 9 ,200* ,939 9 ,542
,222 9 ,200* ,899 9 ,313
DOSIS
kontrol
20%
30%
40%
JUMLAH
Statistic df Sig. Statistic df Sig.
Kolmogorov-Smirnova
Shapiro-Wilk
This is a lower bound of the true significance.*.
Lilliefors Significance Correctiona.
Jika nilai sig. pada levene satatistik > 0.05 maka
varian data dinyatakan homogen
Test of Homogeneity of Variances
JUMLAH
1,256 3 32 ,306
Levene
Statistic df1 df2 Sig.
1/4/2013
17
Hal-hal yang harus diperhatikan dalam
memilih uji statistik
Apakah Skala variabel
uji hipotesis yang dikehendaki peneliti (korelasi, asosiasi atau perbedaan)
berapakah kelompok observasi ( satu, dua, tiga atau lebih)
adakah dalam rancangan penelitian ada pengamatan ulang terhadap suatu variabel
apakah pada uji yang dikehendaki dilakukan pengendalian terhadap variabel tertentu (berapa variabel)
1/4/2013
18
contoh soal
Seorang peneliti ingin membuktikan hipotesis
bahwa pemberian ekstrak meniran dapat
memperbaiki hepar tikus yang dirusak dengan
CCl4. Jika data sebagai berikut, tentukan
apakah hipotesis bahwa meniran efektif
menurunkan kadar SGPT terbukti? Gunakan
uji statstik yang tepat untuk menguji data
tersebut.
Rusak
(ccl4) +
aqua
SGPT Rusak (CCl4)
+ meniran1
SGPT
1 33.99 1 29.23
2 33.79 2 28.16
3 33.5 3 28.35
4 34.28 4 29.13
5 33.6 5 28.45
6 33.69 6 30.59
7 34.47 7 28.06
1/4/2013
19
Peneliti ingin mengetahui efek proteksi ekstrak
meniran pada tikus jantan galur wistar yang
diinduksi CCl4. desain penelitian adalah pre
post test desaign. Hasil uji kadar SGPT tikus
sebelum dan sesudah perlakuan adalah
sebagai berikut. Tentukan apakah terdapat
perbedaan kadar SGPT sebelum dan sesudah
perlakuan?
No.
Tikus
SGPT
sebelum
SGPT
sesudah
1 33.99 31.07
2 33.79 31.36
3 33.5 30.97
4 34.28 30.78
5 33.6 31.27
6 33.69 30.88
1/4/2013
20
Pengolahan data
penelitian observasional Cross sectional
Studi cross sectional merupakan salah satu studi epidemiologi untuk menemukan hubungan antara factor risiko dan penyakit
Untuk rancangan cross sectional, risiko relatif dicerminkandengan angka rasio prevalensi (prevalence ratio, RP)
Rasio prevalensi adalah jumlah subjek dengan efek positif(prevalensi penyakit) pada semua subjek dengan faktorrisiko positif dibagi jumlah subjek dengan efek positif padasemua subjek dengan faktor risiko negatif. Dengandemikian risiko relative adalah angka yang menggambarkan prevalensi penyakit dalam populasiterkait dengan factor risiko yang dipelajari, atau prevalensipenyakit yang timbul akibat factor risiko tertentu
RP = A : C IK=
A+B C+D
Atau gunakan SPSS
Faktor risiko
efek
ya tidak jumlah
YaA B A+B
tidak C D C+D
Jumlah A+C B+D A+B+C+D
)()(96.1ln
dbb
b
caa
aRP
EXP+
++
1/4/2013
21
Interpretasi hasil: Bila nilai Rasio prevalensi = 1 berarti variabel yang diduga sebagai faktor
risiko tidak ada pengaruhnya terhadap terjadinya efek, atau dengan kata lain, dia bersifat netral.
Bila rasio prevalensi > 1, dan rentang interval kepercayaan tidak mencakup angka 1, maka berarti variabel tersebut merupakan faktor risiko timbulnya penyakit. Akan tetapi jika interval kepercayaannya mencakup angka 1, maka nilai rasio prevalensi tidak diperhitungkan.
apabila rasio prevalensi < 1, dan rentang kepercayaannya tidak mencakup angka 1, maka berarti faktor yang diteliti justru menjadi faktor yang mengurangi terjadinya penyakit, dan menjadi faktor protektif. Jika interval kepercayaan lebih dari 1, maka nilai RP tidak diperhitungkan.
Bila nilai interval kepercayaan mencakup angka 1, maka berarti pada populasi yang diwakili oleh sampel tersebut mungkin terdapat nilai prevalen yang sama dengan 1, sehingga belum dapat disimpulkan bahwa faktor yang dikaji tersebut merupakan faktor risiko atau faktor proteksi, karena interval kepercayaan pada dalam konteks ini adalah nilai IK adalah rentang nilai RP pada populasi yang mungkin ditemukan. Jadi jika dalam rentang tersebut terdapat nilai 1, maka dalam populasi kemungkinan terdapat nilai RP = 1, sehingga ada anggota populasi yang memiliki variabel yang diduga sebagai faktor risiko tidak berpengaruh pada efek.
CASE CONTROL
Penelitian case control atau case-comparison study merupakan penelitian epidemiologis yang menelaah hubungan antara efek (penyakit) tertentu dengan factor risiko tertentu.
Pada penelitian case control, kelompok kasus (pasien yang menderita efek) dibandingkan dengan kelompok control (mereka yang tidak menderita penyakit atau efek).
Dalam desain penelitian ini ingin diketahui apakah suatu factor risiko tertentu benar berpengaruh terhadap terjadinya efek dengan membandingkan kekerapan pejanan factor risiko tersebut pada kelompok kasus dan kelompok control.
Risiko relative dinyatakan dalam rasio Odds (OR).
1/4/2013
22
RUMUS OR
IK=
BxC
AxDOR =
dcbaOR
EXP
111196.1ln +++
COHORT
penelitian epidemiologi yang mempelajari hubungan antara faktor risiko dan efek atau penyakit.
Pada penelitian kohort, kausa atau faktor risiko diidentifikasi terlebih dahulu, kemudian subjek diikuti sampai periode tertentu untuk melihat terjadinya efek atau penyakit yang diteliti pada kelompok subjek dengan faktor risiko dan subjek tanpa faktor risiko.
Perbandingan insiden penyakit antara kelompok dengan faktor risiko dan kelompok tanpa faktor risiko disebut dengan risiko relatif atau rasio risiko (RR)
1/4/2013
23
RUMUS RR
RR=
IK =
DC
C
BA
A
++:
)()(96.1ln
dbb
b
caa
aRP
EXP+
++
Seorang peneliti ingin mengetahui anemi ibu
hamil sebagai factor risiko kejadian BBLR di RSI
Sultan Agung. Berikut adalah data yang dia
kumpulkan dari rekam medis. Jika desain
penelitian yang dia pergunakan adalah Cross
sectional, maka hitunglah factor risikonya, dan
tentukan apakah nilai tersebut bermakna atau
tidak. Hitunglah dengan menggunakan SPSS.
1/4/2013
24
No. ibu hamil berat bayi
1 anemi BBLR
2 anemi BBLR
3 tdk anemi Normal
4 tdk anemi Normal
5 tdk anemi Normal
6 tdk anemi Normal
7 tdk anemi Normal
8 anemi BBLR
9 anemi BBLR
10 anemi BBLR
11 anemi BBLR
12 anemi BBLR
13 anemi BBLR
14 tdk anemi Normal
15 tdk anemi Normal
15 tdk anemi Normal
16 tdk anemi Normal
17 anemi Normal
18 anemi Normal
19 anemi BBLR
20 anemi BBLR
21 tdk anemi BBLR
22 anemi BBLR
23 tdk anemi Normal
24 tdk anemi Normal
25 tdk anemi Normal
26 tdk anemi Normal
27 anemi BBLR
28 anemi BBLR
29 anemi BBLR
30 anemi Normal
JIKA PENELITIAN TERSEBUT DILAKUKAN
DENGAN DESAIN CASE CONTROL, HITUNG
NILAI OR NYA
Top Related