Pengantar Analisis Data Edit Ok s2 Kesmas
-
Upload
ikaawiratama -
Category
Documents
-
view
122 -
download
1
description
Transcript of Pengantar Analisis Data Edit Ok s2 Kesmas
PROGRAM STUDI S2 KESEHATAN MASYARAKATPASCA SARJANA UNIVERSITAS ANDALAS
1
MODUL ANALISA DATA
PENGANTAR ANALISIS DATA
1. Pendahuluan
Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya adalah
menganalisis data. Data mentah (raw data) yang sudah susah payah kita kumpulkan tidak
akan ada artinya jika tidak dianalisis. Analisis data merupakan kegiatan yang sangat
penting dalam suatu penelitian, karena dengan analisislah data dapat mempunyai
arti/makna yang dapat berguna untuk memecahkan masalah penelitian.
Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu
dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat langsung
memberi jawaban penelitian, untuk itu perlu diketahui bagaimana menginterpretasi hasil
penelitian tersebut. Menginterpretasi berarti kita menjelaskan hasil analisis guna
memperoleh makna/arti.
Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas. Interpretasi
dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya sebatas pada
masalah penelitian yang diteliti berdasarkan data yang dikumpulkan dan diolah untuk
keperluan penelitian tersebut. Sedangkan interpretasi dalam arti luas (analitik) yaitu
interpretasi guna mencari makna data hasil penelitian dengan jalan tidak hanya
menjelaskan/menganalisis data hasil penelitian tersebut, tetapi juga melakukan inferensi
(generalisasi) dari data yang diperoleh dengan teori-teori yang relevan dengan hasil-hasil
penelitian tersebut.
Pada umumnya analisis data bertujuan untuk:
a. Memperoleh gambaran/deskripsi masing-masing variabel
b. Membandingkan dan menguji teori atau konsep dengan informasi yang ditemukan
c. Menemukan adanya konsepbaru dari data yang dikumpulkan
d. Mencari penjelasan apakah konsep baru yang diuji berlaku umum atau hanya
berlaku pada kondisi tertentu
Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari:
a. Jenis penelitian
b. Jenis sampel
2
c. Jenis data/variabel
d. Asumsi kenormalan distribusi data
a. Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat
masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan survei.
Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan kuantitatif. Namun
bila kita menginginkan untuk mendapatkan pendapat/gambaran yang mendalam tentang
suatu fenomena, maka data dapat dikumpulkan dengan fokus grup diskusi atau observasi,
maka analisisnya menggunakan pendekatan analisis kualitatif.
b. Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah kedua
sampel independen atau dependen. Misalnya pada penelitian survei yang tidak
menggunakan sampel yang sama, dapat digunakan uji statistik yang mengasumsikan
sampel yang independen. Misalkan survei untuk mengetahui apakah ada perbedaan berat
badan bayi antara bayi-bayi yang dilahirkan dari ibu perokok dengan bayi-bayi dari ibu
yang tidak merokok. Disini berarti kelompok ibu perokok dan kelompok ibu bukan
perokok bersifat independen.
Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum dan
sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang digunakan
adalah uji statistik untuk data yang dependen. Misalnya, suatu penelitian ingin
mengetahui pengaruh penelitian manajemen terhadap kinerja petugas kesehatan.
Pertanyaan penelitiannya “Apakah ada perbedaan kinerja petugas kesehatan antara
sebelum dan sesudah mendapatkan pelatihan manajemen?”. Dalam penelitian ini sampel
kelompok petugas kesehatan bersifat dependen, karena pada kelompok (orang) yang
sama diukur dua kali yaitu pada saat sebelum pelatihan (pre test) dan sesudah dilakukan
pelatihan (Post Test).
c. Jenis Data/Variabel
3
Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik.
Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai contoh,
nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk menjelaskan data
berjenis katagorik, sedangkan untuk data jenis numerik biasanya dapat menggunakan
nilai rata-rata untuk menjelaskan karakteristiknya. Untuk analisis hubungan dua variabel
(analsis bivariat), uji kai kuadrat hanya dapat dipakai untuk mengetahui hubungan data
katagori dengan data katagori. Sebaliknya untuk mengetahui hubungan numerik dengan
numerik digunakan uji korelasi/regresi.
d. Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi
datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan prosedur uji
statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat dipenuhi maka dapat
digunakan uji statistik parametrik.
Berikut ini akan dijelaskan langkah-langkah analisis (pendekatan kuantitatif):
1. Analisis Deskriptif (Univariat)
Tujuan dari analisis ini adalah untuk menjelaskan/mendiskripsikan karakteristik
masing-masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk
data numerik digunakan nilai mean (rata-rata), median, standard deviasi dan inter
kuartil range, minimal maksimal.
2. Analisis Analitik (Bivariat)
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis lebih
lanjut. Apabila diinginkan analisis hubungan antar dua variabel, maka analisis
dilanjutkan pada tingkat bivariat. Misalnya ingin diketahui hubungan antara berat
badan dengan tekanan darah. Untuk mengetahui hubungan dua variabel tersebut
biasanya digunakan pengujian statistik. Jenis uji statistik yang digunakan sangat
tergantung jenis data/variabel yang dihubungkan.
3. Analisis Multivariat
Merupakan analisis yang menghubungkan antara beberapa variabel independen
dengan satu variabel dependen.
4
Secara lebih khusus/detail analisis univariat, bivariat dan multivariat akan
dipelajari pada bab tersendiri.
5
ANALISIS UNIVARIAT
( DESKTIPTIF)
Tujuan dari analisis ini adalah untuk menjelaskan/mendeskriptifkan karakteristik
masing-masing variabel yang diteliti. Dalam analisis data kuantitatif kita dihadapkan
pada kumpulan data yang besar/banyak yang belum jelas maknanya. Fungsi analisis
sebetulnya adalah menyederhanakan atau meringkas kumpulan data hasil pengukuran
sedemikian rupa sehingga kumpulan data tersebut berubah menjadi informasi yang
berguna. Peringkasan tersebut berupa ukuran-ukuran statistik, tabel dan juga grafik.
Secara teknis pada dasarnya analisis merupakan kegiatan meringkas kumpulan
data menjadi ukuran tengah dan ukuran variasi. Selanjutnya membandingkan gambaran-
gambaran tersebut antara satu kelompok subyek dan kelompok subyek lain, sesuai
dengan tujuan yang ingin dicapai dalam analisis.
Berbicara peringkasan data (yang berwujud ukuran tengah dan ukuran variasi)
jenis data (apakah numerik atau katagorik) akan sangat menentukan bentuk peringkasan
datanya. Berikut akan diuraikan bentuk/cara peringkasan data untuk data numerik dan
data katagorik.
1. Peringkasan Data Untuk Data Jenis Numerik
a. Ukuran Tengah
Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil pengukuran.
Berbagai ukuran dikembangkan utnuk mencerminkan ukuran tengah tersebut, dan yang
paling sering dipakai adalah mean, median dan mode/modus.
1). Mean
Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah semua nilai
pengukuran dibagioleh banyaknya pengukuran. Secara sederhana perhitungan nilai
mean dapat dituliskan dengan rumus :
6
X = Σ Xi / n
Keuntungan nilai mean adalah mudah menghitungnyadan sudah melibatkan seluruh
data dalam penghitungannya. Namun kelemahan dari nilai mean adalah sangat
dipengaruhi oleh nilai ekstrim, baik ekstrim tinggi maupun rendah. Oleh karena itu
pada kelompok data yang ada nilai ekstrimnya (sering dikenal dengan ‘distribusi data
yang menceng/miring’), Mean tidak dapat mewakili rata-rata kumpulan nilai
pengamatan. Sebagai contoh data yang ada nilai ekstrimnya adalah data penghasilan.
Apabila mean pendapatan perbulan adalah Rp 10.000.000,- , sebenarnya sebagian
besar orang pendapatannya di bawah Rp 10.000.000,- . Mean sebesar Rp 10.000.000,-
diperoleh karena tarikan sekelompok kecil orang (misalnya konglomerat) yang
pendapatannya sangat tinggi. Dengan demikian penggunaan mean untuk data yang
ada nilai ekstrimnya (data yang distribusinya menceng) kurang tepat.
Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90 hr.
Mean = (1+3+4+2+90)/5 = 20 hr.
Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil ini
tentunya tidak dapat mewakili karena secara visual datanya sebagian besar kurang
dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di atas ada nilai
ekstrimnya.
2). Median
Median adalah nilai dimana setengah banyaknya pengamatan mempunyai nilai di
bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda dengan nilai
mean, penghitungan median hanya mempertimbangkan urutan nilai dasil pengukuran,
besar beda antar nilai di abaikan. Karena mengabaikan besar beda, maka median tidak
dipengaruhi oleh nilai ekstrim.
Prosedur penghitungan median melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke besar
b). Hitung posisi median dengan rumus (n+1)/2
c). Hitung nilai mediannya
Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th
Data diurutkan: 20, 24, 26, 30, 36, 40
Posisi = (6+1)/2 = 3,5
7
Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28
Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa berumur di atas
28 tahun
3). Mode/Modus
Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun
Bentuk Distribusi Data
Hubungan nilai mean, median dan mode akan menentukan bentuk distribusi data:
- Bila nilai mean, median dan mode sama, maka bentuk
distribusi datanya normal
- Bila nilai mean > median > mode, maka bentuk
distribusi datanya menceng/miring ke kanan
- Bila nilai mean < median < mode, maka bentuk
distribusi datanya menceng/miring ke kiri
b. Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain atau
dengan kata lain hasil pengamatan akan bervariasi. Untuk mengetahui seberapa jauh data
bervariasi digunakan ukuran variasi antara lain range, jarak linier kuartil dan standard
deviasi.
1). Range
Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai terbesar
dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai ekstrim. Keuntungan
penghitungan dapat dilakukan dengan cepat.
2). Jarak Inter Quartil
Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian ditentukan
kuartil bawah dan atas. Kuartil merupakan pembagian data menjadi 4 bagian yang
dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil II dan kuartil III.
Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di atasnya.
8
Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data berada di
atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya.
Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih baik
dari range, terutama kalau frekuensi pengamatan banyak dan distribusi sangat
menyebar.
3). Standard Deviasi
Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai pengamatan
terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi terhadap mean disebut
varian, yang rumusnya;
Semakin besar nilai varian akan semakin bervariasi, karena satuan varian (kuadrat)
yang tidak sama dengan satuan nilai pengamatan, maka dikembangkan suatu ukuran
variasi yang mempunyai satuan yang sama dengan satuan pengamatan, yaitu Standard
Deviasi.
Standard Deviasi merupakan akar dari varian:
Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila tidak ada
variasi, maka SD=0
Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan nilai mean
(rata-rata), median, standard deviasi dan inter quartil range, minimal dan maksimal. Bila
data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal), maka
perhituungan nilai mean dan standard deviasi merupakan cara analisis univariat yang
tepat. Seddangkan bila dijumpai nilai ekstrim 9 distribusi data tidak normal), maka nilai
nedian dan inter quartil range (IQR) yang lebih tepat dibandingkan nilai mean.
9
Varian = Σ(Xi – X)2
n
Standar deviasi (S atau SD) = Σ(Xi – X)2
n
2. Peringkasan Data Katagorik
Berbeda dengan data numerik, peringkasan, (baik ukuran tengah maupun ukuran
variasi) tidak beragam jenisnya. Pada data katagorik peringkasan data hanya
menggunakan distribusi frekuensi dengan ukuran persentase atau proporsi. Bila data
berjenis katagorik, tentunya informasi/peringkasan yang penting disampaikan tidak
mungkin/tidak lazim menggunakan ukuran mean atau median. melainkan informasi
jumlah dan persentase yang disajikan. Untuk ukuran variasi, pada data katagorik variasi
maksimal apabila jumlah antar katagori sama.
Contoh: Kelas A: mahasiswa 50 dan mahasiswi 50
Kelas B: mahasiswa 90 dan mahasiswi 10
Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50% pria dan 50%
wanita.
Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria) karena pria
90% dan wanita hanya 10%.
3. Bentuk Penyajian Data
Bentuk penyajian analisis univariat dapat berupa tabel atau grafik. Namun perlu
diingat bahwa kita dianjurkan hanya memilih salah satu, tidak diperkenankan secara
sekaligus menggunakan tabel dan juga grafik dalam menyampaikan informasi suatu
data/variabel.
Contoh penyajian analisis deskriptif:
a. Data numerik
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999
Variabel Mean
Median
SD Minimal- Maksimal
1. Umur 30,3
31,1
10,1 17 – 60
2. Lama hari rawat 10,1 8,9 2 – 60
10
7,0
b. Data katagorik
Tabel 2
Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X
tahun 1999
Pendidikan Jumlah Persentase
SD 60 60,0
SMP 30 30,0
SMU 10 10,0
Total 100 100,0
Bagaimana menginterpretasi tabel di atas?
“dilihat konsentrasi/jumlah yang terbesar data pada kelompok mana?”
Selain untuk mendeskripsikan masing-masing variabel, analisis univariat dapat
juga sekaligus untuk mengeksplorasi variabel yang dapat berguna dalam mendiagnosis
asumsi statistik lanjut (terutama untuk variabel jenis numerik), misalnya apakah
variannya homogen atau heterogen, apakah distribusinya normal atau tidak. Eksplorasi
data juga dapat untuk mendeteksi adanya nilai ekstrim/outlier, bila ada nilai ekstrim
sangat menentukan analisis selanjutnya (bivariat) apakah nilainya akan berkurang.
11
KASUS :
ANALISIS DESKRIPTIF (UNIVARIAT)
Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masing-masing
variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk data numerik
digunakan nialai mean (rata-rata), median, standard deviasi dll. Sedangkan untuk data
katagorik tentunya hanya dapat menjelaskan angka/nilai jumlah dan persentase masing-
masing kelompok. Berikut akan dipelajari cara mengeluarkan analisis deskriptif di
SPAA, dimulai untuk variabel katagorik (sebagai latihan digunakan variabel
‘pendidikan’) dan kemudian dilanjutkan variabel numerik (variabel umur).
a. Data Katagorik
Untuk menampilkan tabulasi data katagorik digunakan tampilan frekuensi.
Sebagai contoh kita akan menampilkan tabel distribusi frekuensi untuk variabel
pendidikan dari file ‘ASI.SAV’.
1. Dari menu utama SPSS pilih ‘Analyze’, kemudian ‘Descriptive Statistic’
dan pilih ‘Frequencies’, sehingga muncul tampilan:
2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak “Variable
(s)”
12
3. Klik ‘OK’, hasil dapat dilihat di jendela output, seperti sbb:
Frequencies
Statistics
pendidikan formal ibu menyusui
N Valid
Missing
50
0
pendidikan formal ibu menyusui
Frequency Percent Valid PercentCumulative
Percent
Valid 1 10 20.0 20.0 20.0
2 11 22.0 22.0 42.0
3 16 32.0 32.0 74.0
4 13 26.0 26.0 100.0
Total 50 100.0 100.0
Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai. Pada contoh di
atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang berpendidikan SD,
proporsi dapat dilihat pada kolom ‘Percent’, pada contoh di atas ada 20% ibu yang
berpendidikan SD. Kolom ‘Valid Percent’ memberi hasil yang sama karena pada data ini
13
tidak ada ’missing cases’. ‘Cumulative Percent’ menjelaskan tentang persent kumulatif.
Pada contoh di atas ada 42,0% ibu yang tingkat pendidikannya SD dan SMP. Dalam
menginterpretasikan tabel katagorik dapat dilihat dari variasi dan konsentrasi datanya.
Penyajian dan Interpretasi di Laporan Penelitian
Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan
penelitian/laporan tesis. Adapun penyajian dan interpretasinya sbb:
Tabel …
Distribusi Responden Menurut Tingkat Pendidikan
Di ………… X tahun ….
Pendidikan Jumlah Persentase
SD 10 20,0
SMP 11 22,0
SMU 16 32,0
PT 13 26,0
Total 50 100,0
Distribusi tingkat pendidikan responden hampir merata untuk masing-masing tingkat
pendidikan. Paling banyak responden berpendidikan SMU yaitu 16 orang (32,0%)
sedangkan untuk pendidikan SD, SMP dan PT masing-masing 20,0%, 22,0% dan 26,0%.
b. Data Numerik
Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan ukuran
tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata, median dan modus.
Sedangkan ukuran sebarannya (variasi) yang digunakan adalah range, standard deviasi,
minimal dan maksimal. Pada SPSS ada dua cara untuk mengeluarkan analisis deskriptif
yaitu dapat melalaui perintah ‘Frequencies’ atau perintah ‘Expolre’. Biasanya yang
digunakan adalah Frequencies oleh karena ukuran statistik yang dapat dihasilkan pada
menu ‘Frequencies’ sangat lengkap (seperti mean, median, varian dll), selain itu pada
perintah ini juga dapat ditampilkan grafik histogram dan kurve normalnya. Berikut akan
14
dicoba mengeluarkan analisis deskriptif untuk variabel umur dengan menggunakan
perintah frequencies.
1. Aktifkan data “susu.sav”
2. Pilih ‘Analyze’
3. Pilih ‘Descriptive Statistic’
4. Pilih ‘Frequencies’, terlihat kotak frequencies:
5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda panah sehingga
umur masuk ke kotak variable (s).
6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya mean,
median, standard seviasi, minimum, maximum, SE.
7. Klik ‘Continue’
15
8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’, lalu
klik ‘With Normal Curve’
9. Klik ‘Continue’
10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran statistic
yang diminta dan dibawahnya tampak grafik histogram beserta curve normalnya.
Frequencies
Statistics
Umur ibu menyusui
N Valid
Missing
50
0
Statistics
Umur ibu menyusui
N Valid MissingMeanStd. Error of MeanMedianModeStd. DeviationMinimumMaximum
500
25.10.686
24.0019
4.8501935
16
Umur ibu menyusui
Frequency Percent Valid PercentCumulative
Percent
Valid 19
20
21
22
23
24
25
26
27
30
31
32
34
35
Total
7
3
3
5
5
4
2
5
3
3
3
3
2
2
50
14.0
6.0
6.0
10.0
10.0
8.0
4.0
10.0
6.0
6.0
6.0
6.0
4.0
4.0
100.0
14.0
6.0
6.0
10.0
10.0
8.0
4.0
10.0
6.0
6.0
6.0
6.0
4.0
4.0
100.0
14.0
20.0
26.0
36.0
46.0
54.0
58.0
68.0
74.0
80.0
86.0
92.0
96.0
100.0
17
Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan nilai
standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas, rata-rata
umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi 4,85 tahun dengan
umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi frekuensi ditampilkan
menurut umur termuda sampai dengan umur tertua dengan informasi tentang jumlah dan
persentasenya. Bentuk distribusi data dapat diketahui dari grafik histogram dan kurve
normalnya. Dari tampilan grafik dapat dilihat bahwa distribusi variabel umur berbentuk
normal
Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk
melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi interval
lakukan analisis eksplorasi data dengan perintah ‘Explore’. Adapun caranya sbb:
1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu
‘descriptive Statistics’, lalu pilih ‘Explore’
2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’ dan
‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:
18
3. Klik tombol ‘Plots’, dan pilih ‘Normality Plots With Test’
4. Klik ‘Continue’
5. Klik ‘OK’, hasilnya dapat dilihat di layar:
6.
Explore
Descriptives
Statistic Std. Error
umur ibu menyusui Mean
95% Confidence Lower Bound
Interval for Mean Upper Bound
25.10
23.72
26.48
.686
19
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
24.90
24.00
23.520
4.850
19
35
16
9
.547
-.812
.337
.662
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic Df Sig. Statistic df Sig.
umur ibu menyusui .130 50 .035 .920 50 .002a. Lilliefors Significance Correction
umur ibu menyusui
umur ibu menyusui Stem-and-Leaf Plot
Frequency Stem & Leaf
7.00 1 . 9999999
20.00 2 . 00011122222333334444
10.00 2 . 5566666777
11.00 3 . 00011122244
2.00 3 . 55
Stem width: 10
Each leaf: 1 case(s)
20
Dari hasil analisis ‘Explore’ terlihat juga nilai mean, median dan mode. Namun yang
paling penting dari tampilan explore munculnya angka estimasi interval. Dari hasil
tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita dapat menghitung
95% confidence interval umur yaitu 23,72 s.d. 26,48. Jadi kita 95% yakin bahwa rata-rata
umur ibu di populasi berada pada selang 23,72 sampai 26,48 tahun.
21
Uji kenormalan data:
Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk mengetahuinya yaitu:
1. Dilihat dari grafik histogram dan kurve normal, bila bentuknya menyerupai bel
shape, berarti distribusi normal
2. Menggunakan nilai Skewness dan standar errornya, bila nilai Skewness dibagi
standar errornya menghasilkan angka ≤ 2, maka distribusinya normal
3. Uji kolmogorov smirnov, bila hasil uji signifkan (p value > 0,05) maka distribusi
normal. Namun uji kolmogorov sangat sensitif dengan jumlah sampel, maksudnya :
untuk jumlah sampel yang besar uji kolmogorov cenderung menghasilkan uji yang
signifikan (yang artinya bentuk distribusinya tidak normal). Atas dasar kelemahan ini
dianjurkan untuk mengetahui kenormalan data lebih baik menggunakan angka
skewness atau melihat grafik histogram dan kurve normal
Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat bentuk yang
normal, selain itu hasil dari perbandingan skwness dan standar error didapatkan:
0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti distribusi normal. Dari hasil
tersebut diatas dengan demikian variabel umur disimpulkan berdistribusi normal.
Penyajian dan Interpretasi di Laporan Penelitian
Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan
penelitian/laporan tesis. Adapun penyajian dan interpretasinya adalah sbb:
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x
Variabel Mean SD Minimal-
Maksimal
95% CI
Umur 25,10 4,85 19 - 35 23,72 – 26,48
22
Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72 – 26,48),
dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur tertua 35 tahun.
Dari hasil estimasi interval dapat disimpulkan bahwa 95% diyakini bahwa rata-rata umur
ibu adalah diantara 23,72 sampai dengan 26,48 tahun.
23
ANALISIS BIVARIAT
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis
lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis pembayaran berobat
dan kepuasan pasien, kita hanya melakukan pendeskripsian sendiri-sendiri untuk variabel
jenis pembayaran dan kepuasan pasien. Untuk variabel jenis pembayaran akan diketahui
berapa persen yang berobat dengan biaya sendiri dan berapa persen yang dibiayai askes.
Begitu juga untuk variabel kepuasan pasien, akan diketahui berapa persen yang puas dan
berapa persen yang tidak puas.
Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh diatas
berarti kita ingin mengetahui hubungan jenis pembayaran dengan kepuasan pasien, maka
analisis dilanjutkan pada tingkat bivariat. Pada analisis bivariat kita dapat mengetahui
apakah ada perbedaan kepuasan pasien antara pasien dengan membayar sendiri dengan
pasien dengan biaya askes. Kegunaan analisis bivariat bisa untuk mengetahui apakah ada
hubungan yang siginifikan antara dua variabel, atau bisa juga digunakan untuk
mengetahui apakah ada perbedaan yang signifikan antara dua atau lebih
kelompok(sampel).
Perbedaan Substansi/Klinis dan perbedaan Statistik
Perlu dipahami/disadari bagi peneliti bahwa berbeda bermakna/signifikan secara
statistik tidak berarti (belum tentu) bahwa perbedaan tersebut juga bermakna dipandang
dari segi substansi/klinis. Seperti diketahui bahwa semakin besar sampel yang dianalisis
akan semakin besar menghasilkan kemungkinan berbeda bermakna. Dengan sampel besar
perbedaan-perbedaan sangat kecil, yang sedikit atau bahkan tidak mempunyai manfaat
secara substansi/klinis dapat berubah menjadi bermakna secara statitik. Oleh karena itu
arti kegunaan dari setiap penemuan jangan hanya dilihat dari aspek statistik semata,
namun harus juga dinilai/dilihat kegunaannya dari segi klinis/substansi. Sebagai contoh
ada studi eksperimen yang akan menguji dua obat (katakanlah obat A dan Obat B) untuk
mengatahui pengaruhnya terhadap penurunan tekanan darah. Kemudian obat A dan B
diujicobakan pada dua kelompok relawan penderita hipertensi. Hasil eksperimen
didapatkan bahwa rata-rata penurunan tekanan darah setelah minum obat A adalah 40
24
mmHg dan pada kelompok yang minum Obat B ratarata penurunannya 39 mmHg.
Kemudian dilakukan uji statistik dan hasilnya signifikan/bermakna (p value < alpha), apa
yang dapat disimpulkan dari temuan ini? Secara statistik memang terjadi perbedaan
bermakna, namun secara substansi tidaklah mempunyai perbedaan yang berarti, oleh
karena perbedaan mean penurunan tekanan darah antara obat A dan B hanya 1 mmHg.
Dengan hasil ini dapat disimpulkan bahwa sebenarnya antara obat A dan B tidak ada
perbedaan (sama saja) kasiatnya.
UJI HIPOTESIS
Pengujian hipotesis dapat berguna untuk membantu pengambilan keputusan
tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau hubungan, cukup
menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini didasarkan pada besarnya
peluang untuk memperoleh hubungan tersebut secara kebetulan (by chance). Semakin
kecil peluang tersebut (peluang adanya by chance), semakin besar keyakinan bahwa
hubungan tersebut memang ada.
Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk memutuskan
berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru lebih baik daripada
yang sekarang beraedar di pasaran. Untuk menjawab pertanyaan ini maka perlu dilakukan
pengujian hipotesis. Dengan pengujian hipotesis akan diperoleh suatu kesimpulan secara
probalistik apakah vaksin baru tersebut lebih baik dari yang sekarang beredar di pasaran
atau malah sebaliknya.
Prinsip uji hipotesis adalah melakukan perbandingan antara nilai sampel (data
hasil penelitian) dengan nilai hipotesis (nilai populasi) yang diajukan. Peluang untuk
diterima atau ditolaknya suatu hipotesis tergantung besar kecilnyanya perbedaan antara
nilai sampel dengan nilai hipotesis. Bila perbedaan tersebut cukup besar, maka peluang
untuk menolak hipotesis besar pula, sebaliknya bila perbedaan tersebut kecil, maka
peluang untuk menolak hipotesis menjadi kecil. Jadi, makin besar perbedaan antara nilai
sampel dengan nilai hipotesis, makin besar peluang untuk menolak hipotesis.
Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua kemungkinan
yaitu menolak hipotesis dan menerima hipotesis (gagal menolak hipotesis). Perlu
dipahami bahwa arti menerima hipotesis sebetulnya kurang tepat, yang tepat adalah gagal
25
menolak hipotesis. Dalam uji hipotesis bila kesimpulannya menerima hipotesis, bukan
berarti bahwa kita telah membuktikan hipotesis tersebut benar, karena benar atau
tidaknya suatui hipotesis hanya dapat dibuktikan dengan mengadakan observasi pada
seluruh populasi, dan hal ini sangat sulit bahkan tidak mungkin untuk dilakukan. Jadi
menerima hipotesis sebetulnya artinya adalah kita tidak cukup bukti untuk menolak
hipotesis, dengan kata lain dapat diartikan kita gagal menolak hipotesis. Untuk
memperjelas pengertian bahwa “gagal menolak hipotesis berbeda dengan mengakui
kebenaran hipotesis (menerima hipotesis”, kita coba analogkan proses persidangan
kriminal di pengadilan. Seperti dalam sidang pengadilan, kegagalan membuktikan
kesalahan tertuduh bukan berarti si tertudauh tidak bersalah atau sitertuduh benar.
Pengadilan memutuskan bahwa si tertuduh tidak dapat dibuktikan bersalah, bukan
memutuskan tidak bersalah. Dari uraian tersebut sangatlah jelas bahwa istilah yang tepat
dalam kesimpulan uji hipotesis adalah gagal menolak hiopotesis, dan bukan menerima
hipotesis.
3. Hipotesis
Hipotesis berasal dari kata hupo dan thesis. Hupo artinya sementara/lemah
kebenarannya dan thesis artinya pernyataan/teopri. Dengan demikian hipotesis berarti
pernyataan yang perlu diuji kebenarannya. Untuk menguji kebenaran sebuah hipotesis
digunakan pengujian yang disebut pengujian hipotesis.
Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis nol (Ho)
dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas tentang masing-masing
hipotesis tersebut.
a. Hipotesis Nol (Ho).
Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua
kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara variabel satu
dengan variabel lainnya
Contoh:
1) Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu
yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok
2) Tidak ada hubungan antara merokok dengan berat badan bayi
26
b. Hipotesis Alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok.
Atau hipotesis yang menyatakan ada hubungan antara variabel satu dengan variabel
lainnya
Contoh:
1) Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang
merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok
2) Ada hubungan antara merokok dengan berat badan bayi
2. Arah dan bentuk hipotesis
Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu arah
(one tail) atau dua arah (twa tail)
a. One tail (satu sisi): bila hipotesis alternatifnya menyatakan
adanya perbedaan dan ada pernyataan yang mengatakan hal satu lebih tinggi/rendah
dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan bayi dari
ibu tidak merokok.
b. Two tail (dua sisi) merupakan hipotesis alternatif yang hanya
menyatakan perbedaan tanpa melihat apakah hal satu lebih tinggi/rendah dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan bayi dari ibu
tidak merokok. Atau dengan kata lain: ada perbedaan berat badan bayi antara mereka
yang dilahirkan dari ibu yang merokok dibandingkan dari ibu yang tidak merokok.
Contoh penulisan hipotesis:
Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan tekanan darah,
maka hipotesisnya sbb:
Ho : μA = μB
Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Tidak ada
hubungan antara jenis kelamin dengan tekanan darah.
27
Ho : μA ≠ μB
Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Ada hubungan
antara jenis kelamin dengan tekanan darah
3. Menentukan Tingkat Kemaknaan (Level of Significance)
Tingkat kemaknaan merupakan kesalahan tipe I suatu uji yang biasanya diberi
notasi ‘α’. Seperti sudah diketahui bahwa tujuan dari pengujian hipotesis adalah untuk
membuat suatu pertimbangan tentang perbedaan antara nilai sampel dengan keadaan
populasi sebagai suatu hipotesis. Langkah selanjutnya setelah ktriteria/batasan yang
digunakan untuk memutuskan apakah hipotesis nol ditolak atau gagal ditolak yang
disebut dengan tingkat kemaknaan (Level of Significance). Tingkat kemaknaan, atau
sering disebut dengan nilai α, merupakan nilai yang menunjukkan besarnya peluang
salah dalam menolak hipotesis nol. Atau dengan kata lain, nilai α merupakan batas
toleransi peluang salah dalam menolak hipotesis nol. Dengan kata-kata yang lebih
sederhana, nilai α merupakan batas maksimal kesalahan menolak Ho. Bila kita menolak
Ho berarti menyatakan adanya perbedaan/hubungan. Sehingga nilai α dapat diartikan
pula sebagai batas maksimal kita salah dalam menyatakan adanya perbedaan. Penentuan
nilai α (alpha) tergantung dari tujuan dan kondisi penelitian. Nilai α yang sering
digunakan adalah 10%, 5%, atau 1%. Untuk bidang kesehatan masyarakat biasanya
digunakan nilai α sebesar 5%. Sedangkan untuk pengujian obat-obatan digunakan batas
toleransi kesalahan yang lebih kecil misalnya 1%, karena mengandung risiko yang fatal.
Misalkan seorang peneliti yang akan menentukan apakah suatu obat bius berkhasiat akan
menentukan nilai α yang kecil sekali, peneliti tersebut tidak akan mau mengambil risiko
bahwaketidak berhasilan obat bius besar karena akan berhubungan dengan nyawa
seseorang yang akan dibius.
4. Pemilihan Jenis Uji Parametrik atau Non Parametrik
Dalam pengujian hipotesis sangat berhubungan dengan distribusi data populasi
yang akan diuji. Bila distribusi data populasi yang akan diuji berbentuk
normal/simetris/Gauss, maka proses pengujian dapat digunakan dengan pendekatan uji
28
statistik parametrik. Sedangkan bila distribusi data populasinya tidak normal atau tidak
diketahui distribusinya maka dapat digunakan pendekatan uji statistik non parametrik.
Kenormalan suatu distribusi data dapat juga dilihat dari jenis variabelnya, bila
variabelnya berjenis numerik/kuantitatif biasanya distribusi datanya mendekati
normal/simetris, sehingga dapat digunakan uji statistik parametrik. Bila jenis variabelnya
katagorik (kualitatif), maka bentuk distribusinya tidak normal, sehingga uji non
parametrik dapat digunakan. Penentuan jenis uji juga ditentukan oleh jumlah data yang
dianalisis, bila jumlah data kecil (<30) cenderung digunakan uji non parametrik.
PROSEDUR/LANGKAH UJI HIPOTESIS
Menetapkan Hipotesis
Hipotesis dalam statistik dikenal dua macam yaitu hipotesis nol (Ho) dan hipotesis
alternatif (Ha).
1). Hipotesis nol (Ho)
Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua
kelompok.
Contoh: Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu
yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok
2). Hipotesis alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok.
Contoh: Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang
merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok.
Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu arah (one
tail) atau dua arah (two tail).
Penentuan Uji Statistik Yang Sesuai
Ada beragam jenis uji statistik yang dapat digunakan. Setiap uji statistik
mempunyai persyaratan tertentu yang harus dipenuhi. Oleh karena itu harus digunakan
uji statistik yang tepat sesuai dengan data yang diuji. Jenis uji statistik sangat tergantung
dari:
1). Jenis variabel yang akan dianalisis
29
2). Jenis data apakah dependen atau independen
3). Jenis distribusi data populasinya apakah mengikuti distribusi normal atau tidak.
Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan mean akan
berbeda dengan uji statistik untuk mengetahui perbedaan proporsi/persentase. Uji beda
mean menggunakan uji t atau inova, sedangkan uji untuk mengetahui perbedaan proporsi
digunakan uji Kai kuadrat.
Menentukan Batas atau Tingkat Kemaknaan (Level og Significance)
Batas/tingkat kemaknaan, sering juga disebut dengan nilai α. Penggunaan nilai
alpha tergantung tujuan penelitian yang dilakukan, untuk bidang kesehatan masyarakat
biasanya menggunakan nilai alpha 5%.
Penghitungan Uji Statitik
Penghitungan uji statistik adalah menghitung data sampel ke dalam uji hipotesis
yang sesuai. Misalnya kalau ingin menguji perbedaan mean antara dua kelompok, maka
data hasil pengukuran dimasukkan ke rumus uji t. Dari hasil dengan nilai populasi untuk
mengetahui apakah ada hipotesis ditolak atau gagal menolak hipotesis.
Keputusan Uji Statistik
Seperti telah disebutkan pada langkah D, bahwa hasil pengujian statistik akan
menghasilkan dua kemungkinan keputusan yaitu menolak hipotesis nol (Ho) dan gagal
menolak hipotesisi nol.
Seiring dengan kemajuan perkembangan komputer maka uji statistik dengan
mudah dan cepat dapat dilakukan dengan program-program statistik yang tersedia di
pasaran seperti Epi Info, SPSS, SAS dll. Setiap kita melakukan uji statistik melalui
program komputer maka yang akan kita cari adalalah nilai p (p value). Dengan nilai p ini
kita dapat menggunakan untuk keputusan uji statistik dengan cara membandingkan nilai
p dengan α (alpha). Ketentuan yang berlaku adalah:
a). Bila nilai p ≤ α, maka keputusannya adalah Ho ditolak
b). Bila nilai p > α, maka keputusannya adalah Ho gagal ditolak
30
Perlu diketahui bahwa nilai p two tail adalah 2 kali nilai p one tail berarti kalau
tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang dilakukan adalah
two tail maka nilai p dari tabel harus dikalikan 2. dengan demikian dapat disederhanakan
dengan rumus : nilai p two tail = 2 x nilai p one tail.
Pendekatan probabilistik ini sekarang sudah mulai digunakan oleh para ahli
statistik dalam pengambilan keputusan uji statistik. Pada modul ini dalam memutuskan
uji statistik menggunakan pendekatan ini.
Pengertian Nilai P
Nilai p merupakan nilai yang menunjukkan besarnya peluang salah menolak Ho
dari data penelitian. Nilai P dapat diartikan pula sebagai nilai besarnya peluang hasil
penelitian (misal adanya perbedaan mean atau proporsi) terjadi karena faktor kebetulan
(by chance). Harapan kita nilai p adalah sekecil mungkin, sebab bila nilai p-nya kecil
maka kita yakin bahwa adanya perbedaan pada hasil penelitian menunjukkan pula adanya
perbedaan di populasi. Dengan kata lain kalau nilai p-nya kecil maka perbedaan yang ada
pada penelitian terjadi bukan karena faktor kebetulan (by chance).
Contoh:
Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan berat
badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa rata-rata berat badan
bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat badan bayi yang lahir dari
ibu yang tidak hipertensi adalah 3000 gram. Perbedaan berat bayi antara ibu yang
hipertensi dengan ibu yang tidak hipertensi sebesar 100 gram. Pertanyaan yang timbul
adalah apakah perbedaan berat badan bayi tersebut juga berlaku untuk seluruh populasi
yang diteliti atau hanya faktor kebetulan saja?. Untuk menjawab pertanyaan tersebut
kemudian dilakukan uji statistik yang tepat yaitu uji t. Miisalnya dihasilkan nilai p =
0,0110 maka berarti peluang adanya perbedaan berat bayi sebesar 1000 gram akibat dari
faktor kebetulan (by chance) adalah sebesar 0,0110. oleh karena peluangnya sangat kecil
(p=0,0110), maka dapat diartikan bahwa adanya perbedaan tersebut bukan karena faktor
kebetulan namun karena memang karena adanya riwayat hipetensi.
31
Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat
Variabel I Variabel II Jenis uji statistik yang
digunakan
Katagorik ↔ Katagorik - Kai kuadrat
- Fisher Exact
Katagorik ↔ Numerik - Uji T
- ANOVA
Numerik ↔ Numerik - Korelasi
- Regresi
32
ANALISIS BIVARIAT HUBUNGAN
KATAGORIK DENGAN NUMERIK
Uji t
Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah parameter
dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan tekanan darah
penduduk dewasa orang kota dengan orang desa. Atau, apakah ada perbedaan berat badan
antar sebelum mengikuti program diet dengan sesudahnya. Uji statistik yang
membandingkan mean dua kelompok data ini disebut uji beda dua mean. Pendekatan
ujinya dapat menggunakan pendekatan distribusi Z dan distribusi t , sehingga pada uji
beda dua mean bisa menggunakan uji Z atau uji t, namun lebih sering digunakan uji t.
Sebelum kita melakukan uji statistik dua kelompok data, kita perlu mengetahui
apakah dua kelompok data tersebut berasal dari dua kelompok yang independen atau
berasal dari dua kelompok yang dependen/pasangan. Dikatakan kelompok independen
bila data kelompok yang satu tidak tergantung dari kelopok kedua, misalnya
membandingkan mean tekanan darah sistolik orang desa dengan orang kota. Tekanan
darah orang kota independen (tidak tergantung) dengan orang desa. Dilain pihak, kedua
kelompok data dikatakan dependen/pasangan bila kelompok data yang dibandingkan
datanya saling mempunyai ketergantungan, misalnya data berat badan sebelum dan
sesudah mengikuti program diet berasal dari orang yang sama (data sesudah
dependen/tergantung dengan data sebelum).
Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi dalam dua
kelompok, yaitu: uji beda mean independen (uji T independen) dan uji beda mean
dependen (uji T dependen).
1. Uji beda dua mean independen
Tujuan: untuk mengetahui perbedaan mean dua dua kelompok data independen, syarat
yang harus dipenuhi:
33
a. Data berdistribusi normal/simetris.
b. Kedua kelompok data independen.
c. Variabel yang dihubungkan berbentuk numerik dan katagorik (ket:
variabel katagorik hanya dengan dua kelompok).
Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi kedua kelompok
data. Oleh karena itu dalam pengujian ini diperlukan informasi apakah varian kedua
kelompok yang diuji sama atau tidak. Bentuk varian kedua kelompok data akan
berpengaruh pada nilai standar error yang akhirnya akan membedakan rumus
pengujiannya.
a. Uji untuk varian sama
Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T. Uji Z dapat
digunakan bila standar deviasi populasi (σ) diketahui dan jumlah sampel besar (>30).
Apabila kedua syarat tersebut tidak terpenuhi maka dilakukan uji . pada umumnya
nilai σ sulit diketahui, sehingga uji beda dua mean biasanya menggunakan uji T (T
Test). Untuk varian yang sama maka bentuk ujinya sbb:
df = n1 – n2 - 2
Ket :
n1 atau n2 = jumlah sampel kelompok 1 atau 2
S1 atau S2 = standar deviasi sampel kelompok 1 atau 2
b. Uji untuk varian berbeda
34
X1 – X2
T = Sp (1/n1) + (1/n2)
(n1 - 1)S12 + (n2 - 1) S2
2
Sp2 = n1 - n2 - 2
X1 – X2
T = (S1
2/n1) + (S22/n2)
c. Uji homogenitas varian
Tujuan dari uji ini adalah untuk mengetahui varian antara kelompok data satu apakah
sama dengan kelompok data yang kedua.
df1 = n1-1 dan df2 = n2-1
Pada perhitungan uji F, varian yang lebih besar sebagai pembilang dan varian yang
lebih kecil sebagai penyebut.
2. Uji beda dua mean dependen (Paired sample)
Tujuan : Untuk menguji perbedaan mean anatara dua kelompok data yang
dependen. Contoh kasus:
o Apakah ada perbedaan tingkat pengetahuan antara sebelum dan sesudah
dilakukan pelatihan.
o Apakah ada perbedaan berat badan antara sebelum dan sesudah mengikuti
program diet.
Syarat :
a. Distribusi data normal
b. Kedua kelompok data dependen/pair
c. Jenis variabel: numerik dan katagorik (dua kelompok)
Formula :
35
[(S12/n1) + (S2
2/n2)]2
df = [(S1
2/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]
S12
F = S2
2
dT =
S_d / n
d = rata-rata deviasi/selisih sampel 1 dengan sampel 2
S_d = standar deviasi dari deviasi/selisih sampel sampel 1 dan sampel 2
KASUS:
UJI t INDEPENDEN DAN UJI t DEPENDEN
1. Uji t independen
Sebagai contoh kita gunakan data “ASI.SAV” dengan melakukan uji hubungan perilaku
menyusui dengan kadar Hb (misal digunakan variabel Hb1), apakah ada perbedaan kadar
Hb antara ibu yang menyusui eksklusif dengan ibu yang menyusuinya tidak eksklusif,
caranya:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
3. Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable (s)’I dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variable
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
4. Klik ‘hb1’ dan msukkan ke kotak ‘Test variable’
5. Klik variabel ‘eksklu’ dan masukkan ke kotak ‘Grouping Variable’.
36
6. Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘menyusui’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ kode untuk yang tidak eksklusif dan kode ‘1’ untuk Yang eksklusif. Jadi
ketiklah 0 pada Group 1” dan 1 pada “Group 2”
7. Klik “Continue”
8. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
status menyusui asi N Mean Std. Deviation
Std. Error
Mean
kadar hb pengukuran tdk EKSKLUSIVE
pertama EKSKLUSIVE
24
26
10.421
10.277
1.4712
1.3228
.3003
.2594
Independent Samples Test
Levene's Testfor Equality ofVariances
t-test for Equality of Means
FSig.
tdf
Sig.(2-taile
d)
MeanDifferen
ce
Std.Error
Difference
95% ConfidenceInterval of the
Difference
Lower Upperkadar hb Equalpengukur variancesan assumedpertama Equal variances not assumed
.072 .790 -.364
-.363
48
46.4
.717
.719
-.1439
-.1439
.3951
.3968
-.9384
-.9425
.6505
.6547
37
Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan standar error
kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb ibu yang menyusui
ekslusif adalah 10,277 gr% dengan standar deviasi 1,322 gr%, sedangkan untuk ibu yang
menyusui non eksklusif, rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar
deviasi 1,471 gr%.
Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua uji T,
yaitu uji T dengan asumsi varian kedua kelompok sama (equal variances assumed) dan
uji T dengan asumsi varian kedua kelompok tidak sama (equal variances not assumed).
Untuk, memilih uji mana yang kita pakai, dapat dilihat uji kesamaan varian melalui uji
Levene. Lihat nilai p Levene test, nilai p < alpha (0,05) maka varian berbeda dan bila
nilai p > alpha (0,05) maka varian sama (equal). Pada uji Levene di atas menghasilkan
nilai p = 0,790 sehingga dapat disimpulkan bahwa pada alpha 5%, didapat tidak ada
perbedaan varian (varian kedua kelompok sama). Selanjutnya dicari p value uji t pada
bagian varian sama (equal variances) di kolom sig (2 tailed) ,yaitu sebesar p=0,717
artinya tidak ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui
eksklusif dengan ibu yang menyusui non eksklusif.
Penyajian dan Interpretasi di laporan penelitian:
Seperti pada analisis deskriptif, print out di atas tidak boleh langsung di copy dan
disajikan di laporan penelitian. Pada laporan penelitian kita harus membuat tabel baru
untuk menyajikan hasil print out analisis di atas. Adapun bentuk penyajian dan
interpretasinya adalah sbb:
Tabel …
Distribusi Rata-Rata Kadar Hb Responden Menurut Perilaku Menyusui di..th..
Menyusui Mean SD SE P value N
Ya Eksklusif
Tdk Eksklusif
10,277
10,421
1,322
1,471
0,259
0,300
0,717 26
24
38
Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan standar
deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif rata-rata kadar Hb-
nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%. Hasil uji statistik didapatkan
nilai p=0,717, berarti pada alpha 5% terlihat tidak ada perbedaan yang signifikan rata-rata
kadar Hb antara ibu yang menyusui secara eksklusif dengan non eksklusif.
2. Uji T Dependen
Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji T
dependen sering digunakan pada analisis data penelitian eksperimen. Seperti sudah
dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau kedua
kelompok sampel yang dibandingkan mempunyai subyek yang sama. Dengan kata lain
disebut dependen bila responden diukur dua kali/diteliti dua kali, sering orang
mengatakan penelitian pre dan post. Misalnya kita ingin membandingkan berat badan
antara sebelum dan sesudah mengikuti program diet.
Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb
pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui apakah ada
perbedaan kadar Hb antara pengukuran pertama dengan pengukuran kedua. Disini terlihat
sampelnya dependen karena orangnya sama diukur dua kali. Adapun langkahnya:
1. Pastikan anda berada di file “ASI.SAV”, jika belum aktifkan/bukalah file ini.
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Paired-Samples T Test”
39
3. Klik ‘hb1’
4. Klik ‘hb2’
5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan
6. Klik ‘OK’ hasilnya tampak sbb:
T-Test
Paired Samples Statistics
Mean N Std. Deviation Std. ErrorMean
Pair kadar hb pengukuran
1 pertama
kadar hb pengukuran
kedua
10.346
10.860
50
50
1.3835
1.0558
.1957
.1493
Paired Samples Correlations
N Correlation Sig.
Pair Kadar hb pengukuran pertama
1 & kadar hb pengukuran kedua
50 .707 .000
Paired Samples Test
Paired Differences
tdf
Sig.(2-
tailed)
MeanStd.
Deviation
Std.Error Mean
95% ConfidenceInterval of the
DifferenceLower Upper
Pair kadar hb1 pengukuran pertama - kadar hb pengukuran kedua
-.5140 .9821 .1389 -.7931 -.2349 -3.701 49 .001
Pada tabel pertama terlihat statistik deskriptif berupa rata-rata dan standar deviasi
kadar Hb antara pengukuran pertama dan pengukuran kedua. Rata-rata kadar Hb pada
pengukuran pertama (hb1) adalah 10,346 gr% dengan standar deviasi 1,38 gr%. Pada
40
pengukuran kedua (hb2) didapat rata-rata kadar Hb adalah 10,860 gr% dengan standar
deviasi 1,05 gr%.
Uji T berpasangan dilaporkan pada tabel kedua, terlihat nilai mean perbedaan
antara pengukuran pertama dan kedua adalah 0,514 dengan standar deviasi 0,982.
perbedaan ini diuji dengan uji T berpasangan menghasilkan nilai p yang dapat dilihat
pada kolom “Sig (2-tailed)”. Pada contoh di atas didapatkan nilai p=0,001, maka dapat
disimpulkan ada perbedaan yang signifikan kadar hb antara pengukuran pertama dengan
pengukuran kedua.
Penyajian dan Interpretasi di laporan penelitian:
Dari hasil yang didapat di atas kemudian angka-angka disusun dalam tabel yang
disajikan dalam laporan penelitian. Bentuk penyajian dan interpretasinya sbb:
Tabel …
Distribusi Rata-Rata Kadar Hb Responden Menurut Pengukuran pertama dan
Kedua di …. Th……
Variabel Mean SD SE P value N
Kadar Hb
Pengukuran I
Pengukuran II
10,346
10,860
1,38
1,05
0,19
0,14
0,001 50
Rata-rata kadar Hb pada pengukuran pertama adalah 10,346 gr% dengan standar deviasi
1,38 gr%. Pada pengukuran kedua didapat rata-rata kadar Hb adalah 10,860 gr% dengan
standar deviasi 1,05 gr%. Terlihat nilai mean perbedaan antara pengukuran pertama dan
kedua adalah 0,514 dengan standar deviasi 0,982. hasil uji statistik didapatkan nilai 0,001
maka dapat disimpulkan ada perbedaan yang signifikan antara kadar Hb pengukuran
pertama dan kedua.
41
ANALISIS HUBUNGAN
KATEGORIK DENGAN NUMERIK
UJI ANOVA
Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data baik yang
independen maupun dependen. Namun seringkali kita jumpai jumlah kelompok yang
lebih dari dua, misalnya ingin mengetahui perbedaan mean berat badan bayi untuk daerah
Bekasi, Bogor dan Tangerang. Dalam menganalisis data seperti ini (> 2 kelompok) sangat
tidak dianjurkan menggunakan uji T. kelemahan menggunakan uji T adalah; pertama kita
melakukan uji berulang kali sesuai kombinasi yang mungkin, kedua, bila melakukan uji T
berulang kali akan meningkatkan (inflasi) nilai α, artinya akan meningkatkan peluang
hasil yang keliru.
Perubahan inflasi α sebesar = 1 – (1-α)n
Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang tepat)
dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji F.
Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua
sumber variasi yaitu variasi dalam kelompok (within) dan variasi antar kelompok
(between). Bila variasi within dan between sama (nilai perbandingan kedua varian sama
dengan 1) maka mean-mean yang dibandingkan tidak ada perbedaan, sebaliknya bila
hasil perbandingan tersebut menghasilkan lebih dari 1, maka mean yang dibandingkan
menunjuk ada perbedaan.
Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor (one
way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas analisis varian satu
faktor (one way).
Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:
1. Varian homogen
2. Sampel/kelompok independen
3. Data berdistribusi normal
42
4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk katagori
yang lebih dari 2 kelompok.
Perhitungan uji ANOVA
df = k-1 → untuk pembilang
n-k → untuk penyebut
Ket N = jumlah seluruh data (n1 + n2 + ….. + nk)
Analisis Multi Comparison (POSTHOC TEST)
Analisis ini bertujuam untuk mengetahui lebih lanjut kelompok mana saja yang
berbeda mean-nya bilamana pada pengujian ANOVA dihasilkan ada perbedaan yang
bermakna (Ho ditolak). Ada berbagai jenis analisis multiple comparasion diantaranya
adalah Bonferroni, Honestly Significant different (HSD), Scheffe dan lain-lain. Pada
modul ini yang akan dibahas adalah metode Bonferroni.
Perhitungan Bonfrroni adalah sbb:
43
Sb2
F = Sw2
(n1-1)S12 + (n2-1)S2
2 + ……..+ (nk-1)Sk2
Sw2 = N-k
n1(X1-X)2 + n2(X2-X)2 + ………+ nk(Xk-X)2
Sb2 = k - 1
n1.X1 + n2.X2 + ……. + nk.Xk
X = N
Xi - Xj tij = Sw2[(1/ni) +(1/nj)]
df = n – k
Dengan level of significance (α) sbb:
Kasus:
UJI ANOVA
Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan berat badan
bayi. Variabel pendidikan merupakan variabel katagorik dengan 4 katagori. Variabel
berat bayi berbentuk numerik sehingga uji yang digunakan ANOVA. Adapun caranya
sbb:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “One-Way ANOVA” sesaat akan muncul menu One
Way ANOVA
3. Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan kotak
Factor perlu diisi variabel. Kotak ‘dependent’ diisi variabel numerik dan kotak
‘factor’ diisi variabel katagoriknya. Pada contoh ini berarti pada kotak Dependen diisi
variabel “bbbayi” pada kotak Factor diisi variabel “Didik”.
4. Klik tombol ‘Options” tandai dengan √ pada kotak “Descriptive”
5. Klik “Continue”
44
αα* = (k2)
6. Klik tombol “Post Hoc”, tandai dengan √ pada kotak “Bonferroni”
7. Klik “Continue”
8. Klik “OK”
45
Oneway
Descriptives
berat badan bayi
N MeanStd.
DeviationStd.
Error
95% Confidence Interval forMean
Minimum
Maximum
Lower Bound
Upper Bound
SD
SMP
SMU
PT
Total
10
11
16
13
50
2470.00
2727.27
3431.25
3761.54
3170.00
249.666
241.209
270.108
386.304
584.232
78.951
72.727
67.527
107.141
82.623
2291.40
2565.23
3287.32
3528.10
3003.96
2648.60
2889.32
3575.18
3994.98
3336.04
2100
2100
3000
3000
2100
2900
3000
4000
4100
4100
Test of Homogeneity of Variances
berat badan bayi
Levene
Statistic df1 df2 Sig.
2.506 3 46 .071
ANOVA
berat badan bayi
Sum of
Squares df
Mean
Square F Sig.
Between Groups
Within Groups
Total
12697038
4027962
16725000
3
46
49
4232345.862
87564.400
48.334 .000
46
Post Hoc Tests
Multiple Comparisons
Dependent Variable: berat badan bayi
Bonferroni
(I)pendidikan formalibu
(J)pendidikanformal ibumenyusui
MeanDifference
(I-J) Std. Error Sig.
95% Confidence Interval
Lower Bound Upper BoundSD SMP
SMUPT
-257.273-961.250*
-1291.538*
129.294119.286124.468
.315
.000
.000
-613.76-1290.14-1634.72
99.21-632.36-948.36
SMP SDSMUPT
257.273-703.977*
-1034.266*
129.294115.902121.228
.315
.000
.000
-99.21-1023.54-1368.51
613.76-384.42-700.02
SMU SDSMPPT
961.250*-703.977*-330.288*
119.286115.902110.492
.000
.000
.027
632.36384.42
-634.93
1290.141023.54
-25.64PT SD
SMPSMU
1291.538*1034.266*330.288*
124.468121.228110.492
.000
.000
.027
948.36700.0225.64
1634.721368.51634.93
*. The mean difference is significant at the .05 level.
Dari print out ini diperoleh rata-rata berat bayi dan standar deviasi masing-masing
kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram
dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat
bayinya adalah 2727,2 gram dengan standar deviasi 241,2 gram. Pada mereka yang
berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan standar deviasi
270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5
gram dengan standar deviasi 386,3 gram.
Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom “F” dan “Sig”, terlihat
p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005), berarti pada alpha
5%, dapat disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan.
Pada Box paling bawah terlihat hasil dari uji ‘Multiple Comparisons Bonferroni” yang
berguna untuk menelusuri lebih lanjut kelompok mana saja yang berhubungan signifikan.
Untuk mengetahui kelompok yang signifikan dapat terlihat dari kolom Sig. Ternyata
47
kelompok signifikan adalah tingkat pendidikan SD dengan SMU, SD dengan PT, SMP
dengan SMU, SMP dengan PT dan SMU dengan PT.
Penyajian dan Interpretasi di laporan Penelitian
Tabel …
Distribusi Rata-Rata berat Bayi Menurut Tingkat pendidikan
Variabel Mean SD 95% CI P value
Pendidikan
- SD
- SMP
- SMU
- PT
2470,0
2727,2
3431,2
3761,5
249,6
241,2
270,1
386,3
2291,4 – 2648,6
3565,2 – 2889,3
3287,3 – 3575,1
3528,1 – 3994,9
0,0005
Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram
dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat
bayinya adalah 2727,20 gram dengan standar deviasi 241,2 gram. Pada mereka yang
berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan standar deviasi
270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5
gram dengan standar deviasi 386,3 gram.
Hasil uji statistik didapat niali p=0,0005, berarti pada alpha 5% dapat disimpulkan ada
perbedaan berat bayi diantara keempat jenjang pendidikan. Analisis lebih lanjut
membuktikan bahwa kelompok yang berbeda signifikan adalah tingkat pendidikan SD
dengan SMU, SD dengan PT, SMP dengan SMU,SMP dengan PT dan SMU dengan PT.
48
ANALISIS HUBUNGAN
KATAGORIK DENGAN KATAGORIK
UJI KAI KUADRAT
Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat dinyatakan dalam
bentuk angka-angka pengukuran (data numerik). Sebaliknya justru yang kita jumpai
adalah data hasil dari menghitung jumlah pengamatan yang diklasifikasikan atas
beberapa katagori. Data seperti ini disebut data katagorik (kualitatif), misalnya jenis
kelamin yang mempunyai katagori: laki-laki dan perempuan; status merokok yang
mempunyai katagori; perokok berat, perokok ringan dan tidak merokok. Dalam penelitian
kesehatan seringkali peneliti perlu melakukan analisis hubungan variabel katagorik
dengan variabel katagorik. Analisis ii bertujuan untuk menguji perbedaan proporsi dua
atau lebih kelompok sampel. Uji statistik yang digunakan untuk menjawab kasus tersbut
adalah UJI KAI KUADRAT (CHI SQUARE).
Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku menyusui
ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif antara ibu yang bekerja
dengan ibu yang tidak bekerja. Dari contoh terlihat bahwa variabel jenis pekerjaan
(bekerja/tidak bekerja) merupakan variabel katagorik, dan variabel perilaku menyusui
(eksklusif/non eksklusif) juga merupakan variabel katagorik.
Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita pahami
dengan benar apa itu variabel katagorik. Suatu variabel disebut katagorik bila isi
variabel tersebut terbentuk dari hasil klasifikasi/penggolongan, misalnya variabel sex,
jenis pekerjaan, golongan darah, pendidikan. Di lain pihak variabel numerik (misalnya
berat badan, umur dll) dapat masuk/dapat menjadi variabel katagorik bila variabel
tersebut sudah mengalami pengelompokan. Misalkan kita ambil satu contoh variabel
berat badan, berat badan bila nilainyamasih riil (50 kg, 63 kg dst) maka masih termasuk
variabel numerik, namun bila sudah dilakukan pengelompokan menjadi (<50 kg (kurus),
50-60 kg (sedang) dan > 60 (gemuk) maka variabel tersebut sudah berjenis katagorik.
49
1. Tujuan Uji kai Kuadrat
Tujuan dari digunakannya uji kai kuadrat adalah untuk untuk menguji perbedaan
proporsi/persentase antara beberapa kelompok data. Dilihat dari segi datanya uji kai
kuadrat dapat digunakan untuk mengetahui hubungan antara variabel katagorik dengan
variabel katagorik. Contoh pertanyaan penelitian untuk kasus yang dapat dipecahkan oleh
uji kai kuadrat misalnya:
a. Apakah ada perbedaan kejadian hipertensi antara wanita dan pria. Kasus ii
berarti akan menguji hubungan variabel hipertensi (katagori dengan klasifikasi ya dan
tidak) dengan variabel jenis kelamin (katagori dengan klasisfikasi wanita dan pria)
b. Apakah ada perbedaan kejadian anemia antara ibu yang kondisi soseknya
tinggi, sedang dan rendah. Pada kasus ini akan menguji hubungan variabel anemia
katagori dengan klasifikasi ya dan tidak) dengan variabel Sosek (katagori dengan
klasifikasi rendah, sedang dan tinggi).
2. Prinsip dasar Uji Kai Kuadrat
Proses pengujian kai kuadrat adalah membandingkan frekuensi yang terjadi
(observasi) dengan frekuensi harapan (ekspektasi). Bila nilai frekuensi observasi dengan
nilai frekuensi harapan sama, maka dikatakan tidak ada perbedaan yang bermakna
(signifikan). Sebaliknya, bila niali frekuensi observasi dan nilai frekuensi harapan
berbeda, maka dikatakan ada perbedaan yang bermakna (signifikan).
Pembuktian dengan uji kai kuadrat dengan menggunakan formula:
df = (k-1)(n-1)
ket :
O = nilai observasi
E = nilai ekspektasi (harapan)
k = jumlah kolom
b = jumlah baris
50
(O – E)2
X2 = Σ E
Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan dalam
bentuk tabel silang:
Variabel 1 Variabel 2 Jumlah
Tinggi Rendah
Ya a b a+b
Tidak c d c+d
Jumlah a+c b+d n
a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan) masing-masing
sel dicari dengan rumus:
misalkan untuk mencari nilai ekspektasi (E) untuk sel a adalah:
Ea = (a+b) x (a+c)
n
Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama.
Khususnya untuk tabel 2x2, dapat mencari nilai X2 dengan menggunakan rumus:
Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang besar.
Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya digunakan uji kai
kuadrat yang sudah dikoreksi (Yate Corrected atau Yate’s Correction). Formula kai
kuadrat Yate’s Correction adalah sbb:
Atau
51
Total barisnya X total kolomnyaE = Jumlah keseluruhan data
N (ad-bc)2
X2 = (a+c)(b+d)(a+b)(c+d)
(|O – E| - 0,5)2
X2 = E
3. Keterbatasan Kai Kuadrat
Seperti kita ketahui, uji kai kuadrat menuntut frekuensi harapan/ekspektasi (E)
dalam masing-masing sel tidak boleh terlampau kecil. Jika frekuensi sangat kecil,
penggunaan uji ini mungkin kurang tepat. Oleh karena itu dalam penggunaan kai kuadrat
harus memperhatikan keterbatasanketerbatasan uji ini. Adapun keterbatasan uji kai
kuadrat adalah sbb:
a. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 1.
b. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 5, lebih
dari 20% dari jumlah sel.
Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat, peneliti harus
menggabungkan katagori-katagori yang berdekatan dalam rangka memperbesar frekuensi
harapan dari sel-sel tersebut (penggabungan ini dapat dilakukan untuk analisis tabel
silang lebih dari 2 x 2, misalnya 3 x 2, 3 x 4 dsb). Penggabungan ini tentunya diharapkan
tidak sampai membuat datanya kehilangan makna.
Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti tidak bisa
menggabung katagori-katagorinya lagi), maka dianjurkan menggunakan uji Fisher’s
Exact.
ODDS RATIO (OR) dan RISIKO RELATIF (RR)
Hasil uji Chi Square hanya dapat menyimpulkan ada tidaknya perbedaan proporsi
antar kelompok atau dengan kata lain kita hanya dapat menyimpulkan ada/tidaknya
hubungan du variabel katagorik. Dengan demikian uji Chi Square tidak dapat
menjelaskan derajat hubungan, dalam hal ini uji Chi Square tidak dapat mengetahui
kelompok mana yang memiliki risiko lebih besar disbanding kelompok lain.
Dalam bidang kesehatan untuk mengetahui derajat hubungan, dikenal ukuran
Risiko Relatif (RR) dan Odds Rasio (OR). Risiko relatif membandingkan risiko pada
kelompok terekspose dengan kelompok tidak terekspose. Sedangkan Odds Rasio
52
N {|ad-bc|2 – (N/2)]2
X2 = (a+c)(b+d)(a+b)(c+d)
membandingkan Odds pada kelompok ter-ekspose dengan Odds kelompok tidak ter-
eksp[ose. Ukuuran RR pada umumnya digunakan pada disain Kohort, sedangkan ukuran
OR biasanya digunakan pada desain kasus kontrol atau ptong lintang (Cross Sectional).
Pengkodean Variabel :
Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hati hati
jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada konsistensi
antara variabel independen dengan variabel dependen. Untuk variabel independen,
kelompok yang berisiko/expose diberi kode tinggi (kode 1) dan kode rendah (kode
0)untuk kelompok yang tidak berisiko/non expose. Pada variabel dependennya, kode
tinggi (kode 1) untuk kelompok kasus atau kelompok yang menjadi fokus pembahasan
penelitian dan kode rendah (kode 0) untuk kelompok non kasus atau yang bukan menjadi
fokus penelitian. Sebagai contoh data di atas pengkodeannya adalah sbb: Ibu tidak
bekerja diberi kode 1 dan bekerja kode 0 dan ibu yang menyusui secara eksklusif diberi
kode 1 dan non eksklusif diberi kode 0. Sebetulnya bisa juga kodenya dibalik, tapi harus
konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0, tdk
eksklusive =1.
Tabel …
Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pendidikan
PengetahuanTotal
Rendah Tinggi
N % n % n %
SD
SMP
SMU
PT
25
1610
5
50,0
40,033,3
20,0
25
2420
20
50,0
60,066,7
80,0
50
4030
25
34,4
27,6
20,7
17,3
Jumlah 56 38,7 89 61,3 145 100,0
Pembuatan persentase pada analisis tabel silang harus diperhatikan agar tidak
salah dalam menginterpretasi. Pada jenis penelitian survei/Cross sectional atau Kohort,
53
pembuatan persentasenya berdasarkan nilai variabel independen. Contoh di atas jenis
penelitiannya Cross Sectional, variabel pendidikan sebagai variabel independen dan
pengetahuan sebagai variabel dependen. Dapat dilihat di tabel persentasenya berdasarkan
masing-masing kelompok tingkat pendidikan (persentase baris). Contoh di atas dapat di
interpretasikan sbb:
Dari 50 pasien yang berpendidikan SD, ada sebanyak 25 (50,0%) pasien
mempunyai pengetahuan tinggi. Dari 40 pasien yang berpendidikan SMP, ada sebanyak
24 (60,0%) yang berpengetahuan tinggi. Dari 30 pasien yang berpendidikan SMU ada
sebanyak 20 (66,7%) yang berpengetahuan tinggi. Dan dari 25 pasien yang
berpendidikan PT, ada sebanyak 20 (80,0%) yang berpengetahuan tinggi. Dari data ini
terlihat ada kecenderungan bahwa semakin tinggi tingkat pendidikan akan semakin tinggi
tingkat pengetahuannya.
Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan persentasenya
berdasarkan variabel dependennya, misalkan terlihat pada tabel berikut:
Tabel …
Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin
Jenis
Kelamin
Kanker ParuTotal
Kasus Kontrol
N % n % n %
Laki-laki
Perempuan
75
25
75,0
25,0
30
70
30,0
70,0
105
95
52,5
47,5
Jumlah 100 50,0 100 50,0 200 100,0
Interpretasinya:
Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden berjenis
kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita kanker paru, ada
sebanyak (30%) responden yang berjenis kelamin laki-laki.
54
KASUS :
UJI KAI KUADRAT
Suatu penelitian ingin mengetahui hubngan pekerjaan dengan perilaku menyusui.
Variabel pekerjaan berisi dua nilai yaitu tidak bekerja dan bekerja, dan variabel menyusui
berisi dua nilai yaitu eksklusif dan non eksklusif. Untuk mengerjakan soal ini gunakan
data “Susu. SAV”.
Adapun prosedur di SPSS sbb:
1. Pastikan anda berada pada data editor ASI.SAV
2. Dari menu SPSS, klik “Analyze”, kemudian pilih “Descriptive statistic”, lalu pilih
“Crosstab”, sesaat akan muncul menu Crosstabs
3. Dari menu crosstab, ada dua kotak yang harus diisi, pada kotak “Row(s)’ diisi
variabel independen (variabel bebas), dalam contoh ini variabel pekerjaan masuk ke
kotak “Row(s)”.
4. pada kotak “Column(s)” diisi variabel dependennya, dalam contoh ini variabel
perilaku menyusui masuk ke kotak “Column(s)”.
55
5. Klik option “Statistics..”, klik pilihan “Chi Square” dan klik pilihan “Risk”
6. Klik “Continue”
7. Klik option “Cells”, bawa bagian “Percentages” dan klik “Row”
8. Klik “Continue”
9. Klik “OK” hasilnya tampak sbb:
56
Crosstabs
status pekerjaan ibu * status menyusui asi Crosstabulation
status menyusui asiTotal
tdkEKSKLUSIVE EKSKLUSIVE
status pekerjaanibu
KERJA Count% within statuspekerjaan ibu
17
68.0%
8
32.0%
25
100.0%
tidak kerja Count% within statuspekerjaan ibu
7
28.0%
18
72.0%
25
100.0%
Total Count% within statuspekerjaan ibu
24
48.0%
26
52.0%
50
100.0%
Chi-Square Tests
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Pearson Chi-SquareContinuity Correctiona
Likelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases
8.013b
6.4908.244
7.853
50
111
1
.005
.011
.004
.005.010 .005
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 12.
00.
57
Risk Estimate
Value95% Confidence
IntervalLower Upper
Odds Ratio for statuspekerjaan ibu (TIDAKKERJA / KERJA)For cohort statusmenyusui asi = YAEKSKLUSIVEFor cohort statusmenyusui asi =TIDAK EKSKLUSN of Valid Cases
5.464
2.250
.412
50
1.627
1.209
.208
18.357
4.189
.816
Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola menyusui,
dengan angka di masing-masing selnya. Angka yang paling atas adalah jumlah kasus
masing-masing sel, angka kedua adalah persentase menurut baris (data yang kita analisis
“ASI.SAV, berasal dari penelitian Cross Sectional sehingga persen yang ditampilkan
adalah persentase baris, namun bila jenis penelitiannya Case Control angka persentase
yang digunakan adalah persentase kolom.
Dari analisis data di atas maka interpretasinya:
Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara eksklusif.
Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui secara eksklusif.
Hasil uji Chi Square dapat dilihat pada kotak “Chi Square Test”. Dari print out muncul
dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan, “Angka yang mana
yang kita pakai?”, apakah Pearson, Continuity Correction, Likelihood atau Fisher?”
Aturan yang berlaku pada Chi Square adalah sbb:
a. Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka yang
digunakan adalah “Fisher’s Exact Test”
b. Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai sebaiknya
“Continuity Correction (a)”
c. Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka digunakan uji
“Pearson Chi Square”
58
d. Uji “Likelihood Ratio” dan “Linear-by-Linear Assciation”, biasanya digunakan
untuk keperluan lebih spesifik, misalnya analisis stratifikasi pada bidang
epidemiologi dan juga untuk mengetahui hubungan linier dua variable katagorik,
sehingga kedua jenis ini jarang digunakan.
Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b dibawah
kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti pada tabel silang
diatas tidak ditemukan ada nilai E < 5
Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan koreksi
(Continuity Correction) dengan p value dapat dilihat pada kolom “Asymp. Sig” dan
terlihat p valuenya = 0,011. berarti kesimpulannya ada perbedaan perilaku menyusui
eksklusif antara ibu yang bekerja dengan ibu yang tidak bekerja. Dengan kata lain dapat
disimpulkan bahwa ada hubungan status pekerjaan dengan perilaku menyusui eksklusif.
Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya hubungan
dua variabel, sehingga uji ini tidak dapat untuk mengetahui derajat/kekuatan hubungan
dua variabel. Untuk mengetahui besar/kekuatan hubungan banyak metodenya tergantung
latar belakangdisiplin keilmuannya, misal untuk ilmu sosial dengan melihat koefisien Phi,
koefisien Contingency dan cramer’s V. sedangkan untuk bidang kesehatan terutama
kesehatan masyarakat digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis
penelitian Cross Sectional dan Case Control, sedangkan nilai RR digunakan bila jenis
penelitiannya Kohort.
Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464 (95% CI:
1,627 – 18,357). Sedangkan nilai RR terlihat dari baris For Cohort yaitu bearnya 2,250
(95% CI: 1,209 – 4,189). Pada data ini berasal dari penelitian Cross Sectional maka kita
dapat menginterpretasikan nialai OR=5,464 sbb: Ibu yang tidak bekerja mempunyai
peluang 5,46 kali untuk menyusui eksklusif dibandingkan ibu yang bekerja.. Pada
perintah Crosstab nilai OR akan keluar bila tabel silang 2 x 2, bila tabel silang lebih dari
2 x 2, misalnya 3 x 2, 4 x 2 dsb, maka nilai OR dapat diperoleh dengan analisis regresi
logistik sederhana dengan cara membuat “Dummy variable”
59
Penyajian dan Interpretasi di Laporan Penelitian:
Tabel …
Distribusi Responden Menurut Jenis Pekerjaan dan Perilaku menyusui
Jenis
Pekerjaan
Menyusui TotalOR
(95% CI)
P
valueTdk Eksklusif Eksklusif
n % n % n %
Bekerja
Tdk Bekerja
17
7
68,0
28,0
8
18
32,0
72,0
25
25
100
100
5,464
1,6 – 18,3
0,011
Jumlah 26 52,0 24 48,0 50 100
Hasil analisis hubungan antara status pekerjaan dengan perilaku menyusui eksklusif
diperoleh bahwa ada sebanyak 8 (32%) ibu yang bekerja menyusui bayi secara eksklusif.
Sedangkan diantara ibu yang tidak bekerja, ada 18 (72,0%) yang menyusui secara
eksklusif. Hasil uji statistik diperoleh nilai p=0,011 maka dapat disimpulkan ada
perbedaan proporsi kejadian menyusui eksklusif antara ibu tidak bekerja dengan ibu yang
bekerja (ada hubungan yang signifikan antara pekerjaan dengan perilaku menyusui). Dari
hasil analisis diperoleh pula nilai OR=5,464, artinya ibu tidak bekerja mempunyai
peluang 5,46 kali untuk menyusui eksklusif dibanding ibu yang bekerja.
60
ANALISIS HUBUNGAN
NUMERIK DENGAN NUMERIK
UJI KORELASI DAN REGRESI LINIER SEDERHANA
Seringkali dalam suatu penelitian kita ingin mengetahui hubungan antara dua
variabel yang berjenis numerik, misalnya huubungan berat badan dengan tekanan darah,
hubungan umur dengan kadar Hb, dsb. Hubungan antara dua variabel numerik dapat
dihasilkan dua jenis, yaitu derajat/keeratan hubungan, digunakan korelasi. Sedangkan bila
ingin mengetahui bentuk hubungan antara dua variabel digunakan analisis regresi linier.
1. Korelasi
Korelasi di samping dapat untuk mengetahui derajat/keeratan hubungan, korelasi
dapat juga untuk mengetahui arah hubungan dua variabel numerik. Misalnya, apakah
huubungan berat badan dan tekanan darah mempunyai derajat yang kuat atau lemah, dan
juga apakah kedua variabel tersebut berpola positif atau negatif.
Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari
diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik yang menunjukkan titik-
titik perpotongan nilai data dari dua variabel (X dan Y). Pada umumnya dalam grafik,
variabel independen (X) diletakkan pada garis horizontal sedangkan variabel dependen
(Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara dua
variabel X dan Y. selain memberi informasi pola hubungan dari kedua variabel diagram
tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel tersebut.
61
disimbolkan dengan r (huruf r kecil).
Koefisien korelasi (r) dapat diperoleh dari formula berikut:
Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya antara –1 s.d.
+1.
r = 0 → tidak ada hubungan linier
r = -1 → hubungan linier negatif sempurna
r = +1 → hubungan linier positif sempurna
Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan positif
terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya semakin
bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya.
Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel diikuti penurunan
variabel yang lain, misalnya semakin bertambah umur (semakin tua) semakin rendah
kadar Hb-nya.
Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat dibagi dalam 4
area, yaitu:
62
N (Σ XY) – (ΣX ΣY)r = [NΣX2 – (ΣX)2] [NΣY – (ΣY)2
r = 0,00 – 0,25 → tidak ada hubungan/hubungan lemah
r = 0,00 – 0,25 → hubungan sedang
r = 0,00 – 0,25 → hubungan kuat
r = 0,00 – 0,25 → hubungan sangat kuat / sempurna
Uji Hipotesis
Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk
menjelaskan derajat hubungan derajat hubungan linier anatara dua variabel. Selanjutnya
perlu dilakukan uji hipotesis untuk mengetahui apakah hubungan antara dua
variabelteradi secara signifikan atau hanya karena faktor kebetulan dari random sample
(by chance). Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama:
membandingkan nilai r hitung dengan r tabel, kedua: menggunakan pengujian dengan
pendekatan distribusi t. Pada modul ini kita gunakan pendekatan distribusi t, dengan
formula:
df = n – 2
n = jumlah sampel
2. Regresi Linier Sederhana
Seperti sudah diuraikan di depan bahwa analisis hubungan dua variabel dapat
digunakan untuk mengetahui bentuk hubungan dua variabel, yaitu dengan analisis
regresi.
Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk
mengetahui bentuk hubungan antar dua atau lebih variabel. Tujuan analisis regresi adalah
untuk membuat perkiraan (prediksi) nilai suatu variabel (variabel dependen) melalui
variabel yang lain (variabel independen).
Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat badan dan
tekanan darah. Dalam kasus ini berarti berat badan sebagai variabel independen dan
tekanan darah sebagai variabel dependen, sehingga dengan regresi kita dapat
memperkirakan besarnya nilai tekanan darah bila diketahui data berat badan.
63
n – 2t = r 1 – r2
Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh
dengan berbagai cara/metode. Salah satu cara yang sering digunakan oleh peneliti adalah
dengan menggunakan metode kuadrat terkecil (least square). Metode least square
merupakan suatu metode pembuatan garis regresi dengan cara meminimalkan jumlah
kuadrat jarak antara nilai Y yang teramati dan Y yang diramalkan oleh garis regresi itu.
Secara matematis persamaan garis sbb:
Persamaan di atas merupakan model deterministik yang secara sempurna/tepat dapat
digunakan hanya untuk peristiwa alam, misalnya hukum gravitasi bumi, yang ditemukan
oleh Issac Newton adalah contoh model deterministik. Variabel kecepatan benda jatuh
(variabel dependen) pada keadaan yang ideal adalah fungsi matematik sempurna (bebas
dari kesalahan) dari variabel independen berat beda dan gaya gravitasi.
Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius dapat dibuat
persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat dihitung/diprediksi secara
sempurna/tepat (bebas kesalahan) bila suhu celsius (X) diketahui.
Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada kemungkinan
kesalahan/penyimpangan (tidak eksak), aretinya untuk beberapa nilai X yang sama
kemungkinan diperoleh nilai Y yang berbeda. Misalnya hubungan berat badan dengan
tekanan darah, tidak setiap orang yang berat badannya sama memiliki tekanan darah yang
sama. Oleh karena hubungan X
dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka persamaan garis yang
dibentuk menjadi:
Y = Variabel Dependen
X = Variabel Independen
a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X
berubah satu unit pengukuran
e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati
64
Y = a + bx
Y = a + bx + e
dengan nilai Y yang sesungguhnya pada titik X tertentu
Kesalahan Standar Estimasi (Standard Error of Estimate/Se)
Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan estimasi
untuk menjelaskan nilai variabel dependen yang sesungguhnya. Semakin kecil nilai Se,
makin tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan niali
variabel dependen yang sesungguhnya. Dansebaliknya, semakin besar nilai Se, makin
rendah ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel
dependen yang sesungguhnya. Untuk mengetahhui besarnya Se dapat dihitung melalui
formula sbb:
Koefisien Determinasi (R2)
Ukuran yang penting dan sering digunakan dalam analisisregresi adalah koefisien
determinasi atau disimbolkan R2 (R Square). Koefisien determinasi dapat dihitung
dengan mengkuadratkan nilai r, atau dengan formula R2 = r2. Koeifisien determinasi
berguna untuk mengetahui seberapa besar variasi variabel dependen (Y) dapat dijelaskan
oleh variabel independen (X). atau dengan kata lain R2 menunjukkan seberapa jauh
65
ΣXY – (ΣXΣY)/nb = ΣX2 – (ΣX)2/n
a = Y - bX
Se = ΣY2 - aΣY - bΣXY n-2
variabel independen dapat memprediksi variabel dependen.Semakin besar nilai R square
semakin baik/semakin tepat variabel independen memprediksi variabel dependen.
Besarnya nilai R square antara 0 s.d. 1 atau antara 0% s.d. 100%.
KASUS :
KORELASI DAN REGRESI
Sebagai contoh kita akan melakukan analisis korelasi dan regresi menggunakan
data ‘ASI.SAV’ dengan mengambil variabel yang bersifat numerik yaitu umur dengan
kadar Hb (diambil Hb pengukuran pertama: Hb1).
A. Korelasi
Untuk mengeluarkan uji korelasi langkahnya adalah sbb:
1. Aktifkan data ‘ASI.SAV’
2. Dari menu utama SPSS, klik ‘Analyze’, kemudian pilih ‘Correlate’, dan
lalu pilih ‘Bivariate’, dan muncullah menu Bivariate Correlations:
3. Sorot variabel ‘Umur dan Hb1, lalu masukkan ke kotak sebelah kanan
‘variables’.
4. Klik ‘OK” dan terlihat hasilnya sbb:
66
Correlations
Correlations
beratbadan ibu
beratbadan bayi
berat badan ibu Pearson CorrelationSig. (2-tailed)N
1
50
.684**.000
50berat badan bayi Pearson Correlation
Sig. (2-tailed)N
.684**.000
50
1
50**. Correlation is significant at the 0.01 level (2-tailed).
Tampilan analisis korelasi berupa matrik antar variabel yang di korelasi,
informasi yang muncul terdapat tiga baris, baris pertama berisi nilai korelasi (r), baris
kedua menapilkan nilai p (P value), dan baris ketiga menampilkan N (jumlah data). Pada
hasil di atas diperoleh nilai r = 0,684 dan nilai p = 0,0005. Kesimpulan dari hasil tersebut:
hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan yang kuat
dan berpola positif artinya semakin bertambah berat badannya semakin tinggi berat
bayinya. Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan
ibu dengan berat badan bayi (p = 0,0005).
B. Regresi Linier Sederhana
Berikut akan dilakukan analisis regresi linier dengan menggunakan variabel ‘berat
badan ibu’ dan ‘berat badan bayi’ dari data ASI.SAV. dalam analisis regresi kita harus
menentukan variabel dependen dan variabel independennya. Dalam kasus ini berarti berat
badan ibu sebagai variabel independen dan berat badan bayi sebagai variabel dependen.
Adapun caranya:
1. Pastikan tampilan berada pada data editor ASI.SAV, jika belum aktifkan data
tersebut.
2. Dari menu SPSS, Klik ‘Analysis’, pilih ‘Regression’, pilih ‘Linear’
3. Pada tampilan di atas ada beberpa kotak yang harus diisi. Pada kotak ‘Dependen’
isikan variabel yang kita perlakukan sebagai dependen (dalam contoh ini berarti berat
67
badan bayi) dan pada kotak Independent isikan variabel independennya (dalam
contoh ini berarti berat badan ibu), caranya
4. klik ‘berat badan bayi’, masukkan ke kotak Dependent
5. Klik ‘berat badan ibu’, masukkan ke kotak Independent
6. Klik ‘OK’, dan hasilnya sbb:
Regression
Model Summary
Model R R Square AdjustedR Square
Std. Error ofthe Estimate
1 .684a .468 .456 430.715
a. Predictors: (Constant), berat badan ibu
68
ANOVAb
Model Sum of
Squares
df Mean
Square
F Sig.
1 Regression
Residual
Total
7820262
8904738
16725000
1
48
49
7820261.965
185515.376
42.154 .000a
a. Predictors: (Constant), berat badan ibu
b. Dependent Variable: berat badan bayi’
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t Sig.
B Std. Error Beta1 (Constant)
berat badan ibu657.92944.383
391.6766.836 .684
1.6806.493
.099
.000a. Dependent Variable: berat badan bayi
Dari hasil di atas dapat diinterpretasikan dengan mengkaji nilai-nilai yang penting dalam
regresi linier diantaranya: koefisien determinasi, persamaan garis dan p value. Nilai
koefisien determinasi dapat dilihat dari nilai R Square (anda dapat lihat pada tabel
‘Model Summary’) yaitu besarnya 0,468 artinya, persamaan garis regresi yang kita
peroleh dapat menerangkan 46,8% variasi berat badan bayi atau persamaan garis yang
diperoleh cukup baik untuk menjelaskan variabel berat badan bayi. Selanjutnya pada
tabel ANOVAb, diperoleh nilai p (di kolom Sig) sebesar 0,0005, berarti pada alpha 5%
kita dapat menyimpulkan bahwa regresi sederhana cocok (fit) dengan data yang ada
persamaan garis regresi dapat dilihat pada tabel ‘Coefficienta’ yaitu pada kolom B. Dari
hasil diatas didapat nilai konstant (nilai ini merupakan nilai intercept atau nilai a) sebesar
657,93 dan nilai b = 44,38, sehingga persamaan regresinya:
Y = a + bX
Berat badan bayi = 657,93 + 44,38(berat badan ibu)
69
Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu nilai berat
badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada kolom Sig T, dan
menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak hipotesis nol, berarti ada
hubngan linier antara berat badan ibu dengan berat badan bayi. Dari nilai b=44,38 berarti
bahwa variabel berat badan bayi akan bertambah sebesar 44,38 gr bila berat badan ibu
bertambah setiap satu kilogram.
Penyajian dan Interpretasi
Tabel …
Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi
Variabel R R2 Persamaan garis P value
Umur 0,684 0,468 bbayi =657,93 + 44,38 *bbibu 0,0005
Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan kuat
(r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu semakin besar
berat badan bayinya. Nilai koefisien dengan determinasi 0,468 artinya, persamaan garis
regresi yang kita peroleh dapat menerangkan 46,8,6% variasi berat badan bayi atau
persamaan garis yang diperoleh cukup baik untuk menjelaskan variabel berat badan bayi.
Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan ibu dengan
berat badan bayi (p=0,005).
Memprediksi variabel Dependen
Dari persamaan garis yang didapat tersebut kita dapat memprediksi variabel dependen
(berat badan bayi) dengan variabel independen (berat badan ibu). Misalkan kita ingin
mengetahui berat badan bayi jika diketahui berat badan ibu sebesar 60 kg, maka:
Berat badan bayi =657,93 + 44,38(berat badan ibu)
Berat badan bayi= 657,93 + 44,38(60)
Berat badan bayi = 3320,73
70
Ingat prediksi regresi tidak dapat menghasilkan angka yang tepat seperti diatas, namun
perkiraannya tergantung dari nilai ‘Std, Error of The estimate’(SEE) yang besarnya
adalah 430,715 (lihat di kotak Model Summary). Dengan demikian variasi variabel
dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan tingkat kepercyaan 95% dan
didapat nilai Z = 1,96, sehingga variasinya 1,96 * 430,715 = ± 844,201
Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg diprediksikan berat
badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr
C. Membuat Grafik Prediksi
Langkahnya:
1. Klik ‘Graphs, pilih ‘Scatter’
2. Klik Sampel klik ‘Define’
3. Pada kotak Y Axis isikan variabel dependennya (masukkan veriabel dependennya
(masukkan Hb1)
4. Pada kotak X Axis isikan variabel independennya (masukkan veriabel
dependennya (masukkan Umur)
5. Klik ‘OK’
6. Terlihat di layar grafik scatter plot-nya (garis regresi belum ada?)
7. Untuk mengeluarkan garisnya, klik grafiknya 2 kali
8. klik’Chart’
9. pada kotak ‘Fit Line, Klik Total
10. klik ‘OK’ maka muncul garis regresi
71