Pengantar Analisis Data Edit Ok s2 Kesmas

107
1 MODUL ANALISA DATA

description

i

Transcript of Pengantar Analisis Data Edit Ok s2 Kesmas

Page 1: Pengantar Analisis Data Edit Ok s2 Kesmas

PROGRAM STUDI S2 KESEHATAN MASYARAKATPASCA SARJANA UNIVERSITAS ANDALAS

1

MODUL ANALISA DATA

Page 2: Pengantar Analisis Data Edit Ok s2 Kesmas

PENGANTAR ANALISIS DATA

1. Pendahuluan

Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya adalah

menganalisis data. Data mentah (raw data) yang sudah susah payah kita kumpulkan tidak

akan ada artinya jika tidak dianalisis. Analisis data merupakan kegiatan yang sangat

penting dalam suatu penelitian, karena dengan analisislah data dapat mempunyai

arti/makna yang dapat berguna untuk memecahkan masalah penelitian.

Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu

dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat langsung

memberi jawaban penelitian, untuk itu perlu diketahui bagaimana menginterpretasi hasil

penelitian tersebut. Menginterpretasi berarti kita menjelaskan hasil analisis guna

memperoleh makna/arti.

Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas. Interpretasi

dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya sebatas pada

masalah penelitian yang diteliti berdasarkan data yang dikumpulkan dan diolah untuk

keperluan penelitian tersebut. Sedangkan interpretasi dalam arti luas (analitik) yaitu

interpretasi guna mencari makna data hasil penelitian dengan jalan tidak hanya

menjelaskan/menganalisis data hasil penelitian tersebut, tetapi juga melakukan inferensi

(generalisasi) dari data yang diperoleh dengan teori-teori yang relevan dengan hasil-hasil

penelitian tersebut.

Pada umumnya analisis data bertujuan untuk:

a. Memperoleh gambaran/deskripsi masing-masing variabel

b. Membandingkan dan menguji teori atau konsep dengan informasi yang ditemukan

c. Menemukan adanya konsepbaru dari data yang dikumpulkan

d. Mencari penjelasan apakah konsep baru yang diuji berlaku umum atau hanya

berlaku pada kondisi tertentu

Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari:

a. Jenis penelitian

b. Jenis sampel

2

Page 3: Pengantar Analisis Data Edit Ok s2 Kesmas

c. Jenis data/variabel

d. Asumsi kenormalan distribusi data

a. Jenis Penelitian

Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat

masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan survei.

Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan kuantitatif. Namun

bila kita menginginkan untuk mendapatkan pendapat/gambaran yang mendalam tentang

suatu fenomena, maka data dapat dikumpulkan dengan fokus grup diskusi atau observasi,

maka analisisnya menggunakan pendekatan analisis kualitatif.

b. Jenis Sampel

Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah kedua

sampel independen atau dependen. Misalnya pada penelitian survei yang tidak

menggunakan sampel yang sama, dapat digunakan uji statistik yang mengasumsikan

sampel yang independen. Misalkan survei untuk mengetahui apakah ada perbedaan berat

badan bayi antara bayi-bayi yang dilahirkan dari ibu perokok dengan bayi-bayi dari ibu

yang tidak merokok. Disini berarti kelompok ibu perokok dan kelompok ibu bukan

perokok bersifat independen.

Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum dan

sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang digunakan

adalah uji statistik untuk data yang dependen. Misalnya, suatu penelitian ingin

mengetahui pengaruh penelitian manajemen terhadap kinerja petugas kesehatan.

Pertanyaan penelitiannya “Apakah ada perbedaan kinerja petugas kesehatan antara

sebelum dan sesudah mendapatkan pelatihan manajemen?”. Dalam penelitian ini sampel

kelompok petugas kesehatan bersifat dependen, karena pada kelompok (orang) yang

sama diukur dua kali yaitu pada saat sebelum pelatihan (pre test) dan sesudah dilakukan

pelatihan (Post Test).

c. Jenis Data/Variabel

3

Page 4: Pengantar Analisis Data Edit Ok s2 Kesmas

Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik.

Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai contoh,

nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk menjelaskan data

berjenis katagorik, sedangkan untuk data jenis numerik biasanya dapat menggunakan

nilai rata-rata untuk menjelaskan karakteristiknya. Untuk analisis hubungan dua variabel

(analsis bivariat), uji kai kuadrat hanya dapat dipakai untuk mengetahui hubungan data

katagori dengan data katagori. Sebaliknya untuk mengetahui hubungan numerik dengan

numerik digunakan uji korelasi/regresi.

d. Asumsi Kenormalan

Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi

datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan prosedur uji

statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat dipenuhi maka dapat

digunakan uji statistik parametrik.

Berikut ini akan dijelaskan langkah-langkah analisis (pendekatan kuantitatif):

1. Analisis Deskriptif (Univariat)

Tujuan dari analisis ini adalah untuk menjelaskan/mendiskripsikan karakteristik

masing-masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk

data numerik digunakan nilai mean (rata-rata), median, standard deviasi dan inter

kuartil range, minimal maksimal.

2. Analisis Analitik (Bivariat)

Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis lebih

lanjut. Apabila diinginkan analisis hubungan antar dua variabel, maka analisis

dilanjutkan pada tingkat bivariat. Misalnya ingin diketahui hubungan antara berat

badan dengan tekanan darah. Untuk mengetahui hubungan dua variabel tersebut

biasanya digunakan pengujian statistik. Jenis uji statistik yang digunakan sangat

tergantung jenis data/variabel yang dihubungkan.

3. Analisis Multivariat

Merupakan analisis yang menghubungkan antara beberapa variabel independen

dengan satu variabel dependen.

4

Page 5: Pengantar Analisis Data Edit Ok s2 Kesmas

Secara lebih khusus/detail analisis univariat, bivariat dan multivariat akan

dipelajari pada bab tersendiri.

5

Page 6: Pengantar Analisis Data Edit Ok s2 Kesmas

ANALISIS UNIVARIAT

( DESKTIPTIF)

Tujuan dari analisis ini adalah untuk menjelaskan/mendeskriptifkan karakteristik

masing-masing variabel yang diteliti. Dalam analisis data kuantitatif kita dihadapkan

pada kumpulan data yang besar/banyak yang belum jelas maknanya. Fungsi analisis

sebetulnya adalah menyederhanakan atau meringkas kumpulan data hasil pengukuran

sedemikian rupa sehingga kumpulan data tersebut berubah menjadi informasi yang

berguna. Peringkasan tersebut berupa ukuran-ukuran statistik, tabel dan juga grafik.

Secara teknis pada dasarnya analisis merupakan kegiatan meringkas kumpulan

data menjadi ukuran tengah dan ukuran variasi. Selanjutnya membandingkan gambaran-

gambaran tersebut antara satu kelompok subyek dan kelompok subyek lain, sesuai

dengan tujuan yang ingin dicapai dalam analisis.

Berbicara peringkasan data (yang berwujud ukuran tengah dan ukuran variasi)

jenis data (apakah numerik atau katagorik) akan sangat menentukan bentuk peringkasan

datanya. Berikut akan diuraikan bentuk/cara peringkasan data untuk data numerik dan

data katagorik.

1. Peringkasan Data Untuk Data Jenis Numerik

a. Ukuran Tengah

Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil pengukuran.

Berbagai ukuran dikembangkan utnuk mencerminkan ukuran tengah tersebut, dan yang

paling sering dipakai adalah mean, median dan mode/modus.

1). Mean

Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah semua nilai

pengukuran dibagioleh banyaknya pengukuran. Secara sederhana perhitungan nilai

mean dapat dituliskan dengan rumus :

6

X = Σ Xi / n

Page 7: Pengantar Analisis Data Edit Ok s2 Kesmas

Keuntungan nilai mean adalah mudah menghitungnyadan sudah melibatkan seluruh

data dalam penghitungannya. Namun kelemahan dari nilai mean adalah sangat

dipengaruhi oleh nilai ekstrim, baik ekstrim tinggi maupun rendah. Oleh karena itu

pada kelompok data yang ada nilai ekstrimnya (sering dikenal dengan ‘distribusi data

yang menceng/miring’), Mean tidak dapat mewakili rata-rata kumpulan nilai

pengamatan. Sebagai contoh data yang ada nilai ekstrimnya adalah data penghasilan.

Apabila mean pendapatan perbulan adalah Rp 10.000.000,- , sebenarnya sebagian

besar orang pendapatannya di bawah Rp 10.000.000,- . Mean sebesar Rp 10.000.000,-

diperoleh karena tarikan sekelompok kecil orang (misalnya konglomerat) yang

pendapatannya sangat tinggi. Dengan demikian penggunaan mean untuk data yang

ada nilai ekstrimnya (data yang distribusinya menceng) kurang tepat.

Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90 hr.

Mean = (1+3+4+2+90)/5 = 20 hr.

Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil ini

tentunya tidak dapat mewakili karena secara visual datanya sebagian besar kurang

dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di atas ada nilai

ekstrimnya.

2). Median

Median adalah nilai dimana setengah banyaknya pengamatan mempunyai nilai di

bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda dengan nilai

mean, penghitungan median hanya mempertimbangkan urutan nilai dasil pengukuran,

besar beda antar nilai di abaikan. Karena mengabaikan besar beda, maka median tidak

dipengaruhi oleh nilai ekstrim.

Prosedur penghitungan median melalui langkah

a). Data diurutkan/di-array dari nilai kecil ke besar

b). Hitung posisi median dengan rumus (n+1)/2

c). Hitung nilai mediannya

Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th

Data diurutkan: 20, 24, 26, 30, 36, 40

Posisi = (6+1)/2 = 3,5

7

Page 8: Pengantar Analisis Data Edit Ok s2 Kesmas

Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28

Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa berumur di atas

28 tahun

3). Mode/Modus

Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak.

Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.

Dari data tersebut berarti mode-nya adalah 20 tahun

Bentuk Distribusi Data

Hubungan nilai mean, median dan mode akan menentukan bentuk distribusi data:

- Bila nilai mean, median dan mode sama, maka bentuk

distribusi datanya normal

- Bila nilai mean > median > mode, maka bentuk

distribusi datanya menceng/miring ke kanan

- Bila nilai mean < median < mode, maka bentuk

distribusi datanya menceng/miring ke kiri

b. Ukuran Variasi

Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain atau

dengan kata lain hasil pengamatan akan bervariasi. Untuk mengetahui seberapa jauh data

bervariasi digunakan ukuran variasi antara lain range, jarak linier kuartil dan standard

deviasi.

1). Range

Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai terbesar

dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai ekstrim. Keuntungan

penghitungan dapat dilakukan dengan cepat.

2). Jarak Inter Quartil

Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian ditentukan

kuartil bawah dan atas. Kuartil merupakan pembagian data menjadi 4 bagian yang

dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil II dan kuartil III.

Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di atasnya.

8

Page 9: Pengantar Analisis Data Edit Ok s2 Kesmas

Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data berada di

atasnya.

Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya.

Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih baik

dari range, terutama kalau frekuensi pengamatan banyak dan distribusi sangat

menyebar.

3). Standard Deviasi

Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai pengamatan

terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi terhadap mean disebut

varian, yang rumusnya;

Semakin besar nilai varian akan semakin bervariasi, karena satuan varian (kuadrat)

yang tidak sama dengan satuan nilai pengamatan, maka dikembangkan suatu ukuran

variasi yang mempunyai satuan yang sama dengan satuan pengamatan, yaitu Standard

Deviasi.

Standard Deviasi merupakan akar dari varian:

Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila tidak ada

variasi, maka SD=0

Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan nilai mean

(rata-rata), median, standard deviasi dan inter quartil range, minimal dan maksimal. Bila

data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal), maka

perhituungan nilai mean dan standard deviasi merupakan cara analisis univariat yang

tepat. Seddangkan bila dijumpai nilai ekstrim 9 distribusi data tidak normal), maka nilai

nedian dan inter quartil range (IQR) yang lebih tepat dibandingkan nilai mean.

9

Varian = Σ(Xi – X)2

n

Standar deviasi (S atau SD) = Σ(Xi – X)2

n

Page 10: Pengantar Analisis Data Edit Ok s2 Kesmas

2. Peringkasan Data Katagorik

Berbeda dengan data numerik, peringkasan, (baik ukuran tengah maupun ukuran

variasi) tidak beragam jenisnya. Pada data katagorik peringkasan data hanya

menggunakan distribusi frekuensi dengan ukuran persentase atau proporsi. Bila data

berjenis katagorik, tentunya informasi/peringkasan yang penting disampaikan tidak

mungkin/tidak lazim menggunakan ukuran mean atau median. melainkan informasi

jumlah dan persentase yang disajikan. Untuk ukuran variasi, pada data katagorik variasi

maksimal apabila jumlah antar katagori sama.

Contoh: Kelas A: mahasiswa 50 dan mahasiswi 50

Kelas B: mahasiswa 90 dan mahasiswi 10

Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50% pria dan 50%

wanita.

Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria) karena pria

90% dan wanita hanya 10%.

3. Bentuk Penyajian Data

Bentuk penyajian analisis univariat dapat berupa tabel atau grafik. Namun perlu

diingat bahwa kita dianjurkan hanya memilih salah satu, tidak diperkenankan secara

sekaligus menggunakan tabel dan juga grafik dalam menyampaikan informasi suatu

data/variabel.

Contoh penyajian analisis deskriptif:

a. Data numerik

Tabel 1

Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999

Variabel Mean

Median

SD Minimal- Maksimal

1. Umur 30,3

31,1

10,1 17 – 60

2. Lama hari rawat 10,1 8,9 2 – 60

10

Page 11: Pengantar Analisis Data Edit Ok s2 Kesmas

7,0

b. Data katagorik

Tabel 2

Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X

tahun 1999

Pendidikan Jumlah Persentase

SD 60 60,0

SMP 30 30,0

SMU 10 10,0

Total 100 100,0

Bagaimana menginterpretasi tabel di atas?

“dilihat konsentrasi/jumlah yang terbesar data pada kelompok mana?”

Selain untuk mendeskripsikan masing-masing variabel, analisis univariat dapat

juga sekaligus untuk mengeksplorasi variabel yang dapat berguna dalam mendiagnosis

asumsi statistik lanjut (terutama untuk variabel jenis numerik), misalnya apakah

variannya homogen atau heterogen, apakah distribusinya normal atau tidak. Eksplorasi

data juga dapat untuk mendeteksi adanya nilai ekstrim/outlier, bila ada nilai ekstrim

sangat menentukan analisis selanjutnya (bivariat) apakah nilainya akan berkurang.

11

Page 12: Pengantar Analisis Data Edit Ok s2 Kesmas

KASUS :

ANALISIS DESKRIPTIF (UNIVARIAT)

Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masing-masing

variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk data numerik

digunakan nialai mean (rata-rata), median, standard deviasi dll. Sedangkan untuk data

katagorik tentunya hanya dapat menjelaskan angka/nilai jumlah dan persentase masing-

masing kelompok. Berikut akan dipelajari cara mengeluarkan analisis deskriptif di

SPAA, dimulai untuk variabel katagorik (sebagai latihan digunakan variabel

‘pendidikan’) dan kemudian dilanjutkan variabel numerik (variabel umur).

a. Data Katagorik

Untuk menampilkan tabulasi data katagorik digunakan tampilan frekuensi.

Sebagai contoh kita akan menampilkan tabel distribusi frekuensi untuk variabel

pendidikan dari file ‘ASI.SAV’.

1. Dari menu utama SPSS pilih ‘Analyze’, kemudian ‘Descriptive Statistic’

dan pilih ‘Frequencies’, sehingga muncul tampilan:

2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak “Variable

(s)”

12

Page 13: Pengantar Analisis Data Edit Ok s2 Kesmas

3. Klik ‘OK’, hasil dapat dilihat di jendela output, seperti sbb:

Frequencies

Statistics

pendidikan formal ibu menyusui

N Valid

Missing

50

0

pendidikan formal ibu menyusui

Frequency Percent Valid PercentCumulative

Percent

Valid 1 10 20.0 20.0 20.0

2 11 22.0 22.0 42.0

3 16 32.0 32.0 74.0

4 13 26.0 26.0 100.0

Total 50 100.0 100.0

Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai. Pada contoh di

atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang berpendidikan SD,

proporsi dapat dilihat pada kolom ‘Percent’, pada contoh di atas ada 20% ibu yang

berpendidikan SD. Kolom ‘Valid Percent’ memberi hasil yang sama karena pada data ini

13

Page 14: Pengantar Analisis Data Edit Ok s2 Kesmas

tidak ada ’missing cases’. ‘Cumulative Percent’ menjelaskan tentang persent kumulatif.

Pada contoh di atas ada 42,0% ibu yang tingkat pendidikannya SD dan SMP. Dalam

menginterpretasikan tabel katagorik dapat dilihat dari variasi dan konsentrasi datanya.

Penyajian dan Interpretasi di Laporan Penelitian

Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan

penelitian/laporan tesis. Adapun penyajian dan interpretasinya sbb:

Tabel …

Distribusi Responden Menurut Tingkat Pendidikan

Di ………… X tahun ….

Pendidikan Jumlah Persentase

SD 10 20,0

SMP 11 22,0

SMU 16 32,0

PT 13 26,0

Total 50 100,0

Distribusi tingkat pendidikan responden hampir merata untuk masing-masing tingkat

pendidikan. Paling banyak responden berpendidikan SMU yaitu 16 orang (32,0%)

sedangkan untuk pendidikan SD, SMP dan PT masing-masing 20,0%, 22,0% dan 26,0%.

b. Data Numerik

Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan ukuran

tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata, median dan modus.

Sedangkan ukuran sebarannya (variasi) yang digunakan adalah range, standard deviasi,

minimal dan maksimal. Pada SPSS ada dua cara untuk mengeluarkan analisis deskriptif

yaitu dapat melalaui perintah ‘Frequencies’ atau perintah ‘Expolre’. Biasanya yang

digunakan adalah Frequencies oleh karena ukuran statistik yang dapat dihasilkan pada

menu ‘Frequencies’ sangat lengkap (seperti mean, median, varian dll), selain itu pada

perintah ini juga dapat ditampilkan grafik histogram dan kurve normalnya. Berikut akan

14

Page 15: Pengantar Analisis Data Edit Ok s2 Kesmas

dicoba mengeluarkan analisis deskriptif untuk variabel umur dengan menggunakan

perintah frequencies.

1. Aktifkan data “susu.sav”

2. Pilih ‘Analyze’

3. Pilih ‘Descriptive Statistic’

4. Pilih ‘Frequencies’, terlihat kotak frequencies:

5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda panah sehingga

umur masuk ke kotak variable (s).

6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya mean,

median, standard seviasi, minimum, maximum, SE.

7. Klik ‘Continue’

15

Page 16: Pengantar Analisis Data Edit Ok s2 Kesmas

8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’, lalu

klik ‘With Normal Curve’

9. Klik ‘Continue’

10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran statistic

yang diminta dan dibawahnya tampak grafik histogram beserta curve normalnya.

Frequencies

Statistics

Umur ibu menyusui

N Valid

Missing

50

0

Statistics

Umur ibu menyusui

N Valid MissingMeanStd. Error of MeanMedianModeStd. DeviationMinimumMaximum

500

25.10.686

24.0019

4.8501935

16

Page 17: Pengantar Analisis Data Edit Ok s2 Kesmas

Umur ibu menyusui

Frequency Percent Valid PercentCumulative

Percent

Valid 19

20

21

22

23

24

25

26

27

30

31

32

34

35

Total

7

3

3

5

5

4

2

5

3

3

3

3

2

2

50

14.0

6.0

6.0

10.0

10.0

8.0

4.0

10.0

6.0

6.0

6.0

6.0

4.0

4.0

100.0

14.0

6.0

6.0

10.0

10.0

8.0

4.0

10.0

6.0

6.0

6.0

6.0

4.0

4.0

100.0

14.0

20.0

26.0

36.0

46.0

54.0

58.0

68.0

74.0

80.0

86.0

92.0

96.0

100.0

17

Page 18: Pengantar Analisis Data Edit Ok s2 Kesmas

Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan nilai

standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas, rata-rata

umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi 4,85 tahun dengan

umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi frekuensi ditampilkan

menurut umur termuda sampai dengan umur tertua dengan informasi tentang jumlah dan

persentasenya. Bentuk distribusi data dapat diketahui dari grafik histogram dan kurve

normalnya. Dari tampilan grafik dapat dilihat bahwa distribusi variabel umur berbentuk

normal

Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk

melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi interval

lakukan analisis eksplorasi data dengan perintah ‘Explore’. Adapun caranya sbb:

1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu

‘descriptive Statistics’, lalu pilih ‘Explore’

2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’ dan

‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:

18

Page 19: Pengantar Analisis Data Edit Ok s2 Kesmas

3. Klik tombol ‘Plots’, dan pilih ‘Normality Plots With Test’

4. Klik ‘Continue’

5. Klik ‘OK’, hasilnya dapat dilihat di layar:

6.

Explore

Descriptives

Statistic Std. Error

umur ibu menyusui Mean

95% Confidence Lower Bound

Interval for Mean Upper Bound

25.10

23.72

26.48

.686

19

Page 20: Pengantar Analisis Data Edit Ok s2 Kesmas

5% Trimmed Mean

Median

Variance

Std. Deviation

Minimum

Maximum

Range

Interquartile Range

Skewness

Kurtosis

24.90

24.00

23.520

4.850

19

35

16

9

.547

-.812

.337

.662

Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Statistic Df Sig. Statistic df Sig.

umur ibu menyusui .130 50 .035 .920 50 .002a. Lilliefors Significance Correction

umur ibu menyusui

umur ibu menyusui Stem-and-Leaf Plot

Frequency Stem & Leaf

7.00 1 . 9999999

20.00 2 . 00011122222333334444

10.00 2 . 5566666777

11.00 3 . 00011122244

2.00 3 . 55

Stem width: 10

Each leaf: 1 case(s)

20

Page 21: Pengantar Analisis Data Edit Ok s2 Kesmas

Dari hasil analisis ‘Explore’ terlihat juga nilai mean, median dan mode. Namun yang

paling penting dari tampilan explore munculnya angka estimasi interval. Dari hasil

tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita dapat menghitung

95% confidence interval umur yaitu 23,72 s.d. 26,48. Jadi kita 95% yakin bahwa rata-rata

umur ibu di populasi berada pada selang 23,72 sampai 26,48 tahun.

21

Page 22: Pengantar Analisis Data Edit Ok s2 Kesmas

Uji kenormalan data:

Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk mengetahuinya yaitu:

1. Dilihat dari grafik histogram dan kurve normal, bila bentuknya menyerupai bel

shape, berarti distribusi normal

2. Menggunakan nilai Skewness dan standar errornya, bila nilai Skewness dibagi

standar errornya menghasilkan angka ≤ 2, maka distribusinya normal

3. Uji kolmogorov smirnov, bila hasil uji signifkan (p value > 0,05) maka distribusi

normal. Namun uji kolmogorov sangat sensitif dengan jumlah sampel, maksudnya :

untuk jumlah sampel yang besar uji kolmogorov cenderung menghasilkan uji yang

signifikan (yang artinya bentuk distribusinya tidak normal). Atas dasar kelemahan ini

dianjurkan untuk mengetahui kenormalan data lebih baik menggunakan angka

skewness atau melihat grafik histogram dan kurve normal

Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat bentuk yang

normal, selain itu hasil dari perbandingan skwness dan standar error didapatkan:

0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti distribusi normal. Dari hasil

tersebut diatas dengan demikian variabel umur disimpulkan berdistribusi normal.

Penyajian dan Interpretasi di Laporan Penelitian

Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan

penelitian/laporan tesis. Adapun penyajian dan interpretasinya adalah sbb:

Tabel 1

Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x

Variabel Mean SD Minimal-

Maksimal

95% CI

Umur 25,10 4,85 19 - 35 23,72 – 26,48

22

Page 23: Pengantar Analisis Data Edit Ok s2 Kesmas

Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72 – 26,48),

dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur tertua 35 tahun.

Dari hasil estimasi interval dapat disimpulkan bahwa 95% diyakini bahwa rata-rata umur

ibu adalah diantara 23,72 sampai dengan 26,48 tahun.

23

Page 24: Pengantar Analisis Data Edit Ok s2 Kesmas

ANALISIS BIVARIAT

Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis

lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis pembayaran berobat

dan kepuasan pasien, kita hanya melakukan pendeskripsian sendiri-sendiri untuk variabel

jenis pembayaran dan kepuasan pasien. Untuk variabel jenis pembayaran akan diketahui

berapa persen yang berobat dengan biaya sendiri dan berapa persen yang dibiayai askes.

Begitu juga untuk variabel kepuasan pasien, akan diketahui berapa persen yang puas dan

berapa persen yang tidak puas.

Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh diatas

berarti kita ingin mengetahui hubungan jenis pembayaran dengan kepuasan pasien, maka

analisis dilanjutkan pada tingkat bivariat. Pada analisis bivariat kita dapat mengetahui

apakah ada perbedaan kepuasan pasien antara pasien dengan membayar sendiri dengan

pasien dengan biaya askes. Kegunaan analisis bivariat bisa untuk mengetahui apakah ada

hubungan yang siginifikan antara dua variabel, atau bisa juga digunakan untuk

mengetahui apakah ada perbedaan yang signifikan antara dua atau lebih

kelompok(sampel).

Perbedaan Substansi/Klinis dan perbedaan Statistik

Perlu dipahami/disadari bagi peneliti bahwa berbeda bermakna/signifikan secara

statistik tidak berarti (belum tentu) bahwa perbedaan tersebut juga bermakna dipandang

dari segi substansi/klinis. Seperti diketahui bahwa semakin besar sampel yang dianalisis

akan semakin besar menghasilkan kemungkinan berbeda bermakna. Dengan sampel besar

perbedaan-perbedaan sangat kecil, yang sedikit atau bahkan tidak mempunyai manfaat

secara substansi/klinis dapat berubah menjadi bermakna secara statitik. Oleh karena itu

arti kegunaan dari setiap penemuan jangan hanya dilihat dari aspek statistik semata,

namun harus juga dinilai/dilihat kegunaannya dari segi klinis/substansi. Sebagai contoh

ada studi eksperimen yang akan menguji dua obat (katakanlah obat A dan Obat B) untuk

mengatahui pengaruhnya terhadap penurunan tekanan darah. Kemudian obat A dan B

diujicobakan pada dua kelompok relawan penderita hipertensi. Hasil eksperimen

didapatkan bahwa rata-rata penurunan tekanan darah setelah minum obat A adalah 40

24

Page 25: Pengantar Analisis Data Edit Ok s2 Kesmas

mmHg dan pada kelompok yang minum Obat B ratarata penurunannya 39 mmHg.

Kemudian dilakukan uji statistik dan hasilnya signifikan/bermakna (p value < alpha), apa

yang dapat disimpulkan dari temuan ini? Secara statistik memang terjadi perbedaan

bermakna, namun secara substansi tidaklah mempunyai perbedaan yang berarti, oleh

karena perbedaan mean penurunan tekanan darah antara obat A dan B hanya 1 mmHg.

Dengan hasil ini dapat disimpulkan bahwa sebenarnya antara obat A dan B tidak ada

perbedaan (sama saja) kasiatnya.

UJI HIPOTESIS

Pengujian hipotesis dapat berguna untuk membantu pengambilan keputusan

tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau hubungan, cukup

menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini didasarkan pada besarnya

peluang untuk memperoleh hubungan tersebut secara kebetulan (by chance). Semakin

kecil peluang tersebut (peluang adanya by chance), semakin besar keyakinan bahwa

hubungan tersebut memang ada.

Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk memutuskan

berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru lebih baik daripada

yang sekarang beraedar di pasaran. Untuk menjawab pertanyaan ini maka perlu dilakukan

pengujian hipotesis. Dengan pengujian hipotesis akan diperoleh suatu kesimpulan secara

probalistik apakah vaksin baru tersebut lebih baik dari yang sekarang beredar di pasaran

atau malah sebaliknya.

Prinsip uji hipotesis adalah melakukan perbandingan antara nilai sampel (data

hasil penelitian) dengan nilai hipotesis (nilai populasi) yang diajukan. Peluang untuk

diterima atau ditolaknya suatu hipotesis tergantung besar kecilnyanya perbedaan antara

nilai sampel dengan nilai hipotesis. Bila perbedaan tersebut cukup besar, maka peluang

untuk menolak hipotesis besar pula, sebaliknya bila perbedaan tersebut kecil, maka

peluang untuk menolak hipotesis menjadi kecil. Jadi, makin besar perbedaan antara nilai

sampel dengan nilai hipotesis, makin besar peluang untuk menolak hipotesis.

Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua kemungkinan

yaitu menolak hipotesis dan menerima hipotesis (gagal menolak hipotesis). Perlu

dipahami bahwa arti menerima hipotesis sebetulnya kurang tepat, yang tepat adalah gagal

25

Page 26: Pengantar Analisis Data Edit Ok s2 Kesmas

menolak hipotesis. Dalam uji hipotesis bila kesimpulannya menerima hipotesis, bukan

berarti bahwa kita telah membuktikan hipotesis tersebut benar, karena benar atau

tidaknya suatui hipotesis hanya dapat dibuktikan dengan mengadakan observasi pada

seluruh populasi, dan hal ini sangat sulit bahkan tidak mungkin untuk dilakukan. Jadi

menerima hipotesis sebetulnya artinya adalah kita tidak cukup bukti untuk menolak

hipotesis, dengan kata lain dapat diartikan kita gagal menolak hipotesis. Untuk

memperjelas pengertian bahwa “gagal menolak hipotesis berbeda dengan mengakui

kebenaran hipotesis (menerima hipotesis”, kita coba analogkan proses persidangan

kriminal di pengadilan. Seperti dalam sidang pengadilan, kegagalan membuktikan

kesalahan tertuduh bukan berarti si tertudauh tidak bersalah atau sitertuduh benar.

Pengadilan memutuskan bahwa si tertuduh tidak dapat dibuktikan bersalah, bukan

memutuskan tidak bersalah. Dari uraian tersebut sangatlah jelas bahwa istilah yang tepat

dalam kesimpulan uji hipotesis adalah gagal menolak hiopotesis, dan bukan menerima

hipotesis.

3. Hipotesis

Hipotesis berasal dari kata hupo dan thesis. Hupo artinya sementara/lemah

kebenarannya dan thesis artinya pernyataan/teopri. Dengan demikian hipotesis berarti

pernyataan yang perlu diuji kebenarannya. Untuk menguji kebenaran sebuah hipotesis

digunakan pengujian yang disebut pengujian hipotesis.

Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis nol (Ho)

dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas tentang masing-masing

hipotesis tersebut.

a. Hipotesis Nol (Ho).

Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua

kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara variabel satu

dengan variabel lainnya

Contoh:

1) Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu

yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok

2) Tidak ada hubungan antara merokok dengan berat badan bayi

26

Page 27: Pengantar Analisis Data Edit Ok s2 Kesmas

b. Hipotesis Alternatif (Ha)

Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok.

Atau hipotesis yang menyatakan ada hubungan antara variabel satu dengan variabel

lainnya

Contoh:

1) Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang

merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok

2) Ada hubungan antara merokok dengan berat badan bayi

2. Arah dan bentuk hipotesis

Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu arah

(one tail) atau dua arah (twa tail)

a. One tail (satu sisi): bila hipotesis alternatifnya menyatakan

adanya perbedaan dan ada pernyataan yang mengatakan hal satu lebih tinggi/rendah

dari hal lain.

Contoh:

Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan bayi dari

ibu tidak merokok.

b. Two tail (dua sisi) merupakan hipotesis alternatif yang hanya

menyatakan perbedaan tanpa melihat apakah hal satu lebih tinggi/rendah dari hal lain.

Contoh:

Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan bayi dari ibu

tidak merokok. Atau dengan kata lain: ada perbedaan berat badan bayi antara mereka

yang dilahirkan dari ibu yang merokok dibandingkan dari ibu yang tidak merokok.

Contoh penulisan hipotesis:

Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan tekanan darah,

maka hipotesisnya sbb:

Ho : μA = μB

Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Tidak ada

hubungan antara jenis kelamin dengan tekanan darah.

27

Page 28: Pengantar Analisis Data Edit Ok s2 Kesmas

Ho : μA ≠ μB

Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Ada hubungan

antara jenis kelamin dengan tekanan darah

3. Menentukan Tingkat Kemaknaan (Level of Significance)

Tingkat kemaknaan merupakan kesalahan tipe I suatu uji yang biasanya diberi

notasi ‘α’. Seperti sudah diketahui bahwa tujuan dari pengujian hipotesis adalah untuk

membuat suatu pertimbangan tentang perbedaan antara nilai sampel dengan keadaan

populasi sebagai suatu hipotesis. Langkah selanjutnya setelah ktriteria/batasan yang

digunakan untuk memutuskan apakah hipotesis nol ditolak atau gagal ditolak yang

disebut dengan tingkat kemaknaan (Level of Significance). Tingkat kemaknaan, atau

sering disebut dengan nilai α, merupakan nilai yang menunjukkan besarnya peluang

salah dalam menolak hipotesis nol. Atau dengan kata lain, nilai α merupakan batas

toleransi peluang salah dalam menolak hipotesis nol. Dengan kata-kata yang lebih

sederhana, nilai α merupakan batas maksimal kesalahan menolak Ho. Bila kita menolak

Ho berarti menyatakan adanya perbedaan/hubungan. Sehingga nilai α dapat diartikan

pula sebagai batas maksimal kita salah dalam menyatakan adanya perbedaan. Penentuan

nilai α (alpha) tergantung dari tujuan dan kondisi penelitian. Nilai α yang sering

digunakan adalah 10%, 5%, atau 1%. Untuk bidang kesehatan masyarakat biasanya

digunakan nilai α sebesar 5%. Sedangkan untuk pengujian obat-obatan digunakan batas

toleransi kesalahan yang lebih kecil misalnya 1%, karena mengandung risiko yang fatal.

Misalkan seorang peneliti yang akan menentukan apakah suatu obat bius berkhasiat akan

menentukan nilai α yang kecil sekali, peneliti tersebut tidak akan mau mengambil risiko

bahwaketidak berhasilan obat bius besar karena akan berhubungan dengan nyawa

seseorang yang akan dibius.

4. Pemilihan Jenis Uji Parametrik atau Non Parametrik

Dalam pengujian hipotesis sangat berhubungan dengan distribusi data populasi

yang akan diuji. Bila distribusi data populasi yang akan diuji berbentuk

normal/simetris/Gauss, maka proses pengujian dapat digunakan dengan pendekatan uji

28

Page 29: Pengantar Analisis Data Edit Ok s2 Kesmas

statistik parametrik. Sedangkan bila distribusi data populasinya tidak normal atau tidak

diketahui distribusinya maka dapat digunakan pendekatan uji statistik non parametrik.

Kenormalan suatu distribusi data dapat juga dilihat dari jenis variabelnya, bila

variabelnya berjenis numerik/kuantitatif biasanya distribusi datanya mendekati

normal/simetris, sehingga dapat digunakan uji statistik parametrik. Bila jenis variabelnya

katagorik (kualitatif), maka bentuk distribusinya tidak normal, sehingga uji non

parametrik dapat digunakan. Penentuan jenis uji juga ditentukan oleh jumlah data yang

dianalisis, bila jumlah data kecil (<30) cenderung digunakan uji non parametrik.

PROSEDUR/LANGKAH UJI HIPOTESIS

Menetapkan Hipotesis

Hipotesis dalam statistik dikenal dua macam yaitu hipotesis nol (Ho) dan hipotesis

alternatif (Ha).

1). Hipotesis nol (Ho)

Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua

kelompok.

Contoh: Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu

yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok

2). Hipotesis alternatif (Ha)

Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok.

Contoh: Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang

merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok.

Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu arah (one

tail) atau dua arah (two tail).

Penentuan Uji Statistik Yang Sesuai

Ada beragam jenis uji statistik yang dapat digunakan. Setiap uji statistik

mempunyai persyaratan tertentu yang harus dipenuhi. Oleh karena itu harus digunakan

uji statistik yang tepat sesuai dengan data yang diuji. Jenis uji statistik sangat tergantung

dari:

1). Jenis variabel yang akan dianalisis

29

Page 30: Pengantar Analisis Data Edit Ok s2 Kesmas

2). Jenis data apakah dependen atau independen

3). Jenis distribusi data populasinya apakah mengikuti distribusi normal atau tidak.

Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan mean akan

berbeda dengan uji statistik untuk mengetahui perbedaan proporsi/persentase. Uji beda

mean menggunakan uji t atau inova, sedangkan uji untuk mengetahui perbedaan proporsi

digunakan uji Kai kuadrat.

Menentukan Batas atau Tingkat Kemaknaan (Level og Significance)

Batas/tingkat kemaknaan, sering juga disebut dengan nilai α. Penggunaan nilai

alpha tergantung tujuan penelitian yang dilakukan, untuk bidang kesehatan masyarakat

biasanya menggunakan nilai alpha 5%.

Penghitungan Uji Statitik

Penghitungan uji statistik adalah menghitung data sampel ke dalam uji hipotesis

yang sesuai. Misalnya kalau ingin menguji perbedaan mean antara dua kelompok, maka

data hasil pengukuran dimasukkan ke rumus uji t. Dari hasil dengan nilai populasi untuk

mengetahui apakah ada hipotesis ditolak atau gagal menolak hipotesis.

Keputusan Uji Statistik

Seperti telah disebutkan pada langkah D, bahwa hasil pengujian statistik akan

menghasilkan dua kemungkinan keputusan yaitu menolak hipotesis nol (Ho) dan gagal

menolak hipotesisi nol.

Seiring dengan kemajuan perkembangan komputer maka uji statistik dengan

mudah dan cepat dapat dilakukan dengan program-program statistik yang tersedia di

pasaran seperti Epi Info, SPSS, SAS dll. Setiap kita melakukan uji statistik melalui

program komputer maka yang akan kita cari adalalah nilai p (p value). Dengan nilai p ini

kita dapat menggunakan untuk keputusan uji statistik dengan cara membandingkan nilai

p dengan α (alpha). Ketentuan yang berlaku adalah:

a). Bila nilai p ≤ α, maka keputusannya adalah Ho ditolak

b). Bila nilai p > α, maka keputusannya adalah Ho gagal ditolak

30

Page 31: Pengantar Analisis Data Edit Ok s2 Kesmas

Perlu diketahui bahwa nilai p two tail adalah 2 kali nilai p one tail berarti kalau

tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang dilakukan adalah

two tail maka nilai p dari tabel harus dikalikan 2. dengan demikian dapat disederhanakan

dengan rumus : nilai p two tail = 2 x nilai p one tail.

Pendekatan probabilistik ini sekarang sudah mulai digunakan oleh para ahli

statistik dalam pengambilan keputusan uji statistik. Pada modul ini dalam memutuskan

uji statistik menggunakan pendekatan ini.

Pengertian Nilai P

Nilai p merupakan nilai yang menunjukkan besarnya peluang salah menolak Ho

dari data penelitian. Nilai P dapat diartikan pula sebagai nilai besarnya peluang hasil

penelitian (misal adanya perbedaan mean atau proporsi) terjadi karena faktor kebetulan

(by chance). Harapan kita nilai p adalah sekecil mungkin, sebab bila nilai p-nya kecil

maka kita yakin bahwa adanya perbedaan pada hasil penelitian menunjukkan pula adanya

perbedaan di populasi. Dengan kata lain kalau nilai p-nya kecil maka perbedaan yang ada

pada penelitian terjadi bukan karena faktor kebetulan (by chance).

Contoh:

Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan berat

badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa rata-rata berat badan

bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat badan bayi yang lahir dari

ibu yang tidak hipertensi adalah 3000 gram. Perbedaan berat bayi antara ibu yang

hipertensi dengan ibu yang tidak hipertensi sebesar 100 gram. Pertanyaan yang timbul

adalah apakah perbedaan berat badan bayi tersebut juga berlaku untuk seluruh populasi

yang diteliti atau hanya faktor kebetulan saja?. Untuk menjawab pertanyaan tersebut

kemudian dilakukan uji statistik yang tepat yaitu uji t. Miisalnya dihasilkan nilai p =

0,0110 maka berarti peluang adanya perbedaan berat bayi sebesar 1000 gram akibat dari

faktor kebetulan (by chance) adalah sebesar 0,0110. oleh karena peluangnya sangat kecil

(p=0,0110), maka dapat diartikan bahwa adanya perbedaan tersebut bukan karena faktor

kebetulan namun karena memang karena adanya riwayat hipetensi.

31

Page 32: Pengantar Analisis Data Edit Ok s2 Kesmas

Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat

Variabel I Variabel II Jenis uji statistik yang

digunakan

Katagorik ↔ Katagorik - Kai kuadrat

- Fisher Exact

Katagorik ↔ Numerik - Uji T

- ANOVA

Numerik ↔ Numerik - Korelasi

- Regresi

32

Page 33: Pengantar Analisis Data Edit Ok s2 Kesmas

ANALISIS BIVARIAT HUBUNGAN

KATAGORIK DENGAN NUMERIK

Uji t

Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah parameter

dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan tekanan darah

penduduk dewasa orang kota dengan orang desa. Atau, apakah ada perbedaan berat badan

antar sebelum mengikuti program diet dengan sesudahnya. Uji statistik yang

membandingkan mean dua kelompok data ini disebut uji beda dua mean. Pendekatan

ujinya dapat menggunakan pendekatan distribusi Z dan distribusi t , sehingga pada uji

beda dua mean bisa menggunakan uji Z atau uji t, namun lebih sering digunakan uji t.

Sebelum kita melakukan uji statistik dua kelompok data, kita perlu mengetahui

apakah dua kelompok data tersebut berasal dari dua kelompok yang independen atau

berasal dari dua kelompok yang dependen/pasangan. Dikatakan kelompok independen

bila data kelompok yang satu tidak tergantung dari kelopok kedua, misalnya

membandingkan mean tekanan darah sistolik orang desa dengan orang kota. Tekanan

darah orang kota independen (tidak tergantung) dengan orang desa. Dilain pihak, kedua

kelompok data dikatakan dependen/pasangan bila kelompok data yang dibandingkan

datanya saling mempunyai ketergantungan, misalnya data berat badan sebelum dan

sesudah mengikuti program diet berasal dari orang yang sama (data sesudah

dependen/tergantung dengan data sebelum).

Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi dalam dua

kelompok, yaitu: uji beda mean independen (uji T independen) dan uji beda mean

dependen (uji T dependen).

1. Uji beda dua mean independen

Tujuan: untuk mengetahui perbedaan mean dua dua kelompok data independen, syarat

yang harus dipenuhi:

33

Page 34: Pengantar Analisis Data Edit Ok s2 Kesmas

a. Data berdistribusi normal/simetris.

b. Kedua kelompok data independen.

c. Variabel yang dihubungkan berbentuk numerik dan katagorik (ket:

variabel katagorik hanya dengan dua kelompok).

Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi kedua kelompok

data. Oleh karena itu dalam pengujian ini diperlukan informasi apakah varian kedua

kelompok yang diuji sama atau tidak. Bentuk varian kedua kelompok data akan

berpengaruh pada nilai standar error yang akhirnya akan membedakan rumus

pengujiannya.

a. Uji untuk varian sama

Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T. Uji Z dapat

digunakan bila standar deviasi populasi (σ) diketahui dan jumlah sampel besar (>30).

Apabila kedua syarat tersebut tidak terpenuhi maka dilakukan uji . pada umumnya

nilai σ sulit diketahui, sehingga uji beda dua mean biasanya menggunakan uji T (T

Test). Untuk varian yang sama maka bentuk ujinya sbb:

df = n1 – n2 - 2

Ket :

n1 atau n2 = jumlah sampel kelompok 1 atau 2

S1 atau S2 = standar deviasi sampel kelompok 1 atau 2

b. Uji untuk varian berbeda

34

X1 – X2

T = Sp (1/n1) + (1/n2)

(n1 - 1)S12 + (n2 - 1) S2

2

Sp2 = n1 - n2 - 2

X1 – X2

T = (S1

2/n1) + (S22/n2)

Page 35: Pengantar Analisis Data Edit Ok s2 Kesmas

c. Uji homogenitas varian

Tujuan dari uji ini adalah untuk mengetahui varian antara kelompok data satu apakah

sama dengan kelompok data yang kedua.

df1 = n1-1 dan df2 = n2-1

Pada perhitungan uji F, varian yang lebih besar sebagai pembilang dan varian yang

lebih kecil sebagai penyebut.

2. Uji beda dua mean dependen (Paired sample)

Tujuan : Untuk menguji perbedaan mean anatara dua kelompok data yang

dependen. Contoh kasus:

o Apakah ada perbedaan tingkat pengetahuan antara sebelum dan sesudah

dilakukan pelatihan.

o Apakah ada perbedaan berat badan antara sebelum dan sesudah mengikuti

program diet.

Syarat :

a. Distribusi data normal

b. Kedua kelompok data dependen/pair

c. Jenis variabel: numerik dan katagorik (dua kelompok)

Formula :

35

[(S12/n1) + (S2

2/n2)]2

df = [(S1

2/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]

S12

F = S2

2

dT =

S_d / n

Page 36: Pengantar Analisis Data Edit Ok s2 Kesmas

d = rata-rata deviasi/selisih sampel 1 dengan sampel 2

S_d = standar deviasi dari deviasi/selisih sampel sampel 1 dan sampel 2

KASUS:

UJI t INDEPENDEN DAN UJI t DEPENDEN

1. Uji t independen

Sebagai contoh kita gunakan data “ASI.SAV” dengan melakukan uji hubungan perilaku

menyusui dengan kadar Hb (misal digunakan variabel Hb1), apakah ada perbedaan kadar

Hb antara ibu yang menyusui eksklusif dengan ibu yang menyusuinya tidak eksklusif,

caranya:

1. Aktifkan/bukalah file data “ASI.SAV”

2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu

“Compare Means’, lalu pilih “Independen-Samples T Test”

3. Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable (s)’I dan

‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variable

numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel

katagoriknya, ingat jangan sampai terbalik.

4. Klik ‘hb1’ dan msukkan ke kotak ‘Test variable’

5. Klik variabel ‘eksklu’ dan masukkan ke kotak ‘Grouping Variable’.

36

Page 37: Pengantar Analisis Data Edit Ok s2 Kesmas

6. Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta

mengisi kode variabel ‘menyusui’ ke dalam kedua kotak. Pada contoh ini, kita tahu

bahwa ‘0’ kode untuk yang tidak eksklusif dan kode ‘1’ untuk Yang eksklusif. Jadi

ketiklah 0 pada Group 1” dan 1 pada “Group 2”

7. Klik “Continue”

8. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:

T-Test

Group Statistics

status menyusui asi N Mean Std. Deviation

Std. Error

Mean

kadar hb pengukuran tdk EKSKLUSIVE

pertama EKSKLUSIVE

24

26

10.421

10.277

1.4712

1.3228

.3003

.2594

Independent Samples Test

Levene's Testfor Equality ofVariances

t-test for Equality of Means

FSig.

tdf

Sig.(2-taile

d)

MeanDifferen

ce

Std.Error

Difference

95% ConfidenceInterval of the

Difference

Lower Upperkadar hb Equalpengukur variancesan assumedpertama Equal variances not assumed

.072 .790 -.364

-.363

48

46.4

.717

.719

-.1439

-.1439

.3951

.3968

-.9384

-.9425

.6505

.6547

37

Page 38: Pengantar Analisis Data Edit Ok s2 Kesmas

Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan standar error

kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb ibu yang menyusui

ekslusif adalah 10,277 gr% dengan standar deviasi 1,322 gr%, sedangkan untuk ibu yang

menyusui non eksklusif, rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar

deviasi 1,471 gr%.

Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua uji T,

yaitu uji T dengan asumsi varian kedua kelompok sama (equal variances assumed) dan

uji T dengan asumsi varian kedua kelompok tidak sama (equal variances not assumed).

Untuk, memilih uji mana yang kita pakai, dapat dilihat uji kesamaan varian melalui uji

Levene. Lihat nilai p Levene test, nilai p < alpha (0,05) maka varian berbeda dan bila

nilai p > alpha (0,05) maka varian sama (equal). Pada uji Levene di atas menghasilkan

nilai p = 0,790 sehingga dapat disimpulkan bahwa pada alpha 5%, didapat tidak ada

perbedaan varian (varian kedua kelompok sama). Selanjutnya dicari p value uji t pada

bagian varian sama (equal variances) di kolom sig (2 tailed) ,yaitu sebesar p=0,717

artinya tidak ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui

eksklusif dengan ibu yang menyusui non eksklusif.

Penyajian dan Interpretasi di laporan penelitian:

Seperti pada analisis deskriptif, print out di atas tidak boleh langsung di copy dan

disajikan di laporan penelitian. Pada laporan penelitian kita harus membuat tabel baru

untuk menyajikan hasil print out analisis di atas. Adapun bentuk penyajian dan

interpretasinya adalah sbb:

Tabel …

Distribusi Rata-Rata Kadar Hb Responden Menurut Perilaku Menyusui di..th..

Menyusui Mean SD SE P value N

Ya Eksklusif

Tdk Eksklusif

10,277

10,421

1,322

1,471

0,259

0,300

0,717 26

24

38

Page 39: Pengantar Analisis Data Edit Ok s2 Kesmas

Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan standar

deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif rata-rata kadar Hb-

nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%. Hasil uji statistik didapatkan

nilai p=0,717, berarti pada alpha 5% terlihat tidak ada perbedaan yang signifikan rata-rata

kadar Hb antara ibu yang menyusui secara eksklusif dengan non eksklusif.

2. Uji T Dependen

Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji T

dependen sering digunakan pada analisis data penelitian eksperimen. Seperti sudah

dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau kedua

kelompok sampel yang dibandingkan mempunyai subyek yang sama. Dengan kata lain

disebut dependen bila responden diukur dua kali/diteliti dua kali, sering orang

mengatakan penelitian pre dan post. Misalnya kita ingin membandingkan berat badan

antara sebelum dan sesudah mengikuti program diet.

Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb

pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui apakah ada

perbedaan kadar Hb antara pengukuran pertama dengan pengukuran kedua. Disini terlihat

sampelnya dependen karena orangnya sama diukur dua kali. Adapun langkahnya:

1. Pastikan anda berada di file “ASI.SAV”, jika belum aktifkan/bukalah file ini.

2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu

“Compare Means’, lalu pilih “Paired-Samples T Test”

39

Page 40: Pengantar Analisis Data Edit Ok s2 Kesmas

3. Klik ‘hb1’

4. Klik ‘hb2’

5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan

6. Klik ‘OK’ hasilnya tampak sbb:

T-Test

Paired Samples Statistics

Mean N Std. Deviation Std. ErrorMean

Pair kadar hb pengukuran

1 pertama

kadar hb pengukuran

kedua

10.346

10.860

50

50

1.3835

1.0558

.1957

.1493

Paired Samples Correlations

N Correlation Sig.

Pair Kadar hb pengukuran pertama

1 & kadar hb pengukuran kedua

50 .707 .000

Paired Samples Test

Paired Differences

tdf

Sig.(2-

tailed)

MeanStd.

Deviation

Std.Error Mean

95% ConfidenceInterval of the

DifferenceLower Upper

Pair kadar hb1 pengukuran pertama - kadar hb pengukuran kedua

-.5140 .9821 .1389 -.7931 -.2349 -3.701 49 .001

Pada tabel pertama terlihat statistik deskriptif berupa rata-rata dan standar deviasi

kadar Hb antara pengukuran pertama dan pengukuran kedua. Rata-rata kadar Hb pada

pengukuran pertama (hb1) adalah 10,346 gr% dengan standar deviasi 1,38 gr%. Pada

40

Page 41: Pengantar Analisis Data Edit Ok s2 Kesmas

pengukuran kedua (hb2) didapat rata-rata kadar Hb adalah 10,860 gr% dengan standar

deviasi 1,05 gr%.

Uji T berpasangan dilaporkan pada tabel kedua, terlihat nilai mean perbedaan

antara pengukuran pertama dan kedua adalah 0,514 dengan standar deviasi 0,982.

perbedaan ini diuji dengan uji T berpasangan menghasilkan nilai p yang dapat dilihat

pada kolom “Sig (2-tailed)”. Pada contoh di atas didapatkan nilai p=0,001, maka dapat

disimpulkan ada perbedaan yang signifikan kadar hb antara pengukuran pertama dengan

pengukuran kedua.

Penyajian dan Interpretasi di laporan penelitian:

Dari hasil yang didapat di atas kemudian angka-angka disusun dalam tabel yang

disajikan dalam laporan penelitian. Bentuk penyajian dan interpretasinya sbb:

Tabel …

Distribusi Rata-Rata Kadar Hb Responden Menurut Pengukuran pertama dan

Kedua di …. Th……

Variabel Mean SD SE P value N

Kadar Hb

Pengukuran I

Pengukuran II

10,346

10,860

1,38

1,05

0,19

0,14

0,001 50

Rata-rata kadar Hb pada pengukuran pertama adalah 10,346 gr% dengan standar deviasi

1,38 gr%. Pada pengukuran kedua didapat rata-rata kadar Hb adalah 10,860 gr% dengan

standar deviasi 1,05 gr%. Terlihat nilai mean perbedaan antara pengukuran pertama dan

kedua adalah 0,514 dengan standar deviasi 0,982. hasil uji statistik didapatkan nilai 0,001

maka dapat disimpulkan ada perbedaan yang signifikan antara kadar Hb pengukuran

pertama dan kedua.

41

Page 42: Pengantar Analisis Data Edit Ok s2 Kesmas

ANALISIS HUBUNGAN

KATEGORIK DENGAN NUMERIK

UJI ANOVA

Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data baik yang

independen maupun dependen. Namun seringkali kita jumpai jumlah kelompok yang

lebih dari dua, misalnya ingin mengetahui perbedaan mean berat badan bayi untuk daerah

Bekasi, Bogor dan Tangerang. Dalam menganalisis data seperti ini (> 2 kelompok) sangat

tidak dianjurkan menggunakan uji T. kelemahan menggunakan uji T adalah; pertama kita

melakukan uji berulang kali sesuai kombinasi yang mungkin, kedua, bila melakukan uji T

berulang kali akan meningkatkan (inflasi) nilai α, artinya akan meningkatkan peluang

hasil yang keliru.

Perubahan inflasi α sebesar = 1 – (1-α)n

Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang tepat)

dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji F.

Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua

sumber variasi yaitu variasi dalam kelompok (within) dan variasi antar kelompok

(between). Bila variasi within dan between sama (nilai perbandingan kedua varian sama

dengan 1) maka mean-mean yang dibandingkan tidak ada perbedaan, sebaliknya bila

hasil perbandingan tersebut menghasilkan lebih dari 1, maka mean yang dibandingkan

menunjuk ada perbedaan.

Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor (one

way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas analisis varian satu

faktor (one way).

Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:

1. Varian homogen

2. Sampel/kelompok independen

3. Data berdistribusi normal

42

Page 43: Pengantar Analisis Data Edit Ok s2 Kesmas

4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk katagori

yang lebih dari 2 kelompok.

Perhitungan uji ANOVA

df = k-1 → untuk pembilang

n-k → untuk penyebut

Ket N = jumlah seluruh data (n1 + n2 + ….. + nk)

Analisis Multi Comparison (POSTHOC TEST)

Analisis ini bertujuam untuk mengetahui lebih lanjut kelompok mana saja yang

berbeda mean-nya bilamana pada pengujian ANOVA dihasilkan ada perbedaan yang

bermakna (Ho ditolak). Ada berbagai jenis analisis multiple comparasion diantaranya

adalah Bonferroni, Honestly Significant different (HSD), Scheffe dan lain-lain. Pada

modul ini yang akan dibahas adalah metode Bonferroni.

Perhitungan Bonfrroni adalah sbb:

43

Sb2

F = Sw2

(n1-1)S12 + (n2-1)S2

2 + ……..+ (nk-1)Sk2

Sw2 = N-k

n1(X1-X)2 + n2(X2-X)2 + ………+ nk(Xk-X)2

Sb2 = k - 1

n1.X1 + n2.X2 + ……. + nk.Xk

X = N

Xi - Xj tij = Sw2[(1/ni) +(1/nj)]

Page 44: Pengantar Analisis Data Edit Ok s2 Kesmas

df = n – k

Dengan level of significance (α) sbb:

Kasus:

UJI ANOVA

Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan berat badan

bayi. Variabel pendidikan merupakan variabel katagorik dengan 4 katagori. Variabel

berat bayi berbentuk numerik sehingga uji yang digunakan ANOVA. Adapun caranya

sbb:

1. Aktifkan/bukalah file data “ASI.SAV”

2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu

“Compare Means’, lalu pilih “One-Way ANOVA” sesaat akan muncul menu One

Way ANOVA

3. Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan kotak

Factor perlu diisi variabel. Kotak ‘dependent’ diisi variabel numerik dan kotak

‘factor’ diisi variabel katagoriknya. Pada contoh ini berarti pada kotak Dependen diisi

variabel “bbbayi” pada kotak Factor diisi variabel “Didik”.

4. Klik tombol ‘Options” tandai dengan √ pada kotak “Descriptive”

5. Klik “Continue”

44

αα* = (k2)

Page 45: Pengantar Analisis Data Edit Ok s2 Kesmas

6. Klik tombol “Post Hoc”, tandai dengan √ pada kotak “Bonferroni”

7. Klik “Continue”

8. Klik “OK”

45

Page 46: Pengantar Analisis Data Edit Ok s2 Kesmas

Oneway

Descriptives

berat badan bayi

N MeanStd.

DeviationStd.

Error

95% Confidence Interval forMean

Minimum

Maximum

Lower Bound

Upper Bound

SD

SMP

SMU

PT

Total

10

11

16

13

50

2470.00

2727.27

3431.25

3761.54

3170.00

249.666

241.209

270.108

386.304

584.232

78.951

72.727

67.527

107.141

82.623

2291.40

2565.23

3287.32

3528.10

3003.96

2648.60

2889.32

3575.18

3994.98

3336.04

2100

2100

3000

3000

2100

2900

3000

4000

4100

4100

Test of Homogeneity of Variances

berat badan bayi

Levene

Statistic df1 df2 Sig.

2.506 3 46 .071

ANOVA

berat badan bayi

Sum of

Squares df

Mean

Square F Sig.

Between Groups

Within Groups

Total

12697038

4027962

16725000

3

46

49

4232345.862

87564.400

48.334 .000

46

Page 47: Pengantar Analisis Data Edit Ok s2 Kesmas

Post Hoc Tests

Multiple Comparisons

Dependent Variable: berat badan bayi

Bonferroni

(I)pendidikan formalibu

(J)pendidikanformal ibumenyusui

MeanDifference

(I-J) Std. Error Sig.

95% Confidence Interval

Lower Bound Upper BoundSD SMP

SMUPT

-257.273-961.250*

-1291.538*

129.294119.286124.468

.315

.000

.000

-613.76-1290.14-1634.72

99.21-632.36-948.36

SMP SDSMUPT

257.273-703.977*

-1034.266*

129.294115.902121.228

.315

.000

.000

-99.21-1023.54-1368.51

613.76-384.42-700.02

SMU SDSMPPT

961.250*-703.977*-330.288*

119.286115.902110.492

.000

.000

.027

632.36384.42

-634.93

1290.141023.54

-25.64PT SD

SMPSMU

1291.538*1034.266*330.288*

124.468121.228110.492

.000

.000

.027

948.36700.0225.64

1634.721368.51634.93

*. The mean difference is significant at the .05 level.

Dari print out ini diperoleh rata-rata berat bayi dan standar deviasi masing-masing

kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram

dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat

bayinya adalah 2727,2 gram dengan standar deviasi 241,2 gram. Pada mereka yang

berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan standar deviasi

270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5

gram dengan standar deviasi 386,3 gram.

Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom “F” dan “Sig”, terlihat

p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005), berarti pada alpha

5%, dapat disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan.

Pada Box paling bawah terlihat hasil dari uji ‘Multiple Comparisons Bonferroni” yang

berguna untuk menelusuri lebih lanjut kelompok mana saja yang berhubungan signifikan.

Untuk mengetahui kelompok yang signifikan dapat terlihat dari kolom Sig. Ternyata

47

Page 48: Pengantar Analisis Data Edit Ok s2 Kesmas

kelompok signifikan adalah tingkat pendidikan SD dengan SMU, SD dengan PT, SMP

dengan SMU, SMP dengan PT dan SMU dengan PT.

Penyajian dan Interpretasi di laporan Penelitian

Tabel …

Distribusi Rata-Rata berat Bayi Menurut Tingkat pendidikan

Variabel Mean SD 95% CI P value

Pendidikan

- SD

- SMP

- SMU

- PT

2470,0

2727,2

3431,2

3761,5

249,6

241,2

270,1

386,3

2291,4 – 2648,6

3565,2 – 2889,3

3287,3 – 3575,1

3528,1 – 3994,9

0,0005

Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram

dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat

bayinya adalah 2727,20 gram dengan standar deviasi 241,2 gram. Pada mereka yang

berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan standar deviasi

270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5

gram dengan standar deviasi 386,3 gram.

Hasil uji statistik didapat niali p=0,0005, berarti pada alpha 5% dapat disimpulkan ada

perbedaan berat bayi diantara keempat jenjang pendidikan. Analisis lebih lanjut

membuktikan bahwa kelompok yang berbeda signifikan adalah tingkat pendidikan SD

dengan SMU, SD dengan PT, SMP dengan SMU,SMP dengan PT dan SMU dengan PT.

48

Page 49: Pengantar Analisis Data Edit Ok s2 Kesmas

ANALISIS HUBUNGAN

KATAGORIK DENGAN KATAGORIK

UJI KAI KUADRAT

Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat dinyatakan dalam

bentuk angka-angka pengukuran (data numerik). Sebaliknya justru yang kita jumpai

adalah data hasil dari menghitung jumlah pengamatan yang diklasifikasikan atas

beberapa katagori. Data seperti ini disebut data katagorik (kualitatif), misalnya jenis

kelamin yang mempunyai katagori: laki-laki dan perempuan; status merokok yang

mempunyai katagori; perokok berat, perokok ringan dan tidak merokok. Dalam penelitian

kesehatan seringkali peneliti perlu melakukan analisis hubungan variabel katagorik

dengan variabel katagorik. Analisis ii bertujuan untuk menguji perbedaan proporsi dua

atau lebih kelompok sampel. Uji statistik yang digunakan untuk menjawab kasus tersbut

adalah UJI KAI KUADRAT (CHI SQUARE).

Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku menyusui

ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif antara ibu yang bekerja

dengan ibu yang tidak bekerja. Dari contoh terlihat bahwa variabel jenis pekerjaan

(bekerja/tidak bekerja) merupakan variabel katagorik, dan variabel perilaku menyusui

(eksklusif/non eksklusif) juga merupakan variabel katagorik.

Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita pahami

dengan benar apa itu variabel katagorik. Suatu variabel disebut katagorik bila isi

variabel tersebut terbentuk dari hasil klasifikasi/penggolongan, misalnya variabel sex,

jenis pekerjaan, golongan darah, pendidikan. Di lain pihak variabel numerik (misalnya

berat badan, umur dll) dapat masuk/dapat menjadi variabel katagorik bila variabel

tersebut sudah mengalami pengelompokan. Misalkan kita ambil satu contoh variabel

berat badan, berat badan bila nilainyamasih riil (50 kg, 63 kg dst) maka masih termasuk

variabel numerik, namun bila sudah dilakukan pengelompokan menjadi (<50 kg (kurus),

50-60 kg (sedang) dan > 60 (gemuk) maka variabel tersebut sudah berjenis katagorik.

49

Page 50: Pengantar Analisis Data Edit Ok s2 Kesmas

1. Tujuan Uji kai Kuadrat

Tujuan dari digunakannya uji kai kuadrat adalah untuk untuk menguji perbedaan

proporsi/persentase antara beberapa kelompok data. Dilihat dari segi datanya uji kai

kuadrat dapat digunakan untuk mengetahui hubungan antara variabel katagorik dengan

variabel katagorik. Contoh pertanyaan penelitian untuk kasus yang dapat dipecahkan oleh

uji kai kuadrat misalnya:

a. Apakah ada perbedaan kejadian hipertensi antara wanita dan pria. Kasus ii

berarti akan menguji hubungan variabel hipertensi (katagori dengan klasifikasi ya dan

tidak) dengan variabel jenis kelamin (katagori dengan klasisfikasi wanita dan pria)

b. Apakah ada perbedaan kejadian anemia antara ibu yang kondisi soseknya

tinggi, sedang dan rendah. Pada kasus ini akan menguji hubungan variabel anemia

katagori dengan klasifikasi ya dan tidak) dengan variabel Sosek (katagori dengan

klasifikasi rendah, sedang dan tinggi).

2. Prinsip dasar Uji Kai Kuadrat

Proses pengujian kai kuadrat adalah membandingkan frekuensi yang terjadi

(observasi) dengan frekuensi harapan (ekspektasi). Bila nilai frekuensi observasi dengan

nilai frekuensi harapan sama, maka dikatakan tidak ada perbedaan yang bermakna

(signifikan). Sebaliknya, bila niali frekuensi observasi dan nilai frekuensi harapan

berbeda, maka dikatakan ada perbedaan yang bermakna (signifikan).

Pembuktian dengan uji kai kuadrat dengan menggunakan formula:

df = (k-1)(n-1)

ket :

O = nilai observasi

E = nilai ekspektasi (harapan)

k = jumlah kolom

b = jumlah baris

50

(O – E)2

X2 = Σ E

Page 51: Pengantar Analisis Data Edit Ok s2 Kesmas

Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan dalam

bentuk tabel silang:

Variabel 1 Variabel 2 Jumlah

Tinggi Rendah

Ya a b a+b

Tidak c d c+d

Jumlah a+c b+d n

a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan) masing-masing

sel dicari dengan rumus:

misalkan untuk mencari nilai ekspektasi (E) untuk sel a adalah:

Ea = (a+b) x (a+c)

n

Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama.

Khususnya untuk tabel 2x2, dapat mencari nilai X2 dengan menggunakan rumus:

Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang besar.

Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya digunakan uji kai

kuadrat yang sudah dikoreksi (Yate Corrected atau Yate’s Correction). Formula kai

kuadrat Yate’s Correction adalah sbb:

Atau

51

Total barisnya X total kolomnyaE = Jumlah keseluruhan data

N (ad-bc)2

X2 = (a+c)(b+d)(a+b)(c+d)

(|O – E| - 0,5)2

X2 = E

Page 52: Pengantar Analisis Data Edit Ok s2 Kesmas

3. Keterbatasan Kai Kuadrat

Seperti kita ketahui, uji kai kuadrat menuntut frekuensi harapan/ekspektasi (E)

dalam masing-masing sel tidak boleh terlampau kecil. Jika frekuensi sangat kecil,

penggunaan uji ini mungkin kurang tepat. Oleh karena itu dalam penggunaan kai kuadrat

harus memperhatikan keterbatasanketerbatasan uji ini. Adapun keterbatasan uji kai

kuadrat adalah sbb:

a. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 1.

b. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 5, lebih

dari 20% dari jumlah sel.

Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat, peneliti harus

menggabungkan katagori-katagori yang berdekatan dalam rangka memperbesar frekuensi

harapan dari sel-sel tersebut (penggabungan ini dapat dilakukan untuk analisis tabel

silang lebih dari 2 x 2, misalnya 3 x 2, 3 x 4 dsb). Penggabungan ini tentunya diharapkan

tidak sampai membuat datanya kehilangan makna.

Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti tidak bisa

menggabung katagori-katagorinya lagi), maka dianjurkan menggunakan uji Fisher’s

Exact.

ODDS RATIO (OR) dan RISIKO RELATIF (RR)

Hasil uji Chi Square hanya dapat menyimpulkan ada tidaknya perbedaan proporsi

antar kelompok atau dengan kata lain kita hanya dapat menyimpulkan ada/tidaknya

hubungan du variabel katagorik. Dengan demikian uji Chi Square tidak dapat

menjelaskan derajat hubungan, dalam hal ini uji Chi Square tidak dapat mengetahui

kelompok mana yang memiliki risiko lebih besar disbanding kelompok lain.

Dalam bidang kesehatan untuk mengetahui derajat hubungan, dikenal ukuran

Risiko Relatif (RR) dan Odds Rasio (OR). Risiko relatif membandingkan risiko pada

kelompok terekspose dengan kelompok tidak terekspose. Sedangkan Odds Rasio

52

N {|ad-bc|2 – (N/2)]2

X2 = (a+c)(b+d)(a+b)(c+d)

Page 53: Pengantar Analisis Data Edit Ok s2 Kesmas

membandingkan Odds pada kelompok ter-ekspose dengan Odds kelompok tidak ter-

eksp[ose. Ukuuran RR pada umumnya digunakan pada disain Kohort, sedangkan ukuran

OR biasanya digunakan pada desain kasus kontrol atau ptong lintang (Cross Sectional).

Pengkodean Variabel :

Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hati hati

jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada konsistensi

antara variabel independen dengan variabel dependen. Untuk variabel independen,

kelompok yang berisiko/expose diberi kode tinggi (kode 1) dan kode rendah (kode

0)untuk kelompok yang tidak berisiko/non expose. Pada variabel dependennya, kode

tinggi (kode 1) untuk kelompok kasus atau kelompok yang menjadi fokus pembahasan

penelitian dan kode rendah (kode 0) untuk kelompok non kasus atau yang bukan menjadi

fokus penelitian. Sebagai contoh data di atas pengkodeannya adalah sbb: Ibu tidak

bekerja diberi kode 1 dan bekerja kode 0 dan ibu yang menyusui secara eksklusif diberi

kode 1 dan non eksklusif diberi kode 0. Sebetulnya bisa juga kodenya dibalik, tapi harus

konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0, tdk

eksklusive =1.

Tabel …

Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan

Pendidikan

PengetahuanTotal

Rendah Tinggi

N % n % n %

SD

SMP

SMU

PT

25

1610

5

50,0

40,033,3

20,0

25

2420

20

50,0

60,066,7

80,0

50

4030

25

34,4

27,6

20,7

17,3

Jumlah 56 38,7 89 61,3 145 100,0

Pembuatan persentase pada analisis tabel silang harus diperhatikan agar tidak

salah dalam menginterpretasi. Pada jenis penelitian survei/Cross sectional atau Kohort,

53

Page 54: Pengantar Analisis Data Edit Ok s2 Kesmas

pembuatan persentasenya berdasarkan nilai variabel independen. Contoh di atas jenis

penelitiannya Cross Sectional, variabel pendidikan sebagai variabel independen dan

pengetahuan sebagai variabel dependen. Dapat dilihat di tabel persentasenya berdasarkan

masing-masing kelompok tingkat pendidikan (persentase baris). Contoh di atas dapat di

interpretasikan sbb:

Dari 50 pasien yang berpendidikan SD, ada sebanyak 25 (50,0%) pasien

mempunyai pengetahuan tinggi. Dari 40 pasien yang berpendidikan SMP, ada sebanyak

24 (60,0%) yang berpengetahuan tinggi. Dari 30 pasien yang berpendidikan SMU ada

sebanyak 20 (66,7%) yang berpengetahuan tinggi. Dan dari 25 pasien yang

berpendidikan PT, ada sebanyak 20 (80,0%) yang berpengetahuan tinggi. Dari data ini

terlihat ada kecenderungan bahwa semakin tinggi tingkat pendidikan akan semakin tinggi

tingkat pengetahuannya.

Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan persentasenya

berdasarkan variabel dependennya, misalkan terlihat pada tabel berikut:

Tabel …

Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin

Jenis

Kelamin

Kanker ParuTotal

Kasus Kontrol

N % n % n %

Laki-laki

Perempuan

75

25

75,0

25,0

30

70

30,0

70,0

105

95

52,5

47,5

Jumlah 100 50,0 100 50,0 200 100,0

Interpretasinya:

Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden berjenis

kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita kanker paru, ada

sebanyak (30%) responden yang berjenis kelamin laki-laki.

54

Page 55: Pengantar Analisis Data Edit Ok s2 Kesmas

KASUS :

UJI KAI KUADRAT

Suatu penelitian ingin mengetahui hubngan pekerjaan dengan perilaku menyusui.

Variabel pekerjaan berisi dua nilai yaitu tidak bekerja dan bekerja, dan variabel menyusui

berisi dua nilai yaitu eksklusif dan non eksklusif. Untuk mengerjakan soal ini gunakan

data “Susu. SAV”.

Adapun prosedur di SPSS sbb:

1. Pastikan anda berada pada data editor ASI.SAV

2. Dari menu SPSS, klik “Analyze”, kemudian pilih “Descriptive statistic”, lalu pilih

“Crosstab”, sesaat akan muncul menu Crosstabs

3. Dari menu crosstab, ada dua kotak yang harus diisi, pada kotak “Row(s)’ diisi

variabel independen (variabel bebas), dalam contoh ini variabel pekerjaan masuk ke

kotak “Row(s)”.

4. pada kotak “Column(s)” diisi variabel dependennya, dalam contoh ini variabel

perilaku menyusui masuk ke kotak “Column(s)”.

55

Page 56: Pengantar Analisis Data Edit Ok s2 Kesmas

5. Klik option “Statistics..”, klik pilihan “Chi Square” dan klik pilihan “Risk”

6. Klik “Continue”

7. Klik option “Cells”, bawa bagian “Percentages” dan klik “Row”

8. Klik “Continue”

9. Klik “OK” hasilnya tampak sbb:

56

Page 57: Pengantar Analisis Data Edit Ok s2 Kesmas

Crosstabs

status pekerjaan ibu * status menyusui asi Crosstabulation

status menyusui asiTotal

tdkEKSKLUSIVE EKSKLUSIVE

status pekerjaanibu

KERJA Count% within statuspekerjaan ibu

17

68.0%

8

32.0%

25

100.0%

tidak kerja Count% within statuspekerjaan ibu

7

28.0%

18

72.0%

25

100.0%

Total Count% within statuspekerjaan ibu

24

48.0%

26

52.0%

50

100.0%

Chi-Square Tests

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Pearson Chi-SquareContinuity Correctiona

Likelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases

8.013b

6.4908.244

7.853

50

111

1

.005

.011

.004

.005.010 .005

a. Computed only for a 2x2 table

b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 12.

00.

57

Page 58: Pengantar Analisis Data Edit Ok s2 Kesmas

Risk Estimate

Value95% Confidence

IntervalLower Upper

Odds Ratio for statuspekerjaan ibu (TIDAKKERJA / KERJA)For cohort statusmenyusui asi = YAEKSKLUSIVEFor cohort statusmenyusui asi =TIDAK EKSKLUSN of Valid Cases

5.464

2.250

.412

50

1.627

1.209

.208

18.357

4.189

.816

Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola menyusui,

dengan angka di masing-masing selnya. Angka yang paling atas adalah jumlah kasus

masing-masing sel, angka kedua adalah persentase menurut baris (data yang kita analisis

“ASI.SAV, berasal dari penelitian Cross Sectional sehingga persen yang ditampilkan

adalah persentase baris, namun bila jenis penelitiannya Case Control angka persentase

yang digunakan adalah persentase kolom.

Dari analisis data di atas maka interpretasinya:

Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara eksklusif.

Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui secara eksklusif.

Hasil uji Chi Square dapat dilihat pada kotak “Chi Square Test”. Dari print out muncul

dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan, “Angka yang mana

yang kita pakai?”, apakah Pearson, Continuity Correction, Likelihood atau Fisher?”

Aturan yang berlaku pada Chi Square adalah sbb:

a. Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka yang

digunakan adalah “Fisher’s Exact Test”

b. Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai sebaiknya

“Continuity Correction (a)”

c. Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka digunakan uji

“Pearson Chi Square”

58

Page 59: Pengantar Analisis Data Edit Ok s2 Kesmas

d. Uji “Likelihood Ratio” dan “Linear-by-Linear Assciation”, biasanya digunakan

untuk keperluan lebih spesifik, misalnya analisis stratifikasi pada bidang

epidemiologi dan juga untuk mengetahui hubungan linier dua variable katagorik,

sehingga kedua jenis ini jarang digunakan.

Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b dibawah

kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti pada tabel silang

diatas tidak ditemukan ada nilai E < 5

Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan koreksi

(Continuity Correction) dengan p value dapat dilihat pada kolom “Asymp. Sig” dan

terlihat p valuenya = 0,011. berarti kesimpulannya ada perbedaan perilaku menyusui

eksklusif antara ibu yang bekerja dengan ibu yang tidak bekerja. Dengan kata lain dapat

disimpulkan bahwa ada hubungan status pekerjaan dengan perilaku menyusui eksklusif.

Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya hubungan

dua variabel, sehingga uji ini tidak dapat untuk mengetahui derajat/kekuatan hubungan

dua variabel. Untuk mengetahui besar/kekuatan hubungan banyak metodenya tergantung

latar belakangdisiplin keilmuannya, misal untuk ilmu sosial dengan melihat koefisien Phi,

koefisien Contingency dan cramer’s V. sedangkan untuk bidang kesehatan terutama

kesehatan masyarakat digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis

penelitian Cross Sectional dan Case Control, sedangkan nilai RR digunakan bila jenis

penelitiannya Kohort.

Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464 (95% CI:

1,627 – 18,357). Sedangkan nilai RR terlihat dari baris For Cohort yaitu bearnya 2,250

(95% CI: 1,209 – 4,189). Pada data ini berasal dari penelitian Cross Sectional maka kita

dapat menginterpretasikan nialai OR=5,464 sbb: Ibu yang tidak bekerja mempunyai

peluang 5,46 kali untuk menyusui eksklusif dibandingkan ibu yang bekerja.. Pada

perintah Crosstab nilai OR akan keluar bila tabel silang 2 x 2, bila tabel silang lebih dari

2 x 2, misalnya 3 x 2, 4 x 2 dsb, maka nilai OR dapat diperoleh dengan analisis regresi

logistik sederhana dengan cara membuat “Dummy variable”

59

Page 60: Pengantar Analisis Data Edit Ok s2 Kesmas

Penyajian dan Interpretasi di Laporan Penelitian:

Tabel …

Distribusi Responden Menurut Jenis Pekerjaan dan Perilaku menyusui

Jenis

Pekerjaan

Menyusui TotalOR

(95% CI)

P

valueTdk Eksklusif Eksklusif

n % n % n %

Bekerja

Tdk Bekerja

17

7

68,0

28,0

8

18

32,0

72,0

25

25

100

100

5,464

1,6 – 18,3

0,011

Jumlah 26 52,0 24 48,0 50 100

Hasil analisis hubungan antara status pekerjaan dengan perilaku menyusui eksklusif

diperoleh bahwa ada sebanyak 8 (32%) ibu yang bekerja menyusui bayi secara eksklusif.

Sedangkan diantara ibu yang tidak bekerja, ada 18 (72,0%) yang menyusui secara

eksklusif. Hasil uji statistik diperoleh nilai p=0,011 maka dapat disimpulkan ada

perbedaan proporsi kejadian menyusui eksklusif antara ibu tidak bekerja dengan ibu yang

bekerja (ada hubungan yang signifikan antara pekerjaan dengan perilaku menyusui). Dari

hasil analisis diperoleh pula nilai OR=5,464, artinya ibu tidak bekerja mempunyai

peluang 5,46 kali untuk menyusui eksklusif dibanding ibu yang bekerja.

60

Page 61: Pengantar Analisis Data Edit Ok s2 Kesmas

ANALISIS HUBUNGAN

NUMERIK DENGAN NUMERIK

UJI KORELASI DAN REGRESI LINIER SEDERHANA

Seringkali dalam suatu penelitian kita ingin mengetahui hubungan antara dua

variabel yang berjenis numerik, misalnya huubungan berat badan dengan tekanan darah,

hubungan umur dengan kadar Hb, dsb. Hubungan antara dua variabel numerik dapat

dihasilkan dua jenis, yaitu derajat/keeratan hubungan, digunakan korelasi. Sedangkan bila

ingin mengetahui bentuk hubungan antara dua variabel digunakan analisis regresi linier.

1. Korelasi

Korelasi di samping dapat untuk mengetahui derajat/keeratan hubungan, korelasi

dapat juga untuk mengetahui arah hubungan dua variabel numerik. Misalnya, apakah

huubungan berat badan dan tekanan darah mempunyai derajat yang kuat atau lemah, dan

juga apakah kedua variabel tersebut berpola positif atau negatif.

Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari

diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik yang menunjukkan titik-

titik perpotongan nilai data dari dua variabel (X dan Y). Pada umumnya dalam grafik,

variabel independen (X) diletakkan pada garis horizontal sedangkan variabel dependen

(Y) pada garis vertikal.

Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara dua

variabel X dan Y. selain memberi informasi pola hubungan dari kedua variabel diagram

tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel tersebut.

61

Page 62: Pengantar Analisis Data Edit Ok s2 Kesmas

disimbolkan dengan r (huruf r kecil).

Koefisien korelasi (r) dapat diperoleh dari formula berikut:

Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya antara –1 s.d.

+1.

r = 0 → tidak ada hubungan linier

r = -1 → hubungan linier negatif sempurna

r = +1 → hubungan linier positif sempurna

Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan positif

terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya semakin

bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya.

Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel diikuti penurunan

variabel yang lain, misalnya semakin bertambah umur (semakin tua) semakin rendah

kadar Hb-nya.

Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat dibagi dalam 4

area, yaitu:

62

N (Σ XY) – (ΣX ΣY)r = [NΣX2 – (ΣX)2] [NΣY – (ΣY)2

r = 0,00 – 0,25 → tidak ada hubungan/hubungan lemah

r = 0,00 – 0,25 → hubungan sedang

r = 0,00 – 0,25 → hubungan kuat

r = 0,00 – 0,25 → hubungan sangat kuat / sempurna

Page 63: Pengantar Analisis Data Edit Ok s2 Kesmas

Uji Hipotesis

Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk

menjelaskan derajat hubungan derajat hubungan linier anatara dua variabel. Selanjutnya

perlu dilakukan uji hipotesis untuk mengetahui apakah hubungan antara dua

variabelteradi secara signifikan atau hanya karena faktor kebetulan dari random sample

(by chance). Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama:

membandingkan nilai r hitung dengan r tabel, kedua: menggunakan pengujian dengan

pendekatan distribusi t. Pada modul ini kita gunakan pendekatan distribusi t, dengan

formula:

df = n – 2

n = jumlah sampel

2. Regresi Linier Sederhana

Seperti sudah diuraikan di depan bahwa analisis hubungan dua variabel dapat

digunakan untuk mengetahui bentuk hubungan dua variabel, yaitu dengan analisis

regresi.

Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk

mengetahui bentuk hubungan antar dua atau lebih variabel. Tujuan analisis regresi adalah

untuk membuat perkiraan (prediksi) nilai suatu variabel (variabel dependen) melalui

variabel yang lain (variabel independen).

Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat badan dan

tekanan darah. Dalam kasus ini berarti berat badan sebagai variabel independen dan

tekanan darah sebagai variabel dependen, sehingga dengan regresi kita dapat

memperkirakan besarnya nilai tekanan darah bila diketahui data berat badan.

63

n – 2t = r 1 – r2

Page 64: Pengantar Analisis Data Edit Ok s2 Kesmas

Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh

dengan berbagai cara/metode. Salah satu cara yang sering digunakan oleh peneliti adalah

dengan menggunakan metode kuadrat terkecil (least square). Metode least square

merupakan suatu metode pembuatan garis regresi dengan cara meminimalkan jumlah

kuadrat jarak antara nilai Y yang teramati dan Y yang diramalkan oleh garis regresi itu.

Secara matematis persamaan garis sbb:

Persamaan di atas merupakan model deterministik yang secara sempurna/tepat dapat

digunakan hanya untuk peristiwa alam, misalnya hukum gravitasi bumi, yang ditemukan

oleh Issac Newton adalah contoh model deterministik. Variabel kecepatan benda jatuh

(variabel dependen) pada keadaan yang ideal adalah fungsi matematik sempurna (bebas

dari kesalahan) dari variabel independen berat beda dan gaya gravitasi.

Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius dapat dibuat

persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat dihitung/diprediksi secara

sempurna/tepat (bebas kesalahan) bila suhu celsius (X) diketahui.

Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada kemungkinan

kesalahan/penyimpangan (tidak eksak), aretinya untuk beberapa nilai X yang sama

kemungkinan diperoleh nilai Y yang berbeda. Misalnya hubungan berat badan dengan

tekanan darah, tidak setiap orang yang berat badannya sama memiliki tekanan darah yang

sama. Oleh karena hubungan X

dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka persamaan garis yang

dibentuk menjadi:

Y = Variabel Dependen

X = Variabel Independen

a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0

b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X

berubah satu unit pengukuran

e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati

64

Y = a + bx

Y = a + bx + e

Page 65: Pengantar Analisis Data Edit Ok s2 Kesmas

dengan nilai Y yang sesungguhnya pada titik X tertentu

Kesalahan Standar Estimasi (Standard Error of Estimate/Se)

Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan estimasi

untuk menjelaskan nilai variabel dependen yang sesungguhnya. Semakin kecil nilai Se,

makin tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan niali

variabel dependen yang sesungguhnya. Dansebaliknya, semakin besar nilai Se, makin

rendah ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel

dependen yang sesungguhnya. Untuk mengetahhui besarnya Se dapat dihitung melalui

formula sbb:

Koefisien Determinasi (R2)

Ukuran yang penting dan sering digunakan dalam analisisregresi adalah koefisien

determinasi atau disimbolkan R2 (R Square). Koefisien determinasi dapat dihitung

dengan mengkuadratkan nilai r, atau dengan formula R2 = r2. Koeifisien determinasi

berguna untuk mengetahui seberapa besar variasi variabel dependen (Y) dapat dijelaskan

oleh variabel independen (X). atau dengan kata lain R2 menunjukkan seberapa jauh

65

ΣXY – (ΣXΣY)/nb = ΣX2 – (ΣX)2/n

a = Y - bX

Se = ΣY2 - aΣY - bΣXY n-2

Page 66: Pengantar Analisis Data Edit Ok s2 Kesmas

variabel independen dapat memprediksi variabel dependen.Semakin besar nilai R square

semakin baik/semakin tepat variabel independen memprediksi variabel dependen.

Besarnya nilai R square antara 0 s.d. 1 atau antara 0% s.d. 100%.

KASUS :

KORELASI DAN REGRESI

Sebagai contoh kita akan melakukan analisis korelasi dan regresi menggunakan

data ‘ASI.SAV’ dengan mengambil variabel yang bersifat numerik yaitu umur dengan

kadar Hb (diambil Hb pengukuran pertama: Hb1).

A. Korelasi

Untuk mengeluarkan uji korelasi langkahnya adalah sbb:

1. Aktifkan data ‘ASI.SAV’

2. Dari menu utama SPSS, klik ‘Analyze’, kemudian pilih ‘Correlate’, dan

lalu pilih ‘Bivariate’, dan muncullah menu Bivariate Correlations:

3. Sorot variabel ‘Umur dan Hb1, lalu masukkan ke kotak sebelah kanan

‘variables’.

4. Klik ‘OK” dan terlihat hasilnya sbb:

66

Page 67: Pengantar Analisis Data Edit Ok s2 Kesmas

Correlations

Correlations

beratbadan ibu

beratbadan bayi

berat badan ibu Pearson CorrelationSig. (2-tailed)N

1

50

.684**.000

50berat badan bayi Pearson Correlation

Sig. (2-tailed)N

.684**.000

50

1

50**. Correlation is significant at the 0.01 level (2-tailed).

Tampilan analisis korelasi berupa matrik antar variabel yang di korelasi,

informasi yang muncul terdapat tiga baris, baris pertama berisi nilai korelasi (r), baris

kedua menapilkan nilai p (P value), dan baris ketiga menampilkan N (jumlah data). Pada

hasil di atas diperoleh nilai r = 0,684 dan nilai p = 0,0005. Kesimpulan dari hasil tersebut:

hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan yang kuat

dan berpola positif artinya semakin bertambah berat badannya semakin tinggi berat

bayinya. Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan

ibu dengan berat badan bayi (p = 0,0005).

B. Regresi Linier Sederhana

Berikut akan dilakukan analisis regresi linier dengan menggunakan variabel ‘berat

badan ibu’ dan ‘berat badan bayi’ dari data ASI.SAV. dalam analisis regresi kita harus

menentukan variabel dependen dan variabel independennya. Dalam kasus ini berarti berat

badan ibu sebagai variabel independen dan berat badan bayi sebagai variabel dependen.

Adapun caranya:

1. Pastikan tampilan berada pada data editor ASI.SAV, jika belum aktifkan data

tersebut.

2. Dari menu SPSS, Klik ‘Analysis’, pilih ‘Regression’, pilih ‘Linear’

3. Pada tampilan di atas ada beberpa kotak yang harus diisi. Pada kotak ‘Dependen’

isikan variabel yang kita perlakukan sebagai dependen (dalam contoh ini berarti berat

67

Page 68: Pengantar Analisis Data Edit Ok s2 Kesmas

badan bayi) dan pada kotak Independent isikan variabel independennya (dalam

contoh ini berarti berat badan ibu), caranya

4. klik ‘berat badan bayi’, masukkan ke kotak Dependent

5. Klik ‘berat badan ibu’, masukkan ke kotak Independent

6. Klik ‘OK’, dan hasilnya sbb:

Regression

Model Summary

Model R R Square AdjustedR Square

Std. Error ofthe Estimate

1 .684a .468 .456 430.715

a. Predictors: (Constant), berat badan ibu

68

Page 69: Pengantar Analisis Data Edit Ok s2 Kesmas

ANOVAb

Model Sum of

Squares

df Mean

Square

F Sig.

1 Regression

Residual

Total

7820262

8904738

16725000

1

48

49

7820261.965

185515.376

42.154 .000a

a. Predictors: (Constant), berat badan ibu

b. Dependent Variable: berat badan bayi’

Coefficientsa

Model

UnstandardizedCoefficients

StandardizedCoefficients

t Sig.

B Std. Error Beta1 (Constant)

berat badan ibu657.92944.383

391.6766.836 .684

1.6806.493

.099

.000a. Dependent Variable: berat badan bayi

Dari hasil di atas dapat diinterpretasikan dengan mengkaji nilai-nilai yang penting dalam

regresi linier diantaranya: koefisien determinasi, persamaan garis dan p value. Nilai

koefisien determinasi dapat dilihat dari nilai R Square (anda dapat lihat pada tabel

‘Model Summary’) yaitu besarnya 0,468 artinya, persamaan garis regresi yang kita

peroleh dapat menerangkan 46,8% variasi berat badan bayi atau persamaan garis yang

diperoleh cukup baik untuk menjelaskan variabel berat badan bayi. Selanjutnya pada

tabel ANOVAb, diperoleh nilai p (di kolom Sig) sebesar 0,0005, berarti pada alpha 5%

kita dapat menyimpulkan bahwa regresi sederhana cocok (fit) dengan data yang ada

persamaan garis regresi dapat dilihat pada tabel ‘Coefficienta’ yaitu pada kolom B. Dari

hasil diatas didapat nilai konstant (nilai ini merupakan nilai intercept atau nilai a) sebesar

657,93 dan nilai b = 44,38, sehingga persamaan regresinya:

Y = a + bX

Berat badan bayi = 657,93 + 44,38(berat badan ibu)

69

Page 70: Pengantar Analisis Data Edit Ok s2 Kesmas

Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu nilai berat

badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada kolom Sig T, dan

menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak hipotesis nol, berarti ada

hubngan linier antara berat badan ibu dengan berat badan bayi. Dari nilai b=44,38 berarti

bahwa variabel berat badan bayi akan bertambah sebesar 44,38 gr bila berat badan ibu

bertambah setiap satu kilogram.

Penyajian dan Interpretasi

Tabel …

Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi

Variabel R R2 Persamaan garis P value

Umur 0,684 0,468 bbayi =657,93 + 44,38 *bbibu 0,0005

Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan kuat

(r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu semakin besar

berat badan bayinya. Nilai koefisien dengan determinasi 0,468 artinya, persamaan garis

regresi yang kita peroleh dapat menerangkan 46,8,6% variasi berat badan bayi atau

persamaan garis yang diperoleh cukup baik untuk menjelaskan variabel berat badan bayi.

Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan ibu dengan

berat badan bayi (p=0,005).

Memprediksi variabel Dependen

Dari persamaan garis yang didapat tersebut kita dapat memprediksi variabel dependen

(berat badan bayi) dengan variabel independen (berat badan ibu). Misalkan kita ingin

mengetahui berat badan bayi jika diketahui berat badan ibu sebesar 60 kg, maka:

Berat badan bayi =657,93 + 44,38(berat badan ibu)

Berat badan bayi= 657,93 + 44,38(60)

Berat badan bayi = 3320,73

70

Page 71: Pengantar Analisis Data Edit Ok s2 Kesmas

Ingat prediksi regresi tidak dapat menghasilkan angka yang tepat seperti diatas, namun

perkiraannya tergantung dari nilai ‘Std, Error of The estimate’(SEE) yang besarnya

adalah 430,715 (lihat di kotak Model Summary). Dengan demikian variasi variabel

dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan tingkat kepercyaan 95% dan

didapat nilai Z = 1,96, sehingga variasinya 1,96 * 430,715 = ± 844,201

Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg diprediksikan berat

badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr

C. Membuat Grafik Prediksi

Langkahnya:

1. Klik ‘Graphs, pilih ‘Scatter’

2. Klik Sampel klik ‘Define’

3. Pada kotak Y Axis isikan variabel dependennya (masukkan veriabel dependennya

(masukkan Hb1)

4. Pada kotak X Axis isikan variabel independennya (masukkan veriabel

dependennya (masukkan Umur)

5. Klik ‘OK’

6. Terlihat di layar grafik scatter plot-nya (garis regresi belum ada?)

7. Untuk mengeluarkan garisnya, klik grafiknya 2 kali

8. klik’Chart’

9. pada kotak ‘Fit Line, Klik Total

10. klik ‘OK’ maka muncul garis regresi

71