harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/.../Buku+Biostatistika+Dasar+1.pdfyang...
Transcript of harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/.../Buku+Biostatistika+Dasar+1.pdfyang...
BIOSTATISTIKA DASAR
Johan Harlan
Pusat Studi Informatika Kedokteran
Universitas Gunadarma
PENERBIT GUNADARMA
Perpustakaan Nasional : Katalog Dalam Terbitan (KDT)
Harlan, Johan
Biostatistika Dasar, Johan Harlan
Jakarta : Penerbit Gunadarma, 2007
viii, 169 hlm; 18.2cm x 25.7cm
Bibliografi: hlm 153
ISBN 978-979-1223-04-01
1. Biostatistika Dasar. 1. Judul.
Biostatistika Dasar
Penulis : Johan Harlan
Cetakan Pertama, September 2007
Cetakan Kedua (Revisi), Desember 2009
Cetakan Ketiga (Revisi), April 2011
Cetakan Keempat (Revisi), Juni 2015
Desain cover : Joko Slameto
Diterbitkan pertama kali oleh Gunadarma
Jl. Margonda Raya No. 100, Pondok Cina, Depok 16424
Telp. 78881112, 7863819 Faks. 7872829
e-mail: [email protected]
© Hak Cipta dilindungi undang-undang. Dilarang mengutip atau
memperbanyak dalam bentuk apapun sebagian atau seluruh isi buku tanpa
ijin tertulis dari penerbit.
v
KATA PENGANTAR
Buku Biostatistika Dasar ini disusun terutama untuk mahasiswa
program D3 Kesehatan. Walaupun dalam pendidikan di jenjang D3 lebih
diutamakan penguasaan keterampilan kerja, pengetahuan Statistika tetap
dibutuhkan untuk mempelajari cara pengumpulan data, menganalisis data
yang ditemukan dan diperoleh, membuat laporan dan kertas kerja, serta
membaca dan menginterpretasikan tulisan ilmiah. Sehubungan dengan
karakteristik Ilmu Kesehatan yang khas sebagai lahan terapannya, dalam
bidang Biostastika digunakan berbagai teknik dan metode yang agak berbeda
dengan Statistika Umum. Pengajaran Biostatistika di jenjang D3 Kesehatan
umumnya hanya diberikan selama satu semester, sehingga dalam buku ini
hanya akan dibahas dasar-dasar terpenting Biostistika.
Penulis mengucapkan terima kasih kepada segenap pihak yang telah
membantu terlaksananya penerbitan buku ini. Semua kritik dan saran akan
diterima dengan tangan terbuka.
Johan Harlan
Daftar Isi
vi
DAFTAR ISI
Kata Pengantar v
Daftar Isi vi
BAB 1 KONSEP DASAR STATISTIKA
Pengertian Statistika 1
Ruang Lingkup Statistika 1
D a t a 2
V a r i a b e l 3
Populasi dan Sampel 4
Latihan 1 6
BAB 2 PERINGKASAN DAN PENYAJIAN DATA
Pengertian Peringkasan Dan Penyajian Data 8
Macam Cara Penyajian Data 8
T a b e l 9
G r a f i k 14
Latihan 2 20
Lampiran 2.1 23
BAB 3 NILAI TENGAH DAN NILAI PENYEBARAN
Nilai Tengah 28
Ukuran Lokasi 31
Nilai Penyebaran 33
Latihan 3 38
BAB 4 P R O B A B I L I T A S
Pengertian Probabilitas 41
Hukum Probabilitas 43
Aturan Perhitungan 44
Distribusi Probabilitas 46
Distribusi Binomial 47
Distribusi Normal 51
Latihan 4 55
Lampiran 4.1 59
Daftar Isi
vii
BAB 5 S A M P L I N G
Konsep Dasar Sampling 60
Metode Sampling 61
Distribusi Sampling 65
Latihan 5 69
BAB 6 DASAR-DASAR PENGUJIAN HIPOTESIS
Pengertian Dan Jenis Uji Hipotesis 72
Teori Kesalahan 74
Uji Satu-Sisi Dan Uji Dua-Sisi 76
Langkah-Langkah Uji Hipotesis 77
Latihan 6 79
BAB 7 UJI Z DAN UJI t
U j i Z 82
U j i t 85
N i l a i p 88
Latihan 7 91
BAB 8 UJI DATA KATEGORIK
U j i 2χ 94
Uji Eksak Fisher 99
Latihan 8 103
BAB 9 KORELASI DAN REGRESI LINEAR
K o r e l a s i 107
Regresi Linear 111
Latihan 9 115
BAB 10 STATISTIK VITAL
Pengertian Statistik Vital 118
Angka Kematian 118
Angka Kelahiran 121
Latihan 10 123
BAB 11 STATISTIK RUMAH SAKIT
Statistik Pasien Rawat Jalan 126
Statistik Pasien Rawat Inap 127
Latihan 11 134
Daftar Isi
viii
BAB 12 TABEL KEHIDUPAN
Pengertian Tabel Kehidupan 138
Interval Usia 138
Jumlah Individu Hidup 140
Proporsi Kematian 141
Populasi Stasioner 142
Harapan Hidup 142
Peluang Hidup 143
Tabel Kehidupan Telusuran 144
Latihan 12 147
Lampiran 12.1 150
KEPUSTAKAAN 153
ADDENDUM A BILANGAN ACAK 154
ADDENDUM B1 DISTRIBUSI PROBABILITAS
BINOMIAL
156
ADDENDUM B2 PROBABILITAS BINOMIAL
KUMULATIF
162
ADDENDUM C DISTRIBUSI Z 167
ADDENDUM D NILAI KRITIS DISTRIBUSI t 168
ADDENDUM E NILAI KRITIS DISTRIBUSI 2χχχχ 169
INDEKS 205
Konsep Dasar Statistika
1
B A B 1
KONSEP DASAR STATISTIKA
� Pengertian Statistika
Statistika adalah sekumpulan konsep dan metode yang digunakan
untuk mengumpulkan dan menginterpretasikan data kuantitatif dalam bidang
kegiatan tertentu dan mengambil kesimpulan pada situasi dengan
ketidakpastian dan bervariasi.
Istilah Statistika berasal dari kata ‘status’ (Latin) yang berarti ‘negara’.
Asal kata status disebabkan pada awal perkembangannya, Statistika semata-
mata dikaitkan dengan penyajian fakta-fakta dan angka-angka tentang situasi
perekonomian, kependudukan, dan politik di suatu negara.
Biostatistika adalah salah satu cabang Statistika yang digunakan untuk
mempelajari aspek kuantitatif Biologi. Istilah lain yang sering dipakai dalam
pengertian yang sama atau hampir sama dengan Biostatistika adalah
Biometri, selain itu istilah Biostatistika seringkali pula diinterpretasikan
dalam ruang lingkup yang lebih terbatas, yaitu dalam pengertian yang sama
dengan Statistika Kesehatan atau Statistika Kedokteran.
� Ruang Lingkup Statistika
Secara umum, Statistika dibedakan atas:
1. Statistika Deskriptif:
Merupakan bagian Statistika yang mencakup metode untuk
meringkaskan dan mendeskripsikan segi-segi yang penting pada data.
Contoh penggunaan Statistika Deskriptif ialah pada Sensus Nasional.
2. Statistika Inferensi:
Merupakan bagian Statistika yang mencakup metode untuk mengevaluasi
informasi yang terkandung dalam data dan menafsirkan pengetahuan
baru yang diperoleh dari informasi itu. Contoh penggunaan Statistika
Inferensi yaitu dalam polling pendapat pada pemilihan presiden.
Secara spesifik, ruang lingkup kerja Statistika adalah:
1. Membimbing perancangan eksperimen atau survei.
2. Menganalisis data.
3. Menyajikan dan menginterpretasikan hasil eksperimen atau survei.
Konsep Dasar Statistika
2
Contoh 1.1: Simpson (1957) mempelajari pengaruh kebiasaan merokok selama
kehamilan terhadap tingkat prematuritas kelahiran bayi pada 7,499 pasien.
Ditemukan bahwa angka prematuritas meningkat sebanding dengan jumlah
batang rokok yang diisap setiap hari. The Surgeon General's Report on
Smoking and Health (1979) menyimpulkan bahwa: "Kebiasaan merokok
pada ibu hamil memiliki dampak yang secara bermakna mengganggu
kesehatan janin dan bayi neonatus."
� D a t a
Dalam pengamatan terhadap berbagai fenomena, pengamatan tersebut
biasanya ditujukan terhadap beberapa karakteristik tertentu, misalnya usia,
berat badan, tinggi badan, status pernikahan, kebiasaan merokok, dan
sebagainya. Karakteristik ini disebut variabel, sedangkan nilai-nilai
pengamatan yang tercatat untuk masing-masing variabel adalah data.
Data yang dikumpulkan dapat bersifat kualitatif ataupun kuantitatif:
1. Data kuantitatif: adalah fakta yang direpresentasikan dalam bentuk
numerik. Contoh data kuantitatif yaitu tinggi badan (dalam cm), berat
badan (dalam kg), dan sebagainya.
2. Data kualitatif: adalah fakta yang dinyatakan dalam bentuk sifat dan
bukan dalam bentuk numerik. Contoh data kualitatif antara lain jenis
kelamin, suku bangsa, dan sebagainya.
Metode Statistika terutama dikerjakan terhadap data kuantitatif atau
data kualitatif yang telah dikuantitatifkan. Data kuantitatif dibedakan atas
data diskret dan data kontinu.
Data kontinu (data ukur) adalah data yang nilainya dapat terletak di
setiap titik pada garis bilangan, diperoleh melalui proses pengukuran
(measurement), misalnya suhu tubuh (dalam oC).
Data diskret (data hitung) adalah data yang nilainya hanya dapat
berupa bilangan bulat non-negatif, diperoleh melalui proses pencacahan
(counting), misalnya jumlah gigi sehat dalam mulut seseorang. Data kontinu
dapat dijadikan diskret dengan proses pembulatan untuk menyederhanakan
perhitungan.
Berdasarkan sumber perolehannya, data dibedakan atas data primer dan
data sekunder. Data primer adalah data yang dikumpulkan sendiri oleh
peneliti dari subjek penelitian, sedangkan data sekunder adalah data yang
telah dikumpulkan terlebih dahulu dari subjek penelitian oleh pihak lain
dengan maksud dan tujuan yang berbeda dengan maksud dan tujuan peneliti.
Konsep Dasar Statistika
3
Contoh 1.2: Tidak adanya kontrasepsi berkaitan dengan tingkat abortus yang sangat tinggi
di Uni Soviet–120 abortus untuk setiap 100 kelahiran, dibandingkan dengan 20 per
100 kelahiran di Inggris, yang aksesnya terhadap kontrasepsi terjamin. Dukungan
yang tak memadai bagi Keluarga Berencana di Amerika Serikat menghasilkan 40
abortus untuk setiap 100 kelahiran–tingkat yang lebih rendah daripada Uni Soviet,
namun dua kali lebih tinggi dibandingkan dengan kebanyakan negara industri.
(The Boston Globe, 19 Januari, 1990)
Pada contoh ini, sebagian besar informasi tercakup dalam tiga angka:
120, 20, dan 40. Angka-angka ini sedikit banyak telah memberikan wawasan
mengenai konsekuensi sikap yang berbeda-beda terhadap Keluarga
Berencana.
� Variabel
Di atas telah dinyatakan bahwa variabel adalah karakteristik yang
diamati pada subjek penelitian, yang menunjukkan hasil pengamatan yang
bervariasi dari satu ke lain subjek. Menurut skala pengamatannya, variabel
dibedakan atas:
1. Skala nominal:
Merupakan bentuk pengamatan yang paling rendah tingkatannya.
Pengamatan terhadap tiap subjek tidak menghasilkan data kuantitatif,
sehingga pada skala ini hanya dapat dilakukan klasifikasi pengamatan.
Data yang diperoleh pada skala pengamatan ini dinamakan data nominal.
Contoh:
- Warna kulit: putih, hitam, dan kuning.
- Suku bangsa: Jawa, Sunda, Madura, dan sebagainya.
- Agama: Islam, Kristen, Hindu-Bali, dan sebagainya.
Apabila tidak dikuantifikasikan, maka yang dianalisis secara statistik
hanyalah frekuensi menurut kategori, misalnya di antara sekelompok
subjek, berapa orang anggota yang termasuk suku Jawa, berapa orang
yang termasuk suku Sunda, dan sebagainya.
2. Skala ordinal:
Pada skala ini pengamatan terhadap subjek juga belum menghasilkan
data kuantitatif, sehingga hanya dapat dilakukan klasifikasi pengamatan,
tetapi klasifikasi ini dapat disusun menurut urutan (orde) tertentu
Contoh:
- Status sosial-ekonomi: tinggi, menengah, dan rendah
Konsep Dasar Statistika
4
- Tingkat kesadaran: kompos mentis, apatis, somnolen, sopor, dan
koma.
- Skor APGAR untuk neonatus.
Dalam analisis statistik, data ordinal seringkali diperlakukan dan diolah
dengan cara yang sama seperti data nominal.
3. Skala interval:
Pada skala ini selain pengklasifikasian dan pengurutan, dapat pula
ditentukan jarak (interval) antar dua titik skala (ada satuan pengukuran).
Contoh: Suhu tubuh (dalam oC), tahun kelahiran subjek, dan sebagainya.
4. Skala rasio:
Merupakan bentuk skala pengamatan yang tertinggi tingkatannya. Pada
skala ini, selain klasifikasi, urutan pengamatan, dan jarak antar dua titik
skala, juga dapat ditentukan titik nol mutlak, sehingga dapat dihitung
rasio (perbandingan) antar dua hasil pengamatan. Pada skala interval,
titik nol mutlak tidak ada, sehingga rasio antar dua hasil pengamatan
tidak dapat dihitung.
Contoh: Usia (dalam tahun), berat badan (dalam kg), tinggi badan (dalam
cm), dan sebagainya.
Untuk keempat skala pengamatan ini, pada tiap skala yang lebih tinggi
tercakup semua kapasitas yang ada pada tiap skala yang lebih rendah.
Misalnya skala interval mencakup semua kapasitas yang ada pada skala
nominal maupun ordinal (kapasitas untuk pengklasifikasian dan pengurutan
kategori), namun tidak mencakup semua kapasitas yang ada pada skala rasio
(kapasitas perhitungan rasio antar dua hasil pengamatan). Secara skematis,
kapasitas yang tercakup pada keempat skala pengamatan ini dapat dilihat
pada tabel 1.1.
� Populasi dan Sampel
Populasi adalah himpunan seluruh subjek yang dipelajari (diselidiki /
diinvestigasi), sedangkan sampel adalah himpunan bagian populasi yang
diamati (diobservasi).
Jika seluruh populasi diamati, cara penyelidikan ini dinamakan sensus.
Dalam praktik, karena keterbatasan biaya, waktu, atau tenaga, maupun
karena pengamatan bersifat merusak atau merugikan subjek penyelidikan,
pengamatan umumnya tidak dilakukan terhadap seluruh anggota populasi,
melainkan hanya terhadap himpunan bagian populasi yaitu sampel.
Konsep Dasar Statistika
5
Penyelidikan terhadap sampel dapat dilakukan dalam bentuk survei ataupun
eksperimen (percobaan).
Tabel 1.1. Skema kapasitas keempat skala pengamatan
Skala
pengamatan
Kapasitas
Klasifikasi Urutan Hitung
interval
Hitung
rasio
ix = jx
atau
i jx x≠
ix < jx ,
ix = jx , atau
ix > jx
Hitung
ix – jx
Hitung
i jx x
Nominal
Ordinal
Interval
Rasio
+
+
+
+
–
+
+
+
–
–
+
+
–
–
–
+
Karakteristik populasi dinyatakan oleh ukuran yang dinamakan
parameter, yang nilainya umumnya tak pernah diketahui karena ukuran
populasi yang biasanya sangat besar ataupun tak berhingga. Sebagai penaksir
(estimator) untuk parameter, digunakan statistik, yaitu ukuran yang
diperoleh dari sampel.
Agar dapat menjadi estimator yang valid bagi parameter populasi,
statistik sampel harus diperoleh dari sampel representatif, yang dipilih secara
acak dari populasi. Sampel demikian dinamakan sampel random (acak).
Contoh 1.3: Untuk mengevaluasi keberhasilan program KB di sebuah kelurahan,
hendak diselidiki rerata jumlah anak yang dimiliki oleh PUS (pasangan usia
subur) di kelurahan tersebut. Untuk itu dipilih secara acak 100 PUS, dan
dikumpulkan data jumlah anak pada tiap PUS serta dihitung reratanya.
Populasi yang dipelajari mencakup seluruh PUS yang ada di kelurahan
tersebut, sedangkan sampel adalah 100 PUS yang terpilih untuk diamati.
Rerata jumlah anak per PUS yang diperoleh dari sampel yang terdiri atas 100
PUS adalah statistik sampel, merupakan penaksir (estimator) bagi parameter
populasi, yaitu rerata jumlah anak per PUS di seluruh kelurahan tersebut.
Latihan 1
6
LATIHAN 1
Pilihlah satu jawaban yang paling benar!
1. Cabang Statistika yang membahas mengenai metode peringkasan data
adalah:
A. Statistika matematik C. Statistika deskriptif
B. Statistika terapan D. Statistika inferensi
2. Biostatistika adalah:
A. Cabang Statistika yang digunakan untuk mempelajari aspek
kuantitatif Biologi.
B. Sekumpulan konsep dan metode yang digunakan untuk
mengumpulkan dan menginterpretasikan dalam data kuantitatif
dalam bidang Kesehatan / Kedokteran.
C. A) dan B) benar.
D. A) dan B) salah.
3. Ruang lingkup kerja Statistika adalah sebagai berikut, kecuali:
A. Membimbing perancangan eksperimen atau survei.
B. Menganalisis data.
C. Menyajikan dan menginterpretasikan hasil eksperimen atau
survei.
D. Mengorganisasikan penerbitan hasil eksperimen atau survei.
4. Nilai-nilai hasil pengamatan terhadap suatu karakteristik tertentu
adalah:
A. Data C. Variabel
B. Informasi D. Pengetahuan
5. Ukuran yang menyatakan karakteristik populasi adalah:
A. Sampel C. Statistik
B. Populasi D. Parameter
6. Data kuantitatif adalah:
A. Fakta yang diperoleh melalui proses pengukuran (measurement)
B. Fakta yang direpresentasikan dalam bentuk numerik
C. Fakta yang dikumpulkan sendiri oleh peneliti dari subjek
penelitian
D. Semuanya benar
Latihan 1
7
7. Skor APGAR merupakan contoh variabel dengan skala pengukuran:
A. Nominal C. Interval
B. Ordinal D. Rasio
8. Data untuk keperluan penelitian kesehatan yang diperoleh dari Dinas
Kesehatan setempat merupakan contoh:
A. Data diskret C. Data primer
B. Data kontinu D. Data sekunder
9. Pengumpulan data yang dilakukan terhadap seluruh anggota populasi
adalah:
A. Survei C. Sensus
B. Surveilans D. Skrining
10. Yang benar di antara pernyataan berikut ialah:
A. Skala interval memiliki seluruh kapasitas skala rasio
B. Skala nominal memiliki seluruh kapasitas skala ordinal
C. Skala interval memiliki seluruh kapasitas skala ordinal
D. Skala nominal memiliki seluruh kapasitas skala rasio
Peringkasan dan Penyajian Data
8
B A B 2
PERINGKASAN DAN
PENYAJIAN DATA
� Pengertian Peringkasan dan Penyajian Data
Data yang terkumpul sebagai hasil pengamatan harus dipaparkan dan
disampaikan dalam bentuk yang relatif sederhana dan mudah dipahami oleh
pembaca tanpa mengubah atau mengurangi informasi yang tercakup dalam
data tersebut. Umumnya volume data yang dikumpulkan relatif besar,
sehingga tidak mudah untuk menyimpulkan informasi yang ada dalam
keseluruhan data tersebut. Karena itu biasanya diperlukan proses peringkasan
sebelum data dapat disajikan, sebagai bagian tak terpisahkan dari proses
penyajian data itu sendiri.
Metode untuk meringkaskan dan mendeskripsikan segi-segi yang
penting pada data ini tercakup dalam Statistika Deskriptif.
� Macam Cara Penyajian Data
Dikenal berbagai macam cara penyajian data, antara lain dengan cara
tekstular, tabular, dan grafikal.
� Cara tekstular Penyajian data secara tekstular terutama bersifat naratif (menggunakan
teks), walaupun di tengah narasi itu sendiri biasanya terdapat data numerik
berupa angka-angka. Penyajian data tekstular dapat dilakukan secara
eksklusif, ataupun sebagai penjelasan bagi tabel atau grafik yang
menyertainya.
� Cara tabular Cara tabular adalah cara penyajian data dengan menggunakan tabel.
Peringkasan dan Penyajian Data
9
� Cara grafikal Cara grafikal adalah cara penyajian data dengan menggunakan grafik.
� T a b e l
Tabel adalah bentuk peringkasan data menjadi sekumpulan angka dan
fakta yang disajikan dalam sejumlah baris dan kolom. Tabel yang baik
haruslah sederhana dan tidak memerlukan penjelasan secara rinci (bersifat
self-explanatory), walaupun adakalanya perlu untuk membuat tabel induk
(master table) yang kompleks, sedangkan penjelasan naratif yang tidak rinci
umumnya tetap disertakan dalam pembahasan isi tabel.
Sebagai contoh, dapat dilihat tabel 2.2 dan 2.3, masing-masing
menyajikan distribusi frekuensi tekanan darah sistolik pada kelompok
perokok dan bukan perokok yang diperoleh sebagai hasil pengolahan data
Studi Jantung Honolulu, 1969 (lampiran 2.1).
Bagian-bagian tabel adalah:
1. Judul tabel:
Judul tabel ditempatkan di atas tabel, memuat deskripsi singkat mengenai
isi tabel. Apabila terdapat lebih daripada satu tabel dalam suatu
penyajian, setiap tabel harus diberi nomor tabel.
2. Caption kolom:
Baris teratas pada tabel, menjelaskan tentang kolom-kolom yang ada
pada tabel.
3. Caption baris (stub):
Kolom terkiri pada tabel, menjelaskan tentang baris-baris pada tabel.
4. Badan tabel:
Kumpulan angka/fakta yang disajikan pada sel-sel tabel.
5. Catatan kaki (footnote):
Tidak selalu ada, umumnya memuat sumber informasi untuk
pembuatan/penyajian tabel.
Tabel dalam bentuk distribusi frekuensi digunakan untuk menyajikan
ringkasan data kategorik ataupun data numerik yang dikategorikan. Apabila
yang akan ditabelkan adalah data numerik yang akan dikategorikan, langkah
pertama adalah menentukan jumlah kelas. Untuk beberapa macam data
tertentu yang sering diteliti dan dibahas, biasanya sudah ada kategorisasi
baku. Untuk data yang belum ada kategorisasi bakunya, dapat dipilih sendiri
banyaknya kelas yang umumnya berkisar antara 5 sampai dengan 15.
Peringkasan dan Penyajian Data
10
Contoh 2.1: Pada tabel 2.1 diperlihat pembuatan tabel distribusi frekuensi tekanan
darah sistolik pada kelompok bukan perokok untuk data Studi Jantung
Honolulu, 1969 (lampiran 2.1).
Langkah pertama adalah menentukan jumlah kelas, dengan melihat
rentang nilai-nilai pengamatan. Karena tabel yang terbentuk akan
diperbandingkan dengan tabel serupa untuk kelompok perokok, rentang
nilai-nilai pengamatan yang dilihat adalah untuk seluruh basis-data, yang
berkisar antara 92 mm Hg (nilai minimum) sampai dengan 208 mm Hg (nilai
maksimum). Untuk itu digunakan 6 kelas penyajian data, yaitu 90-109 mm
Hg, 110-129 mm Hg, . . . , 190-209 mm Hg, walaupun untuk kelompok
bukan perokok kelas terakhir ini ternyata kosong (tidak ada anggotanya).
Setelah itu frekuensi anggota masing-masing kelas ditentukan dengan
proses 'melidi' (tally) seperti terlihat pada kolom kedua pada tabel 2.1.
Penentuan batas-batas kelas harus dilakukan sedemikian rupa, sehingga tidak
memungkinkan adanya nilai pengamatan yang dapat dimasukkan dalam 2
kelas sekaligus. Proses melidi diakhiri dengan menghitung nilai frekuensi
untuk tiap kelas (kolom ketiga pada tabel 2.1).
Tabel 2.1. Distribusi frekuensi tekanan darah sistolik untuk
bukan perokok
Interval kelas
(tekanan darah
sistolik*)
Melidi f
(frekuensi)
90-109
110-129
130-149
150-169
170-189
190-209
///// /////
///// ///// ///// ///// ////
///// ///// ///// ///
///// ////
//
10
24
18
9
2
0
Jumlah 63
* Dalam mm Hg
(Sumber: Studi Jantung Honolulu)
Pembuatan tabel diselesaikan dengan membuang kolom untuk proses
melidi, selain itu nilai-nilai frekuensi tiap kelas dapat pula disajikan dalam
bentuk persentase (frekuensi relatif; tabel 2.2).
Peringkasan dan Penyajian Data
11
Tabel 2.2. Distribusi frekuensi tekanan darah sistolik untuk bukan
perokok, Studi Jantung Honolulu, 1969
Interval kelas
(tekanan darah
sistolik*)
N %
90-109
110-129
130-149
150-169
170-189
190-209
10
24
18
9
2
0
16
38
29
14
3
0
Jumlah 63 100
* dalam mm Hg
Pada tabel 2.3 diperlihatkan distribusi frekuensi serupa pada kelompok
perokok.
Tabel 2.3. Distribusi frekuensi tekanan darah sistolik untuk perokok,
Studi Jantung Honolulu, 1969
Interval kelas
(tekanan darah
sistolik*)
N %
90-109
110-129
130-149
150-169
170-189
190-209
5
15
10
3
2
2
14
41
27
8
5
5
Jumlah 37 100
* dalam mm Hg
Contoh 2.2: Tabel 2.2 dan 2.3 dapat digabung dan disajikan dalam satu tabel (tabel
2.4). Walaupun penggabungan ini menyebabkan tabel menjadi lebih
kompleks, penggabungan di sini dimaksudkan untuk memudahkan pembaca
yang ingin memperbandingkan distribusi frekuensi antar dua kelompok,
perokok dan bukan perokok.
Peringkasan dan Penyajian Data
12
Tabel 2.4. Distribusi frekuensi responden menurut tekanan darah dan
status merokok, Studi Jantung Honolulu, 1969
Interval kelas
(tekanan darah
sistolik*)
Perokok Bukan
perokok
Jumlah
N % N % N %
90-109
110-129
130-149
150-169
170-189
190-209
5
15
10
3
2
2
14
41
27
8
5
5
10
24
18
9
2
0
16
38
29
14
3
0
15
39
28
12
4
2
15
39
28
12
4
2
Jumlah 37 100 63 100 100 100
* dalam mm Hg
Contoh 2.3: Pada tabel 2.5 diperlihatkan distribusi berat badan lahir 1,260 bayi
wanita pada kehamilan 40 minggu. Batas kelas yang dicantumkan pada tabel
adalah 1.76-2.00, 2.01-2.25, dan seterusnya, walaupun batas kelas
sebenarnya adalah 1.755-2.005, 2.005-2.255, dan seterusnya. Pencantuman
batas atas sebuah kelas tidak boleh sama dengan batas bawah kelas
berikutnya untuk mencegah duplikasi pemasukan nilai (sebuah nilai dapat
dimasukkan ke dalam dua kelas sekaligus). Dengan demikian interval kelas
bukan 0.24 kg (1.76-2.00), melainkan 0.25 kg (1.755-2.005), sedangkan
untuk perhitungan selanjutnya dianggap ada 4 bayi dengan BBL (berat badan
lahir) 1.88 kg, 3 bayi dengan BBL 2.13 kg, dan seterusnya.
Pada contoh-contoh di atas diperlihatkan tabel distribusi frekuensi
untuk satu variabel. Dalam satu tabel dapat pula disajikan distribusi frekuensi
dua variabel sekaligus, yaitu dalam bentuk tabel silang.
Peringkasan dan Penyajian Data
13
Tabel 2.5. Distribusi berat badan lahir 1,260 bayi wanita pada
kehamilan 40 minggu
BBL* (kg) Interval
kelas
Titik
tengah
kelas Frekuensi Batas
pada tabel
Batas kelas
sebenarnya
1.76-2.00
2.01-2.25
2.26-2.50
2.51-2.75
2.76-3.00
3.01-3.25
3.26-3.50
3.51-3.75
3.76-4.00
4.01-4.25
4.26-4.50
4.51-4.75
4.76-5.00
5.01-5.25
1.755-2.005
2.005-2.255
2.255-2.505
2.505-2.755
2.755-3.005
3.005-3.255
3.255-3.505
3.505-3.755
3.755-4.005
4.005-4.255
4.255-4.505
4.505-4.755
4.755-5.005
5.005-5.255
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
1.88
2.13
2.38
2.63
2.88
3.13
3.38
3.63
3.88
4.13
4.38
4.63
4.88
5.13
4
3
12
34
115
175
281
261
212
94
47
14
6
2
Jumlah kelahiran 1,260
* Berat badan lahir
Contoh 2.4:
Pada tabel 2.6 di bawah diperlihat contoh tabel silang 2×2 (badan sel
terdiri atas 2 baris dan 2 kolom), yang menunjukkan distribusi frekuensi dua
variabel sekaligus, indeks massa tubuh (BMI) dan kadar kolesterol serum
yang masing-masing telah dikategorisasikan menjadi 2 kelas (berskala
dikotomi). Distribusi frekuensi masing-masing variabel dapat dilihat pada
baris terbawah dan kolom terkanan tabel, dinamakan sebagai distribusi
marginal, sedangkan nilai-nilai yang ada pada sel-sel badan tabel
menunjukkan distribusi bersama (joint distribution) kedua variabel.
Peringkasan dan Penyajian Data
14
Tabel 2.6. Indeks massa tubuh dan kadar kolesterol serum pada Studi
Jantung Honolulu, 1969
BMI* Kadar kolesterol serum**
Jumlah < 200 > 200
< 25.00
> 25.00
25
12
35
28
60
40
Jumlah 37 63 100
* dalam kg/m2; ** dalam mg%
� G r a f i k
Dengan tabel, penyajian ringkasan data dapat dilakukan secara lebih
rinci, namun kesan sekilas secara kasar lebih mudah diperoleh dari grafik.
Selain itu secara visual penyajian grafik umumnya lebih menarik bagi
pembaca.
Bentuk-bentuk grafik yang lazim digunakan antara lain adalah diagram
lingkar, diagram batang, histogram, dan poligon frekuensi.
� Diagram lingkar Diagram lingkar (pie diagram) digunakan untuk menyajikan ringkasan
data nominal secara grafikal. Contoh diagram lingkar diperlihatkan pada
diagram 2.1, yang menunjukkan penyebab utama kematian ibu hamil di
dunia (WHO, 2001). Untuk penyajian diagram lingkar dianjurkan:
- Tidak mencantum besaran proporsi masing-masing segmen di sekitar
lingkaran. Apabila angka-angka ini ingin ditampilkan, sebaiknya
ringkasan data disajikan dalam bentuk tabel.
- Jangan memotong salah satu segmen dan menariknya keluar, walaupun
segmen itu dianggap merupakan kelas terpenting di antara keseluruhan
kategori.
Diagram 2.1. Penyebab utama kematian ibu hamil, WHO, 2001
Peringkasan dan Penyajian Data
15
� Diagram batang Diagram batang (bar diagram) digunakan untuk menyajikan ringkasan
data ordinal. Contoh diagram batang diperlihatkan pada diagram 2.2, yang
menunjukkan status merokok pada 1,371 wanita dalam Studi Populasi
Irlandia. Perhatikan bahwa angka-angka yang tercantum hanya menyatakan
skala pengukuran pada sumbu vertikal dan tidak menyatakan tinggi
(proporsi) masing-masing batang.
Diagram 2.2. Status merokok pada wanita, Studi Populasi Irlandia,
1983
� Histogram Histogram digunakan untuk menyajikan ringkasan data numerik yang
telah dikategorisasikan. Contoh histogram diperlihatkan pada diagram 2.3,
yang merupakan penyajian dalam bentuk grafikal untuk data pada tabel 2.5.
Seperti halnya dengan diagram batang, pada histogram pun tidak
dicantumkan angka-angka untuk menyatakan tinggi (proporsi) masing-
masing batang.
Peringkasan dan Penyajian Data
16
Diagram 2.3. Distribusi berat badan lahir 1,260 bayi wanita pada
kehamilan 40 minggu
� Poligon frekuensi Poligon frekuensi diperoleh dengan menghubungkan titik tengah
puncak-puncak batang histogram. Pada diagram 2.4 diperlihatkan contoh
pembuatan poligon frekuensi dari histogram pada diagram 2.3, dan pada
diagram 2.5 diperlihatkan poligon frekuensi tanpa histogram.
Diagram 2.4. Histogram dan poligon frekuensi untuk distribusi berat
badan lahir 1,260 bayi wanita pada kehamilan 40 minggu
Peringkasan dan Penyajian Data
17
Diagram 2.5. Poligon frekuensi untuk distribusi berat badan lahir 1,260
bayi wanita pada kehamilan 40 minggu
� Ogive Ogive adalah poligon frekuensi untuk data kumulatif. Pada tabel 2.7,
pada kolom terkanan diperlihatkan distribusi kumulatif untuk data BBL bayi
wanita pada tabel 2.5 dan ogive-nya diperlihatkan pada diagram 2.6.
Tabel 2.7. Distribusi kumulatif berat badan lahir 1,260 bayi wanita
pada kehamilan 40 minggu
BBL* (kg) Frekuensi Frekuensi kumulatif
1.76-2.00
2.01-2.25
2.26-2.50
2.51-2.75
2.76-3.00
3.01-3.25
3.26-3.50
3.51-3.75
3.76-4.00
4.01-4.25
4.26-4.50
4.51-4.75
4.76-5.00
5.01-5.25
4
3
12
34
115
175
281
261
212
94
47
14
6
2
4
7
19
53
168
343
624
885
1,097
1,191
1,238
1,252
1,258
1,260
* Berat badan lahir
Peringkasan dan Penyajian Data
18
Diagram 2.6. Ogive berat badan lahir 1,260 bayi wanita pada
kehamilan 40 minggu
� Diagram gambar Diagram gambar (piktogram; pictorial graph) umumnya jarang
ditampilkan dalam tulisan ilmiah, biasanya digunakan dalam tulisan ilmiah
populer ataupun laporan untuk konsumsi masyarakat awam. Contoh diagram
gambar diperlihatkan pada diagram 2.7. Upaya penulis yang berlebihan
untuk menekankan adanya penurunan persentase angka pengangguran
tercermin pada perbandingan besar gambar yang tidak proporsional antara
gambar untuk angka 10.4% (Februari 1983) dengan 8.0% (Januari 1984).
Diagram 2.7. Persentase pengangguran pada angkatan kerja di
Amerika Serikat, Februari 1983-Januari 1984
Peringkasan dan Penyajian Data
19
� Diagram batang-dan-daun Diagram batang-dan-daun (stem-and-leaf) dapat dianggap sebagai
perpaduan antara histogram dengan tabel distribusi frekuensi. Contoh
diagram batang-dan-daun diperlihatkan pada diagram 2.8. Angka-angka di
sisi kiri ('batang') menyatakan puluhan dan ratusan, sedangkan angka-angka
di sisi kanan ('daun') menyatakan satuan, misalnya angka-angka pada baris
pertama menyatakan tekanan darah 92, 94, 96, dan 98 mm Hg. Diagram
batang-dan-daun hanya sesuai untuk digunakan bagi kumpulan data yang
tidak terlalu besar.
9* | 2468
10* | 046888
11* | 224488888
12* | 022224488888888
13* | 000224444448
14* | 002446
15* | 2244446
16* | 22
17* | 02
Diagram 2.8. Diagram batang-dan-daun tekanan darah sistolik untuk
kelompok bukan perokok, Studi Jantung Honolulu, 1983
� Diagram tebar Diagram tebar (scatter diagram) memperlihatkan gambaran dua-
dimensi untuk data dua variabel (bivariat), seperti contoh yang tampak pada
diagram 2.9, yang memperlihatkan hitung bakteri dari kultur (sumbu
horizontal) dan nilai-nilai hitung leukosit (sumbu vertikal) pada penderita
penyakit infeksi.
Diagram 2.9. Hitung leukosit dan hitung bakteri dari kultur pada
penderita penyakit infeksi
Latihan 2
20
LATIHAN 2
Pilihlah satu jawaban yang paling benar!
1. Alasan utama untuk melakukan peringkasan data ialah:
A. Data bersifat kompeks dan sulit diinterpretasikan.
B. Volume data yang dikumpulkan relatif besar.
C. Ruang yang tersedia untuk publikasi sangat terbatas.
D. Semuanya salah.
2. Penyampaian data secara naratif tergolong dalam cara penyajian data:
A. Tekstular C. Grafikal
B. Tabular D. Semuanya benar
3. Tabel yang baik ialah tabel yang:
A. Bersifat self-explanatory
B. Sederhana
C. Bersifat self-explanatory dan sederhana
D. Bersifat self-explanatory dan kompleks
4. Bagian-bagian tabel berikut mutlak harus ada, kecuali:
A. Judul tabel C. Badan tabel
B. Caption kolom D. Catatan kaki
5. 'Melidi' (tally) adalah proses:
A. Penentuan rentang nilai-nilai pengamatan untuk seluruh basis-
data.
B. Penentuan jumlah kelas/kategori untuk penyusunan distribusi
frekuensi.
C. Pemasukan masing-masing anggota kelompok ke dalam
kelas/kategori yang sesuai.
D. Perhitungan frekuensi absolut untuk tiap kelas/kategori.
6. 'Interval kelas' pada tabel distribusi frekuensi adalah:
A. Batas atas kelas dikurangi batas bawah kelas yang sama.
B. Batas atas kelas dikurangi batas atas kelas berikutnya yang lebih
rendah.
C. Batas bawah kelas dikurangi batas atas kelas berikutnya yang
lebih rendah.
D. Batas atas kelas dikurangi batas bawah kelas berikutnya yang
lebih rendah.
Latihan 2
21
7. Tabel silang adalah:
A. Tabel yang tidak memiliki stub.
B. Tabel dengan jumlah kelas kurang daripada lima.
C. Tabel yang menyajikan distribusi frekuensi dua variabel
sekaligus.
D. Tabel yang merupakan penjabaran dari tabel induk.
8. Dibandingkan dengan tabel, keuntungan penggunaan grafik adalah
sebagai berikut, kecuali:
A. Pembacaan data dapat dilakukan secara lebih rinci.
B. Gambaran sekilas lebih mudah diperoleh.
C. Secara visual penyajian dapat dibuat lebih menarik.
D. Semua di atas merupakan keuntungan penggunaan grafik.
9. Diagram lingkar (pie diagram) terutama dianjurkan untuk penyajian
data:
A. Nominal
B. Ordinal
C. Numerik yang dikategorisasikan.
D. Semuanya salah.
10. Bentuk grafik yang dianjurkan untuk menyajikan ringkasan data
ordinal adalah:
A. Diagram lingkar C. Histogram
B. Diagram batang D. Poligon frekuensi
11. Secara konseptual, poligon frekuensi identik dengan:
A. Diagram lingkar C. Histogram
B. Diagram batang D. Semuanya benar
12. Ogive adalah:
A. Basis-data yang telah diurut dari nilai terkecil sampai dengan nilai
terbesar.
B. Grafik yang diperoleh dengan menghubungkan titik tengah
puncak-puncak batang histogram.
C. Poligon frekuensi untuk data kumulatif.
D. Diagram berbentuk gambar yang biasa disajikan dalam tulisan
ilmiah populer.
Latihan 2
22
13. Diagram batang-dan-daun adalah perpaduan antara:
A. Diagram batang dengan tabel distribusi frekuensi.
B. Histogram dengan tabel distribusi frekuensi.
C. Piktogram dengan tabel distribusi frekuensi.
D. Semuanya salah.
14. Dalam penyajian data dengan nilai-nilai dua-digit pada diagram batang-
dan-daun:
A. Batang menyatakan puluhan dan daun menyatakan satuan.
B. Batang menyatakan satuan dan daun menyatakan puluhan.
C. A) dan B) benar.
D. A) dan B) salah.
15. Grafik yang dapat digunakan untuk data bivariabel ialah:
A. Diagram batang C. Diagram tebar
B. Diagram batang dan daun D. Diagram lingkar
Lampiran 2.1
23
La
mp
ira
n 2
.1
Ta
bel
II.
1. D
ata
sa
mp
el 1
00
su
bje
k d
ari
7,6
83
an
gg
ota
Po
pu
lasi
Stu
di
Ja
ntu
ng
Ho
no
lulu
, 1
96
9
Lampiran 2.1
24
Lampiran 2.1
25
Lampiran 2.1
26
Lampiran 2.1
27
Ko
de
un
tuk
va
riab
el:
Pen
did
ikan
: 1
= t
idak
ad
a, 2
= S
D,
3 =
SM
P,
4 =
SM
A,
5=
SM
K,
6 =
Un
iver
sita
s
Mer
ok
ok
: 0
= t
idak
, 1
= y
a
Ak
tiv
itas
fis
ik:
1 =
ham
pir
sel
alu
du
du
k,
2 =
mo
der
at,
3 =
gia
t
Glu
ko
sa d
arah
: d
alam
mg
%
Ko
lest
ero
l se
rum
: d
alam
mg
%
Tek
anan
dar
ah s
isto
lik
: d
alam
mm
Hg
BM
I (i
nd
eks
mas
sa t
ub
uh
): B
B/T
B2,
BB
dal
am k
g,
TB
dal
am m
Nilai Tengah dan Nilai Penyebaran
28
B A B 3
NILAI TENGAH DAN NILAI
PENYEBARAN
� Nilai Tengah
Nilai tengah (central values; central tendency) suatu himpunan data
adalah titik tempat nilai-nilainya cenderung untuk mengelompok. Tiga nilai
tengah yang paling umum dikenal ialah rerata (rerata hitung; mean /
arithmetic mean), median, dan modus.
� R e r a t a Rerata (rerata hitung) suatu himpunan data, dinyatakan dengan
lambang x , adalah jumlah seluruh nilai dibagi dengan banyaknya nilai:
x = 1 2 . . . nx x x
n
+ + +
atau: x = 1
n
ii
x
n
=∑
(3.1)
ix : nilai ke-i pada himpunan data; i = 1, 2, . . . , n
n : banyaknya nilai
Contoh 3.1: Misalkan dimiliki data berat badan lima orang mahasiswa, masing-
masing 58, 52, 61, 52, dan 47 kg, maka reratanya adalah:
x = 1
n
ii
x
n
=∑
= 58 52 61 52 47
5
+ + + +=
270
5= 54 kg
Nilai Tengah dan Nilai Penyebaran
29
Rerata memiliki keunggulan yaitu mudah dihitung dan mempunyai
nilai matematik, yaitu dapat digunakan dalam inferensi statistik. Sebaliknya,
untuk aspek deskripsi rerata memiliki kelemahan, yaitu sangat terpengaruh
oleh pengamatan luar (outlier). Pengamatan luar adalah nilai pada
himpunan data yang sangat berbeda dengan nilai lain pada umumnya, dapat
terlalu besar ataupun terlalu kecil nilainya.
Contoh 3.2: Misalkan pada kelompok lima orang mahasiswa pada contoh 3.1 di atas
ditambahkan seorang pendatang baru dengan berat badan 102 kg, nilai
reratanya akan berubah menjadi:
x = 58 52 61 52 47 102
6
+ + + + +=
372
6= 62 kg
Nilai rerata yang baru ini lebih besar daripada setiap nilai pada
kelompok semula, sehingga tidak lagi dapat dianggap sebagai nilai tengah
yang representatif.
� M e d i a n Median adalah nilai yang terletak tepat di tengah suatu himpunan data
yang telah diurutkan menurut besarnya (di-ranking). Himpunan data yang
telah diurutkan menurut besarnya ini dinamakan array. Jika array
dinyatakan sebagai ( )1
x , ( )2
x , . . . , ( )n
x , maka posisi median adalah pada
urutan ke-1
2
n +, sehingga:
Med = 1
2
nx
+ ; n ganjil (3.2.a)
Med = 1
2 2
2
n nx x
++
; n genap (3.2.b)
( )ix : nilai ke-i pada array; i = 1, 2, . . . , n
n : banyaknya nilai
Nilai Tengah dan Nilai Penyebaran
30
Contoh 3.3: Lihat kembali data berat badan mahasiswa pada contoh 3.1. Array-nya
adalah:
47, 52, 52, 58, 61,
sehingga mediannya adalah ( )3
x = 52 kg. Jika ditambahkan satu pendatang
baru pada contoh 3.2, array-nya adalah:
47, 52, 52, 58, 61, 102,
dan mediannya adalah ( ) ( )3 4
2
x x+=
52 58
2
+= 55 kg.
Median membagi nilai-nilai yang ada pada himpunan data menjadi dua
bagian yang sama besarnya. Median tidak dapat digunakan dalam inferensi
statistik, tetapi untuk pendeskripsian data, median memiliki keunggulan
karena bersifat tangguh (robust; tidak terlalu terpengaruh oleh pengamatan
luar). Tampak pada contoh 3.3 bahwa kehadiran pendatang baru dengan
berat badan 102 kg hanya mengubah median menjadi 55 kg, perubahan yang
relatif kecil dibandingkan dengan perubahan rerata pada contoh 3.2.
� M o d u s Modus (mode) adalah nilai yang paling banyak (paling sering)
ditemukan dalam suatu himpunan data. Suatu himpunan data dapat memiliki
satu modus (unimodal) ataupun lebih daripada satu modus. Untuk data berat
badan mahasiswa pada contoh 3.1 di atas, modusnya adalah 52 kg.
Pada himpunan data yang simetris, rerata, median, dan modusnya
berimpit pada satu titik. Jika pada himpunan data tersebut ditambahkan nilai-
nilai baru yang ekstrim besar, himpunan data menjadi menceng ke kanan
(skewed to the right). Nilai tengah yang paling terpengaruh (tertarik ke
kanan) adalah rerata, sedangkan modus tidak terpengaruh, sehingga
diperoleh urutan nilai tengah dari kiri ke kanan: modus −−−− median −−−− rerata.
Sebaliknya, penambahan nilai-nilai baru yang ekstrim kecil pada
himpunan data simetris akan menyebabkan himpunan data menjadi menceng
ke kiri (skewed to the left), sehingga diperoleh urutan nilai tengah dari kiri
ke kanan: rerata −−−− median −−−− modus.
Nilai Tengah dan Nilai Penyebaran
31
� Ukuran lokasi
Selain sebagai nilai tengah, rerata, median, dan modus juga dapat
dianggap merupakan ukuran lokasi bagi himpunan data, yaitu ukuran yang
menentukan letak / lokasi distribusi himpunan data pada sistem koordinat
Kartesian. Ukuran lokasi lain yang terpenting dalam Biostatistika ialah
kuartil dan persentil.
� K u a r t i l Seperti halnya median yang membagi nilai-nilai pada himpunan data
menjadi dua bagian yang sama besar, kuartil (quartile) membagi nilai-nilai
pada himpunan data menjadi empat bagian yang sama besar. Nilai-nilai
kuartil adalah:
- Kuartil nol (dinyatakan dengan lambang 0Q ): nilai terkecil pada
himpunan data.
- Kuartil pertama (kuartil bawah; dinyatakan dengan lambang 1Q ):
memisahkan seperempat bagian terkecil (terbawah) dengan tiga perempat
bagian terbesar (teratas) himpunan data.
- Kuartil kedua (dinyatakan dengan lambang 2Q ): memisahkan setengah
bagian terkecil dengan setengah bagian terbesar himpunan data. Kuartil
kedua sama dengan median.
- Kuartil ketiga (kuartil atas; dinyatakan dengan lambang 3Q ):
memisahkan tiga perempat bagian terkecil dengan seperempat bagian
terbesar himpunan data.
- Kuartil keempat (dinyatakan dengan lambang 4Q ): nilai terbesar pada
himpunan data.
Contoh 3.4:
Lihat data tekanan darah sistolik 12 subjek pertama (No. ID 1 s.d. 12)
pada Studi Jantung Honolulu (lampiran 2.1):
102, 138, 190, 122, 128, 112, 128, 116, 134, 104, 116, dan 152 mm Hg
Array-nya adalah:
102, 104, 112, 116, 116, 122, 128, 128, 134, 138, 152, 190
Dengan n = 12, kuartil pertama, kuartil kedua (= median), dan kuartil
ketiga masing-masing adalah:
Nilai Tengah dan Nilai Penyebaran
32
1Q = ( ) ( )3 4
2
x x+=
112 116
2
+= 114
2Q = Med = ( ) ( )6 7
2
x x+=
122 128
2
+= 125
3Q = ( ) ( )9 10
2
x x+=
134 138
2
+= 136
� P e r s e n t i l
Nilai-nilai persentil, dinyatakan dengan lambang 0P sampai dengan
100P , membagi himpunan data menjadi seratus bagian yang sama besar.
Persentil hanya dihitung dan ditentukan untuk himpunan data yang cukup
besar, yaitu n > 100. Pada diagram 3.1 diperlihatkan contoh persentil tinggi
dan berat badan anak perempuan usia 2-18 tahun (Grafik Pertumbuhan
NCHS, Ross Laboratories).
Nilai Tengah dan Nilai Penyebaran
33
Diagram 3.1. Persentil tinggi dan berat badan anak perempuan
menurut usia, 2-18 tahun (Grafik Pertumbuhan NCHS, Ross
Laboratories)
� Nilai Penyebaran
Nilai penyebaran (measures of dispersion; measures of variation)
adalah ukuran yang mendeskripsikan variabilitas nilai-nilai pada suatu
himpunan data. Beberapa nilai penyebaran yang lazim ditampilkan antara
lain yaitu rentang, rentang inter-kuartil, variansi, dan standar deviasi.
Nilai Tengah dan Nilai Penyebaran
34
� R e n t a n g Rentang (range), dinyatakan dengan lambang R, adalah selisih antara
nilai terbesar dengan nilai terkecil dalam suatu himpunan data.
R = maxx − minx (3.3)
� Rentang inter-kuartil Rentang inter-kuartil (inter-quartile range), dinyatakan dengan
lambang IQR, adalah selisih antara kuartil ketiga dengan kuartil pertama:
IQR = 3Q − 1Q (3.4)
Contoh 3.5:
Lihat kembali data pada contoh 3.4. Dengan minx = 102, 1Q = 114, 3Q =
136, dan maxx = 190, rentang dan rentang inter-kuartil adalah:
R = maxx − minx
= 190 − 102 = 88
IQR = 3Q − 1Q
= 136 − 114 = 22
� V a r i a n s i
Variansi (variance), dinyatakan dengan lambang 2s [atau Var (x)],
adalah rerata kuadrat deviasi nilai-nilai suatu himpunan data terhadap
reratanya, dengan pembagi (n − 1).
Misalkan dimiliki himpunan data 1x , 2x , . . . , nx dengan rerata x ,
maka deviasinya (penyimpangannya) terhadap rerata masing-masing adalah
( )1x x− , ( )2x x− , . . . , ( )nx x− , dan rerata kuadrat deviasi ini dengan
pembagi (n − 1) adalah:
2s =
( ) ( ) ( )2 2 2
1 2
1
. . . n
x x x x x x
n
− + − + + −
−
atau: 2s =
( )2
1
1
n
ii
x x
n
=
−
−
∑ (3.5)
Nilai Tengah dan Nilai Penyebaran
35
Rumus 3.5 yang dinamakan sebagai rumus definisi variansi, hanya
digunakan untuk perhitungan jika himpunan data relatif kecil. Untuk
himpunan data yang besar, digunakan rumus operasional variansi:
2s =
2
2 1
1
1
n
ini
ii
x
xn
n
=
=
−
−
∑∑
(3.6)
Untuk menggunakan rumus operasional, rerata x dan nilai-nilai
deviasinya tidak perlu dihitung, namun yang harus dihitung terlebih dahulu
adalah ix∑ dan 2
ix∑ .
� Standar deviasi Standar deviasi, dinyatakan dengan lambang s [atau SD (x)], adalah
akar positif variansi. Rumus definisi-nya adalah:
s =
( )2
1
1
n
ii
x x
n
=
−
−
∑ (3.7)
Sedangkan rumus operasional-nya adalah:
s =
2
2 1
1
1
n
ini
ii
x
xn
n
=
=
−
−
∑∑
(3.8)
Contoh 3.6: Lihat kembali data berat badan lima orang mahasiswa pada contoh 3.1:
58 kg, 52 kg, 61 kg, 52 kg, dan 47 kg. Pada contoh 3.1 telah dihitung
reratanya yaitu x = 54 kg. Untuk menghitung ( )2
ix x−∑ , lihat tabel 3.1
berikut.
Nilai Tengah dan Nilai Penyebaran
36
Tabel 3.1. Perhitungan variansi dan standar deviasi berat badan
mahasiswa dengan rumus definisi
ix x ( )ix x− ( )2
ix x−
58
52
61
52
47
54
54
54
54
54
4
-2
7
-2
-7
16
4
49
4
49
( )ix x−∑ = 0 ( )2
ix x−∑ = 122
Perhatikan bahwa ( )ix x−∑ selalu bernilai nol. Variansi dan standar
deviasi masing-masing adalah:
2s =
( )2
1
1
n
ii
x x
n
=
−
−
∑
= 122
5 1−= 30.5
s = 30.5 = 5.52
Contoh 3.7: Lihat kembali data berat badan lima orang mahasiswa pada contoh 3.1.
Untuk menghitung variansi dan standar deviasi dengan rumus operasional,
terlebih dahulu dihitung ix∑ dan 2
ix∑ :
Tabel 3.2. Perhitungan variansi dan standar deviasi berat badan
mahasiswa dengan rumus operasional
No ix 2
ix
1
2
3
4
5
58
52
61
52
47
3,364
2,704
3,721
2,704
2,209
ix∑ = 270 2
ix∑ = 14,702
Dengan rumus operasional, variansi dan standar deviasi adalah:
Nilai Tengah dan Nilai Penyebaran
37
2s =
2
2 1
1
1
n
ini
ii
x
xn
n
=
=
−
−
∑∑
=
227014,702
5
5 1
−
−= 30.5
s = 30.5 = 5.52
Latihan 3
38
LATIHAN 3
Pilihlah satu jawaban yang paling benar!
1. Contoh nilai tengah di antara beberapa ukuran berikut yaitu:
A. Median C. Persentil
B. Kuartil D. Rentang inter-kuartil
2. Jumlah seluruh nilai dalam suatu himpunan data dibagi dengan banyaknya
nilai adalah:
A. Rerata C. Standar deviasi
B. Median D. Variansi
3. Array adalah:
A. Himpunan data yang memiliki lebih daripada satu modus.
B. Himpunan data yang tidak memiliki pengamatan luar (outlier).
C. Himpunan data yang nilai-nilainya telah diurut menurut besarnya.
D. Semuanya salah.
4. Pada himpunan data simetris, hubungan antara rerata dan median adalah:
A. Rerata < median C. Rerata > median
B. Rerata = median D. Tak dapat ditentukan.
5. Pada himpunan data yang menceng ke kiri (skewed to the left), urutan nilai
tengah dari kanan ke kiri adalah:
A. Rerata-modus-median C. Rerata-median-modus
B. Median-modus-rerata D. Modus-median-rerata
6. Keuntungan utama penggunaan median sebagai nilai tengah dibandingkan
dengan rerata yaitu:
A. Median mudah dihitung dan terutama bermanfaat dalam inferensi
statistik
B. Median kurang terpengaruh oleh pengamatan luar
C. A) dan B) benar
D. A) dan B) salah
7. Suatu himpunan data terdiri atas 24 nilai pengamatan. Banyaknya nilai
pengamatan yang lebih besar daripada kuartil pertama, tetapi lebih kecil
daripada kuartil ketiga:
A. 6 C. 18
B. 12 D. 24
Latihan 3
39
8. Ukuran di bawah ini mendeskripsikan variabilitas nilai-nilai pada himpunan
datanya, kecuali:
A. Rentang C. Variansi
B. Standar deviasi D. Persentil
9. Jika R menyatakan rentang pada suatu himpunan data dan IQR menyatakan
rentang inter-kuartil pada himpunan data yang sama, maka:
A. R < IQR C. R > IQR
B. R < IQR D. R > IQR
10. Standar deviasi adalah:
A. Rerata kuadrat deviasi nilai-nilai himpunan data terhadap reratanya
dengan pembagi (n − 1).
B. Kuadrat rerata deviasi nilai-nilai himpunan data terhadap reratanya
dengan pembagi (n − 1).
C. Akar positif rerata kuadrat deviasi nilai-nilai himpunan data terhadap
reratanya dengan pembagi (n − 1)
D. Akar positif kuadrat rerata deviasi nilai-nilai himpunan data terhadap
reratanya dengan pembagi (n − 1)
11. ( )2
1
n
ii
x x=
−∑ =
A. 0 C.
2
12
1
n
ini
ii n
x
x=
=
−
∑∑
B.
2
12
1
n
ini
ii n
x
x=
=
−
∑∑ D.
2
12
1 1
n
ini
ii n
x
x=
= −
−
∑∑
12. Variansi adalah:
A. Akar positif standar deviasi C. Kuadrat standar deviasi
B. Akar negatif standar deviasi D. Semua nya salah.
Untuk soal nomor 13 dan 14:
Lihat data 20 subjek pertama Populasi Studi Jantung Honolulu, 1969 (nomor
ID 1 s.d. 20) pada tabel II.1, halaman 26.
13. Rerata dan standar deviasi Usia adalah:
A. 52.6 dan 4.32 C. 52.6 dan 18.67
B. 55.4 dan 4.32 D. 55.4 dan 18.67
Latihan 3
40
14. Median dan rentang inter-kuartil TD (tekanan darah) sistolik adalah:
A. 125 dan 22 C. 128 dan 22
B. 125 dan 88 D. 128 dan 88
15. Lihat kembali grafik persentil tinggi dan berat badan anak perempuan
menurut usia, 2-18 tahun (Grafik Pertumbuhan NCHS, Ross Laboratories)
pada halaman 40. Menurut grafik tersebut:
A. Sembilan puluh persen anak perempuan usia 12 tahun tinggi badannya
kurang daripada 160 cm.
B. Sembilan puluh persen anak perempuan usia 12 tahun tinggi badannya
tepat 160 cm.
C. Sembilan puluh persen anak perempuan usia 12 tahun tinggi badannya
lebih daripada 160 cm.
D. Semuanya salah.
Probabilitas
41
B A B 4
P R O B A B I L I T A S
� Pengertian Probabilitas
Probabilitas adalah rasio antara banyaknya cara suatu peristiwa tertentu
dapat terjadi dengan jumlah total peristiwa yang sama kemungkinannya
untuk terjadi. Misalnya data statistik vital menyatakan adanya 1,056 bayi
laki-laki yang lahir hidup (banyaknya cara) di antara 2,056 kelahiran hidup
(jumlah total peristiwa), maka probabilitas untuk mendapatkan bayi laki-laki
dapat diestimasikan sebagai 1, 056 2,056 = 0.514.
Dengan demikian, probabilitas terjadinya peristiwa A, dinyatakan
dengan lambang P (A) dapat didefinisikan sebagai proporsi banyak kalinya
peristiwa A terjadi pada sejumlah besar percobaan berulang dengan kondisi
yang identik:
P (A) = ( )
( )
N A
N S (4.1)
N (A) : banyak kalinya peristiwa A terjadi
N (S) : banyaknya kalinya pengulangan percobaan; N (S) besar
Contoh 4.1: Pada pelontaran koin (mata uang logam) yang setimbang, ada 2
kemungkinan hasil-akhir (outcome), M (muka) atau B (belakang), maka
probabilitas untuk memperoleh hasil-akhir M pada 1 kali pelontaran adalah:
P (M) = 1
2 = 0.5
Probabilitas untuk memperoleh hasil-akhir B adalah:
P (B) = 1
2 = 0.5
Contoh 4.2: Jika sebuah koin yang setimbang dilontarkan 2 kali, ada 4
kemungkinan hasil-akhir, yaitu MM, MB, BM, dan BB, sehingga:
Probabilitas
42
P (MM) = P (MB) = P (BM) = P (BB) = 1
4 = 0.25
Probabilitas untuk memperoleh hasil-akhir 0 M, 1 M, dan 2 M masing-
masing adalah:
P (0 M) = P (BB) = 0.25
P (1 M) = P (MB) + P (BM) = 0.25 + 0.25 = 0.50
P (2 M) = P (MM) = 0.25
Probabilitas untuk memperoleh hasil-akhir paling sedikit 1 M adalah:
P (paling sedikit 1 M) = P (1 M) + P (2 M)
= 0.50 + 0.25 = 0.75
Contoh 4.3: Pada pelontaran sebuah dadu yang setimbang, ada 6 kemungkinan
hasil-akhir, yaitu 1, 2, 3, 4, 5, dan 6:
P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = 1
6
Probabilitas untuk memperoleh hasil-akhir genap adalah:
P (genap) = P (2) + P (4) + P (6)
= 1
6 +
1
6 +
1
6 =
3
6 = 0.5
Secara matematis, probabilitas adalah suatu proporsi, sehingga sifat
dasar probabilitas dapat dinyatakan sebagai ialah:
0 < P (A) < 1 (4.2)
Peristiwa yang tidak mungkin terjadi dinamakan sebagai peristiwa nol
(himpunan kosong) dan dinyatakan dengan lambang φ ; misalnya perolehan
hasil-akhir 0 pada pelontaran sebuah dadu. Probabilitasnya adalah:
P (φ ) = 0 (4.3)
Jika 1A ,
2A , . . . , nA semua hasil-akhir yang mungkin terjadi pada
sebuah percobaan, maka:
P ( ) 1A + P ( )
2A + . . . + P ( ) nA = 1 (4.4)
Probabilitas
43
Tampak pada contoh 4.1, 4.2, dan 4.3 masing-masing:
P (M) + P (B) = 0.5 + 0.5 = 1
P (MM) + P (MB) + P (BM) + P (BB) = 0.25 + 0.25 + 0.25 + 0.25
= 1
P (1) + P (2) + P (3) + P (4) + P (5) + P (6) = (6)1
6
= 1
� Hukum Probabilitas
Dua hukum terpenting dalam teori probabilitas ialah hukum
penjumlahan dan hukum perkalian.
� Hukum Penjumlahan Hukum penjumlahan berlaku bagi peristiwa saling-asing. Peristiwa
saling-asing (mutually exclusive events) adalah dua (atau lebih) peristiwa
yang tidak dapat terjadi secara bersama-sama. Untuk peristiwa A dan B yang
saling-asing berlaku hukum penjumlahan:
P ( )A B∪ = P (A) + P (B) (4.5)
Misalnya, pada contoh 4.3 di atas hasil-akhir 2, 4, dan 6 merupakan
peristiwa-peristiwa yang saling-asing, sehingga:
P (genap) = P (2) + P (4) + P (6) = 1
6 +
1
6 +
1
6 =
3
6 = 0.5
� Hukum Perkalian Hukum perkalian berlaku bagi peristiwa yang saling independen, yaitu
dua (atau lebih) peristiwa dengan hasil-akhir pada suatu peristiwa tidak
mempengaruhi hasil-akhir pada peristiwa selanjutnya. Untuk peristiwa A dan
B yang saling independen berlaku hukum perkalian:
P ( )A B∩ = P (A) . P (B) (4.6)
Contoh 4.4: Sebuah koin dan sebuah dadu, keduanya setimbang, dilontar bersama-
sama. Probabilitas untuk memperoleh hasil-akhir M pada pelontaran koin
adalah P (M) = 0.5, sedangkan probabilitas untuk memperoleh hasil-akhir
kurang daripada 3 pada pelontaran dadu adalah:
Probabilitas
44
P (kurang daripada 3) = P (1) + P (2)
= (2) 1
6
= 2
6 =
1
3
Hasil-akhir pelontaran koin dan hasil-akhir pelontaran dadu bersifat
independen, yaitu hasil-akhir yang diperoleh pada pelontaran koin tidak akan
mempengaruhi hasil-akhir yang akan diperoleh pada pelontaran dadu (dan
sebaliknya), sehingga probabilitas untuk memperoleh hasil-akhir M pada
pelontaran koin dan hasil-akhir kurang daripada 3 pada pelontaran dadu
adalah:
P (M) . P (kurang daripada 3) = (0.5) 1
3
= 1
6
� Aturan Perhitungan
� Banyaknya Cara Banyaknya cara (number of ways) menyatakan banyaknya hasil-akhir
yang mungkin terjadi pada suatu peristiwa. Bagi seseorang yang memiliki 3
buah kemeja, biru, putih, dan kuning, ada 3 cara untuk mengenakan kemeja.
Pada pelontaran sebuah dadu, ada 6 cara untuk memperoleh hasil-akhirnya
(angka 1 sampai dengan 6). Jika perjalanan dari kota A ke kota B dapat
ditempuh melalui 4 rute, ada 4 cara untuk bepergian dari kota A ke kota B.
Jika peristiwa A dapat terjadi dengan m cara dan peristiwa B dengan
n cara, maka peristiwa A dan B dapat terjadi dalam mn cara.
Contoh 4.5: Seseorang yang memiliki 3 buah kemeja, biru, putih, dan kuning, serta
2 pasang celana, coklat dan hitam, maka ia memiliki (3)(2) = 6 cara untuk
berpakaian:
kemeja biru ; celana coklat kemeja biru ; celana hitam
kemeja putih ; celana coklat kemeja putih ; celana hitam
kemeja kuning ; celana coklat kemeja kuning ; celana hitam
� Permutasi Permutasi adalah banyaknya susunan yang dapat diperoleh pada
pemilihan k objek dari sekumpulan n objek, dengan memperhitungkan urutan
Probabilitas
45
objek yang terpilih. Permutasi k objek dari n objek, dinyatakan dengan
lambang nkP adalah:
nkP =
( )
!
!
n
n k− (4.7)
dengan: 1! = 1
2! = (1)(2) = 2
3! = (1)(2)(3) = 6
n! = (1)(2) . . . (n)
dan: 0! = 1
(n − k)! = (1)(2) . . . (n − k)
Perhatikan bahwa:
( )
!
!
n
n k− =
( )( ) ( )( ) ( )
( )( ) ( )
1 2 . . . 1 2 . . .
1 2 . . .
n k n k n k n
n k
− − + − +
−
= ( )( )1 2 . . . n k n k n− + − +
Contoh 4.6: Kelompok belajar biostatistika yang memiliki anggota 15 orang
mahasiswa akan memilih 3 orang pengurus, masing-masing sebagai ketua,
sekretaris, dan bendahara kelompok belajar. Banyak susunan pengurus yang
mungkin terpilih sama dengan permutasi 3 orang dari 15 orang, yaitu:
153P =
( )
15!
15 3 !− = (13)(14)(15) = 2,730
� Kombinasi Kombinasi adalah banyaknya susunan yang dapat diperoleh pada
pemilihan k objek dari sekumpulan n objek, tanpa memperhitungkan urutan
objek yang terpilih. Kombinasi k objek dari n objek, dinyatakan dengan
lambang nkC adalah:
nkC =
( )
!
! !
n
k n k− (4.8)
Probabilitas
46
Contoh 4.7: Misalkan kelompok belajar pada contoh 4.6 hendak memilih 5 orang
wakil untuk diikutsertakan dalam lomba biostatistika tahunan universitas.
Banyaknya susunan tim yang mungkin terbentuk dari kelompok belajar
tersebut adalah kombinasi 5 orang dari 15 orang, yaitu:
155C =
( )
15!
5! 15 5 !− =
( )( )( )( )( )
( )( )( )( )( )
11 12 13 14 15
1 2 3 4 5 = 3,003
� Distribusi Probabilitas
Distribusi probabilitas adalah daftar lengkap seluruh hasil-akhir yang
mungkin terjadi pada suatu peristiwa beserta probabilitasnya masing-masing.
Pada tabel 4.1 diperlihatkan distribusi probabilitas untuk pelontaran 1 koin,
pelontaran 2 koin, dan pelontaran 1 dadu yang probabilitasnya masing-
masing telah dihitung pada contoh 4.1, 4.2, dan 4.3. Variabel random X, Y,
dan Z, menyatakan hasil-akhir untuk masing-masing peristiwa tersebut.
Perhatikan bahwa jumlah probabilitas untuk semua kemungkinan hasil-akhir
yang saling-asing sama dengan satu.
Tabel 4.1. Contoh-contoh distribusi probabilitas
Pelontaran 1 koin Pelontaran 2 koin Pelontaran 1 dadu
X P (X) Y P (Y) Z P (Z)
M 0.5 MM 0.25 1 1/6
B 0.5 MB 0.25 2 1/6
1.0 BM 0.25 3 1/6
BB 0.25 4 1/6
1.00 5 1/6
6 1/6
1.0
Dalam bahasan statistika dikenal berbagai macam distribusi
probabilitas teoretis. Di sini hanya akan dibahas mengenai 2 distribusi
teoretis terpenting, yaitu distribusi binomial dan distribusi normal.
Probabilitas
47
� Distribusi Binomial
Distribusi binomial adalah distribusi yang terbentuk sebagai hasil-
akhir sejumlah percobaan Bernoulli (Bernoulli trials), yang memiliki sifat-
sifat berikut:
1. Pada tiap percobaan hanya ada 2 hasil-akhir yang mungkin (bersifat
dikotomi; binary), sukses atau gagal.
2. Hasil-akhir tiap percobaan bersifat independen terhadap (tidak tergantung
pada) hasil-akhir percobaan lainnya.
3. Probabilitas sukses, dinyatakan dengan lambang p, bersifat konstan dari
satu percobaan ke percobaan lainnya.
Dalam kehidupan sehari-hari terdapat berbagai peristiwa yang dapat
dianggap berdistribusi binomial, misalnya:
a. Kelahiran anak dengan hasil-akhir anak laki-laki atau perempuan.
b. Perawatan pasien di rumah sakit dengan hasil-akhir sembuh atau tidak
sembuh.
c. Tindakan pembedahan dengan hasil-akhir hidup atau mati.
Contoh 4.8: Pasangan usia subur yang baru menikah merencanakan untuk memiliki
3 orang anak. Probabilitas ibu untuk melahirkan anak laki-laki (L) dalam
populasi adalah 0.5. Jika variabel random X menyatakan jumlah anak laki-
laki di antara ketiga anak pasangan usia subur tersebut, maka variabel
random X dapat dianggap berdistribusi binomial. Distribusi probabilitas
peristiwa E, yaitu hasil-akhir untuk ke-3 anak tersebut diperlihatkan pada
tabel 4.2, sedangkan distribusi variabel random X diperlihatkan pada tabel
4.3.
Tabel 4.2. Distribusi probabilitas E
E P (E)
LLL (0.5) (0.5) (0.5) = 0.125
LLP (0.5) (0.5) (0.5) = 0.125
LPL (0.5) (0.5) (0.5) = 0.125
PLL (0.5) (0.5) (0.5) = 0.125
LPP (0.5) (0.5) (0.5) = 0.125
PLP (0.5) (0.5) (0.5) = 0.125
PPL (0.5) (0.5) (0.5) = 0.125
PPP (0.5) (0.5) (0.5) = 0.125
1.00
Probabilitas
48
E : Hasil-akhir susunan jenis kelamin 3 orang anak
L : anak laki-laki; P : anak perempuan
Tabel 4.3. Distribusi probabilitas variabel random X
E X P (X)
LLL 3 (1)(0.125) = 0.125
LLP
2 (3)(0.125) = 0.375 LPL
PLL
LPP
1 (3)(0.125) = 0.375 PLP
PPL
PPP 0 (1)(0.125) = 0.125
1.000
X : Jumlah anak laki-laki di antara ketiga anak
Contoh 4.9: Sebuah koin yang tidak seimbang dilontarkan 3 kali. Probabilitas untuk
mendapatkan hasil-akhir M pada tiap pelontaran adalah P (M) = 0.6 dan
probabilitas untuk mendapatkan hasil-akhir B adalah P (B) = 1 − P (M) =
0.4. Misalkan peristiwa E menyatakan hasil-akhir pelontaran koin 3 kali dan
variabel random X menyatakan banyak M dalam 3 kali pelontaran, maka
distribusi probabilitas E dan X dapat dilihat pada tabel 4.4 berikut.
Tabel 4.4. Distribusi probabilitas E dan variabel random X
E P (E) X P (X)
MMM (0.6)(0.6)(0.6) = 0.216 3 (1)(0.63)(0.4
0) =
0.216
MMB (0.6)(0.6)(0.4) = 0.144
2 (3)(0.6
2)(0.4
1) =
0.432 MBM (0.6)(0.4)(0.6) = 0.144
BMM (0.4)(0.6)(0.6) = 0.144
MBB (0.6)(0.4)(0.4) = 0.096
1 (3)(0.6
1)(0.4
2) =
0.288 BMB (0.4)(0.6)(0.4) = 0.096
BBM (0.4)(0.4)(0.6) = 0.096
BBB (0.4)(0.4)(0.4) = 0.064 0 (1)(0.60)(0.4
3) =
0.064
1.000 1.000
E : Hasil-akhir 3 kali pelontaran koin
X : Jumlah M di antara hasil-akhir 3 kali pelontaran koin
Probabilitas
49
Jika variabel random X yang berdistribusi binomial menyatakan jumlah
(banyaknya) sukses di antara n kali percobaan, maka probabilitas P (X) dapat
dinyatakan sebagai (lihat tabel 4.4):
P (X = x) = n x n xxC p q
− (4.9)
x : Nilai tertentu untuk variabel random X; X = 0, 1, 2, . . . , n
n : Banyaknya percobaan
p : Probabilitas sukses pada tiap percobaan; P (X = 1) pada 1 kali
percobaan
q : Probabilitas tidak sukses (gagal) pada tiap percobaan; q = 1 − p = P (X
= 0) pada 1 kali percobaan
Distribusi binomial memiliki 2 parameter, yaitu n dan p. Reratanya
yang dinyatakan dengan lambang µ, variansinya yang dinyatakan dengan
lambang σ2, serta standar deviasinya yang dinyatakan dengan lambang σ,
masing-masing adalah:
µ = np (4.10)
σ2 = npq (4.11.a)
σ = npq (4.11.b)
Untuk mempermudah perhitungan, telah disusun tabel distribusi
probabilitas binomial (addendum B1) serta probabilitas kumulatif
binomial (addendum B2).
Contoh 4.10: Tabel distribusi probabilitas binomial (addendum B1) memuat nilai-
nilai probabilitas untuk 1 sampai dengan 20 kali percobaan (1 < n < 20),
dengan probabilitas sukses 0.01 < p < 0.50. Misalnya:
- Jika n = 5; p = 0.15; maka probabilitas untuk memperoleh 3 kali sukses
adalah:
P (X = 3) = 0.0244
- Jika n = 8; p = 0.30; maka probabilitas untuk memperoleh 5 kali sukses
adalah:
P (X = 5) = 0.0467
Probabilitas
50
Contoh 4.11: Tabel distribusi probabilitas binomial umumnya hanya memuat nilai-
nilai probabilitas untuk p < 0.50. Untuk p > 0.50, nilai-nilai probabilitas
dapat dihitung sebagai berikut:
Misalkan probabilitas lulus mahasiswa yang menempuh ujian Statistika
adalah p = 0.8. Misalkan pula ada 12 orang mahasiswa yang akan menempuh
ujian Statistika, dan hendak dihitung probabilitas bahwa yang lulus adalah 10
orang.
Perhatikan bahwa jika probabilitas lulus adalah p = 0.8, maka
probabilitas tidak lulus adalah p = 0.2, dan 10 orang yang lulus di antara 12
mahasiswa sama dengan 2 orang yang tidak lulus di antara 12 mahasiswa
yang sama, sehingga:
P (X = 10 | n = 12; p = 0.8) = P (X = 2 | n = 12; p = 0.2)
= 0.2835
Contoh 4.12: Tabel probabilitas binomial kumulatif (addendum B2) memuat nilai-
nilai probabilitas kumulatif 'lebih kecil daripada', yaitu P (X < x). Misalkan
untuk jumlah percobaan n = 5 dan probabilitas sukses p = 0.40, nilai-nilai
probabilitas binomial dan binomial kumulatifnya diperlihatkan pada tabel
4.5.
Tabel 4.5. Contoh probabilitas binomial dan probabilitas binomial
kumulatif untuk n = 5 dan p = 0.40
Probabilitas
binomial
Probabilitas binomial kumulatif
P (X = 0) = 0.0778
P (X = 1) = 0.2592
P (X = 2) = 0.3456
P (X = 3) = 0.2304
dan seterusnya
P (X < 0) = 0.0778
P (X < 1) = 0.0778 + 0.2592 = 0.3370
P (X < 2) = 0.0778 + 0.2592 + 0.3456 = 0.6826
P (X < 3) = 0.0778 + 0.2592 + 0.3456 + 0.2304
= 0.9130, dan seterusnya
Misalnya dimiliki koin yang tidak setimbang, yang probabilitasnya
untuk memperoleh M (muka) pada pelontaran adalah P (M) = p = 0.4. Jika
koin dilontarkan 5 kali, maka probabilitas untuk memperoleh sebanyak-
banyaknya 1 kali M adalah P (X < 1) = 0.3370, probabilitas untuk
memperoleh sebanyak-banyaknya 2 kali muka adalah P (X < 2) = 0.6826,
dan seterusnya.
Probabilitas
51
Contoh 4.13: Lihat kembali data koin pada contoh 4.12. Perhatikan bahwa untuk n =
5, P (X < 5) = 1. Jika koin dilontarkan 5 kali, maka probabilitas untuk
memperoleh sekurang-kurangnya 3 kali M adalah:
P (X > 3) = 1 − P (X < 3)
= 1 − P (X < 2)
= 1 − 0.6826 = 0.3174
� Distribusi Normal
Distribusi normal (distribusi Gauss) adalah distribusi teoretis yang
simetris berbentuk genta (bell-shaped) untuk variabel random X yang
bernilai kontinu, terentang dari nilai minus tak berhingga sampai dengan plus
tak berhingga (memotong sumbu horizontal X secara asimptotis).
Gambaran pada diagram 4.1 dinamakan juga fungsi densitas X, yang
secara matematis dapat dinyatakan sebagai:
f (x) =
2121
2
x
e
µσ
σ π
−−
(4.12)
dengan 2 parameter, yaitu rerata µ dan standar deviasi σ.
Contoh 4.14: Nilai IQ (intelligence quotient; tingkat kecerdasan manusia yang diukur
dengan tes psikologi) dalam populasi dapat dianggap berdistribusi normal
dengan rerata µ = 100 dan standar deviasi σ = 15. Grafik distribusinya yang
dinamakan sebagai fungsi densitas diperlihatkan pada diagram 4.1.
Probabilitas
52
Diagram 4.1. Nilai IQ sebagai contoh variabel yang dapat dianggap
berdistribusi normal
Pada grafik tersebut yang dapat dianggap sebagai contoh tipikal grafik
normal dapat dilihat beberapa sifat penting distribusi normal:
1. Grafik simetris; rerata, median, dan modus terletak pada 1 titik.
2. Grafik memotong sumbu horizontal secara asimptotis (terentang dari
minus tak berhingga sampai dengan plus tak berhingga).
3. Luas area di bawah grafik (antara grafik dengan sumbu horizontal sama
dengan satu (atau 100%).
4. Luas area antara 2 nilai X (variabel random, pada sumbu horizontal) yang
berturutan menyatakan probabilitas untuk mendapatkan nilai-nilai di
antara keduanya dalam populasi:
P (a < X < b) = ( )
b
a
f x dx∫ (4.13)
a dan b : titik-titik pada sumbu horizontal, menyatakan nilai tertentu
X
( )
b
a
f x dx∫ : luas area di bawah grafik antara X = a dan X = b
5. Beberapa luas area (sekaligus menyatakan probabilitas) yang penting
pada grafik normal:
a. P (µ − σ < X < µ + σ) ≈ 68%
b. P (µ − 2σ < X < µ + 2σ) ≈ 95%
c. P (µ − 3σ < X < µ + 3σ) ≈ 99%
Probabilitas
53
Untuk mempermudah perhitungan, bagi distribusi normal juga telah
dibuat tabel nilai-nilai probabilitasnya. Namun karena distribusi normal
dapat memiliki parameter berupa nilai rerata µ dan standar deviasi σ yang
berbeda-beda, tabel normal disusun hanya untuk distribusi normal yang telah
distandardisasikan, yang dinamakan sebagai distribusi normal standar
(distribusi Z). Variabel random Z diperoleh melalui transformasi terhadap
variabel random X:
Z = X µ
σ
− (4.14)
Transformasi ini menghasilkan variabel random Z yang berdistribusi
normal dengan rerata µ = 0 dan standar deviasi σ = 1 (diagram 4.2). Dengan
merujuk pada butir 5 pada sifat distribusi normal di atas, maka untuk
distribusi Z berlaku:
a. P (−1 < Z < +1) ≈ 68%
b. P (−2 < Z < +2) ≈ 95%
c. P (−3 < Z < +3) ≈ 99%
Diagram 4.2. Distribusi normal standar
Contoh 4.15: Lihat tabel normal pada addendum C. Kolom terkiri menyatakan satuan
dan desimal pertama nilai Z, baris reatas menyatakan desimal kedua nilai Z,
dan badan tabel menyatakan luas area di sisi kanan nilai Z yang diberikan,
yaitu P (Z > z). Misalnya:
- Untuk Z = 1.64, maka P (Z > 1.64) = 0.0505
- Untuk Z = 1.96, maka P (Z > 1.96) = 0.0250
Probabilitas
54
- Untuk Z = 2.58, maka P (Z > 2.58) = 0.0049
Sebaliknya, jika diberikan luas area P (Z > z), nilai Z juga dapat dicari,
misalnya:
- Untuk P (Z > z) = 0.05, maka Z ≈ 1.64
- Untuk P (Z > z) = 0.25, maka Z ≈ 1.96
- Untuk P (Z > z) = 0.05, maka Z ≈ 2.58
Contoh 4.16: Grafik distribusi Z bersifat simetris terhadap sumbu vertikal. Sifat ini
dapat dimanfaatkan untuk mencari luas area di sisi kiri nilai Z yang
diberikan, misalnya:
- Untuk Z = −1.64, maka P (Z < −1.64) = 0.0505
- Untuk Z = −1.96, maka P (Z < −1.96) = 0.0250
- Untuk Z = −2.58, maka P (Z < −2.58) = 0.0049
Contoh 4.17:
Jika 2z > 1z > 0, maka P ( 1z < Z < 2z ) = P (Z > 1z ) − P (Z > 2z ), juga
P (− ∞ < Z < 0) = P (0 < Z < ∞ ) = 0.50, misalnya:
- P (0.50 < Z < 1.00) = P (Z > 0.50) − P (Z > 1.00)
= 0.3085 − 0.1587 = 0.1498
- P (1.25 < Z < 2.45) = P (Z > 1.25) − P (Z > 2.45)
= 0.1056 − 0.0071 = 0.0985
Contoh 4.18:
Jika 1z < 0 dan 2z > 0, maka P ( 1z < Z < 2z ) = P ( 1z < Z < 0) + P (0 <
Z < 2z ), misalnya:
- P (−0.50 < Z < 1.00) = P (−0.50 < Z < 0) + P (0 < Z < 1.00)
= (0.50 − 0.3085) + (0.50 − 0.1587)
= 0.5328
- P (−1.25 < Z < 2.45) = P (−1.25 < Z < 0) + P (0 < Z < 2.45)
= (0.50 − 0.1056) + (0.50 − 0.0071)
= 0.8873
Latihan 4
55
LATIHAN 4
Pilihlah satu jawaban yang paling benar!
1. Probabilitas adalah:
A. Rasio antara banyaknya cara suatu peristiwa dapat terjadi dengan
jumlah keseluruhan peristiwa yang sama kemungkinannya untuk
terjadi.
B. Proporsi banyak kalinya suatu peristiwa terjadi pada sejumlah besar
percobaan berulang dengan kondisi identik.
C. A) dan B) benar.
D. A) dan B) salah.
2. Jika diketahui di antara 2,056 kelahiran hidup tercatat adanya 1,056 bayi laki-
laki, maka probabilitas untuk mendapatkan bayi perempuan adalah:
A. 0.486 C. 0.947
B. 0.514 D. Tak dapat dihitung
3. Contoh peristiwa saling asing di antara peristiwa berikut yaitu:
A. Peristiwa seorang pasien dinyatakan memiliki tingkat kesadaran apatis
dan somnolen pada sekali pemeriksaan oleh seorang pemeriksa.
B. Peristiwa seorang ibu melahirkan bayi laki-laki pada kehamilan
pertama dan keduanya.
C. Keduanya benar.
D. Keduanya salah.
4. Contoh peristiwa independen di antara peristiwa berikut yaitu:
A. Peristiwa seorang pasien dinyatakan memiliki tingkat kesadaran apatis
dan somnolen pada sekali pemeriksaan oleh seorang pemeriksa.
B. Peristiwa seorang ibu melahirkan bayi laki-laki pada kehamilan
pertama dan keduanya.
C. Keduanya benar.
D. Keduanya salah.
5. Hukum penjumlahan dalam probabilitas berlaku bagi:
A. Peristiwa independen C. A) dan B) benar.
B. Peristiwa saling-asing D. A) dan B) salah.
6. Jika P (A) = 0.2 dan P (B) = 0.5, maka hukum penjumlahan menyatakan:
A. P (A ∪ B) = 0.10 C. P (A ∪ B) = 0.7
B. P (A ∩ B) = 0.10 D. P (A ∩ B) = 0.7
7. Hukum perkalian dalam probabilitas berlaku bagi:
A. Peristiwa independen C. A) dan B) benar.
B. Peristiwa saling-asing D. A) dan B) salah.
Latihan 4
56
8. Jika P (A) = 0.3 dan P (B) = 0.4, maka hukum perkalian menyatakan:
A. P (A ∪ B) = 0.12. C. P (A ∪ B) = 0.7
B. P (A ∩ B) = 0.12 D. P (A ∩ B) = 0.7
9. Jika peristiwa A dapat terjadi dengan 6 cara dan peristiwa B dengan 2 cara,
maka aturan banyaknya cara menyatakan peristiwa A dan B dapat terjadi
dalam:
A. 3 cara C. 12 cara
B. 8 cara D. Semuanya salah
10. Area berwarna gelap pada diagram Venn di bawah ini menyatakan:
A. C CA B C∩ ∩ C. ( ) C
B C A∩ ∩
B. ( )C
C A B∩ ∩ D. ( ) ( )C C
B C B C A∪ ∩ ∩ ∩
11. Kelompok seni drama Gunadarma yang beranggotakan 12 orang akan
memilih tiga orang anggotanya untuk tampil dalam pentas, masing-
masing untuk berperan sebagai dokter, perawat, dan bidan. Banyaknya
kelompok tiga orang anggota yang mungkin dipilih adalah:
A. 15 C. 220
B. 36 D. 1,320
12. Rumah Sakit Sukasehat membutuhkan lima orang perawat baru. Jika
ada sepuluh perawat yang melamar, maka banyak susunan lima
perawat yang mungkin diterima adalah:
A. 15 C. 252
B. 50 D. 30,240
13. Sebuah dadu dan sebuah mata uang, keduanya setimbang, dilemparkan
bersama-sama. Probabilitas untuk mendapatkan angka genap pada dadu
dan sisi muka mata uang bersama-sama adalah:
A. 1
6 C.
5
6
B. 1
4 D. 1
Latihan 4
57
14. Probabilitas seorang ibu untuk memperoleh anak laki-laki (L) adalah
0.51 dan anak perempuan (P) 0.49 dalam setiap kelahiran. Probabilitas
seorang ibu yang memperoleh tiga anak laki-laki dan satu anak
perempuan dalam empat kali kelahiran adalah:
A. 3 1 0.51 . 0.49 C. 4 3 1
3 . 0.51 . 0.49C
B. 3 1 3 . 0.51 . 0.49 D. ( )
44 4
3
. 0.51 . 0.49x x
x
x
C−
=
∑
15. Lihat kembali data pada soal No.14. Probabilitas seorang ibu yang
untuk memperoleh tiga anak laki-laki dan satu anak perempuan dengan
urutan LLLP dalam empat kali kelahiran adalah:
A. 3 1 0.51 . 0.49 C. 4 3 1
3 . 0.51 . 0.49C
B. 3 1 3 . 0.51 . 0.49 D. ( )
44 4
3
. 0.51 . 0.49x x
x
x
C−
=
∑
16. Lihat kembali data pada soal No.14. Probabilitas seorang ibu yang
untuk memperoleh paling sedikit tiga anak laki-laki dalam empat kali
kelahiran adalah:
A. 3 1 0.51 . 0.49 C. 4 3 1
3 . 0.51 . 0.49C
B. 3 1 3 . 0.51 . 0.49 D. ( )
44 4
3
. 0.51 . 0.49x x
x
x
C−
=
∑
17. Data lampau menunjukkan bahwa tujuh di antara setiap sepuluh orang
pasien yang menjalani bedak otak di Rumah Sakit Umurpanjang
meninggal dalam pembedahan. Jika bulan depan dijadwalkan 12 orang
pasien untuk menjalani bedah otak, probabilitas tepat enam orang
selamat menjalani pembedahan adalah:
A. 3.4% C. 92.1%
B. 7.9% D. 96.6%
18. Lihat kembali data pada soal No. 17. Probabilitas bahwa yang meinggal
dalam pembedahan otak bulan depan tidak lebih daripada tiga orang
adalah:
A. 0.17% C. 50.75%
B. 49.25% D. 99.8%
Latihan 4
58
19. Jika X berdistribusi normal dengan rerata 30 dan variansi 25, maka
probabilitas bahwa 25 37.5X< < adalah:
A. 0.0919 C. 0.4332
B. 0.3413 D. 0.7745
20. Nilai tekanan darah diastolik dalam populasi di negara Barat dapat
dianggap berdistribusi normal dengan rerata 85 mm Hg dan standar
deviasi 13 mm Hg. Jika anggota populasi dengan tekanan darah
diastolik lebih daripada 90 mm Hg dianggap sebagai penderita
hipertensi, maka persentase penderita hipertensi dalam populasi di
negara Barat adalah:
A. 8% C. 25%
B. 17.5% D. 35%
Lampiran 4.1
59
Lampiran 4.1
HIMPUNAN DAN OPERASI HIMPUNAN
Himpunan adalah sekumpulan objek yang terdefinisi dengan jelas,
seperti himpunan buku, himpunan mobil, himpunan mahasiswa, ataupun
himpunan bilangan. Himpunan dilambangkan dengan huruf besar A, B, C,
dan sebagainya.
Operasi himpunan seringkali digambarkan dalam bentuk diagram
Venn untuk mempermudah pemahamannya. Jika S menyatakan semesta
(himpunan seluruh anggota populasi), maka operasi dasar himpunan adalah:
a. Union (gabungan).
Union 2 himpunan A dan B, dinyatakan dengan lambang A ∪ B, adalah
himpunan unsur yang termasuk dalam A, B, ataupun keduanya.
b. Interseksi (selisih).
Interseksi 2 himpunan A dan B, dinyatakan dengan lambang A ∩ B,
adalah himpunan unsur yang termasuk dalam A dan B sekaligus.
c. Komplemen.
Komplemen himpunan A, dinyatakan dengan lambang CA atau A ,
adalah himpunan unsur yang tidak termasuk dalam A.
A B CA
A ∪ B ( )C
A B∪ A ∩ B ( )C
A B∩
Diagram IV.1. Beberapa contoh diagram Venn