harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/.../Buku+Biostatistika+Dasar+1.pdfyang...

BIOSTATISTIKA DASAR

Johan Harlan

Pusat Studi Informatika Kedokteran

Universitas Gunadarma

PENERBIT GUNADARMA

Perpustakaan Nasional : Katalog Dalam Terbitan (KDT)

Harlan, Johan

Biostatistika Dasar, Johan Harlan

Jakarta : Penerbit Gunadarma, 2007

viii, 169 hlm; 18.2cm x 25.7cm

Bibliografi: hlm 153

ISBN 978-979-1223-04-01

1. Biostatistika Dasar. 1. Judul.

Biostatistika Dasar

Penulis : Johan Harlan

Cetakan Pertama, September 2007

Cetakan Kedua (Revisi), Desember 2009

Cetakan Ketiga (Revisi), April 2011

Cetakan Keempat (Revisi), Juni 2015

Desain cover : Joko Slameto

Diterbitkan pertama kali oleh Gunadarma

Jl. Margonda Raya No. 100, Pondok Cina, Depok 16424

Telp. 78881112, 7863819 Faks. 7872829

e-mail: [email protected]

© Hak Cipta dilindungi undang-undang. Dilarang mengutip atau

memperbanyak dalam bentuk apapun sebagian atau seluruh isi buku tanpa

ijin tertulis dari penerbit.

v

KATA PENGANTAR

Buku Biostatistika Dasar ini disusun terutama untuk mahasiswa

program D3 Kesehatan. Walaupun dalam pendidikan di jenjang D3 lebih

diutamakan penguasaan keterampilan kerja, pengetahuan Statistika tetap

dibutuhkan untuk mempelajari cara pengumpulan data, menganalisis data

yang ditemukan dan diperoleh, membuat laporan dan kertas kerja, serta

membaca dan menginterpretasikan tulisan ilmiah. Sehubungan dengan

karakteristik Ilmu Kesehatan yang khas sebagai lahan terapannya, dalam

bidang Biostastika digunakan berbagai teknik dan metode yang agak berbeda

dengan Statistika Umum. Pengajaran Biostatistika di jenjang D3 Kesehatan

umumnya hanya diberikan selama satu semester, sehingga dalam buku ini

hanya akan dibahas dasar-dasar terpenting Biostistika.

Penulis mengucapkan terima kasih kepada segenap pihak yang telah

membantu terlaksananya penerbitan buku ini. Semua kritik dan saran akan

diterima dengan tangan terbuka.

Johan Harlan

Daftar Isi

vi

DAFTAR ISI

Kata Pengantar v

Daftar Isi vi

BAB 1 KONSEP DASAR STATISTIKA

Pengertian Statistika 1

Ruang Lingkup Statistika 1

D a t a 2

V a r i a b e l 3

Populasi dan Sampel 4

Latihan 1 6

BAB 2 PERINGKASAN DAN PENYAJIAN DATA

Pengertian Peringkasan Dan Penyajian Data 8

Macam Cara Penyajian Data 8

T a b e l 9

G r a f i k 14

Latihan 2 20

Lampiran 2.1 23

BAB 3 NILAI TENGAH DAN NILAI PENYEBARAN

Nilai Tengah 28

Ukuran Lokasi 31

Nilai Penyebaran 33

Latihan 3 38

BAB 4 P R O B A B I L I T A S

Pengertian Probabilitas 41

Hukum Probabilitas 43

Aturan Perhitungan 44

Distribusi Probabilitas 46

Distribusi Binomial 47

Distribusi Normal 51

Latihan 4 55

Lampiran 4.1 59

Daftar Isi

vii

BAB 5 S A M P L I N G

Konsep Dasar Sampling 60

Metode Sampling 61

Distribusi Sampling 65

Latihan 5 69

BAB 6 DASAR-DASAR PENGUJIAN HIPOTESIS

Pengertian Dan Jenis Uji Hipotesis 72

Teori Kesalahan 74

Uji Satu-Sisi Dan Uji Dua-Sisi 76

Langkah-Langkah Uji Hipotesis 77

Latihan 6 79

BAB 7 UJI Z DAN UJI t

U j i Z 82

U j i t 85

N i l a i p 88

Latihan 7 91

BAB 8 UJI DATA KATEGORIK

U j i 2χ 94

Uji Eksak Fisher 99

Latihan 8 103

BAB 9 KORELASI DAN REGRESI LINEAR

K o r e l a s i 107

Regresi Linear 111

Latihan 9 115

BAB 10 STATISTIK VITAL

Pengertian Statistik Vital 118

Angka Kematian 118

Angka Kelahiran 121

Latihan 10 123

BAB 11 STATISTIK RUMAH SAKIT

Statistik Pasien Rawat Jalan 126

Statistik Pasien Rawat Inap 127

Latihan 11 134

Daftar Isi

viii

BAB 12 TABEL KEHIDUPAN

Pengertian Tabel Kehidupan 138

Interval Usia 138

Jumlah Individu Hidup 140

Proporsi Kematian 141

Populasi Stasioner 142

Harapan Hidup 142

Peluang Hidup 143

Tabel Kehidupan Telusuran 144

Latihan 12 147

Lampiran 12.1 150

KEPUSTAKAAN 153

ADDENDUM A BILANGAN ACAK 154

ADDENDUM B1 DISTRIBUSI PROBABILITAS

BINOMIAL

156

ADDENDUM B2 PROBABILITAS BINOMIAL

KUMULATIF

162

ADDENDUM C DISTRIBUSI Z 167

ADDENDUM D NILAI KRITIS DISTRIBUSI t 168

ADDENDUM E NILAI KRITIS DISTRIBUSI 2χχχχ 169

INDEKS 205

Konsep Dasar Statistika

1

B A B 1

KONSEP DASAR STATISTIKA

� Pengertian Statistika

Statistika adalah sekumpulan konsep dan metode yang digunakan

untuk mengumpulkan dan menginterpretasikan data kuantitatif dalam bidang

kegiatan tertentu dan mengambil kesimpulan pada situasi dengan

ketidakpastian dan bervariasi.

Istilah Statistika berasal dari kata ‘status’ (Latin) yang berarti ‘negara’.

Asal kata status disebabkan pada awal perkembangannya, Statistika semata-

mata dikaitkan dengan penyajian fakta-fakta dan angka-angka tentang situasi

perekonomian, kependudukan, dan politik di suatu negara.

Biostatistika adalah salah satu cabang Statistika yang digunakan untuk

mempelajari aspek kuantitatif Biologi. Istilah lain yang sering dipakai dalam

pengertian yang sama atau hampir sama dengan Biostatistika adalah

Biometri, selain itu istilah Biostatistika seringkali pula diinterpretasikan

dalam ruang lingkup yang lebih terbatas, yaitu dalam pengertian yang sama

dengan Statistika Kesehatan atau Statistika Kedokteran.

� Ruang Lingkup Statistika

Secara umum, Statistika dibedakan atas:

1. Statistika Deskriptif:

Merupakan bagian Statistika yang mencakup metode untuk

meringkaskan dan mendeskripsikan segi-segi yang penting pada data.

Contoh penggunaan Statistika Deskriptif ialah pada Sensus Nasional.

2. Statistika Inferensi:

Merupakan bagian Statistika yang mencakup metode untuk mengevaluasi

informasi yang terkandung dalam data dan menafsirkan pengetahuan

baru yang diperoleh dari informasi itu. Contoh penggunaan Statistika

Inferensi yaitu dalam polling pendapat pada pemilihan presiden.

Secara spesifik, ruang lingkup kerja Statistika adalah:

1. Membimbing perancangan eksperimen atau survei.

2. Menganalisis data.

3. Menyajikan dan menginterpretasikan hasil eksperimen atau survei.


2

Contoh 1.1: Simpson (1957) mempelajari pengaruh kebiasaan merokok selama

kehamilan terhadap tingkat prematuritas kelahiran bayi pada 7,499 pasien.

Ditemukan bahwa angka prematuritas meningkat sebanding dengan jumlah

batang rokok yang diisap setiap hari. The Surgeon General's Report on

Smoking and Health (1979) menyimpulkan bahwa: "Kebiasaan merokok

pada ibu hamil memiliki dampak yang secara bermakna mengganggu

kesehatan janin dan bayi neonatus."

� D a t a

Dalam pengamatan terhadap berbagai fenomena, pengamatan tersebut

biasanya ditujukan terhadap beberapa karakteristik tertentu, misalnya usia,

berat badan, tinggi badan, status pernikahan, kebiasaan merokok, dan

sebagainya. Karakteristik ini disebut variabel, sedangkan nilai-nilai

pengamatan yang tercatat untuk masing-masing variabel adalah data.

Data yang dikumpulkan dapat bersifat kualitatif ataupun kuantitatif:

1. Data kuantitatif: adalah fakta yang direpresentasikan dalam bentuk

numerik. Contoh data kuantitatif yaitu tinggi badan (dalam cm), berat

badan (dalam kg), dan sebagainya.

2. Data kualitatif: adalah fakta yang dinyatakan dalam bentuk sifat dan

bukan dalam bentuk numerik. Contoh data kualitatif antara lain jenis

kelamin, suku bangsa, dan sebagainya.

Metode Statistika terutama dikerjakan terhadap data kuantitatif atau

data kualitatif yang telah dikuantitatifkan. Data kuantitatif dibedakan atas

data diskret dan data kontinu.

Data kontinu (data ukur) adalah data yang nilainya dapat terletak di

setiap titik pada garis bilangan, diperoleh melalui proses pengukuran

(measurement), misalnya suhu tubuh (dalam oC).

Data diskret (data hitung) adalah data yang nilainya hanya dapat

berupa bilangan bulat non-negatif, diperoleh melalui proses pencacahan

(counting), misalnya jumlah gigi sehat dalam mulut seseorang. Data kontinu

dapat dijadikan diskret dengan proses pembulatan untuk menyederhanakan

perhitungan.

Berdasarkan sumber perolehannya, data dibedakan atas data primer dan

data sekunder. Data primer adalah data yang dikumpulkan sendiri oleh

peneliti dari subjek penelitian, sedangkan data sekunder adalah data yang

telah dikumpulkan terlebih dahulu dari subjek penelitian oleh pihak lain

dengan maksud dan tujuan yang berbeda dengan maksud dan tujuan peneliti.


3

Contoh 1.2: Tidak adanya kontrasepsi berkaitan dengan tingkat abortus yang sangat tinggi

di Uni Soviet–120 abortus untuk setiap 100 kelahiran, dibandingkan dengan 20 per

100 kelahiran di Inggris, yang aksesnya terhadap kontrasepsi terjamin. Dukungan

yang tak memadai bagi Keluarga Berencana di Amerika Serikat menghasilkan 40

abortus untuk setiap 100 kelahiran–tingkat yang lebih rendah daripada Uni Soviet,

namun dua kali lebih tinggi dibandingkan dengan kebanyakan negara industri.

(The Boston Globe, 19 Januari, 1990)

Pada contoh ini, sebagian besar informasi tercakup dalam tiga angka:

120, 20, dan 40. Angka-angka ini sedikit banyak telah memberikan wawasan

mengenai konsekuensi sikap yang berbeda-beda terhadap Keluarga

Berencana.

� Variabel

Di atas telah dinyatakan bahwa variabel adalah karakteristik yang

diamati pada subjek penelitian, yang menunjukkan hasil pengamatan yang

bervariasi dari satu ke lain subjek. Menurut skala pengamatannya, variabel

dibedakan atas:

1. Skala nominal:

Merupakan bentuk pengamatan yang paling rendah tingkatannya.

Pengamatan terhadap tiap subjek tidak menghasilkan data kuantitatif,

sehingga pada skala ini hanya dapat dilakukan klasifikasi pengamatan.

Data yang diperoleh pada skala pengamatan ini dinamakan data nominal.

Contoh:

- Warna kulit: putih, hitam, dan kuning.

- Suku bangsa: Jawa, Sunda, Madura, dan sebagainya.

- Agama: Islam, Kristen, Hindu-Bali, dan sebagainya.

Apabila tidak dikuantifikasikan, maka yang dianalisis secara statistik

hanyalah frekuensi menurut kategori, misalnya di antara sekelompok

subjek, berapa orang anggota yang termasuk suku Jawa, berapa orang

yang termasuk suku Sunda, dan sebagainya.

2. Skala ordinal:

Pada skala ini pengamatan terhadap subjek juga belum menghasilkan

data kuantitatif, sehingga hanya dapat dilakukan klasifikasi pengamatan,

tetapi klasifikasi ini dapat disusun menurut urutan (orde) tertentu

Contoh:

- Status sosial-ekonomi: tinggi, menengah, dan rendah


4

- Tingkat kesadaran: kompos mentis, apatis, somnolen, sopor, dan

koma.

- Skor APGAR untuk neonatus.

Dalam analisis statistik, data ordinal seringkali diperlakukan dan diolah

dengan cara yang sama seperti data nominal.

3. Skala interval:

Pada skala ini selain pengklasifikasian dan pengurutan, dapat pula

ditentukan jarak (interval) antar dua titik skala (ada satuan pengukuran).

Contoh: Suhu tubuh (dalam oC), tahun kelahiran subjek, dan sebagainya.

4. Skala rasio:

Merupakan bentuk skala pengamatan yang tertinggi tingkatannya. Pada

skala ini, selain klasifikasi, urutan pengamatan, dan jarak antar dua titik

skala, juga dapat ditentukan titik nol mutlak, sehingga dapat dihitung

rasio (perbandingan) antar dua hasil pengamatan. Pada skala interval,

titik nol mutlak tidak ada, sehingga rasio antar dua hasil pengamatan

tidak dapat dihitung.

Contoh: Usia (dalam tahun), berat badan (dalam kg), tinggi badan (dalam

cm), dan sebagainya.

Untuk keempat skala pengamatan ini, pada tiap skala yang lebih tinggi

tercakup semua kapasitas yang ada pada tiap skala yang lebih rendah.

Misalnya skala interval mencakup semua kapasitas yang ada pada skala

nominal maupun ordinal (kapasitas untuk pengklasifikasian dan pengurutan

kategori), namun tidak mencakup semua kapasitas yang ada pada skala rasio

(kapasitas perhitungan rasio antar dua hasil pengamatan). Secara skematis,

kapasitas yang tercakup pada keempat skala pengamatan ini dapat dilihat

pada tabel 1.1.

� Populasi dan Sampel

Populasi adalah himpunan seluruh subjek yang dipelajari (diselidiki /

diinvestigasi), sedangkan sampel adalah himpunan bagian populasi yang

diamati (diobservasi).

Jika seluruh populasi diamati, cara penyelidikan ini dinamakan sensus.

Dalam praktik, karena keterbatasan biaya, waktu, atau tenaga, maupun

karena pengamatan bersifat merusak atau merugikan subjek penyelidikan,

pengamatan umumnya tidak dilakukan terhadap seluruh anggota populasi,

melainkan hanya terhadap himpunan bagian populasi yaitu sampel.


5

Penyelidikan terhadap sampel dapat dilakukan dalam bentuk survei ataupun

eksperimen (percobaan).

Tabel 1.1. Skema kapasitas keempat skala pengamatan

Skala

pengamatan

Kapasitas

Klasifikasi Urutan Hitung

interval

Hitung

rasio

ix = jx

atau

i jx x≠

ix < jx ,

ix = jx , atau

ix > jx

Hitung

ix – jx

Hitung

i jx x

Nominal

Ordinal

Interval

Rasio

+

+

+

+

–

+

+

+

–

–

+

+

–

–

–

+

Karakteristik populasi dinyatakan oleh ukuran yang dinamakan

parameter, yang nilainya umumnya tak pernah diketahui karena ukuran

populasi yang biasanya sangat besar ataupun tak berhingga. Sebagai penaksir

(estimator) untuk parameter, digunakan statistik, yaitu ukuran yang

diperoleh dari sampel.

Agar dapat menjadi estimator yang valid bagi parameter populasi,

statistik sampel harus diperoleh dari sampel representatif, yang dipilih secara

acak dari populasi. Sampel demikian dinamakan sampel random (acak).

Contoh 1.3: Untuk mengevaluasi keberhasilan program KB di sebuah kelurahan,

hendak diselidiki rerata jumlah anak yang dimiliki oleh PUS (pasangan usia

subur) di kelurahan tersebut. Untuk itu dipilih secara acak 100 PUS, dan

dikumpulkan data jumlah anak pada tiap PUS serta dihitung reratanya.

Populasi yang dipelajari mencakup seluruh PUS yang ada di kelurahan

tersebut, sedangkan sampel adalah 100 PUS yang terpilih untuk diamati.

Rerata jumlah anak per PUS yang diperoleh dari sampel yang terdiri atas 100

PUS adalah statistik sampel, merupakan penaksir (estimator) bagi parameter

populasi, yaitu rerata jumlah anak per PUS di seluruh kelurahan tersebut.

Latihan 1

6

LATIHAN 1

Pilihlah satu jawaban yang paling benar!

1. Cabang Statistika yang membahas mengenai metode peringkasan data

adalah:

A. Statistika matematik C. Statistika deskriptif

B. Statistika terapan D. Statistika inferensi

2. Biostatistika adalah:

A. Cabang Statistika yang digunakan untuk mempelajari aspek

kuantitatif Biologi.

B. Sekumpulan konsep dan metode yang digunakan untuk

mengumpulkan dan menginterpretasikan dalam data kuantitatif

dalam bidang Kesehatan / Kedokteran.

C. A) dan B) benar.

D. A) dan B) salah.

3. Ruang lingkup kerja Statistika adalah sebagai berikut, kecuali:

A. Membimbing perancangan eksperimen atau survei.

B. Menganalisis data.

C. Menyajikan dan menginterpretasikan hasil eksperimen atau

survei.

D. Mengorganisasikan penerbitan hasil eksperimen atau survei.

4. Nilai-nilai hasil pengamatan terhadap suatu karakteristik tertentu

adalah:

A. Data C. Variabel

B. Informasi D. Pengetahuan

5. Ukuran yang menyatakan karakteristik populasi adalah:

A. Sampel C. Statistik

B. Populasi D. Parameter

6. Data kuantitatif adalah:

A. Fakta yang diperoleh melalui proses pengukuran (measurement)

B. Fakta yang direpresentasikan dalam bentuk numerik

C. Fakta yang dikumpulkan sendiri oleh peneliti dari subjek

penelitian

D. Semuanya benar

Latihan 1

7

7. Skor APGAR merupakan contoh variabel dengan skala pengukuran:

A. Nominal C. Interval

B. Ordinal D. Rasio

8. Data untuk keperluan penelitian kesehatan yang diperoleh dari Dinas

Kesehatan setempat merupakan contoh:

A. Data diskret C. Data primer

B. Data kontinu D. Data sekunder

9. Pengumpulan data yang dilakukan terhadap seluruh anggota populasi

adalah:

A. Survei C. Sensus

B. Surveilans D. Skrining

10. Yang benar di antara pernyataan berikut ialah:

A. Skala interval memiliki seluruh kapasitas skala rasio

B. Skala nominal memiliki seluruh kapasitas skala ordinal

C. Skala interval memiliki seluruh kapasitas skala ordinal

D. Skala nominal memiliki seluruh kapasitas skala rasio

Peringkasan dan Penyajian Data

8

B A B 2

PERINGKASAN DAN

PENYAJIAN DATA

� Pengertian Peringkasan dan Penyajian Data

Data yang terkumpul sebagai hasil pengamatan harus dipaparkan dan

disampaikan dalam bentuk yang relatif sederhana dan mudah dipahami oleh

pembaca tanpa mengubah atau mengurangi informasi yang tercakup dalam

data tersebut. Umumnya volume data yang dikumpulkan relatif besar,

sehingga tidak mudah untuk menyimpulkan informasi yang ada dalam

keseluruhan data tersebut. Karena itu biasanya diperlukan proses peringkasan

sebelum data dapat disajikan, sebagai bagian tak terpisahkan dari proses

penyajian data itu sendiri.

Metode untuk meringkaskan dan mendeskripsikan segi-segi yang

penting pada data ini tercakup dalam Statistika Deskriptif.

� Macam Cara Penyajian Data

Dikenal berbagai macam cara penyajian data, antara lain dengan cara

tekstular, tabular, dan grafikal.

� Cara tekstular Penyajian data secara tekstular terutama bersifat naratif (menggunakan

teks), walaupun di tengah narasi itu sendiri biasanya terdapat data numerik

berupa angka-angka. Penyajian data tekstular dapat dilakukan secara

eksklusif, ataupun sebagai penjelasan bagi tabel atau grafik yang

menyertainya.

� Cara tabular Cara tabular adalah cara penyajian data dengan menggunakan tabel.


9

� Cara grafikal Cara grafikal adalah cara penyajian data dengan menggunakan grafik.

� T a b e l

Tabel adalah bentuk peringkasan data menjadi sekumpulan angka dan

fakta yang disajikan dalam sejumlah baris dan kolom. Tabel yang baik

haruslah sederhana dan tidak memerlukan penjelasan secara rinci (bersifat

self-explanatory), walaupun adakalanya perlu untuk membuat tabel induk

(master table) yang kompleks, sedangkan penjelasan naratif yang tidak rinci

umumnya tetap disertakan dalam pembahasan isi tabel.

Sebagai contoh, dapat dilihat tabel 2.2 dan 2.3, masing-masing

menyajikan distribusi frekuensi tekanan darah sistolik pada kelompok

perokok dan bukan perokok yang diperoleh sebagai hasil pengolahan data

Studi Jantung Honolulu, 1969 (lampiran 2.1).

Bagian-bagian tabel adalah:

1. Judul tabel:

Judul tabel ditempatkan di atas tabel, memuat deskripsi singkat mengenai

isi tabel. Apabila terdapat lebih daripada satu tabel dalam suatu

penyajian, setiap tabel harus diberi nomor tabel.

2. Caption kolom:

Baris teratas pada tabel, menjelaskan tentang kolom-kolom yang ada

pada tabel.

3. Caption baris (stub):

Kolom terkiri pada tabel, menjelaskan tentang baris-baris pada tabel.

4. Badan tabel:

Kumpulan angka/fakta yang disajikan pada sel-sel tabel.

5. Catatan kaki (footnote):

Tidak selalu ada, umumnya memuat sumber informasi untuk

pembuatan/penyajian tabel.

Tabel dalam bentuk distribusi frekuensi digunakan untuk menyajikan

ringkasan data kategorik ataupun data numerik yang dikategorikan. Apabila

yang akan ditabelkan adalah data numerik yang akan dikategorikan, langkah

pertama adalah menentukan jumlah kelas. Untuk beberapa macam data

tertentu yang sering diteliti dan dibahas, biasanya sudah ada kategorisasi

baku. Untuk data yang belum ada kategorisasi bakunya, dapat dipilih sendiri

banyaknya kelas yang umumnya berkisar antara 5 sampai dengan 15.


10

Contoh 2.1: Pada tabel 2.1 diperlihat pembuatan tabel distribusi frekuensi tekanan

darah sistolik pada kelompok bukan perokok untuk data Studi Jantung

Honolulu, 1969 (lampiran 2.1).

Langkah pertama adalah menentukan jumlah kelas, dengan melihat

rentang nilai-nilai pengamatan. Karena tabel yang terbentuk akan

diperbandingkan dengan tabel serupa untuk kelompok perokok, rentang

nilai-nilai pengamatan yang dilihat adalah untuk seluruh basis-data, yang

berkisar antara 92 mm Hg (nilai minimum) sampai dengan 208 mm Hg (nilai

maksimum). Untuk itu digunakan 6 kelas penyajian data, yaitu 90-109 mm

Hg, 110-129 mm Hg, . . . , 190-209 mm Hg, walaupun untuk kelompok

bukan perokok kelas terakhir ini ternyata kosong (tidak ada anggotanya).

Setelah itu frekuensi anggota masing-masing kelas ditentukan dengan

proses 'melidi' (tally) seperti terlihat pada kolom kedua pada tabel 2.1.

Penentuan batas-batas kelas harus dilakukan sedemikian rupa, sehingga tidak

memungkinkan adanya nilai pengamatan yang dapat dimasukkan dalam 2

kelas sekaligus. Proses melidi diakhiri dengan menghitung nilai frekuensi

untuk tiap kelas (kolom ketiga pada tabel 2.1).

Tabel 2.1. Distribusi frekuensi tekanan darah sistolik untuk

bukan perokok

Interval kelas

(tekanan darah

sistolik*)

Melidi f

(frekuensi)

90-109

110-129

130-149

150-169

170-189

190-209

///// /////

///// ///// ///// ///// ////

///// ///// ///// ///

///// ////

//

10

24

18

9

2

0

Jumlah 63

* Dalam mm Hg

(Sumber: Studi Jantung Honolulu)

Pembuatan tabel diselesaikan dengan membuang kolom untuk proses

melidi, selain itu nilai-nilai frekuensi tiap kelas dapat pula disajikan dalam

bentuk persentase (frekuensi relatif; tabel 2.2).


11

Tabel 2.2. Distribusi frekuensi tekanan darah sistolik untuk bukan

perokok, Studi Jantung Honolulu, 1969

Interval kelas

(tekanan darah

sistolik*)

N %

90-109

110-129

130-149

150-169

170-189

190-209

10

24

18

9

2

0

16

38

29

14

3

0

Jumlah 63 100

* dalam mm Hg

Pada tabel 2.3 diperlihatkan distribusi frekuensi serupa pada kelompok

perokok.

Tabel 2.3. Distribusi frekuensi tekanan darah sistolik untuk perokok,

Studi Jantung Honolulu, 1969

Interval kelas

(tekanan darah

sistolik*)

N %

90-109

110-129

130-149

150-169

170-189

190-209

5

15

10

3

2

2

14

41

27

8

5

5

Jumlah 37 100

* dalam mm Hg

Contoh 2.2: Tabel 2.2 dan 2.3 dapat digabung dan disajikan dalam satu tabel (tabel

2.4). Walaupun penggabungan ini menyebabkan tabel menjadi lebih

kompleks, penggabungan di sini dimaksudkan untuk memudahkan pembaca

yang ingin memperbandingkan distribusi frekuensi antar dua kelompok,

perokok dan bukan perokok.


12

Tabel 2.4. Distribusi frekuensi responden menurut tekanan darah dan

status merokok, Studi Jantung Honolulu, 1969

Interval kelas

(tekanan darah

sistolik*)

Perokok Bukan

perokok

Jumlah

N % N % N %

90-109

110-129

130-149

150-169

170-189

190-209

5

15

10

3

2

2

14

41

27

8

5

5

10

24

18

9

2

0

16

38

29

14

3

0

15

39

28

12

4

2

15

39

28

12

4

2

Jumlah 37 100 63 100 100 100

* dalam mm Hg

Contoh 2.3: Pada tabel 2.5 diperlihatkan distribusi berat badan lahir 1,260 bayi

wanita pada kehamilan 40 minggu. Batas kelas yang dicantumkan pada tabel

adalah 1.76-2.00, 2.01-2.25, dan seterusnya, walaupun batas kelas

sebenarnya adalah 1.755-2.005, 2.005-2.255, dan seterusnya. Pencantuman

batas atas sebuah kelas tidak boleh sama dengan batas bawah kelas

berikutnya untuk mencegah duplikasi pemasukan nilai (sebuah nilai dapat

dimasukkan ke dalam dua kelas sekaligus). Dengan demikian interval kelas

bukan 0.24 kg (1.76-2.00), melainkan 0.25 kg (1.755-2.005), sedangkan

untuk perhitungan selanjutnya dianggap ada 4 bayi dengan BBL (berat badan

lahir) 1.88 kg, 3 bayi dengan BBL 2.13 kg, dan seterusnya.

Pada contoh-contoh di atas diperlihatkan tabel distribusi frekuensi

untuk satu variabel. Dalam satu tabel dapat pula disajikan distribusi frekuensi

dua variabel sekaligus, yaitu dalam bentuk tabel silang.


13

Tabel 2.5. Distribusi berat badan lahir 1,260 bayi wanita pada

kehamilan 40 minggu

BBL* (kg) Interval

kelas

Titik

tengah

kelas Frekuensi Batas

pada tabel

Batas kelas

sebenarnya

1.76-2.00

2.01-2.25

2.26-2.50

2.51-2.75

2.76-3.00

3.01-3.25

3.26-3.50

3.51-3.75

3.76-4.00

4.01-4.25

4.26-4.50

4.51-4.75

4.76-5.00

5.01-5.25

1.755-2.005

2.005-2.255

2.255-2.505

2.505-2.755

2.755-3.005

3.005-3.255

3.255-3.505

3.505-3.755

3.755-4.005

4.005-4.255

4.255-4.505

4.505-4.755

4.755-5.005

5.005-5.255

0.25

0.25

0.25

0.25

0.25

0.25

0.25

0.25

0.25

0.25

0.25

0.25

0.25

0.25

1.88

2.13

2.38

2.63

2.88

3.13

3.38

3.63

3.88

4.13

4.38

4.63

4.88

5.13

4

3

12

34

115

175

281

261

212

94

47

14

6

2

Jumlah kelahiran 1,260

* Berat badan lahir

Contoh 2.4:

Pada tabel 2.6 di bawah diperlihat contoh tabel silang 2×2 (badan sel

terdiri atas 2 baris dan 2 kolom), yang menunjukkan distribusi frekuensi dua

variabel sekaligus, indeks massa tubuh (BMI) dan kadar kolesterol serum

yang masing-masing telah dikategorisasikan menjadi 2 kelas (berskala

dikotomi). Distribusi frekuensi masing-masing variabel dapat dilihat pada

baris terbawah dan kolom terkanan tabel, dinamakan sebagai distribusi

marginal, sedangkan nilai-nilai yang ada pada sel-sel badan tabel

menunjukkan distribusi bersama (joint distribution) kedua variabel.


14

Tabel 2.6. Indeks massa tubuh dan kadar kolesterol serum pada Studi

Jantung Honolulu, 1969

BMI* Kadar kolesterol serum**

Jumlah < 200 > 200

< 25.00

> 25.00

25

12

35

28

60

40

Jumlah 37 63 100

* dalam kg/m2; ** dalam mg%

� G r a f i k

Dengan tabel, penyajian ringkasan data dapat dilakukan secara lebih

rinci, namun kesan sekilas secara kasar lebih mudah diperoleh dari grafik.

Selain itu secara visual penyajian grafik umumnya lebih menarik bagi

pembaca.

Bentuk-bentuk grafik yang lazim digunakan antara lain adalah diagram

lingkar, diagram batang, histogram, dan poligon frekuensi.

� Diagram lingkar Diagram lingkar (pie diagram) digunakan untuk menyajikan ringkasan

data nominal secara grafikal. Contoh diagram lingkar diperlihatkan pada

diagram 2.1, yang menunjukkan penyebab utama kematian ibu hamil di

dunia (WHO, 2001). Untuk penyajian diagram lingkar dianjurkan:

- Tidak mencantum besaran proporsi masing-masing segmen di sekitar

lingkaran. Apabila angka-angka ini ingin ditampilkan, sebaiknya

ringkasan data disajikan dalam bentuk tabel.

- Jangan memotong salah satu segmen dan menariknya keluar, walaupun

segmen itu dianggap merupakan kelas terpenting di antara keseluruhan

kategori.

Diagram 2.1. Penyebab utama kematian ibu hamil, WHO, 2001


15

� Diagram batang Diagram batang (bar diagram) digunakan untuk menyajikan ringkasan

data ordinal. Contoh diagram batang diperlihatkan pada diagram 2.2, yang

menunjukkan status merokok pada 1,371 wanita dalam Studi Populasi

Irlandia. Perhatikan bahwa angka-angka yang tercantum hanya menyatakan

skala pengukuran pada sumbu vertikal dan tidak menyatakan tinggi

(proporsi) masing-masing batang.

Diagram 2.2. Status merokok pada wanita, Studi Populasi Irlandia,

1983

� Histogram Histogram digunakan untuk menyajikan ringkasan data numerik yang

telah dikategorisasikan. Contoh histogram diperlihatkan pada diagram 2.3,

yang merupakan penyajian dalam bentuk grafikal untuk data pada tabel 2.5.

Seperti halnya dengan diagram batang, pada histogram pun tidak

dicantumkan angka-angka untuk menyatakan tinggi (proporsi) masing-

masing batang.


16

Diagram 2.3. Distribusi berat badan lahir 1,260 bayi wanita pada

kehamilan 40 minggu

� Poligon frekuensi Poligon frekuensi diperoleh dengan menghubungkan titik tengah

puncak-puncak batang histogram. Pada diagram 2.4 diperlihatkan contoh

pembuatan poligon frekuensi dari histogram pada diagram 2.3, dan pada

diagram 2.5 diperlihatkan poligon frekuensi tanpa histogram.

Diagram 2.4. Histogram dan poligon frekuensi untuk distribusi berat

badan lahir 1,260 bayi wanita pada kehamilan 40 minggu


17

Diagram 2.5. Poligon frekuensi untuk distribusi berat badan lahir 1,260

bayi wanita pada kehamilan 40 minggu

� Ogive Ogive adalah poligon frekuensi untuk data kumulatif. Pada tabel 2.7,

pada kolom terkanan diperlihatkan distribusi kumulatif untuk data BBL bayi

wanita pada tabel 2.5 dan ogive-nya diperlihatkan pada diagram 2.6.

Tabel 2.7. Distribusi kumulatif berat badan lahir 1,260 bayi wanita

pada kehamilan 40 minggu

BBL* (kg) Frekuensi Frekuensi kumulatif

1.76-2.00

2.01-2.25

2.26-2.50

2.51-2.75

2.76-3.00

3.01-3.25

3.26-3.50

3.51-3.75

3.76-4.00

4.01-4.25

4.26-4.50

4.51-4.75

4.76-5.00

5.01-5.25

4

3

12

34

115

175

281

261

212

94

47

14

6

2

4

7

19

53

168

343

624

885

1,097

1,191

1,238

1,252

1,258

1,260

* Berat badan lahir


18

Diagram 2.6. Ogive berat badan lahir 1,260 bayi wanita pada

kehamilan 40 minggu

� Diagram gambar Diagram gambar (piktogram; pictorial graph) umumnya jarang

ditampilkan dalam tulisan ilmiah, biasanya digunakan dalam tulisan ilmiah

populer ataupun laporan untuk konsumsi masyarakat awam. Contoh diagram

gambar diperlihatkan pada diagram 2.7. Upaya penulis yang berlebihan

untuk menekankan adanya penurunan persentase angka pengangguran

tercermin pada perbandingan besar gambar yang tidak proporsional antara

gambar untuk angka 10.4% (Februari 1983) dengan 8.0% (Januari 1984).

Diagram 2.7. Persentase pengangguran pada angkatan kerja di

Amerika Serikat, Februari 1983-Januari 1984


19

� Diagram batang-dan-daun Diagram batang-dan-daun (stem-and-leaf) dapat dianggap sebagai

perpaduan antara histogram dengan tabel distribusi frekuensi. Contoh

diagram batang-dan-daun diperlihatkan pada diagram 2.8. Angka-angka di

sisi kiri ('batang') menyatakan puluhan dan ratusan, sedangkan angka-angka

di sisi kanan ('daun') menyatakan satuan, misalnya angka-angka pada baris

pertama menyatakan tekanan darah 92, 94, 96, dan 98 mm Hg. Diagram

batang-dan-daun hanya sesuai untuk digunakan bagi kumpulan data yang

tidak terlalu besar.

9* | 2468

10* | 046888

11* | 224488888

12* | 022224488888888

13* | 000224444448

14* | 002446

15* | 2244446

16* | 22

17* | 02

Diagram 2.8. Diagram batang-dan-daun tekanan darah sistolik untuk

kelompok bukan perokok, Studi Jantung Honolulu, 1983

� Diagram tebar Diagram tebar (scatter diagram) memperlihatkan gambaran dua-

dimensi untuk data dua variabel (bivariat), seperti contoh yang tampak pada

diagram 2.9, yang memperlihatkan hitung bakteri dari kultur (sumbu

horizontal) dan nilai-nilai hitung leukosit (sumbu vertikal) pada penderita

penyakit infeksi.

Diagram 2.9. Hitung leukosit dan hitung bakteri dari kultur pada

penderita penyakit infeksi

Latihan 2

20

LATIHAN 2


1. Alasan utama untuk melakukan peringkasan data ialah:

A. Data bersifat kompeks dan sulit diinterpretasikan.

B. Volume data yang dikumpulkan relatif besar.

C. Ruang yang tersedia untuk publikasi sangat terbatas.

D. Semuanya salah.

2. Penyampaian data secara naratif tergolong dalam cara penyajian data:

A. Tekstular C. Grafikal

B. Tabular D. Semuanya benar

3. Tabel yang baik ialah tabel yang:

A. Bersifat self-explanatory

B. Sederhana

C. Bersifat self-explanatory dan sederhana

D. Bersifat self-explanatory dan kompleks

4. Bagian-bagian tabel berikut mutlak harus ada, kecuali:

A. Judul tabel C. Badan tabel

B. Caption kolom D. Catatan kaki

5. 'Melidi' (tally) adalah proses:

A. Penentuan rentang nilai-nilai pengamatan untuk seluruh basis-

data.

B. Penentuan jumlah kelas/kategori untuk penyusunan distribusi

frekuensi.

C. Pemasukan masing-masing anggota kelompok ke dalam

kelas/kategori yang sesuai.

D. Perhitungan frekuensi absolut untuk tiap kelas/kategori.

6. 'Interval kelas' pada tabel distribusi frekuensi adalah:

A. Batas atas kelas dikurangi batas bawah kelas yang sama.

B. Batas atas kelas dikurangi batas atas kelas berikutnya yang lebih

rendah.

C. Batas bawah kelas dikurangi batas atas kelas berikutnya yang

lebih rendah.

D. Batas atas kelas dikurangi batas bawah kelas berikutnya yang

lebih rendah.

Latihan 2

21

7. Tabel silang adalah:

A. Tabel yang tidak memiliki stub.

B. Tabel dengan jumlah kelas kurang daripada lima.

C. Tabel yang menyajikan distribusi frekuensi dua variabel

sekaligus.

D. Tabel yang merupakan penjabaran dari tabel induk.

8. Dibandingkan dengan tabel, keuntungan penggunaan grafik adalah

sebagai berikut, kecuali:

A. Pembacaan data dapat dilakukan secara lebih rinci.

B. Gambaran sekilas lebih mudah diperoleh.

C. Secara visual penyajian dapat dibuat lebih menarik.

D. Semua di atas merupakan keuntungan penggunaan grafik.

9. Diagram lingkar (pie diagram) terutama dianjurkan untuk penyajian

data:

A. Nominal

B. Ordinal

C. Numerik yang dikategorisasikan.

D. Semuanya salah.

10. Bentuk grafik yang dianjurkan untuk menyajikan ringkasan data

ordinal adalah:

A. Diagram lingkar C. Histogram

B. Diagram batang D. Poligon frekuensi

11. Secara konseptual, poligon frekuensi identik dengan:

A. Diagram lingkar C. Histogram

B. Diagram batang D. Semuanya benar

12. Ogive adalah:

A. Basis-data yang telah diurut dari nilai terkecil sampai dengan nilai

terbesar.

B. Grafik yang diperoleh dengan menghubungkan titik tengah

puncak-puncak batang histogram.

C. Poligon frekuensi untuk data kumulatif.

D. Diagram berbentuk gambar yang biasa disajikan dalam tulisan

ilmiah populer.

Latihan 2

22

13. Diagram batang-dan-daun adalah perpaduan antara:

A. Diagram batang dengan tabel distribusi frekuensi.

B. Histogram dengan tabel distribusi frekuensi.

C. Piktogram dengan tabel distribusi frekuensi.

D. Semuanya salah.

14. Dalam penyajian data dengan nilai-nilai dua-digit pada diagram batang-

dan-daun:

A. Batang menyatakan puluhan dan daun menyatakan satuan.

B. Batang menyatakan satuan dan daun menyatakan puluhan.

C. A) dan B) benar.

D. A) dan B) salah.

15. Grafik yang dapat digunakan untuk data bivariabel ialah:

A. Diagram batang C. Diagram tebar

B. Diagram batang dan daun D. Diagram lingkar

Lampiran 2.1

23

La

mp

ira

n 2

.1

Ta

bel

II.

1. D

ata

sa

mp

el 1

00

su

bje

k d

ari

7,6

83

an

gg

ota

Po

pu

lasi

Stu

di

Ja

ntu

ng

Ho

no

lulu

, 1

96

9

Lampiran 2.1

24

Lampiran 2.1

25

Lampiran 2.1

26

Lampiran 2.1

27

Ko

de

un

tuk

va

riab

el:

Pen

did

ikan

: 1

= t

idak

ad

a, 2

= S

D,

3 =

SM

P,

4 =

SM

A,

5=

SM

K,

6 =

Un

iver

sita

s

Mer

ok

ok

: 0

= t

idak

, 1

= y

a

Ak

tiv

itas

fis

ik:

1 =

ham

pir

sel

alu

du

du

k,

2 =

mo

der

at,

3 =

gia

t

Glu

ko

sa d

arah

: d

alam

mg

%

Ko

lest

ero

l se

rum

: d

alam

mg

%

Tek

anan

dar

ah s

isto

lik

: d

alam

mm

Hg

BM

I (i

nd

eks

mas

sa t

ub

uh

): B

B/T

B2,

BB

dal

am k

g,

TB

dal

am m

Nilai Tengah dan Nilai Penyebaran

28

B A B 3

NILAI TENGAH DAN NILAI

PENYEBARAN

� Nilai Tengah

Nilai tengah (central values; central tendency) suatu himpunan data

adalah titik tempat nilai-nilainya cenderung untuk mengelompok. Tiga nilai

tengah yang paling umum dikenal ialah rerata (rerata hitung; mean /

arithmetic mean), median, dan modus.

� R e r a t a Rerata (rerata hitung) suatu himpunan data, dinyatakan dengan

lambang x , adalah jumlah seluruh nilai dibagi dengan banyaknya nilai:

x = 1 2 . . . nx x x

n

+ + +

atau: x = 1

n

ii

x

n

=∑

(3.1)

ix : nilai ke-i pada himpunan data; i = 1, 2, . . . , n

n : banyaknya nilai

Contoh 3.1: Misalkan dimiliki data berat badan lima orang mahasiswa, masing-

masing 58, 52, 61, 52, dan 47 kg, maka reratanya adalah:

x = 1

n

ii

x

n

=∑

= 58 52 61 52 47

5

+ + + +=

270

5= 54 kg


29

Rerata memiliki keunggulan yaitu mudah dihitung dan mempunyai

nilai matematik, yaitu dapat digunakan dalam inferensi statistik. Sebaliknya,

untuk aspek deskripsi rerata memiliki kelemahan, yaitu sangat terpengaruh

oleh pengamatan luar (outlier). Pengamatan luar adalah nilai pada

himpunan data yang sangat berbeda dengan nilai lain pada umumnya, dapat

terlalu besar ataupun terlalu kecil nilainya.

Contoh 3.2: Misalkan pada kelompok lima orang mahasiswa pada contoh 3.1 di atas

ditambahkan seorang pendatang baru dengan berat badan 102 kg, nilai

reratanya akan berubah menjadi:

x = 58 52 61 52 47 102

6

+ + + + +=

372

6= 62 kg

Nilai rerata yang baru ini lebih besar daripada setiap nilai pada

kelompok semula, sehingga tidak lagi dapat dianggap sebagai nilai tengah

yang representatif.

� M e d i a n Median adalah nilai yang terletak tepat di tengah suatu himpunan data

yang telah diurutkan menurut besarnya (di-ranking). Himpunan data yang

telah diurutkan menurut besarnya ini dinamakan array. Jika array

dinyatakan sebagai ( )1

x , ( )2

x , . . . , ( )n

x , maka posisi median adalah pada

urutan ke-1

2

n +, sehingga:

Med = 1

2

nx

+ ; n ganjil (3.2.a)

Med = 1

2 2

2

n nx x

++

; n genap (3.2.b)

( )ix : nilai ke-i pada array; i = 1, 2, . . . , n

n : banyaknya nilai


30

Contoh 3.3: Lihat kembali data berat badan mahasiswa pada contoh 3.1. Array-nya

adalah:

47, 52, 52, 58, 61,

sehingga mediannya adalah ( )3

x = 52 kg. Jika ditambahkan satu pendatang

baru pada contoh 3.2, array-nya adalah:

47, 52, 52, 58, 61, 102,

dan mediannya adalah ( ) ( )3 4

2

x x+=

52 58

2

+= 55 kg.

Median membagi nilai-nilai yang ada pada himpunan data menjadi dua

bagian yang sama besarnya. Median tidak dapat digunakan dalam inferensi

statistik, tetapi untuk pendeskripsian data, median memiliki keunggulan

karena bersifat tangguh (robust; tidak terlalu terpengaruh oleh pengamatan

luar). Tampak pada contoh 3.3 bahwa kehadiran pendatang baru dengan

berat badan 102 kg hanya mengubah median menjadi 55 kg, perubahan yang

relatif kecil dibandingkan dengan perubahan rerata pada contoh 3.2.

� M o d u s Modus (mode) adalah nilai yang paling banyak (paling sering)

ditemukan dalam suatu himpunan data. Suatu himpunan data dapat memiliki

satu modus (unimodal) ataupun lebih daripada satu modus. Untuk data berat

badan mahasiswa pada contoh 3.1 di atas, modusnya adalah 52 kg.

Pada himpunan data yang simetris, rerata, median, dan modusnya

berimpit pada satu titik. Jika pada himpunan data tersebut ditambahkan nilai-

nilai baru yang ekstrim besar, himpunan data menjadi menceng ke kanan

(skewed to the right). Nilai tengah yang paling terpengaruh (tertarik ke

kanan) adalah rerata, sedangkan modus tidak terpengaruh, sehingga

diperoleh urutan nilai tengah dari kiri ke kanan: modus −−−− median −−−− rerata.

Sebaliknya, penambahan nilai-nilai baru yang ekstrim kecil pada

himpunan data simetris akan menyebabkan himpunan data menjadi menceng

ke kiri (skewed to the left), sehingga diperoleh urutan nilai tengah dari kiri

ke kanan: rerata −−−− median −−−− modus.


31

� Ukuran lokasi

Selain sebagai nilai tengah, rerata, median, dan modus juga dapat

dianggap merupakan ukuran lokasi bagi himpunan data, yaitu ukuran yang

menentukan letak / lokasi distribusi himpunan data pada sistem koordinat

Kartesian. Ukuran lokasi lain yang terpenting dalam Biostatistika ialah

kuartil dan persentil.

� K u a r t i l Seperti halnya median yang membagi nilai-nilai pada himpunan data

menjadi dua bagian yang sama besar, kuartil (quartile) membagi nilai-nilai

pada himpunan data menjadi empat bagian yang sama besar. Nilai-nilai

kuartil adalah:

- Kuartil nol (dinyatakan dengan lambang 0Q ): nilai terkecil pada

himpunan data.

- Kuartil pertama (kuartil bawah; dinyatakan dengan lambang 1Q ):

memisahkan seperempat bagian terkecil (terbawah) dengan tiga perempat

bagian terbesar (teratas) himpunan data.

- Kuartil kedua (dinyatakan dengan lambang 2Q ): memisahkan setengah

bagian terkecil dengan setengah bagian terbesar himpunan data. Kuartil

kedua sama dengan median.

- Kuartil ketiga (kuartil atas; dinyatakan dengan lambang 3Q ):

memisahkan tiga perempat bagian terkecil dengan seperempat bagian

terbesar himpunan data.

- Kuartil keempat (dinyatakan dengan lambang 4Q ): nilai terbesar pada

himpunan data.

Contoh 3.4:

Lihat data tekanan darah sistolik 12 subjek pertama (No. ID 1 s.d. 12)

pada Studi Jantung Honolulu (lampiran 2.1):

102, 138, 190, 122, 128, 112, 128, 116, 134, 104, 116, dan 152 mm Hg

Array-nya adalah:

102, 104, 112, 116, 116, 122, 128, 128, 134, 138, 152, 190

Dengan n = 12, kuartil pertama, kuartil kedua (= median), dan kuartil

ketiga masing-masing adalah:


32

1Q = ( ) ( )3 4

2

x x+=

112 116

2

+= 114

2Q = Med = ( ) ( )6 7

2

x x+=

122 128

2

+= 125

3Q = ( ) ( )9 10

2

x x+=

134 138

2

+= 136

� P e r s e n t i l

Nilai-nilai persentil, dinyatakan dengan lambang 0P sampai dengan

100P , membagi himpunan data menjadi seratus bagian yang sama besar.

Persentil hanya dihitung dan ditentukan untuk himpunan data yang cukup

besar, yaitu n > 100. Pada diagram 3.1 diperlihatkan contoh persentil tinggi

dan berat badan anak perempuan usia 2-18 tahun (Grafik Pertumbuhan

NCHS, Ross Laboratories).


33

Diagram 3.1. Persentil tinggi dan berat badan anak perempuan

menurut usia, 2-18 tahun (Grafik Pertumbuhan NCHS, Ross

Laboratories)

� Nilai Penyebaran

Nilai penyebaran (measures of dispersion; measures of variation)

adalah ukuran yang mendeskripsikan variabilitas nilai-nilai pada suatu

himpunan data. Beberapa nilai penyebaran yang lazim ditampilkan antara

lain yaitu rentang, rentang inter-kuartil, variansi, dan standar deviasi.


34

� R e n t a n g Rentang (range), dinyatakan dengan lambang R, adalah selisih antara

nilai terbesar dengan nilai terkecil dalam suatu himpunan data.

R = maxx − minx (3.3)

� Rentang inter-kuartil Rentang inter-kuartil (inter-quartile range), dinyatakan dengan

lambang IQR, adalah selisih antara kuartil ketiga dengan kuartil pertama:

IQR = 3Q − 1Q (3.4)

Contoh 3.5:

Lihat kembali data pada contoh 3.4. Dengan minx = 102, 1Q = 114, 3Q =

136, dan maxx = 190, rentang dan rentang inter-kuartil adalah:

R = maxx − minx

= 190 − 102 = 88

IQR = 3Q − 1Q

= 136 − 114 = 22

� V a r i a n s i

Variansi (variance), dinyatakan dengan lambang 2s [atau Var (x)],

adalah rerata kuadrat deviasi nilai-nilai suatu himpunan data terhadap

reratanya, dengan pembagi (n − 1).

Misalkan dimiliki himpunan data 1x , 2x , . . . , nx dengan rerata x ,

maka deviasinya (penyimpangannya) terhadap rerata masing-masing adalah

( )1x x− , ( )2x x− , . . . , ( )nx x− , dan rerata kuadrat deviasi ini dengan

pembagi (n − 1) adalah:

2s =

( ) ( ) ( )2 2 2

1 2

1

. . . n

x x x x x x

n

− + − + + −

−

atau: 2s =

( )2

1

1

n

ii

x x

n

=

−

−

∑ (3.5)


35

Rumus 3.5 yang dinamakan sebagai rumus definisi variansi, hanya

digunakan untuk perhitungan jika himpunan data relatif kecil. Untuk

himpunan data yang besar, digunakan rumus operasional variansi:

2s =

2

2 1

1

1

n

ini

ii

x

xn

n

=

=

−

−

∑∑

(3.6)

Untuk menggunakan rumus operasional, rerata x dan nilai-nilai

deviasinya tidak perlu dihitung, namun yang harus dihitung terlebih dahulu

adalah ix∑ dan 2

ix∑ .

� Standar deviasi Standar deviasi, dinyatakan dengan lambang s [atau SD (x)], adalah

akar positif variansi. Rumus definisi-nya adalah:

s =

( )2

1

1

n

ii

x x

n

=

−

−

∑ (3.7)

Sedangkan rumus operasional-nya adalah:

s =

2

2 1

1

1

n

ini

ii

x

xn

n

=

=

−

−

∑∑

(3.8)

Contoh 3.6: Lihat kembali data berat badan lima orang mahasiswa pada contoh 3.1:

58 kg, 52 kg, 61 kg, 52 kg, dan 47 kg. Pada contoh 3.1 telah dihitung

reratanya yaitu x = 54 kg. Untuk menghitung ( )2

ix x−∑ , lihat tabel 3.1

berikut.


36

Tabel 3.1. Perhitungan variansi dan standar deviasi berat badan

mahasiswa dengan rumus definisi

ix x ( )ix x− ( )2

ix x−

58

52

61

52

47

54

54

54

54

54

4

-2

7

-2

-7

16

4

49

4

49

( )ix x−∑ = 0 ( )2

ix x−∑ = 122

Perhatikan bahwa ( )ix x−∑ selalu bernilai nol. Variansi dan standar

deviasi masing-masing adalah:

2s =

( )2

1

1

n

ii

x x

n

=

−

−

∑

= 122

5 1−= 30.5

s = 30.5 = 5.52

Contoh 3.7: Lihat kembali data berat badan lima orang mahasiswa pada contoh 3.1.

Untuk menghitung variansi dan standar deviasi dengan rumus operasional,

terlebih dahulu dihitung ix∑ dan 2

ix∑ :

Tabel 3.2. Perhitungan variansi dan standar deviasi berat badan

mahasiswa dengan rumus operasional

No ix 2

ix

1

2

3

4

5

58

52

61

52

47

3,364

2,704

3,721

2,704

2,209

ix∑ = 270 2

ix∑ = 14,702

Dengan rumus operasional, variansi dan standar deviasi adalah:


37

2s =

2

2 1

1

1

n

ini

ii

x

xn

n

=

=

−

−

∑∑

=

227014,702

5

5 1

−

−= 30.5

s = 30.5 = 5.52

Latihan 3

38

LATIHAN 3


1. Contoh nilai tengah di antara beberapa ukuran berikut yaitu:

A. Median C. Persentil

B. Kuartil D. Rentang inter-kuartil

2. Jumlah seluruh nilai dalam suatu himpunan data dibagi dengan banyaknya

nilai adalah:

A. Rerata C. Standar deviasi

B. Median D. Variansi

3. Array adalah:

A. Himpunan data yang memiliki lebih daripada satu modus.

B. Himpunan data yang tidak memiliki pengamatan luar (outlier).

C. Himpunan data yang nilai-nilainya telah diurut menurut besarnya.

D. Semuanya salah.

4. Pada himpunan data simetris, hubungan antara rerata dan median adalah:

A. Rerata < median C. Rerata > median

B. Rerata = median D. Tak dapat ditentukan.

5. Pada himpunan data yang menceng ke kiri (skewed to the left), urutan nilai

tengah dari kanan ke kiri adalah:

A. Rerata-modus-median C. Rerata-median-modus

B. Median-modus-rerata D. Modus-median-rerata

6. Keuntungan utama penggunaan median sebagai nilai tengah dibandingkan

dengan rerata yaitu:

A. Median mudah dihitung dan terutama bermanfaat dalam inferensi

statistik

B. Median kurang terpengaruh oleh pengamatan luar

C. A) dan B) benar

D. A) dan B) salah

7. Suatu himpunan data terdiri atas 24 nilai pengamatan. Banyaknya nilai

pengamatan yang lebih besar daripada kuartil pertama, tetapi lebih kecil

daripada kuartil ketiga:

A. 6 C. 18

B. 12 D. 24

Latihan 3

39

8. Ukuran di bawah ini mendeskripsikan variabilitas nilai-nilai pada himpunan

datanya, kecuali:

A. Rentang C. Variansi

B. Standar deviasi D. Persentil

9. Jika R menyatakan rentang pada suatu himpunan data dan IQR menyatakan

rentang inter-kuartil pada himpunan data yang sama, maka:

A. R < IQR C. R > IQR

B. R < IQR D. R > IQR

10. Standar deviasi adalah:

A. Rerata kuadrat deviasi nilai-nilai himpunan data terhadap reratanya

dengan pembagi (n − 1).

B. Kuadrat rerata deviasi nilai-nilai himpunan data terhadap reratanya

dengan pembagi (n − 1).

C. Akar positif rerata kuadrat deviasi nilai-nilai himpunan data terhadap

reratanya dengan pembagi (n − 1)

D. Akar positif kuadrat rerata deviasi nilai-nilai himpunan data terhadap

reratanya dengan pembagi (n − 1)

11. ( )2

1

n

ii

x x=

−∑ =

A. 0 C.

2

12

1

n

ini

ii n

x

x=

=

−

∑∑

B.

2

12

1

n

ini

ii n

x

x=

=

−

∑∑ D.

2

12

1 1

n

ini

ii n

x

x=

= −

−

∑∑

12. Variansi adalah:

A. Akar positif standar deviasi C. Kuadrat standar deviasi

B. Akar negatif standar deviasi D. Semua nya salah.

Untuk soal nomor 13 dan 14:

Lihat data 20 subjek pertama Populasi Studi Jantung Honolulu, 1969 (nomor

ID 1 s.d. 20) pada tabel II.1, halaman 26.

13. Rerata dan standar deviasi Usia adalah:

A. 52.6 dan 4.32 C. 52.6 dan 18.67

B. 55.4 dan 4.32 D. 55.4 dan 18.67

Latihan 3

40

14. Median dan rentang inter-kuartil TD (tekanan darah) sistolik adalah:

A. 125 dan 22 C. 128 dan 22

B. 125 dan 88 D. 128 dan 88

15. Lihat kembali grafik persentil tinggi dan berat badan anak perempuan

menurut usia, 2-18 tahun (Grafik Pertumbuhan NCHS, Ross Laboratories)

pada halaman 40. Menurut grafik tersebut:

A. Sembilan puluh persen anak perempuan usia 12 tahun tinggi badannya

kurang daripada 160 cm.

B. Sembilan puluh persen anak perempuan usia 12 tahun tinggi badannya

tepat 160 cm.

C. Sembilan puluh persen anak perempuan usia 12 tahun tinggi badannya

lebih daripada 160 cm.

D. Semuanya salah.

Probabilitas

41

B A B 4

P R O B A B I L I T A S

� Pengertian Probabilitas

Probabilitas adalah rasio antara banyaknya cara suatu peristiwa tertentu

dapat terjadi dengan jumlah total peristiwa yang sama kemungkinannya

untuk terjadi. Misalnya data statistik vital menyatakan adanya 1,056 bayi

laki-laki yang lahir hidup (banyaknya cara) di antara 2,056 kelahiran hidup

(jumlah total peristiwa), maka probabilitas untuk mendapatkan bayi laki-laki

dapat diestimasikan sebagai 1, 056 2,056 = 0.514.

Dengan demikian, probabilitas terjadinya peristiwa A, dinyatakan

dengan lambang P (A) dapat didefinisikan sebagai proporsi banyak kalinya

peristiwa A terjadi pada sejumlah besar percobaan berulang dengan kondisi

yang identik:

P (A) = ( )

( )

N A

N S (4.1)

N (A) : banyak kalinya peristiwa A terjadi

N (S) : banyaknya kalinya pengulangan percobaan; N (S) besar

Contoh 4.1: Pada pelontaran koin (mata uang logam) yang setimbang, ada 2

kemungkinan hasil-akhir (outcome), M (muka) atau B (belakang), maka

probabilitas untuk memperoleh hasil-akhir M pada 1 kali pelontaran adalah:

P (M) = 1

2 = 0.5

Probabilitas untuk memperoleh hasil-akhir B adalah:

P (B) = 1

2 = 0.5

Contoh 4.2: Jika sebuah koin yang setimbang dilontarkan 2 kali, ada 4

kemungkinan hasil-akhir, yaitu MM, MB, BM, dan BB, sehingga:

Probabilitas

42

P (MM) = P (MB) = P (BM) = P (BB) = 1

4 = 0.25

Probabilitas untuk memperoleh hasil-akhir 0 M, 1 M, dan 2 M masing-

masing adalah:

P (0 M) = P (BB) = 0.25

P (1 M) = P (MB) + P (BM) = 0.25 + 0.25 = 0.50

P (2 M) = P (MM) = 0.25

Probabilitas untuk memperoleh hasil-akhir paling sedikit 1 M adalah:

P (paling sedikit 1 M) = P (1 M) + P (2 M)

= 0.50 + 0.25 = 0.75

Contoh 4.3: Pada pelontaran sebuah dadu yang setimbang, ada 6 kemungkinan

hasil-akhir, yaitu 1, 2, 3, 4, 5, dan 6:

P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = 1

6

Probabilitas untuk memperoleh hasil-akhir genap adalah:

P (genap) = P (2) + P (4) + P (6)

= 1

6 +

1

6 +

1

6 =

3

6 = 0.5

Secara matematis, probabilitas adalah suatu proporsi, sehingga sifat

dasar probabilitas dapat dinyatakan sebagai ialah:

0 < P (A) < 1 (4.2)

Peristiwa yang tidak mungkin terjadi dinamakan sebagai peristiwa nol

(himpunan kosong) dan dinyatakan dengan lambang φ ; misalnya perolehan

hasil-akhir 0 pada pelontaran sebuah dadu. Probabilitasnya adalah:

P (φ ) = 0 (4.3)

Jika 1A ,

2A , . . . , nA semua hasil-akhir yang mungkin terjadi pada

sebuah percobaan, maka:

P ( ) 1A + P ( )

2A + . . . + P ( ) nA = 1 (4.4)

Probabilitas

43

Tampak pada contoh 4.1, 4.2, dan 4.3 masing-masing:

P (M) + P (B) = 0.5 + 0.5 = 1

P (MM) + P (MB) + P (BM) + P (BB) = 0.25 + 0.25 + 0.25 + 0.25

= 1

P (1) + P (2) + P (3) + P (4) + P (5) + P (6) = (6)1

6

= 1

� Hukum Probabilitas

Dua hukum terpenting dalam teori probabilitas ialah hukum

penjumlahan dan hukum perkalian.

� Hukum Penjumlahan Hukum penjumlahan berlaku bagi peristiwa saling-asing. Peristiwa

saling-asing (mutually exclusive events) adalah dua (atau lebih) peristiwa

yang tidak dapat terjadi secara bersama-sama. Untuk peristiwa A dan B yang

saling-asing berlaku hukum penjumlahan:

P ( )A B∪ = P (A) + P (B) (4.5)

Misalnya, pada contoh 4.3 di atas hasil-akhir 2, 4, dan 6 merupakan

peristiwa-peristiwa yang saling-asing, sehingga:

P (genap) = P (2) + P (4) + P (6) = 1

6 +

1

6 +

1

6 =

3

6 = 0.5

� Hukum Perkalian Hukum perkalian berlaku bagi peristiwa yang saling independen, yaitu

dua (atau lebih) peristiwa dengan hasil-akhir pada suatu peristiwa tidak

mempengaruhi hasil-akhir pada peristiwa selanjutnya. Untuk peristiwa A dan

B yang saling independen berlaku hukum perkalian:

P ( )A B∩ = P (A) . P (B) (4.6)

Contoh 4.4: Sebuah koin dan sebuah dadu, keduanya setimbang, dilontar bersama-

sama. Probabilitas untuk memperoleh hasil-akhir M pada pelontaran koin

adalah P (M) = 0.5, sedangkan probabilitas untuk memperoleh hasil-akhir

kurang daripada 3 pada pelontaran dadu adalah:

Probabilitas

44

P (kurang daripada 3) = P (1) + P (2)

= (2) 1

6

= 2

6 =

1

3

Hasil-akhir pelontaran koin dan hasil-akhir pelontaran dadu bersifat

independen, yaitu hasil-akhir yang diperoleh pada pelontaran koin tidak akan

mempengaruhi hasil-akhir yang akan diperoleh pada pelontaran dadu (dan

sebaliknya), sehingga probabilitas untuk memperoleh hasil-akhir M pada

pelontaran koin dan hasil-akhir kurang daripada 3 pada pelontaran dadu

adalah:

P (M) . P (kurang daripada 3) = (0.5) 1

3

= 1

6

� Aturan Perhitungan

� Banyaknya Cara Banyaknya cara (number of ways) menyatakan banyaknya hasil-akhir

yang mungkin terjadi pada suatu peristiwa. Bagi seseorang yang memiliki 3

buah kemeja, biru, putih, dan kuning, ada 3 cara untuk mengenakan kemeja.

Pada pelontaran sebuah dadu, ada 6 cara untuk memperoleh hasil-akhirnya

(angka 1 sampai dengan 6). Jika perjalanan dari kota A ke kota B dapat

ditempuh melalui 4 rute, ada 4 cara untuk bepergian dari kota A ke kota B.

Jika peristiwa A dapat terjadi dengan m cara dan peristiwa B dengan

n cara, maka peristiwa A dan B dapat terjadi dalam mn cara.

Contoh 4.5: Seseorang yang memiliki 3 buah kemeja, biru, putih, dan kuning, serta

2 pasang celana, coklat dan hitam, maka ia memiliki (3)(2) = 6 cara untuk

berpakaian:

kemeja biru ; celana coklat kemeja biru ; celana hitam

kemeja putih ; celana coklat kemeja putih ; celana hitam

kemeja kuning ; celana coklat kemeja kuning ; celana hitam

� Permutasi Permutasi adalah banyaknya susunan yang dapat diperoleh pada

pemilihan k objek dari sekumpulan n objek, dengan memperhitungkan urutan

Probabilitas

45

objek yang terpilih. Permutasi k objek dari n objek, dinyatakan dengan

lambang nkP adalah:

nkP =

( )

!

!

n

n k− (4.7)

dengan: 1! = 1

2! = (1)(2) = 2

3! = (1)(2)(3) = 6

n! = (1)(2) . . . (n)

dan: 0! = 1

(n − k)! = (1)(2) . . . (n − k)

Perhatikan bahwa:

( )

!

!

n

n k− =

( )( ) ( )( ) ( )

( )( ) ( )

1 2 . . . 1 2 . . .

1 2 . . .

n k n k n k n

n k

− − + − +

−

= ( )( )1 2 . . . n k n k n− + − +

Contoh 4.6: Kelompok belajar biostatistika yang memiliki anggota 15 orang

mahasiswa akan memilih 3 orang pengurus, masing-masing sebagai ketua,

sekretaris, dan bendahara kelompok belajar. Banyak susunan pengurus yang

mungkin terpilih sama dengan permutasi 3 orang dari 15 orang, yaitu:

153P =

( )

15!

15 3 !− = (13)(14)(15) = 2,730

� Kombinasi Kombinasi adalah banyaknya susunan yang dapat diperoleh pada

pemilihan k objek dari sekumpulan n objek, tanpa memperhitungkan urutan

objek yang terpilih. Kombinasi k objek dari n objek, dinyatakan dengan

lambang nkC adalah:

nkC =

( )

!

! !

n

k n k− (4.8)

Probabilitas

46

Contoh 4.7: Misalkan kelompok belajar pada contoh 4.6 hendak memilih 5 orang

wakil untuk diikutsertakan dalam lomba biostatistika tahunan universitas.

Banyaknya susunan tim yang mungkin terbentuk dari kelompok belajar

tersebut adalah kombinasi 5 orang dari 15 orang, yaitu:

155C =

( )

15!

5! 15 5 !− =

( )( )( )( )( )

( )( )( )( )( )

11 12 13 14 15

1 2 3 4 5 = 3,003

� Distribusi Probabilitas

Distribusi probabilitas adalah daftar lengkap seluruh hasil-akhir yang

mungkin terjadi pada suatu peristiwa beserta probabilitasnya masing-masing.

Pada tabel 4.1 diperlihatkan distribusi probabilitas untuk pelontaran 1 koin,

pelontaran 2 koin, dan pelontaran 1 dadu yang probabilitasnya masing-

masing telah dihitung pada contoh 4.1, 4.2, dan 4.3. Variabel random X, Y,

dan Z, menyatakan hasil-akhir untuk masing-masing peristiwa tersebut.

Perhatikan bahwa jumlah probabilitas untuk semua kemungkinan hasil-akhir

yang saling-asing sama dengan satu.

Tabel 4.1. Contoh-contoh distribusi probabilitas

Pelontaran 1 koin Pelontaran 2 koin Pelontaran 1 dadu

X P (X) Y P (Y) Z P (Z)

M 0.5 MM 0.25 1 1/6

B 0.5 MB 0.25 2 1/6

1.0 BM 0.25 3 1/6

BB 0.25 4 1/6

1.00 5 1/6

6 1/6

1.0

Dalam bahasan statistika dikenal berbagai macam distribusi

probabilitas teoretis. Di sini hanya akan dibahas mengenai 2 distribusi

teoretis terpenting, yaitu distribusi binomial dan distribusi normal.

Probabilitas

47

� Distribusi Binomial

Distribusi binomial adalah distribusi yang terbentuk sebagai hasil-

akhir sejumlah percobaan Bernoulli (Bernoulli trials), yang memiliki sifat-

sifat berikut:

1. Pada tiap percobaan hanya ada 2 hasil-akhir yang mungkin (bersifat

dikotomi; binary), sukses atau gagal.

2. Hasil-akhir tiap percobaan bersifat independen terhadap (tidak tergantung

pada) hasil-akhir percobaan lainnya.

3. Probabilitas sukses, dinyatakan dengan lambang p, bersifat konstan dari

satu percobaan ke percobaan lainnya.

Dalam kehidupan sehari-hari terdapat berbagai peristiwa yang dapat

dianggap berdistribusi binomial, misalnya:

a. Kelahiran anak dengan hasil-akhir anak laki-laki atau perempuan.

b. Perawatan pasien di rumah sakit dengan hasil-akhir sembuh atau tidak

sembuh.

c. Tindakan pembedahan dengan hasil-akhir hidup atau mati.

Contoh 4.8: Pasangan usia subur yang baru menikah merencanakan untuk memiliki

3 orang anak. Probabilitas ibu untuk melahirkan anak laki-laki (L) dalam

populasi adalah 0.5. Jika variabel random X menyatakan jumlah anak laki-

laki di antara ketiga anak pasangan usia subur tersebut, maka variabel

random X dapat dianggap berdistribusi binomial. Distribusi probabilitas

peristiwa E, yaitu hasil-akhir untuk ke-3 anak tersebut diperlihatkan pada

tabel 4.2, sedangkan distribusi variabel random X diperlihatkan pada tabel

4.3.

Tabel 4.2. Distribusi probabilitas E

E P (E)

LLL (0.5) (0.5) (0.5) = 0.125

LLP (0.5) (0.5) (0.5) = 0.125

LPL (0.5) (0.5) (0.5) = 0.125

PLL (0.5) (0.5) (0.5) = 0.125

LPP (0.5) (0.5) (0.5) = 0.125

PLP (0.5) (0.5) (0.5) = 0.125

PPL (0.5) (0.5) (0.5) = 0.125

PPP (0.5) (0.5) (0.5) = 0.125

1.00

Probabilitas

48

E : Hasil-akhir susunan jenis kelamin 3 orang anak

L : anak laki-laki; P : anak perempuan

Tabel 4.3. Distribusi probabilitas variabel random X

E X P (X)

LLL 3 (1)(0.125) = 0.125

LLP

2 (3)(0.125) = 0.375 LPL

PLL

LPP

1 (3)(0.125) = 0.375 PLP

PPL

PPP 0 (1)(0.125) = 0.125

1.000

X : Jumlah anak laki-laki di antara ketiga anak

Contoh 4.9: Sebuah koin yang tidak seimbang dilontarkan 3 kali. Probabilitas untuk

mendapatkan hasil-akhir M pada tiap pelontaran adalah P (M) = 0.6 dan

probabilitas untuk mendapatkan hasil-akhir B adalah P (B) = 1 − P (M) =

0.4. Misalkan peristiwa E menyatakan hasil-akhir pelontaran koin 3 kali dan

variabel random X menyatakan banyak M dalam 3 kali pelontaran, maka

distribusi probabilitas E dan X dapat dilihat pada tabel 4.4 berikut.

Tabel 4.4. Distribusi probabilitas E dan variabel random X

E P (E) X P (X)

MMM (0.6)(0.6)(0.6) = 0.216 3 (1)(0.63)(0.4

0) =

0.216

MMB (0.6)(0.6)(0.4) = 0.144

2 (3)(0.6

2)(0.4

1) =

0.432 MBM (0.6)(0.4)(0.6) = 0.144

BMM (0.4)(0.6)(0.6) = 0.144

MBB (0.6)(0.4)(0.4) = 0.096

1 (3)(0.6

1)(0.4

2) =

0.288 BMB (0.4)(0.6)(0.4) = 0.096

BBM (0.4)(0.4)(0.6) = 0.096

BBB (0.4)(0.4)(0.4) = 0.064 0 (1)(0.60)(0.4

3) =

0.064

1.000 1.000

E : Hasil-akhir 3 kali pelontaran koin

X : Jumlah M di antara hasil-akhir 3 kali pelontaran koin

Probabilitas

49

Jika variabel random X yang berdistribusi binomial menyatakan jumlah

(banyaknya) sukses di antara n kali percobaan, maka probabilitas P (X) dapat

dinyatakan sebagai (lihat tabel 4.4):

P (X = x) = n x n xxC p q

− (4.9)

x : Nilai tertentu untuk variabel random X; X = 0, 1, 2, . . . , n

n : Banyaknya percobaan

p : Probabilitas sukses pada tiap percobaan; P (X = 1) pada 1 kali

percobaan

q : Probabilitas tidak sukses (gagal) pada tiap percobaan; q = 1 − p = P (X

= 0) pada 1 kali percobaan

Distribusi binomial memiliki 2 parameter, yaitu n dan p. Reratanya

yang dinyatakan dengan lambang µ, variansinya yang dinyatakan dengan

lambang σ2, serta standar deviasinya yang dinyatakan dengan lambang σ,

masing-masing adalah:

µ = np (4.10)

σ2 = npq (4.11.a)

σ = npq (4.11.b)

Untuk mempermudah perhitungan, telah disusun tabel distribusi

probabilitas binomial (addendum B1) serta probabilitas kumulatif

binomial (addendum B2).

Contoh 4.10: Tabel distribusi probabilitas binomial (addendum B1) memuat nilai-

nilai probabilitas untuk 1 sampai dengan 20 kali percobaan (1 < n < 20),

dengan probabilitas sukses 0.01 < p < 0.50. Misalnya:

- Jika n = 5; p = 0.15; maka probabilitas untuk memperoleh 3 kali sukses

adalah:

P (X = 3) = 0.0244

- Jika n = 8; p = 0.30; maka probabilitas untuk memperoleh 5 kali sukses

adalah:

P (X = 5) = 0.0467

Probabilitas

50

Contoh 4.11: Tabel distribusi probabilitas binomial umumnya hanya memuat nilai-

nilai probabilitas untuk p < 0.50. Untuk p > 0.50, nilai-nilai probabilitas

dapat dihitung sebagai berikut:

Misalkan probabilitas lulus mahasiswa yang menempuh ujian Statistika

adalah p = 0.8. Misalkan pula ada 12 orang mahasiswa yang akan menempuh

ujian Statistika, dan hendak dihitung probabilitas bahwa yang lulus adalah 10

orang.

Perhatikan bahwa jika probabilitas lulus adalah p = 0.8, maka

probabilitas tidak lulus adalah p = 0.2, dan 10 orang yang lulus di antara 12

mahasiswa sama dengan 2 orang yang tidak lulus di antara 12 mahasiswa

yang sama, sehingga:

P (X = 10 | n = 12; p = 0.8) = P (X = 2 | n = 12; p = 0.2)

= 0.2835

Contoh 4.12: Tabel probabilitas binomial kumulatif (addendum B2) memuat nilai-

nilai probabilitas kumulatif 'lebih kecil daripada', yaitu P (X < x). Misalkan

untuk jumlah percobaan n = 5 dan probabilitas sukses p = 0.40, nilai-nilai

probabilitas binomial dan binomial kumulatifnya diperlihatkan pada tabel

4.5.

Tabel 4.5. Contoh probabilitas binomial dan probabilitas binomial

kumulatif untuk n = 5 dan p = 0.40

Probabilitas

binomial

Probabilitas binomial kumulatif

P (X = 0) = 0.0778

P (X = 1) = 0.2592

P (X = 2) = 0.3456

P (X = 3) = 0.2304

dan seterusnya

P (X < 0) = 0.0778

P (X < 1) = 0.0778 + 0.2592 = 0.3370

P (X < 2) = 0.0778 + 0.2592 + 0.3456 = 0.6826

P (X < 3) = 0.0778 + 0.2592 + 0.3456 + 0.2304

= 0.9130, dan seterusnya

Misalnya dimiliki koin yang tidak setimbang, yang probabilitasnya

untuk memperoleh M (muka) pada pelontaran adalah P (M) = p = 0.4. Jika

koin dilontarkan 5 kali, maka probabilitas untuk memperoleh sebanyak-

banyaknya 1 kali M adalah P (X < 1) = 0.3370, probabilitas untuk

memperoleh sebanyak-banyaknya 2 kali muka adalah P (X < 2) = 0.6826,

dan seterusnya.

Probabilitas

51

Contoh 4.13: Lihat kembali data koin pada contoh 4.12. Perhatikan bahwa untuk n =

5, P (X < 5) = 1. Jika koin dilontarkan 5 kali, maka probabilitas untuk

memperoleh sekurang-kurangnya 3 kali M adalah:

P (X > 3) = 1 − P (X < 3)

= 1 − P (X < 2)

= 1 − 0.6826 = 0.3174

� Distribusi Normal

Distribusi normal (distribusi Gauss) adalah distribusi teoretis yang

simetris berbentuk genta (bell-shaped) untuk variabel random X yang

bernilai kontinu, terentang dari nilai minus tak berhingga sampai dengan plus

tak berhingga (memotong sumbu horizontal X secara asimptotis).

Gambaran pada diagram 4.1 dinamakan juga fungsi densitas X, yang

secara matematis dapat dinyatakan sebagai:

f (x) =

2121

2

x

e

µσ

σ π

−−

(4.12)

dengan 2 parameter, yaitu rerata µ dan standar deviasi σ.

Contoh 4.14: Nilai IQ (intelligence quotient; tingkat kecerdasan manusia yang diukur

dengan tes psikologi) dalam populasi dapat dianggap berdistribusi normal

dengan rerata µ = 100 dan standar deviasi σ = 15. Grafik distribusinya yang

dinamakan sebagai fungsi densitas diperlihatkan pada diagram 4.1.

Probabilitas

52

Diagram 4.1. Nilai IQ sebagai contoh variabel yang dapat dianggap

berdistribusi normal

Pada grafik tersebut yang dapat dianggap sebagai contoh tipikal grafik

normal dapat dilihat beberapa sifat penting distribusi normal:

1. Grafik simetris; rerata, median, dan modus terletak pada 1 titik.

2. Grafik memotong sumbu horizontal secara asimptotis (terentang dari

minus tak berhingga sampai dengan plus tak berhingga).

3. Luas area di bawah grafik (antara grafik dengan sumbu horizontal sama

dengan satu (atau 100%).

4. Luas area antara 2 nilai X (variabel random, pada sumbu horizontal) yang

berturutan menyatakan probabilitas untuk mendapatkan nilai-nilai di

antara keduanya dalam populasi:

P (a < X < b) = ( )

b

a

f x dx∫ (4.13)

a dan b : titik-titik pada sumbu horizontal, menyatakan nilai tertentu

X

( )

b

a

f x dx∫ : luas area di bawah grafik antara X = a dan X = b

5. Beberapa luas area (sekaligus menyatakan probabilitas) yang penting

pada grafik normal:

a. P (µ − σ < X < µ + σ) ≈ 68%

b. P (µ − 2σ < X < µ + 2σ) ≈ 95%

c. P (µ − 3σ < X < µ + 3σ) ≈ 99%

Probabilitas

53

Untuk mempermudah perhitungan, bagi distribusi normal juga telah

dibuat tabel nilai-nilai probabilitasnya. Namun karena distribusi normal

dapat memiliki parameter berupa nilai rerata µ dan standar deviasi σ yang

berbeda-beda, tabel normal disusun hanya untuk distribusi normal yang telah

distandardisasikan, yang dinamakan sebagai distribusi normal standar

(distribusi Z). Variabel random Z diperoleh melalui transformasi terhadap

variabel random X:

Z = X µ

σ

− (4.14)

Transformasi ini menghasilkan variabel random Z yang berdistribusi

normal dengan rerata µ = 0 dan standar deviasi σ = 1 (diagram 4.2). Dengan

merujuk pada butir 5 pada sifat distribusi normal di atas, maka untuk

distribusi Z berlaku:

a. P (−1 < Z < +1) ≈ 68%

b. P (−2 < Z < +2) ≈ 95%

c. P (−3 < Z < +3) ≈ 99%

Diagram 4.2. Distribusi normal standar

Contoh 4.15: Lihat tabel normal pada addendum C. Kolom terkiri menyatakan satuan

dan desimal pertama nilai Z, baris reatas menyatakan desimal kedua nilai Z,

dan badan tabel menyatakan luas area di sisi kanan nilai Z yang diberikan,

yaitu P (Z > z). Misalnya:

- Untuk Z = 1.64, maka P (Z > 1.64) = 0.0505

- Untuk Z = 1.96, maka P (Z > 1.96) = 0.0250

Probabilitas

54

- Untuk Z = 2.58, maka P (Z > 2.58) = 0.0049

Sebaliknya, jika diberikan luas area P (Z > z), nilai Z juga dapat dicari,

misalnya:

- Untuk P (Z > z) = 0.05, maka Z ≈ 1.64

- Untuk P (Z > z) = 0.25, maka Z ≈ 1.96

- Untuk P (Z > z) = 0.05, maka Z ≈ 2.58

Contoh 4.16: Grafik distribusi Z bersifat simetris terhadap sumbu vertikal. Sifat ini

dapat dimanfaatkan untuk mencari luas area di sisi kiri nilai Z yang

diberikan, misalnya:

- Untuk Z = −1.64, maka P (Z < −1.64) = 0.0505

- Untuk Z = −1.96, maka P (Z < −1.96) = 0.0250

- Untuk Z = −2.58, maka P (Z < −2.58) = 0.0049

Contoh 4.17:

Jika 2z > 1z > 0, maka P ( 1z < Z < 2z ) = P (Z > 1z ) − P (Z > 2z ), juga

P (− ∞ < Z < 0) = P (0 < Z < ∞ ) = 0.50, misalnya:

- P (0.50 < Z < 1.00) = P (Z > 0.50) − P (Z > 1.00)

= 0.3085 − 0.1587 = 0.1498

- P (1.25 < Z < 2.45) = P (Z > 1.25) − P (Z > 2.45)

= 0.1056 − 0.0071 = 0.0985

Contoh 4.18:

Jika 1z < 0 dan 2z > 0, maka P ( 1z < Z < 2z ) = P ( 1z < Z < 0) + P (0 <

Z < 2z ), misalnya:

- P (−0.50 < Z < 1.00) = P (−0.50 < Z < 0) + P (0 < Z < 1.00)

= (0.50 − 0.3085) + (0.50 − 0.1587)

= 0.5328

- P (−1.25 < Z < 2.45) = P (−1.25 < Z < 0) + P (0 < Z < 2.45)

= (0.50 − 0.1056) + (0.50 − 0.0071)

= 0.8873

Latihan 4

55

LATIHAN 4


1. Probabilitas adalah:

A. Rasio antara banyaknya cara suatu peristiwa dapat terjadi dengan

jumlah keseluruhan peristiwa yang sama kemungkinannya untuk

terjadi.

B. Proporsi banyak kalinya suatu peristiwa terjadi pada sejumlah besar

percobaan berulang dengan kondisi identik.

C. A) dan B) benar.

D. A) dan B) salah.

2. Jika diketahui di antara 2,056 kelahiran hidup tercatat adanya 1,056 bayi laki-

laki, maka probabilitas untuk mendapatkan bayi perempuan adalah:

A. 0.486 C. 0.947

B. 0.514 D. Tak dapat dihitung

3. Contoh peristiwa saling asing di antara peristiwa berikut yaitu:

A. Peristiwa seorang pasien dinyatakan memiliki tingkat kesadaran apatis

dan somnolen pada sekali pemeriksaan oleh seorang pemeriksa.

B. Peristiwa seorang ibu melahirkan bayi laki-laki pada kehamilan

pertama dan keduanya.

C. Keduanya benar.

D. Keduanya salah.

4. Contoh peristiwa independen di antara peristiwa berikut yaitu:

A. Peristiwa seorang pasien dinyatakan memiliki tingkat kesadaran apatis

dan somnolen pada sekali pemeriksaan oleh seorang pemeriksa.

B. Peristiwa seorang ibu melahirkan bayi laki-laki pada kehamilan

pertama dan keduanya.

C. Keduanya benar.

D. Keduanya salah.

5. Hukum penjumlahan dalam probabilitas berlaku bagi:

A. Peristiwa independen C. A) dan B) benar.

B. Peristiwa saling-asing D. A) dan B) salah.

6. Jika P (A) = 0.2 dan P (B) = 0.5, maka hukum penjumlahan menyatakan:

A. P (A ∪ B) = 0.10 C. P (A ∪ B) = 0.7

B. P (A ∩ B) = 0.10 D. P (A ∩ B) = 0.7

7. Hukum perkalian dalam probabilitas berlaku bagi:

A. Peristiwa independen C. A) dan B) benar.

B. Peristiwa saling-asing D. A) dan B) salah.

Latihan 4

56

8. Jika P (A) = 0.3 dan P (B) = 0.4, maka hukum perkalian menyatakan:

A. P (A ∪ B) = 0.12. C. P (A ∪ B) = 0.7

B. P (A ∩ B) = 0.12 D. P (A ∩ B) = 0.7

9. Jika peristiwa A dapat terjadi dengan 6 cara dan peristiwa B dengan 2 cara,

maka aturan banyaknya cara menyatakan peristiwa A dan B dapat terjadi

dalam:

A. 3 cara C. 12 cara

B. 8 cara D. Semuanya salah

10. Area berwarna gelap pada diagram Venn di bawah ini menyatakan:

A. C CA B C∩ ∩ C. ( ) C

B C A∩ ∩

B. ( )C

C A B∩ ∩ D. ( ) ( )C C

B C B C A∪ ∩ ∩ ∩

11. Kelompok seni drama Gunadarma yang beranggotakan 12 orang akan

memilih tiga orang anggotanya untuk tampil dalam pentas, masing-

masing untuk berperan sebagai dokter, perawat, dan bidan. Banyaknya

kelompok tiga orang anggota yang mungkin dipilih adalah:

A. 15 C. 220

B. 36 D. 1,320

12. Rumah Sakit Sukasehat membutuhkan lima orang perawat baru. Jika

ada sepuluh perawat yang melamar, maka banyak susunan lima

perawat yang mungkin diterima adalah:

A. 15 C. 252

B. 50 D. 30,240

13. Sebuah dadu dan sebuah mata uang, keduanya setimbang, dilemparkan

bersama-sama. Probabilitas untuk mendapatkan angka genap pada dadu

dan sisi muka mata uang bersama-sama adalah:

A. 1

6 C.

5

6

B. 1

4 D. 1

Latihan 4

57

14. Probabilitas seorang ibu untuk memperoleh anak laki-laki (L) adalah

0.51 dan anak perempuan (P) 0.49 dalam setiap kelahiran. Probabilitas

seorang ibu yang memperoleh tiga anak laki-laki dan satu anak

perempuan dalam empat kali kelahiran adalah:

A. 3 1 0.51 . 0.49 C. 4 3 1

3 . 0.51 . 0.49C

B. 3 1 3 . 0.51 . 0.49 D. ( )

44 4

3

. 0.51 . 0.49x x

x

x

C−

=

∑

15. Lihat kembali data pada soal No.14. Probabilitas seorang ibu yang

untuk memperoleh tiga anak laki-laki dan satu anak perempuan dengan

urutan LLLP dalam empat kali kelahiran adalah:

A. 3 1 0.51 . 0.49 C. 4 3 1

3 . 0.51 . 0.49C

B. 3 1 3 . 0.51 . 0.49 D. ( )

44 4

3

. 0.51 . 0.49x x

x

x

C−

=

∑

16. Lihat kembali data pada soal No.14. Probabilitas seorang ibu yang

untuk memperoleh paling sedikit tiga anak laki-laki dalam empat kali

kelahiran adalah:

A. 3 1 0.51 . 0.49 C. 4 3 1

3 . 0.51 . 0.49C

B. 3 1 3 . 0.51 . 0.49 D. ( )

44 4

3

. 0.51 . 0.49x x

x

x

C−

=

∑

17. Data lampau menunjukkan bahwa tujuh di antara setiap sepuluh orang

pasien yang menjalani bedak otak di Rumah Sakit Umurpanjang

meninggal dalam pembedahan. Jika bulan depan dijadwalkan 12 orang

pasien untuk menjalani bedah otak, probabilitas tepat enam orang

selamat menjalani pembedahan adalah:

A. 3.4% C. 92.1%

B. 7.9% D. 96.6%

18. Lihat kembali data pada soal No. 17. Probabilitas bahwa yang meinggal

dalam pembedahan otak bulan depan tidak lebih daripada tiga orang

adalah:

A. 0.17% C. 50.75%

B. 49.25% D. 99.8%

Latihan 4

58

19. Jika X berdistribusi normal dengan rerata 30 dan variansi 25, maka

probabilitas bahwa 25 37.5X< < adalah:

A. 0.0919 C. 0.4332

B. 0.3413 D. 0.7745

20. Nilai tekanan darah diastolik dalam populasi di negara Barat dapat

dianggap berdistribusi normal dengan rerata 85 mm Hg dan standar

deviasi 13 mm Hg. Jika anggota populasi dengan tekanan darah

diastolik lebih daripada 90 mm Hg dianggap sebagai penderita

hipertensi, maka persentase penderita hipertensi dalam populasi di

negara Barat adalah:

A. 8% C. 25%

B. 17.5% D. 35%

Lampiran 4.1

59

Lampiran 4.1

HIMPUNAN DAN OPERASI HIMPUNAN

Himpunan adalah sekumpulan objek yang terdefinisi dengan jelas,

seperti himpunan buku, himpunan mobil, himpunan mahasiswa, ataupun

himpunan bilangan. Himpunan dilambangkan dengan huruf besar A, B, C,

dan sebagainya.

Operasi himpunan seringkali digambarkan dalam bentuk diagram

Venn untuk mempermudah pemahamannya. Jika S menyatakan semesta

(himpunan seluruh anggota populasi), maka operasi dasar himpunan adalah:

a. Union (gabungan).

Union 2 himpunan A dan B, dinyatakan dengan lambang A ∪ B, adalah

himpunan unsur yang termasuk dalam A, B, ataupun keduanya.

b. Interseksi (selisih).

Interseksi 2 himpunan A dan B, dinyatakan dengan lambang A ∩ B,

adalah himpunan unsur yang termasuk dalam A dan B sekaligus.

c. Komplemen.

Komplemen himpunan A, dinyatakan dengan lambang CA atau A ,

adalah himpunan unsur yang tidak termasuk dalam A.

A B CA

A ∪ B ( )C

A B∪ A ∩ B ( )C

A B∩

Diagram IV.1. Beberapa contoh diagram Venn

harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/.../Buku+Biostatistika+Dasar+1.pdfyang...

Documents

Transcript of harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/.../Buku+Biostatistika+Dasar+1.pdfyang...