Post on 04-Jan-2016
description
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 1
Distribusi Variabel Acak Kontinu
Pada penulisan Keenam tentang Statistika Elementer ini, penulis akan memberikan bahasan
mengenai Distribusi Variabel Acak Kontinu kepada para pembaca untuk menambah
pemahaman dan contoh soal mengenai Variabel Acak kontinu dan fungsi distribusinya. Pada
penulisan ini, Distribusi Variabel Acak Kontinu yang diberikan adalah Distribusi Normal dan
Hampiran Distribusi Normal terhadap Distribusi Binomial. Sebagai tambahan, disisipkan
teori tentang Hampiran Distribusi Poisson terhadap Distribusi Binomial.
Variabel Acak Kontinu.
Variabel Acak adalah suatu fungsi yang memetakan setiap anggota Ruang Sampel S ke
bilangan Real[3]
. Dalam statistika, variabel acak disimbolkan dengan huruf-huruf kapital
misalkan X, Y, Z, dll. Variabel acak yang mampu menjalani bilangan bulat adalah Variabel
Acak Diskrit, sedangkan variabel acak yang mampu menjalani bilangan real adalah Variabel
Acak Kontinu. Misalkan X adalah variabel acak kontinu maka fungsi kepadatan probabilitas
(probability density function, PDF) dapat didefinisikan sebagai
)X(P)(X xxf == .
Dengan kata lain, fungsi fX(x) adalah fungsi distribusi probabilitas dari X untuk variabel acak
kontinu. PDF dari variabel acak kontinu X harus memenuhi sifat-sifat berikut:
1. 1)(0 X ≤≤ xf , PDF bernilai nol sampai satu.
2. 1)(X =∫x
dxxf , luasan dari semua PDF dari variabel acak kontinu X pada ruang sampel
adalah satu.
3. ∫=
=≤≤b
ax
dxxfbXaP )()( X , nilai a dan b adalah dua nilai sembarang dari X yang
memenuhi a < b .
4. )()( xXPxXP <=≤ , tanda (< dan ≤) atau (> dan ≥) dianggap sama saja.
Misalkan X merupakan variabel acak kontinu maka fungsi kepadatan kumulatif (cumulative
density function, CDF) dapat didefinisikan sebagai
bxadkkfxxFx
ak≤≤=≤= ∫ =
;)()X(P)( XX .
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 2
Dengan kata lain, fungsi FX(x) adalah fungsi distribusi dari X untuk variabel acak kontinu. Jika
fX(x) merupakan PDF dari variabel acak kontinu X, maka terdapat relasi antara PDF dan CDF,
yaitu
[ ].
)()( X
X dx
xFdxf =
Rumusan ini tidak dapat digunakan untuk distribusi variabel acak diskrit. Sebagai tambahan,
mean dan varian dari variabel acak kontinu masing-masing adalah[1]
∫=x
dxxfx )(. Xµ dan .)(.)( X22
∫ −=x
dxxfx µσ
Distribusi Variabel Acak Kontinu.
Pada penulisan ini, diberikan distribusi variabel acak kontinu yang biasa digunakan, yaitu:
1. Distribusi Normal
2. Hampiran Distribusi Normal terhadap Distribusi Binomial
Distribusi Normal.
Distribusi Normal merupakan distribusi probabilitas kontinu yang paling penting dalam
segala bidang Statistika. Distribusi ini memiliki karakteristik dari fungsi kepadatan-nya yang
berbentuk kurva simetris menyerupai suatu lonceng, sehingga kurva Normal ini disebut
sebagai kurva berbentuk lonceng (bell-shaped curve). Disamping itu, distribusi Normal juga
disebut juga sebagai Distribusi Gaussian[2]
yang mana hal ini diberikan sebagai penghargaan
untuk Ahli Matematika Jerman Karl Friedrich Gauss (1777 – 1855) dalam membentuk fungsi
distribusi Normal. Fungsi kepadatan probabilitas (PDF) dari variabel acak X Normal
dirumuskan sebagai
...718281828,2;7/22
.;0;
2
)(exp
2
1)(
2)X(P)(
),(N~X
2
2
X
2
)(
X
2
2
2
≈≈∞<<∞−>∞<<∞−
−−=
===
−−
e
x
xxf
atau
exxf
x
πσµ
σµ
πσ
πσ
σµ
σµ
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 3
Variabel acak X berdistribusi Normal dengan parameter mean μ dan varian σ2 yang mana
PDF dari distribusi ini dapat diilustrasikan sebagai berikut.
Misalkan diberikan dua sampel data X1 ~ N(μ1 , σ12) dan X2 ~ N(μ2 , σ2
2) dengan:
• kondisi μ1 < μ2 dan σ1 = σ2 , maka kurva Normal diilustrasikan menjadi
• kondisi μ1 = μ2 dan σ1 < σ2 , maka kurva Normal digambarkan mengikuti
• kondisi μ1 < μ2 dan σ1 < σ2 , maka kurva Normal diilustrasikan menjadi
Distribusi Normal memiliki kurva yang simetris membentuk suatu lonceng. Hal ini terjadi
ketika nilai mean, median, dan modus dari data bernilai sama[1]
; namun ketika kondisi ini
tidak terpenuhi, distribusi data yang terbentuk akan miring kanan atau miring kiri.
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 4
Simetris
Miring Kiri (Skewed-to-Left) Miring Kanan (Skewed-to-Right)
Berdasarkan penyebaran data yang berdistribusi Normal[1]
, penyebaran 68% data
pengamatan berada pada interval μ – σ sampai μ + σ; penyebaran 95% data pengamatan
berada pada interval μ – 2σ sampai μ + 2σ; dan penyebaran 99,7% data pengamatan berada
pada interval μ – 3σ sampai μ + 3σ.
Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak X Normal adalah
∫∫ ∞−∞−
−−==≤=xx
dkk
dkkfxxF2
2
XX2
)(exp
2
1)()X(P)(
σµ
πσ.
Penyelesaian masalah distribusi Normal dapat diselesaikan dengan mudah menggunakan
Distribusi Normal Standar. Misalkan diberikan variabel acak X berdistribusi Normal dengan
parameter mean μ dan varian σ2, maka variabel acak Z yang berdistribusi Normal Standar
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 5
dengan parameter mean 0 dan varian 1 akan menghasilkan fungsi kepadatan probabilitas
(PDF) sebagai
∞<<∞−
−=
===
−=
−
z
zzf
atau
ezzf
z
2exp
2
1)(
2)Z(P)(
)1,0(N~Z;X
Z
2
Z
2
Z
2
π
π
σµ
Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak Z Normal Standar adalah
∫∫ ∞−∞−
−==≤=
zzdk
kdkkfzzF
2exp
2
1)()Z(P)(
2
ZZ π.
Sebagai Contoh, Dari hasil survei satu komplek perumahan, biaya pengeluaran untuk
konsumsi listrik rumah tangga adalah 400.000 rupiah perbulan dan standar deviasinya
sebesar 30.000 . Jika biaya pengeluaran tersebut berdistribusi Normal, maka tentukan
probabilitas:
a. biaya pengeluaran untuk konsumsi listrik sebesar 375.000 rupiah. [P(X = 375.000) ?]
b. biaya pengeluaran untuk konsumsi listrik maksimal 450.000 rupiah. [P(X ≤ 450.000) ?]
c. biaya pengeluaran untuk konsumsi listrik diantara 300.000 dan 400.000 rupiah.
[P(300.000 < X < 400.000) ?]
Penyelesaian:
Misalkan X adalah variabel acak yang menyatakan biaya pengeluaran untuk konsumsi listrik
rumah tangga yang memiliki parameter μ = 400.000 rupiah dan σ = 30.000 . Secara teori,
distribusi Normal dapat diselesaikan kedalam bentuk distribusi Normal Standar, sehingga:
a. Untuk x = 375.000, perlu dilakukan transformasi kedalam bentuk Normal Standar.
833,0000.30
000.400000.375 −=−=−=σ
µxz
Jadi, P(X = 375.000) = P(Z = -0,833)
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 6
2820,02
)833,0(exp
2
1)833,0()833,0(
2exp
2
1)()(
2
Z
2
Z
=
−−=−=−=
−===
π
π
fZP
zzfzZP
Probabilitas biaya pengeluaran untuk konsumsi listrik sebesar 375.000 rupiah adalah
0,2820 .
b. Untuk x = 450.000, perlu dilakukan transformasi kedalam bentuk Normal Standar.
67,1000.30
000.400000.450 =−=−=σ
µxz
Jadi, P(X ≤ 450.000) = P(Z ≤ 1,67)
?)67,1Z(P
2exp
2
1)67,1()67,1Z(P
2exp
2
1)()()Z(P
67,1 2
Z
2
ZZ
=≤
−==≤
−===≤
∫
∫∫
∞−
∞−∞−
MM
dkk
F
dkk
dkkfzFzzz
π
π
Penyelesaian soal (b) diselesaikan dengan bantuan Tabel Normal Standar.
?...)67,1Z(P
67,1;)()Z(P Z
=≤==≤ zzFz
z 0.00 … 0.07 …
: ↓
1.6 ------ → 0.9525
:
.9525,0)67,1Z(P =≤
Jadi, probabilitas biaya pengeluaran untuk konsumsi listrik maksimal 450.000 rupiah
adalah 0,9525 .
c. Untuk x1 = 300.000 dan x2 = 400.000, perlu dilakukan transformasi kedalam bentuk
Normal Standar.
0000.30
000.400000.400
33,3000.30
000.400000.300
22
11
=−=−
=
−=−=−
=
σµ
σµ
xz
xz
Jadi, P(300.000 < X < 400.000) = P(-3,33 < Z < 0)
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 7
)33,3Z(P)0Z(P)Z(P
)Z(P)Z(P)Z(P
21
1221
−≤−≤=≤≤≤−≤=≤≤
zz
zzzz
z 0.00 … 0.03 …
: | ↓
-3.3 ------ → 0.0005
: ↓
0.0 →0.5000
:
4995,00005,05000,0)Z(P
)33,3Z(P)0Z(P)Z(P
21
21
=−=≤≤−≤−≤=≤≤
zz
zz
Probabilitas biaya pengeluaran untuk konsumsi listrik diantara 300.000 dan 400.000
rupiah adalah 0,4995 .
Hampiran Distribusi Normal terhadap Distribusi Binomial.
Ada beberapa kasus dimana data X berdistribusi Binomial hanya dapat diselesaikan dengan
pendekatan distribusi Normal. Jika ukuran sampel n besar dan p tidak dekat dengan 0 atau
1, melainkan nilai p lebih dekat ke nilai 1/2; maka persoalan distribusi Binomial dapat
diselesaikan dengan menggunakan pendekatan distribusi Normal.
Teorema[2]
:
Jika X variabel acak Binomial dengan mean np=µ dan varians npq=2σ ,
maka bentuk limit distribusi npq
npXZ
−= untuk ∞→n
merupakan distribusi Normal Standar.
Sebagai contoh, soal ujian pilihan ganda diberikan biasanya sebanyak 200 dengan
ketentuan probabilitas banyaknya soal yang rumit adalah 40%. Hitung probabilitas terdapat
maksimal 85 soal yang rumit. [P(X ≤ 85) ?]
Penyelesaian:
X = banyaknya soal yang rumit dalam soal ujian pilihan ganda.
Karena nilai n berukuran besar dan p mendekati 1/2, maka distribusi Binomial dapat
dihampiri oleh distribusi Normal dengan µ = np = 200(0,4) = 80 dan σ2 = npq = 200(0,4)(0,6)
= 48. Selanjutnya distribusi Normal diselesaikan kedalam bentuk distribusi Normal Standar,
sehingga P(X ≤ 85) ini perlu ditransformasi kedalam bentuk Normal Standar, berikut.
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 8
79,048
80)5,085()5,0( =−+=−+=σ
µxz
dengan kondisi +0,5 adalah continuity correction. Hal ini berlaku pada hampiran distribusi
Normal terhadap distribusi Binomial.
Jadi, P(X ≤ 85) = P(Z ≤ 0,79)
z 0.00 … 0.09 …
: ↓
0.7 ------ → 0.7852
:
7852,0)79,0Z(P =≤
Probabilitas probabilitas terdapat maksimal 85 soal yang rumit adalah 0,7852 .
Hampiran Distribusi Poisson terhadap Distribusi Binomial.
Ada beberapa kasus dimana data X berdistribusi Binomial hanya dapat diselesaikan dengan
pendekatan distribusi Poisson. Jika ukuran sampel n besar dan p dekat dengan 0 atau 1;
maka persoalan distribusi Binomial dapat diselesaikan dengan menggunakan pendekatan
distribusi Poisson dengan parameter µ = np.
Teorema[2]
:
Misalkan X variabel acak Binomial dengan parameter n dan p.
Ketika ∞→n , 0→p , dan µ∞→
→n
np ,
maka );(),;( µxppnxbn ∞→→ .
Sebagai contoh, Perusaha memiliki klaim bahwa dari 1000 sekrup yang diproduksi terdapat
1 sekrup yang cacat. Hitung probabilitas banyaknya sekrup yang cacat kurang dari 7 pada
sampel acak 5000 sekrup. [P(X < 7) ?]
Penyelesaian:
X = banyaknya sekrup yang cacat.
Karena nilai n berukuran besar dan p mendekati 0, maka distribusi binomial dapat dihampiri
oleh distribusi Poisson dengan n = 5000, p = 1/1000 = 0,001 , dan λ = µ = np = 5000(0,001) =
5. Jadi, P(X < 7)
E-book Statistika Gratis... STATSDATA Statistical Data Analyst
www.statsdata.my.id Page 9
λ
x … 5 …
: ↓
7 → 0.8666
:
8666,0)7X(P =<
Probabilitas banyaknya sekrup yang cacat kurang dari 7 pada sampel acak 5000 sekrup
adalah 0,8666 .
REFERENSI
[1] Bluman, A.G., (2012), Elementary Statistics: A Step By Step Approach, Eighth Edition,
New York: McGraw-Hill.
[2] Walpole, R.E., Myers, R.H., Myers, S.L., and Ye, K., (2012), Probability and Statistics for
Engineers and Scientists, Ninth Edition, Boston: Pearson Education.
[3] Lefebvre, M., (2006), Applied Probability and Statistics, New York: Springer.