KKP Nota MTE 3053 (TAJUK 2: TEORI PENSAMPELAN DAN ANGGARAN)
Transcript of KKP Nota MTE 3053 (TAJUK 2: TEORI PENSAMPELAN DAN ANGGARAN)
TAJUK 2: TEORI PENSAMPELAN DAN ANGGARAN
2.1 PENSAMPELAN
Pensampelan meluas digunakan di dalam perniagaan untuk memperolehi maklumat
yang berguna berkaitan populasi. Data adalah diambil daripada sampel dan kesimpulan
adalah dibuat terhadap populasi sebagai bahagian daripada proses pentaabiran statistik.
Sebagai contoh, katakan penyelidik mahu menjalankan kajian terhadap kepuasan pekerja-
pekerja kilang disekitar Lembah Kelang. Untuk melakukan kajian ini, sampel rawak pekerja-
pekerja kilang dari beberapa kilang disekitar Lembah Kelang akan dipilih. Soal selidik yang
dibuat dengan teliti akan digunakan untuk memperolehi data yang dikehendaki. Penyelidik
kemudiannya akan menganalisis data yang diperolehi dari jawapan pekerja-pekerja yang
telah dipilih. Ringkasan dan keputusan kajian akan disediakan berdasarkan keputusan
analisis yang diperolehi. Pihak pengurusan kilang dan pembuat keputusan akan
menggunakan lapuran keputusan kajian tersebut uantu membantu mereka di dalam
memperbaiki keadaan tempat kerja dan motivasi pekerja-pekerja. Biasanya sampel yang
sempurna akan dapat memberikan maklumat yang amat berguna di dalam proses membuat
keputusan.
Beberapa sebab yang baik untuk mengambil sampel berbanding menjalankan bancian:
Sampel boleh menjimatkan perbelanjaan.
Sampel boleh menjimatkan masa.
Untuk sumber-sumber yang terhad, sampel boleh meluaskan skop kajian.
Disebabkan proses penyelidikan kadangkala merosakkan, sampel boleh
menyelamatkan barangan.
Jika untuk memperolehi populasi adalah mustahil, maka sampel merupakan
pilihan.
2.1.1 Pensampelan Rawak dan Tidak Rawak
Dua jenis persampelan yang utama ialah rawak dan tidak rawak. Di dalam persampelan
rawak setiap unit di dalam populasi mempunyai kebarangkalian yang sama untuk dipilih
sebagai sampel. Persampelan rawak menunjukkan peluang yang sama untuk memasuki
proses pemilihan. Sebagai contoh, kebanyakan rakyat Malaysia yang membeli Sijil
Simpanan Primium percaya pemenang cabutan Sijil Simpanan Primium adalah dipilih dari
cabutan nombor rawak. Di dalam situasi ini, ahli-ahli populasi percaya bahawa pemilihan
adalah dibuat melalui peluang.
Di dalam sampel tidak rawak pula bukan semua unit populasi mempunyai
kebarangkalian untuk dipilih kedalam sampel. Ahli-ahli persampelan tidak rawak tidak
dipilih melalui peluang. Sebagai contoh, mereka dipilih disebabkan mereka berada ditempat
yang betul dan pada waktu yang betul atau mereka mengetahui bahawa penyelidik sedang
menjalankan penyelidikan.
Kadangkala persampelan rawak dipanggil sebagai persampelan kebarangkalian dan
persampelan tidak rawak dipanggil sebagai persampelan bukan kebarangkalian.
Disebabkan oleh setiap unit populasi tidak mempunyai peluang yang sama dipilih maka
untuk meletakkan sesuatu kebarangkalian adalah mustahil. Kaedah statistik yang akan
dibincangkan di dalam buku ini adalah berdasarkan kepada andaian bertaburan normal.
Persampelan tidak rawak adalah teknik yang tidak sesuai bagi memungut data untuk
dianalisis oleh kebanyakan kaedah statistik yang dibincangkan di dalam teks ini. Walau
bagaimanapun, beberapa teknik persampelan bukan rawak akan diterangkan di dalam
bahagian ini, terutamanya untuk memberikan kefahaman terhadap ciri-ciri dan batasannya.
2.1.2 Teknik Pensampelan Rawak
Empat jenis teknik persampelan rawak iaitu persampelan rawak mudah,
persampelan rawak berstarata, persampelan rawak sistematik, dan persampelan rawak
kelompok.
(a) Persampelan Rawak Mudah
Teknik persampelan yang paling asas sekali ialah persampelan rawak mudah. Persampelan
rawak mudah merupakan asas kepada lain-lain teknik persampelan rawak. Melalui
persampelan rawak mudah, setiap unit di dalam kerangka diletakkan nombor dari 1 hingga
N (dimana N adalah saiz populasi). Kemudian, jadual nombor rawak adalah digunakan
untuk memilih n item ke dalam sampel. Penjana nombor rawak adalah program komputer
yang membolehkan komputer untuk mengira output untuk menghasilkan nombor rawak.
Sebagai contoh, daripada kerangka populasi syarikat yang disenaraikan di dalam
Jadual 2.1, kita menggunakan persampelan rawak mudah untuk memilih enam syarikat.
Pertamanya, kita meletakan nombor bagi setiap ahli di dalam populasi. Kita memilih
seberapa banyak digit bagi setiap unit yang hendak disampel sebagaimana besarnya
nombor di dalam populasi. Sebagai contoh, jika populasi mempunyai 2000 ahli, kita memilih
empat digit nombor. Disebabkan populasi di dalam Jadual 7.2 mengandungi 30 ahli, hanya
dua digit diperlukan untuk dipilih bagi setiap nombor. Populasi adalah dinomborkan dari 01
hingga 30, sebagaimana ditunjukkan di dalam Jadual 2.2.
Affin HH Bank MBF Holding
Amanah HL Bank PBB
AMCORP Idris Phileo
Apax Insas PM Cap
BIMB Jerneh RHB
BJCAP KAF S Bank
CMS bhd Kenanga Suria Cap
Commer Z MAA Takaful
G. Cap Maybank UCB
HDBS MIDF UMG
Jadual 2.1Kerangka Populasi 30 Syarikat
01 Affin 11 HH Bank 21 MBF Holding
02 Amanah 12 HL Bank 22 PBB
03 AMCORP 13 Idris 23 Phileo
04 Apax 14 Insas 24 PM Cap
05 BIMB 15 Jerneh 25 RHB
06 BJCAP 16 KAF 26 S Bank
07 CMS bhd 17 Kenanga 27 Suria Cap
08 Commer Z 18 MAA 28 Takaful
09 G. Cap 19 Maybank 29 UCB
10 HDBS 20 MIDF 30 UMG
Jadual 2.2Nombor Populasi 30 Syarikat
Objeknya ialah untuk mengambil sampel enam syarikat, oleh itu enam nombor dua-
digit mesti dipilih daripada jadual nombor rawak. Disebabkan populasi ini hanya
mengandungi 30 syarikat, semua nombor yang lebih besar daripada 30 (31-99) hendaklah
diabaikan. Sebagai contoh, jika 67 dipilih, proses hendaklah diteruskan sehingga nilai di
antara 1 hingga 30 diperolehi. Jika nombor yang sama diperolehi lebih dari sekali, teruskan
kepada nombor yang lain. Untuk lebih memahami, kita mulakan dengan pasangan digit
yang pertama di dalam Jadual 7.1 dan memilih disepanjang baris sehingga n = 6 nilai yang
berbeza di antara 1 hingga 30. Jika tambahan nombor diperlukan, kita teruskan ke kedua,
dan seterusnya. Biasanya penyelidik akan memulakan pada lokasi yang dipilih secara
rawak di dalam jadual dan meneruskannya kearah yang telah ditentukan untuk memilih
nombor.
Di dalam baris pertama, nombor pertama ialah 91. Nombor ini diluar jeda oleh itu ia
diabaikan. Nombor dua digit berikutnya ialah 56. Kemudian 74, diikuti 25, yang merupakan
nombor yang boleh diambil. Dari Jadual 7.3, kita lihat 25 ialah nombor yang berpadanan
dengan Syarikat RHB merupakan syarikat pertama yang dipilih kedalam sampel. Nombor
berikutnya ialah 95, juga diabaikan, diikuti 27, merupakan nombor yang boleh dipilih.
Nombor 27 merupakan nombor untuk syarikat Suria Cap. Meneruskan proses ini kita
mendapati nombor 95 dan 83. Nombor berikutnya ialah 01, merupakan nilai untuk Syarikat
Affin. Nombor 34 adalah nombor berikutnya, diikuti oleh nombor 04 dan 02, kedua-duanjya
boleh digunakan. Nombor ini adalah berpadanan dengan Syarikat Apax dan Amanah.
Meneruskan proses ini disepanjang baris, nombor berikutnya ialah 29, yang berpadanan
dengan Syarikat UCB. Oleh itu pemilihan enam sampel syarikat telah diselesaikan. Berikut
adalah syarikat yang dipilih sebagai sampel akhir:
RHB
Suria Cap
Affin
Apax
Amanah
UCB
Persampelan rawak mudah adalah senang dilakukan keatas populasi yang kecil
berbanding populasi besar. Proses meletakkan nombor kepada populasi dan memilihnya
adalah mengelirukan untuk sampel yang besar.
(b) Persampelan Rawak Berstarata
Persampelan rawak jenis kedua ialah persampelan rawak berstarata dimana populasi
adalah dibahagikan kepada sub-populasi yang tidak bertindih dipanggil sebagai starata.
Penyelidik kemudiannya akan memilih sampel rawak mudah dari setiap sub-populasi.
Sebab utama mengapa menggunakan persampelan rawak berstarata ialah kerana kaedah
ini berpotensi untuk mengurangkan ralat persampelan. Ralat persampelan terjadi apabila
melalui peluang sampel tidak mewakili populasi. Melalui persampelan rawak berstarata,
potensi untuk sepadan dengan sampel hampir kepada populasi adalah lebih berbanding
persampelan rawak mudah kerana bahagian daripada jumlah sampel adalah diambil
daripada kumpulan populasi yang berlainan. Walau bagaimanapun, persampelan rawak
berstarata adalah mahal berbanding persampelan rawak mudah kerana setiap unit populasi
mesti diletakkan di dalam starata sebelum proses pemilihan rawak dilakukan.
Pemilihan strata biasanya berdasarkan kepada maklumat yang ada. Maklumat-
maklumat tersebut mungkin diperolehi daripada kajian atau bancian yang terdahulu.
Kelebihan strata meningkat apabila strata lebih berbeza. Secara dalaman, strata hendaklah
homogen secara relatif; secara luaran pula, strata hendaklah kontras antara satu sama lain.
Strata selalunya dilakukan dengan menggunakan angkubah demografi, seperti jantina, kelas
sosioekonomi, kawasan geografi, ugama, ethnik dan sebagainya. Sebagai contoh, di dalam
memasarkan siaran radio, umur pendengar adalah penentu penting terhadap jenis program
yang disediakan oleh stesyen radio. Rajah 2.1 mengandungi strata mengikut umur yang
dibahagi kepada tiga strata, berdasarkan kepada andaian umur adalah faktor yang
menentukan citarasa terhadap program radio. Strata ini menunjukkan pendengar berumur
20 hingga 30 tahun adalah mengemari jenis program yang sama, tetapi berbeza daripada
apa yang digemari oleh pendengar yang berumur 30 – 40 tahun dan 40 – 50 tahun. Di
kalangan setiap kumpulan umur, homogeniti adalah ujud; di antara kumpulan adalah
berbeza, atau heterogeniti adalah ujud.
Rajah 2.1
Persampelan Rawak Berstrata Pendengar Radio
20-30 tahun
(homogen)
20-30 tahun
(homogen)
20-30 tahun
(homogen)
Hetrogen di antaranya
Hetrogen di antaranya
Persampelan rawak berstrata boleh jadi berkadaran atau tidak berkadaran.
Persampelan rawak berstrata berkadaran terjadi apabila peratus sampel yang diambil
daripada setiap strata adalah berkadaran dengan peratus bagi setiap strata dikalngan
populasi keseluruhan. Sebagai contoh, di Kuala Lumpur, untuk mengambil sampel dari
kaum Melayu, Cina, India dan lain-lain. Jika populasi penduduk Kuala Lumpur 60% adalah
kaum Melayu dan jika sampel yang hendak diambil ialah 1,000 orang, maka sampel Kaum
Melayu yang dipilih ialah 600 orang. Sampel kaum lain adalah mengikut kadar dari populasi
mereka. Jika kadar strata di dalam sampel adalah berbeza berbanding dengan kadar strata
di dalam populasi maka ia merupakan persampelan rawak berstrata tidak berkadaran.
(c) Persampelan Sistematik
Tidak seperti persampelan rawak mudah dan persampelan rawak berstrata, persampelan
sistematik tidak cuba untuk mengurangkan ralat persampelan. Persampelan sistematik
digunakan kerana ia selesa dan relatif mudah untuk ditadbirkan. Melalui persampelan
sistematik, setiap item k adalah dipilih untuk mengurangkan saiz sampel n dari populasi
bersaiz N. Nilai k boleh ditentukan dengan menggunakan formula. Jika k bukan nilai
integer, nombor bulat akan digunakan.
Sebagai contoh persampelan sistematik, katakan penyelidik sistem pengurusan
maklumat mahu mengambil sampel kilang di Lembah Kelang. Ia mempunyai bantuan
kewangan yang mencukupi untuk mengambil 1000 kilang (n). Direktori Perkilangan Kuala
Lumpur menyenaraikan hampir 17,000 jumlah kilang di Lembah Kelang (N) mengikut
Menentukan Nilai k
k =Nn
dimana
n = saiz sampel
N = saiz populasi
K = saiz selang untuk dipilih
susunan abjad. Nilai k ialah 17,000/1000 = 17 dan penyelidik akan memilih setiap 17 kilang
dari senarai direktori sebagai sampel.
Apakah penyelidik memilih kilang yang pertama disenaraikan atau kilang ke 17 atau
mana-mana kilang di antaranya? Di dalam memilih setiap nilai k, jadual nombor rawak
mesti digunakan untuk memilih nilai di antara 1 dan k sebagai titik awal. Unsur kedua bagi
sampel adalah adalah titik awal tambah k. Sebagai contoh, k = 17, oleh itu penyelidik pelu
mengikut jadual rawak untuk menentukan titi awal di antara 1 dengan 17. Katakan ia
memilih nombor 5. Ia kemudiannya bermula dengan kilang 5, kemudian memilih 22 (5 +
17), dan kemudian kilang ke 39 dan seterusnya.
Disamping keselesaan, persampelan sistematik mempunyai kebaikan lain.
Disebabkan persampelan sistematik bertaburan seragam disepanjang kerangka, mereka
yang berpengetahuan dengan mudah dapat menentukan samada perancangan
persampelan telah diikuti di dalam kajian. Walau bagaimanapun, masalah persampelan
sistematik boleh terjadi jika ujudnya data yang berkala, dan selang persampelan adalah di
dalam ‘syncopation’ dengannya. Sebagai contoh, jika senarai 150 pelajar sebenarnya
adalah cantuman dari lima kelas dengan 30 pelajar setiap kelas dan jika setiap senarai bagi
setiap kelas telah disusun dengan nama pelajar terbaik, sederhana dan rendah, maka
persampelan sistematik berkemungkinan memilih semua pelajar terbaik sahaja, semua
pelajar sederhana dan semua pelajar kurang baik. Metodologi persampelan sistematik
adalah berdasarkan kepada andaian bahawa sumber populasi adalah rawak.
(d) Persampelan Kelompok
Persampelan kelompok melibatkan pembahagian populasi kepada kawasan yang tidak
bertindih. Walau bagaimanapun, ia berbeza dengan persampelan rawak berstrata dimana
strata adalah homogen, sementara persampelan kelompok adalah heterogen dalamannya.
Secara teorinya, setiap kelompok mengandungi berbagai-bagai varieti unsur yang luas, dan
kluster adalah bahangian kecil bagi populasi. Contoh kelompok ialah bandar, syarikat,
rumah, universiti, kawasan perbandaran, dan kawasan geografi. Selalunya kelompok
adalah kumpulan populasi yang terjadi semulajadi dan sedia dikenalpasti, seperti negeri
atau Kawasan Majlis Bandaraya. Walaupun persampelan kawasan biasanya dirujukkan
sebagai kelompok yang merupakan kawasan populasi, seperti kawasan geografi atau
bandar, istilah persampelan kluster dan persampelan kawasan adalah digunakan silih
berganti di dalam tek ini.
Selepas memilih kelompok, penyelidik memilih secara rawak unsur individu untuk
sampel daripada kluster. Satu contoh penyelidikan perniagaan ialah menggunakan
kelompok untuk menguji pasaran barangan baru. Biasanya di dalam ujian pemasaran,
Malaysia akan dibahagikan kepada kelompok mengikut negeri, dan pelanggan individu di
kalangan pasaran bandar ujian adan dikaji. Rajah 2.1 menunjukkan pasaran bandar ujian
bagi Malaysia yang menggunakan kluster untuk menguji keluaran.
Rajah 2.1Beberapa Bandar Ujian Pemasaran
Kadangkala kelompok adalah terlalu besar, dan set kelompok yang kedua akan
dibuat daripada setiap kluster asal. Teknik ini dipanggil sebagai persampelan dua-peringkat.
Sebagi contoh, penyelidik akan membahagikan Malaysia mengikut kluster bandar. Ia
kemudiannya membahagikan bandar tersebut kepada kluster blok dan memilih secara
rawak rumah individu daripada kluster blok. Peringkat pertama ialah memilih bandar ujian
dan peringkat kedua memilih blok.
Persampelan kelompok mempunyai beberapa kebaikan. Dua daripada kebaikan
yang utama ialah selesa dan kos. Kelompok biasanya mudah diperolehi, dan kos
persampelan daripada keseluruhan populasi adalah dikurangkan kerana skop kajian telah
dikurangkan kepada kluster. Kos per unsur biasanya rendah di dalam persampelan kluster
atau kawasan di dalam kluster berbanding persampelan rawak berstrata disebabkan
penyenaraian unsur dan kos lokasi yang rendah. Masa dan kos menghubungi unsur
populasi juga dikurangkan, terutamanya jika melibatkan perjalanan disebabkan kluster
mengurangkan jarak di antara unsur sampel. Disamping itu pentabiran sampel survei boleh
diringkaskan. Kadangkala persampelan kelompok merupakan pendekan yang hanya boleh
dilakukan disebabkan kerangka persampelan bagi unsur populasi individu tidak diperolehi
dan oleh itu lain-lain teknik persampelan tidak boleh digunakan.
Persampelan kelompok juga mempunyai beberapa kelemahan. Jika unsur kluster
adalah sama, persampelan kluster mungkin secara statistik tidak cekap berbanding
persampelan rawak mudah. Di dalam kes yang lebih ekstrim, - apabila unsur kluster adalah
sama – persampelan daripada kluster mungkin tidak baik berbanding persampelann unit
tunggal daripada kluster. Selanjutnya, kos dan masalah analisis statistik adalah lebih besar
dngan persampelan kluster berbanding persampelan rawak mudah.
2.2 TABURAN PENSAMPELAN X
Di dalam bahagian ini, kita akan mengkaji min sampel, X , sebagai statistik. Min
sampel ialah statistik yang biasa digunakan di dalam statistik pentaabiran. Untuk mengira
dan menetapkan kebarangkalian terjadi sesuatu nilai bagi min sampel, penyelidik mesti
mengetahui taburan bagi min sampel. Satu cara untuk menguji taburan kebarangkalian
adalah mengambil populasi dengan taburan tertentu, memilih sampel rawak bagi saiz
tertentu, kira min sampel, dan cuba untuk menentukan bagaimana mereka bertaburan.
Katakan populasi finit yang kecil mengandungi hanya N = 8 angka:
54, 55, 59, 63, 64, 68, 69, 70
Menggunakan histogram, kita lihat bentuk taburan bagi populasi data.
Katakan kita mengambil semua kemungkinan sampel bersaiz n = 2 daripada
populasi ini dengan penggantian. Keputusannya adalah sebagaimana pasangan data
berikut:
(54,54) (55,54) (59,54) (63,54) (64,54) (68,54) (69,54) (70,54)
(54,55) (55,55) (59,55) (63,55) (64,55) (68,55) (69,55) (70,55)
(54,59) (55,59) (59,59) (63,59) (64,59) (68,59) (69,59) (70,59)
(54,63) (55,63) (59,63) (63,63) (64,63) (68,63) (69,63) (70,63)
(54,64) (55,64) (59,64) (63,64) (64,64) (68,64) (69,64) (70,64)
(54,68) (55,68) (59,68) (63,68) (64,68) (68,68) (69,68) (70,68)
(54,69) (55,69) (59,69) (63,69) (64,69) (68,69) (69,69) (70,69)
(54,70) (55,70) (59,70) (63,70) (64,70) (68,70) (69,70) (70,70)
Min bagi setiap sampel ini ialah
54.0 54.5 56.5 58.5 59.0 61.0 61.5 62.0
54.5 55.0 57.0 59.0 59.5 61.5 62.0 62.5
56.5 57.0 59.0 61.0 61.5 63.5 64.0 64.5
58.5 59.0 61.0 63.0 63.5 65.5 66.0 66.5
59.0 59.5 61.5 63.5 64.0 66.0 66.5 67.0
61.0 61.5 63.5 65.5 66.0 68.0 68.5 69.0
61.5 62.0 64.0 66.0 66.5 68.5 69.0 69.5
62.0 62.5 64.5 66.5 67.0 69.0 69.5 70.0
Sekali lagi, menggunakan histogram, kita boleh melihat bentuk taburan bagi min
sampel ini.
Perhatikan bentuk histogram bagi min sampel adalah lebih kurang sama bentuknya
histogram populasi. Min sampel kelihatannya memenuhi kearah pertengahan taburan dan
mengecil kearah hujung taburan.
Setakat ini, kita telah menguji populasi dengan taburannya. Walau bagaimanapun, min
sampel yang diambil dari populasi ini menghampiri taburan normal, terutamanya apabila
saiz sampel bertambah besar.
Teorem Had Memusat
Teorem had memusat membentuk potensi penggunaan taburan normal kepada
banyak masalah apabila saiz sampel adalah cukup besar. Min sampel yang hendak dikira
dari sampel rawak yang dipilih daripada populasi yang bertaburan normal adalah bertaburan
normal. Walau bagaimanapun, kebaikan sebenar teorem had memusat ialah bahawa
sampel data adalah diambil daripada populasi yang tidak bertaburan normal atau populasi
yang tidak diketahui bentuknya juga boleh dianalisis menggunakan taburan normal kerana
min sampel adalah bertaburan normal untuk sampel yang cukup besar saiznya. Lajur 1
Rajah 2.2 menunjukkan empat taburan populasi yang berbeza. Setiap lajur yang
bersebelahan menunjukkan bentuk taburan min sampel bagi saiz sampel yang tertentu.
Perhatikan dibaris bawah sekali bagi populasi yang bertaburan normal menunjukkan min
sampel adalah juga bertaburan normal apabila n = 2. Perhatikan juga bagi lain-lain taburan
populasi, taburan min sampel menghampiri keluk normal apabila n menjadi semangkin
besar. Bagi semua empat taburan, taburan min sampel menghampiri normal apabila n = 30.
Teorem Had Memusat
Jika sampel bersaiz n diambil secara rawak daripada populasi dan mempunyai min
dan sisihan piawai , min sampel X , adalah bertaburan normal bagi sampel saiz yang cukup besar (n 30) menurut bentuk taburan populasi. Jika populasi bertaburan normal, min sampel adalah bertaburan normal bagi sebarang saiz sampel.
Dari jangkaan matematik, ia boleh ditunjukkan bahawa min bagi min sampel ialah min populasi.
μX=μ
dan sisihan piawai bagi min sampel ialah sisihan piawai populasi dibahagikan dengan punca kuasadua saiz sampel.
σ X¿ σ√n
Rajah 2.2
Bentuk Taburan Min Sampel bagi Tiga Saiz Sampelyang diambil dari Empat Taburan Populasi yang Berbeza
2.3 ANGGARAN TITIK DAN ANGGARAN SELANG
Syarikat talipon cellular, memikirkan untuk mengubah struktur harga. Pelanggan
kelihatan sanggup untuk memperuntukkan lebih masa keatas talipon dan meninjau untuk
melihat harga yang terbaik. Untuk mendapatkan perancangan yang lebih baik, syarikat
talipon celluler mahu menentukan purata masa yang digunakan sebulan setiap pengguna
tetapi tidak mempunyai sumber yang ada untuk menguji bil pelanggan dan memperolehi
maklumat. Syarikat telah mengambil sampel 85 bil bulanan yang terbaru dan mendapati
min sampel masa panggilan ialah 153 minit. Min sampel ini adalah statistik, yang akan
digunakan untuk menganggar min populasi, yang merupakan parameter. Jika syarikat
menggunakan min sampel 153 minit sebagai penganggaran untuk min populasi, maka min
sampel tersebut ialah penganggaran titik.
Penganggaran titik ialah statistik yang diambil daripada sampel dan digunakan untuk
menganggarkan min populasi. Walau bagaimanapun, penganggaran titik ini hanya baik
sebagai perwakilan sampelnya sahaja. Jika sampel rawak yang lain diambil daripada
populasi, penganggaran titik yang diterbitkan daripada sampel tersebut adalah berlainan.
Disebabkan oleh variasi di dalam sampel statistik, penganggaran parameter populasi
dengan selang penganggaran biasanya lebih digemari untuk menggunakan penganggaran
titik. Penganggaran selang (selang keyakinan) adalah jeda nilai dimana penganalisis boleh
menyatakan dengan keyakinan tertentu dimana kedudukan parameter populasi. Selang
keyakinan boleh jadi dua atau satu bahagian.
Sebagai hasil teorem had memusat, formula Z yang berikut untuk min sampel boleh
digunakan apabila saiz sampel adalah besar, tidak kira bentuk taburan populasi, atau untuk
saiz sampel yang kecil dan bertaburan normal.
Z = X - μ
( σ√n )
Menyusun semula formula tersebut untuk menyelesaikan nilai memberikan
μ=X - Z σ√n
Disebabkan min sampel boleh jadi lebih besar daripada atau lebih kecil daripada min
populasi, Z boleh jadi positif atau negatif. Oleh itu formula di atas boleh disusun sebagai
X± Z σ√n
Menulis semula pernyataan di atas menghasilkan formula selang keyakinan untuk
menganggar dengan saiz sampel yang besar.
Alpha () adalah keluasan di bawah keluk normal dibahagian hujung taburan diluar
kawasan yang dikenalpasti sebagai selang keyakinan. Disini kita akan menggunakan
untuk mentukan nilai Z di dalam membina selang keyakinan sebagaimana ditunjukkan di
dalam Rajah 2.3. Disebabkan jadual normal piawai adalah berdasarkan keatas keluasan Z
di antara 0 dan Z/2, nilai Z adalah ditemui terletak dikawasan 0.5000 - α2 , yang merupakan
bahagian keluk normal di antara pertengahan keluk dan satu bahagian ekor. Cara lain untuk
menentukan kedudukan nilai Z ialah mengubah paras keyakinan daripada peratus kepada
perkadaran, dibahagikan dengan setengah, dan lihat semula jadual dengan nilai ini.
Keputusannya adalah sama.
Selang Keyakinan 100(1 - )% untuk Menganggar
X± Zα /2σ√n
atau
X− Zα /2σ√n
≤μ≤X+ Zα /2σ√n (8.1)
dimana
= keluasan di bawah keluk normal diluar kawasan selang keyakinan
α2 = keluasan di dalam satu ekor taburan diluar selang keyakinan
Formula selang keyakinan (2.3) menghasilkan selang yang kita rasakan yakin
dimana min populasi terletak. Adalah tidak pasti dimana min populasi terletak di dalam
selang tersebut melainkan kita mempunyai 100% selang keyakinan. Walau bagaimanapun,
kita boleh meletakkan kebarangkalian bahawa parameter (di dalam kes ini ialah ) terletak
di antara selang. Formula 2.3 boleh dinyatakan di dalam pernyataan kebarangkalian seperti
berikut:
Kebarangkalian(X− Zα /2
σ√n
≤μ≤X+ Zα /2σ√n ) = 1 -
Jika kita mahu membentuk selang keyakinan 95%, paras keyakinan ialah 95% atau
0.95. Kenyataan kebarangkalian yang ditunjukkan memberitahu kita terdapat 0.95
kebarangkalian min populasi adalah di dalam selang ini. Jika 100 selang seperti itu dibentuk
dengan mengambil sampel rawak daripada populasi, lebih kurang 95 daripada selang
tersebut melibatkan min populasi dan lima daripadanya bukan. Kebarangkalian
memberitahu kita kebolehjadian selang tertentu adalah satu yang termasuk di dalam min
populasi.
Sebagai contoh, di dalam masalah syarikat talipon cellular untuk menganggarkan
min populasi masa panggilan setiap pelanggan sebulan, bagi sampel 85 bil telah
mengenalpasti min sampel ialah 153 minit. Menggunakan min sampel ini, selang keyakinan
boleh dikira dimana penyelidik relatif yakin min populasi sebenar terletak. Untuk
melakukannya menggunakan Formula 8.1, nilai sisihan piawai populasi dan nilai Z ) sebagai
tambahan min sampel, 153, dan saiz sampel, 85) mesti diketahui. Katakan rekod lepas dan
kajian yang sama menunjukkan bahawa sisihan piawai populasi ialah 46 minit.
Nilai Z adalah ditentukan oleh paras keyakinan yang diperlukan. Selang dengan
100% keyakinan adalah terlalu luas dan tidak bermakna. Beberapa paras selang keyakinan
yang biasa digunakan oleh penyelidik adalah 95%, 95%, 98% dan 99%. Mengapakan
penyelidik tidak hanya memilih keyakinan yang tertinggi dan sentiasa menggunakan paras
tersebut? Ini disebabkan bahawa penggantian dantara saiz sampel, lebar selang, dan paras
keyakinan mesti dipertimbangkan. Sebagai contoh, apabila paras keyakinan meningkat,
selang semangkin luas, memberikan saiz sampel dan sisihan piawai tetap kekal.
Untuk masalah syarikat talipon cellular, katakan penyelidik menetapkan 90% selang
keyakinan bagi keputusannya. Rajah 2.4 menunjukkan taburan normal min sampel
berkaitan min populasi. Apabila menggunakan 90% paras keyakinan, ia telah memilih
selang tersebut dengan disekitar 95% dimana semua nilai min sampel akan jatuh dan
kemudian menggunakan lebar selang tersebut untuk membina selang disekitar min sampel
dimana ia yakin min populasi akan berada.
Untuk 95% keyakinan, = 0.05 dan α
2 = 0.025. Nilai Z/2 atay Z0.025 adalah ditemui
dengan melihat jadual taburan normal di bawah 0.5000 – 0.025 = 0.4750. Keluasan ini di
dalam jadual adalah berpadanan dengan nilai Z = 1.960. Terdapat cara lain untuk
menentukan nilai Z. Disebabkan taburan adalah simetri dan selang adalah sama dikedua-
dua belah bahagian min populasi, 12 (95 % )atau 0.4750, daripada keluasan adalah terletak
disatu bahagian min. Jadual A.3 menghasilkan nilai Z = 1.96 bagi bahagian keluk normal.
Oleh itu nilai Z untuk 95% selang keyakinan adalah sentiasa 1.96. Dengan lain perkataan,
semua kemungkinan nilai X disepanjang paksi mendatar rajah, 95% daripadanya
sepatutnya disekitar skor Z =1.96 daripada min populasi.
Penyelidik sekarang boleh melengkapkan masalah syarikat talipon cellular. Untuk
mencari 95% selang keyakinan bagi X = 153, = 46, n = 85 dan Z = 1.96, ia
menganggarkan purata masa panggilan dengan melibatkan nilai Z di dalam Formula 8.1
adalah.
153 - 1 .96 (46√85 )≤μ≤ 153 + 1 . 96 (46
√85 )153 – 9.78 153 + 9.78
143.22 162.78
Selang keyakinan ini dibina daripada penganggaran titik, dimana di dalam masalah
ini ialah 153 minit, dan ralat bagi penganggaran ini ialah 9.78 minit. Keputusan selang
keyakinan ialah 143.22 162.78. Penyelidik syarikat talipon cellular ini 95% yakin
bahawa purata masa panggilan untuk populasi ialah di antara 143.22 dan 162.78 minit.
95% keyakinan menunjukkan bahawa, jika penyelidik syarikat mengambil 100
sampel mengandungi 85 panggilan secara rawak dan menggunakan keputusan bagi setiap
sampel dan menjalankan 95% selang keyakinan, hampir 95 daripada 100 selang tersebut
akan mengandungi min populasi. Ia juga menunjukkan 5% daripada selang tidak
mengandungi min populasi. Penyelidik hanya perlu mengambil satu sampel dan mengira
selang keyakinan daripada maklumat sampel tersebut. Selang tersebut sama ada
mengandungi min populasi atau tidak.
Menganggar min populasi apabila sisihan piawai bagi populasi diketahui
Contoh 1Satu kajian telah dilakukan kepada syarikat di Malaysia yang menjalankan kajian di Cina.
Satu daripada soalan ialah: Telah berapa lamakah syarikat anda menjalankann perniagaan
dengan Cina? Satu sampel rawak 44 syarikat telah dipilih menghasilkan min 10.455 tahun.
Katakan sisihan piawai populasi bagi soalan ini ialah 7.7 tahun. Menggunakan maklumat ini,
jalankan selang keyakinan 90% min bilangan tahun syarikat di Malaysia telah menjalankan
perniagaan di Cina bagi populasi syarikat Malaysia yang menjalankan perniagaan di Cina.
Penyelesaian
Disini, n = 44, X = 10.455. dan = 7.7. Untuk menentukan nilai Z/2, bahagikan selang
keyakina 90% dengan dua atau 0.05 - α
2 = 0.500 – 0.0500. Taburan Z bagi X disekitar
mengandungi 0.4500 daripada kawasan sisetiap bahagian , atau (12 ) (90 % ) . Jadual A.3
menghasilkan nilai Z = 1.645 bagi keluasan 0.4500 (interpolasi di antara 0.4495 dan
0.4505). Selang keyakinan ialah
X - Z ( σ√n )≤ μ≤X+ Z ( σ
√n )10 .455 - 1 .645 ( 7 .7
√44 )≤μ≤ 10 . 455 + 1. 645( 7 . 7√44 )
10.455 – 1.91 10.455 + 1.91
8.545 12.365
Kebarangkalian (8.545 12.365 = 0.90
Oleh itu, penganalisis mempunyai keyakinan 90% menyatakan jika bancian terhadap
syarikat Malaysia yang menjalankan perniagaan di Cina diambil pada masa survei ini, min
populasi sebenar lama mereka menjalankan perniagaan di Cina adalah di antara 8.545 dan
12.365. Titik penganggaran ialah 10.455.
Contoh 2 Satu kajian telah dilakukan di dalam syarikat yang mempunyai 800 jurutera. Sampel rawak
50 jurutera ini mendapati purata umur sampel ialah 34.3 tahun. Rekod lama mendapati
sisihan piawai umur jurutera syarikat ialah 8 tahun. Lakukan selang keyakinan 98% untuk
menganggar unur semua jurutera di dalam syarikat ini.
Penyelesaian
Masalah ini ialah masalah finit. Saiz sampel, 50 adalah lebih besar daripada 5% populasi,
oleh itu faktor pembetulan perlu dilakukan. Di dalam kes ini N = 800, n = 50, X = 34.3 dan
= 8. Nilai Z bagi 98% selang keyakinan ialah 2.33 (0.98 dibahagi 2 menghasilkan 0.4900;
Nilai Z adalah diperolehi daripada Jadual A.3 dengan menggunakan 0.4900).
Menggantikannya kedalam Formula 8.2 dan menyelesaikan untuk selang keyakinan
memberikan
34 . 3 - 2 .33 ( 8√50 )(√750
799 )≤μ≤ 34 . 3 + 2 .33 ( 8√50 )(√750
799 )34.3 – 2.554 34.3 + 2.554
31.75 36.85
Tanpa faktor pembetulan finit, keputusannya adalah
34.3 – 2.64 34.3 + 2.64
31.66 36.94
Faktor pembetulan finit mengambil kira kenyataan bahawa populasi hanya 800 berbanding
infiniti. Sampel, n = 50 adalah perkadaran yang besar daripada 800 yang sepatutmua
populasi yang besar, dan oleh itu lebar selang keyakinan adalah dikurangkan.
Menganggar min dan sisihan piawai bagi populasi daripada data sampel
Contoh
Syarikat pakaian mengeluarkan jean untuk lelaki. Jean tersebut dibuat dan dijual sama ada
potongan biasa atau potongan ‘boot’. Dalam usaha untuk menganggar perkadaran pasaran
jean lelaki tersebut di Kuala Lumpur untuk jean potongan ‘boot’, penganalisis mengambil
sampel rawak 212 jean yang dijual oleh syarikat tersebut dari dua kedai di Kuala Lumpur.
Hanya 34 daripada jualan adalah jean potongan ‘boot’. Jalankan 90% selang keyakinan
untuk menganggar perkadaran populasi di Kuala Lumpur yang mengemari jean potongan
‘boot’.
PenyelesaianSampel saiz ialah 212, dan bilangan yang mengemari jean potongan ‘boot’ ialah 34.
Perkadaran sampel ialah p¿̂
¿= 34/212 = 0.16. Titik penganggaran bagi jean potongan ‘boot’
di dalam populasi ialah 0.16 atau 16%. Nilai Z untuk 90% selangan keyakinan ialah 1.645,
dan nilai p¿̂
¿ = 0.16 dan q¿̂
¿ = 1 – p¿̂
¿ = 1 – 0.16 = 0.84. Selang keyakinan yang dianggarkan
ialah
0 .16 - 1. 645 √(0 .16 )(0. 84 )212
≤ P ≤ 0 . 16 + 1 . 645 √ (0 .16 )(0 . 84 )212
0.16 – 0.04 P 0.16 + 0.04
0.12 P 0.20
Kebarangkalian (0.12 P 0.20) = 0.90
Anggaran penganalisis dengan kebarangkalian 0.90 bahawa perkadaran populasi
pembelian jean potongan ‘boot’ adalah di antara 0.12 dan 0.20. Paras selang keyakinan
ialah 90%.
Menganggar min populasi berdasarkan saiz sampel yang kecil
Taburan t
Gosset telah membangunkan taburan t, yang mana menerangkan sampel data di
dalam sampel bersaiz kecil apabila sisihan piawai tidak diketahui dan populasi bertaburan
normal. Formula bagi nilai t ialah:
t = X - μ
( S√n )
Taburan t sebenarnya adalah siri taburan disebabkan setiap saiz sampel mempunyai
taburan yang berbeza, oleh itu membuatkan banyak potensi jadual t. Untuk menjadikan nilai
t ini lebih bermakna, hanya nilai utama sahaja dipilih dan dibentangkan; setiap barisan di
dalam jadual mengandungi nilai daripada taburan t yang berbeza. Andaian disebalik
penggunaan teknik yang dibincangkan di dalam buku ini adalah untuk saiz sampel yang
kecil dan populasi adalah bertaburan normal. Jika populasi tidak bertaburan normal atau
tidak diketahui, teknik tidak berparameter perlu digunakan.
Ciri-ciri Tabutan t
Rajah 2.5 menunjukkan dua taburan t di atas taburan normal piawai. Sebagaimana
taburan normal, taburan t juga simetri, unimodel dan keluarga kepada keluk. Taburan t lebih
rata dipertengahan dan mempunyai lebih keluasan dihujung ekornnya berbanding dengan
taburan normal.
Menguji nilai taburan t mendapati taburan t menghampiri keluk taburan normal
apabila n menjadi semangkin besar. Taburan t adalah taburan yang bersesuaian untuk
digunakan pada sebarabng masa varian dan sisihan piawai populasi tidak diketahui, walau
apa pun saiz sampel. Walau bagaimanapun, disebabkan perbezaan di antara nilai jadual Z
dan t tidak berubah apabila sampel menjadi besar, kebanyakan penyelidik menggunakan
taburan Z untuk menganalisis sampel bersaiz besar apabila sisihan piawai atau varian tidak
diketahui. Di dalam buku ini, taburan t adalah digunakan hanya untuk masalah bersaiz kecil
(n < 30) disebabkan n menghampiri saiz 30 niali jadual t menghampiri nilai jadual Z.
Rajah 2.5
Perbandingan dua taburan t denga keluk normal piawai
Keluk normal piawai
Keluk t (n=25)Keluk t (n=10)
Selang Keyakinan unruk Menganggar :
Sampel Kecil dan Tidak Diketahui
X± tα /2,n-1S√n
X - tα /2,n-1S√n
≤μ≤X+ tα /2,n-1S√n
df = n - 1