KKP Nota MTE 3053 (TAJUK 2: TEORI PENSAMPELAN DAN ANGGARAN)

TAJUK 2: TEORI PENSAMPELAN DAN ANGGARAN

2.1 PENSAMPELAN

Pensampelan meluas digunakan di dalam perniagaan untuk memperolehi maklumat

yang berguna berkaitan populasi. Data adalah diambil daripada sampel dan kesimpulan

adalah dibuat terhadap populasi sebagai bahagian daripada proses pentaabiran statistik.

Sebagai contoh, katakan penyelidik mahu menjalankan kajian terhadap kepuasan pekerja-

pekerja kilang disekitar Lembah Kelang. Untuk melakukan kajian ini, sampel rawak pekerja-

pekerja kilang dari beberapa kilang disekitar Lembah Kelang akan dipilih. Soal selidik yang

dibuat dengan teliti akan digunakan untuk memperolehi data yang dikehendaki. Penyelidik

kemudiannya akan menganalisis data yang diperolehi dari jawapan pekerja-pekerja yang

telah dipilih. Ringkasan dan keputusan kajian akan disediakan berdasarkan keputusan

analisis yang diperolehi. Pihak pengurusan kilang dan pembuat keputusan akan

menggunakan lapuran keputusan kajian tersebut uantu membantu mereka di dalam

memperbaiki keadaan tempat kerja dan motivasi pekerja-pekerja. Biasanya sampel yang

sempurna akan dapat memberikan maklumat yang amat berguna di dalam proses membuat

keputusan.

Beberapa sebab yang baik untuk mengambil sampel berbanding menjalankan bancian:

Sampel boleh menjimatkan perbelanjaan.

Sampel boleh menjimatkan masa.

Untuk sumber-sumber yang terhad, sampel boleh meluaskan skop kajian.

Disebabkan proses penyelidikan kadangkala merosakkan, sampel boleh

menyelamatkan barangan.

Jika untuk memperolehi populasi adalah mustahil, maka sampel merupakan

pilihan.

2.1.1 Pensampelan Rawak dan Tidak Rawak

Dua jenis persampelan yang utama ialah rawak dan tidak rawak. Di dalam persampelan

rawak setiap unit di dalam populasi mempunyai kebarangkalian yang sama untuk dipilih

sebagai sampel. Persampelan rawak menunjukkan peluang yang sama untuk memasuki

proses pemilihan. Sebagai contoh, kebanyakan rakyat Malaysia yang membeli Sijil

Simpanan Primium percaya pemenang cabutan Sijil Simpanan Primium adalah dipilih dari

cabutan nombor rawak. Di dalam situasi ini, ahli-ahli populasi percaya bahawa pemilihan

adalah dibuat melalui peluang.

Di dalam sampel tidak rawak pula bukan semua unit populasi mempunyai

kebarangkalian untuk dipilih kedalam sampel. Ahli-ahli persampelan tidak rawak tidak

dipilih melalui peluang. Sebagai contoh, mereka dipilih disebabkan mereka berada ditempat

yang betul dan pada waktu yang betul atau mereka mengetahui bahawa penyelidik sedang

menjalankan penyelidikan.

Kadangkala persampelan rawak dipanggil sebagai persampelan kebarangkalian dan

persampelan tidak rawak dipanggil sebagai persampelan bukan kebarangkalian.

Disebabkan oleh setiap unit populasi tidak mempunyai peluang yang sama dipilih maka

untuk meletakkan sesuatu kebarangkalian adalah mustahil. Kaedah statistik yang akan

dibincangkan di dalam buku ini adalah berdasarkan kepada andaian bertaburan normal.

Persampelan tidak rawak adalah teknik yang tidak sesuai bagi memungut data untuk

dianalisis oleh kebanyakan kaedah statistik yang dibincangkan di dalam teks ini. Walau

bagaimanapun, beberapa teknik persampelan bukan rawak akan diterangkan di dalam

bahagian ini, terutamanya untuk memberikan kefahaman terhadap ciri-ciri dan batasannya.

2.1.2 Teknik Pensampelan Rawak

Empat jenis teknik persampelan rawak iaitu persampelan rawak mudah,

persampelan rawak berstarata, persampelan rawak sistematik, dan persampelan rawak

kelompok.

(a) Persampelan Rawak Mudah

Teknik persampelan yang paling asas sekali ialah persampelan rawak mudah. Persampelan

rawak mudah merupakan asas kepada lain-lain teknik persampelan rawak. Melalui

persampelan rawak mudah, setiap unit di dalam kerangka diletakkan nombor dari 1 hingga

N (dimana N adalah saiz populasi). Kemudian, jadual nombor rawak adalah digunakan

untuk memilih n item ke dalam sampel. Penjana nombor rawak adalah program komputer

yang membolehkan komputer untuk mengira output untuk menghasilkan nombor rawak.

Sebagai contoh, daripada kerangka populasi syarikat yang disenaraikan di dalam

Jadual 2.1, kita menggunakan persampelan rawak mudah untuk memilih enam syarikat.

Pertamanya, kita meletakan nombor bagi setiap ahli di dalam populasi. Kita memilih

seberapa banyak digit bagi setiap unit yang hendak disampel sebagaimana besarnya

nombor di dalam populasi. Sebagai contoh, jika populasi mempunyai 2000 ahli, kita memilih

empat digit nombor. Disebabkan populasi di dalam Jadual 7.2 mengandungi 30 ahli, hanya

dua digit diperlukan untuk dipilih bagi setiap nombor. Populasi adalah dinomborkan dari 01

hingga 30, sebagaimana ditunjukkan di dalam Jadual 2.2.

Affin HH Bank MBF Holding

Amanah HL Bank PBB

AMCORP Idris Phileo

Apax Insas PM Cap

BIMB Jerneh RHB

BJCAP KAF S Bank

CMS bhd Kenanga Suria Cap

Commer Z MAA Takaful

G. Cap Maybank UCB

HDBS MIDF UMG

Jadual 2.1Kerangka Populasi 30 Syarikat

01 Affin 11 HH Bank 21 MBF Holding

02 Amanah 12 HL Bank 22 PBB

03 AMCORP 13 Idris 23 Phileo

04 Apax 14 Insas 24 PM Cap

05 BIMB 15 Jerneh 25 RHB

06 BJCAP 16 KAF 26 S Bank

07 CMS bhd 17 Kenanga 27 Suria Cap

08 Commer Z 18 MAA 28 Takaful

09 G. Cap 19 Maybank 29 UCB

10 HDBS 20 MIDF 30 UMG

Jadual 2.2Nombor Populasi 30 Syarikat

Objeknya ialah untuk mengambil sampel enam syarikat, oleh itu enam nombor dua-

digit mesti dipilih daripada jadual nombor rawak. Disebabkan populasi ini hanya

mengandungi 30 syarikat, semua nombor yang lebih besar daripada 30 (31-99) hendaklah

diabaikan. Sebagai contoh, jika 67 dipilih, proses hendaklah diteruskan sehingga nilai di

antara 1 hingga 30 diperolehi. Jika nombor yang sama diperolehi lebih dari sekali, teruskan

kepada nombor yang lain. Untuk lebih memahami, kita mulakan dengan pasangan digit

yang pertama di dalam Jadual 7.1 dan memilih disepanjang baris sehingga n = 6 nilai yang

berbeza di antara 1 hingga 30. Jika tambahan nombor diperlukan, kita teruskan ke kedua,

dan seterusnya. Biasanya penyelidik akan memulakan pada lokasi yang dipilih secara

rawak di dalam jadual dan meneruskannya kearah yang telah ditentukan untuk memilih

nombor.

Di dalam baris pertama, nombor pertama ialah 91. Nombor ini diluar jeda oleh itu ia

diabaikan. Nombor dua digit berikutnya ialah 56. Kemudian 74, diikuti 25, yang merupakan

nombor yang boleh diambil. Dari Jadual 7.3, kita lihat 25 ialah nombor yang berpadanan

dengan Syarikat RHB merupakan syarikat pertama yang dipilih kedalam sampel. Nombor

berikutnya ialah 95, juga diabaikan, diikuti 27, merupakan nombor yang boleh dipilih.

Nombor 27 merupakan nombor untuk syarikat Suria Cap. Meneruskan proses ini kita

mendapati nombor 95 dan 83. Nombor berikutnya ialah 01, merupakan nilai untuk Syarikat

Affin. Nombor 34 adalah nombor berikutnya, diikuti oleh nombor 04 dan 02, kedua-duanjya

boleh digunakan. Nombor ini adalah berpadanan dengan Syarikat Apax dan Amanah.

Meneruskan proses ini disepanjang baris, nombor berikutnya ialah 29, yang berpadanan

dengan Syarikat UCB. Oleh itu pemilihan enam sampel syarikat telah diselesaikan. Berikut

adalah syarikat yang dipilih sebagai sampel akhir:

RHB

Suria Cap

Affin

Apax

Amanah

UCB

Persampelan rawak mudah adalah senang dilakukan keatas populasi yang kecil

berbanding populasi besar. Proses meletakkan nombor kepada populasi dan memilihnya

adalah mengelirukan untuk sampel yang besar.

(b) Persampelan Rawak Berstarata

Persampelan rawak jenis kedua ialah persampelan rawak berstarata dimana populasi

adalah dibahagikan kepada sub-populasi yang tidak bertindih dipanggil sebagai starata.

Penyelidik kemudiannya akan memilih sampel rawak mudah dari setiap sub-populasi.

Sebab utama mengapa menggunakan persampelan rawak berstarata ialah kerana kaedah

ini berpotensi untuk mengurangkan ralat persampelan. Ralat persampelan terjadi apabila

melalui peluang sampel tidak mewakili populasi. Melalui persampelan rawak berstarata,

potensi untuk sepadan dengan sampel hampir kepada populasi adalah lebih berbanding

persampelan rawak mudah kerana bahagian daripada jumlah sampel adalah diambil

daripada kumpulan populasi yang berlainan. Walau bagaimanapun, persampelan rawak

berstarata adalah mahal berbanding persampelan rawak mudah kerana setiap unit populasi

mesti diletakkan di dalam starata sebelum proses pemilihan rawak dilakukan.

Pemilihan strata biasanya berdasarkan kepada maklumat yang ada. Maklumat-

maklumat tersebut mungkin diperolehi daripada kajian atau bancian yang terdahulu.

Kelebihan strata meningkat apabila strata lebih berbeza. Secara dalaman, strata hendaklah

homogen secara relatif; secara luaran pula, strata hendaklah kontras antara satu sama lain.

Strata selalunya dilakukan dengan menggunakan angkubah demografi, seperti jantina, kelas

sosioekonomi, kawasan geografi, ugama, ethnik dan sebagainya. Sebagai contoh, di dalam

memasarkan siaran radio, umur pendengar adalah penentu penting terhadap jenis program

yang disediakan oleh stesyen radio. Rajah 2.1 mengandungi strata mengikut umur yang

dibahagi kepada tiga strata, berdasarkan kepada andaian umur adalah faktor yang

menentukan citarasa terhadap program radio. Strata ini menunjukkan pendengar berumur

20 hingga 30 tahun adalah mengemari jenis program yang sama, tetapi berbeza daripada

apa yang digemari oleh pendengar yang berumur 30 – 40 tahun dan 40 – 50 tahun. Di

kalangan setiap kumpulan umur, homogeniti adalah ujud; di antara kumpulan adalah

berbeza, atau heterogeniti adalah ujud.

Rajah 2.1

Persampelan Rawak Berstrata Pendengar Radio

20-30 tahun

(homogen)

20-30 tahun

(homogen)

20-30 tahun

(homogen)

Hetrogen di antaranya

Hetrogen di antaranya

Persampelan rawak berstrata boleh jadi berkadaran atau tidak berkadaran.

Persampelan rawak berstrata berkadaran terjadi apabila peratus sampel yang diambil

daripada setiap strata adalah berkadaran dengan peratus bagi setiap strata dikalngan

populasi keseluruhan. Sebagai contoh, di Kuala Lumpur, untuk mengambil sampel dari

kaum Melayu, Cina, India dan lain-lain. Jika populasi penduduk Kuala Lumpur 60% adalah

kaum Melayu dan jika sampel yang hendak diambil ialah 1,000 orang, maka sampel Kaum

Melayu yang dipilih ialah 600 orang. Sampel kaum lain adalah mengikut kadar dari populasi

mereka. Jika kadar strata di dalam sampel adalah berbeza berbanding dengan kadar strata

di dalam populasi maka ia merupakan persampelan rawak berstrata tidak berkadaran.

(c) Persampelan Sistematik

Tidak seperti persampelan rawak mudah dan persampelan rawak berstrata, persampelan

sistematik tidak cuba untuk mengurangkan ralat persampelan. Persampelan sistematik

digunakan kerana ia selesa dan relatif mudah untuk ditadbirkan. Melalui persampelan

sistematik, setiap item k adalah dipilih untuk mengurangkan saiz sampel n dari populasi

bersaiz N. Nilai k boleh ditentukan dengan menggunakan formula. Jika k bukan nilai

integer, nombor bulat akan digunakan.

Sebagai contoh persampelan sistematik, katakan penyelidik sistem pengurusan

maklumat mahu mengambil sampel kilang di Lembah Kelang. Ia mempunyai bantuan

kewangan yang mencukupi untuk mengambil 1000 kilang (n). Direktori Perkilangan Kuala

Lumpur menyenaraikan hampir 17,000 jumlah kilang di Lembah Kelang (N) mengikut

Menentukan Nilai k

k =Nn

dimana

n = saiz sampel

N = saiz populasi

K = saiz selang untuk dipilih

susunan abjad. Nilai k ialah 17,000/1000 = 17 dan penyelidik akan memilih setiap 17 kilang

dari senarai direktori sebagai sampel.

Apakah penyelidik memilih kilang yang pertama disenaraikan atau kilang ke 17 atau

mana-mana kilang di antaranya? Di dalam memilih setiap nilai k, jadual nombor rawak

mesti digunakan untuk memilih nilai di antara 1 dan k sebagai titik awal. Unsur kedua bagi

sampel adalah adalah titik awal tambah k. Sebagai contoh, k = 17, oleh itu penyelidik pelu

mengikut jadual rawak untuk menentukan titi awal di antara 1 dengan 17. Katakan ia

memilih nombor 5. Ia kemudiannya bermula dengan kilang 5, kemudian memilih 22 (5 +

17), dan kemudian kilang ke 39 dan seterusnya.

Disamping keselesaan, persampelan sistematik mempunyai kebaikan lain.

Disebabkan persampelan sistematik bertaburan seragam disepanjang kerangka, mereka

yang berpengetahuan dengan mudah dapat menentukan samada perancangan

persampelan telah diikuti di dalam kajian. Walau bagaimanapun, masalah persampelan

sistematik boleh terjadi jika ujudnya data yang berkala, dan selang persampelan adalah di

dalam ‘syncopation’ dengannya. Sebagai contoh, jika senarai 150 pelajar sebenarnya

adalah cantuman dari lima kelas dengan 30 pelajar setiap kelas dan jika setiap senarai bagi

setiap kelas telah disusun dengan nama pelajar terbaik, sederhana dan rendah, maka

persampelan sistematik berkemungkinan memilih semua pelajar terbaik sahaja, semua

pelajar sederhana dan semua pelajar kurang baik. Metodologi persampelan sistematik

adalah berdasarkan kepada andaian bahawa sumber populasi adalah rawak.

(d) Persampelan Kelompok

Persampelan kelompok melibatkan pembahagian populasi kepada kawasan yang tidak

bertindih. Walau bagaimanapun, ia berbeza dengan persampelan rawak berstrata dimana

strata adalah homogen, sementara persampelan kelompok adalah heterogen dalamannya.

Secara teorinya, setiap kelompok mengandungi berbagai-bagai varieti unsur yang luas, dan

kluster adalah bahangian kecil bagi populasi. Contoh kelompok ialah bandar, syarikat,

rumah, universiti, kawasan perbandaran, dan kawasan geografi. Selalunya kelompok

adalah kumpulan populasi yang terjadi semulajadi dan sedia dikenalpasti, seperti negeri

atau Kawasan Majlis Bandaraya. Walaupun persampelan kawasan biasanya dirujukkan

sebagai kelompok yang merupakan kawasan populasi, seperti kawasan geografi atau

bandar, istilah persampelan kluster dan persampelan kawasan adalah digunakan silih

berganti di dalam tek ini.

Selepas memilih kelompok, penyelidik memilih secara rawak unsur individu untuk

sampel daripada kluster. Satu contoh penyelidikan perniagaan ialah menggunakan

kelompok untuk menguji pasaran barangan baru. Biasanya di dalam ujian pemasaran,

Malaysia akan dibahagikan kepada kelompok mengikut negeri, dan pelanggan individu di

kalangan pasaran bandar ujian adan dikaji. Rajah 2.1 menunjukkan pasaran bandar ujian

bagi Malaysia yang menggunakan kluster untuk menguji keluaran.

Rajah 2.1Beberapa Bandar Ujian Pemasaran

Kadangkala kelompok adalah terlalu besar, dan set kelompok yang kedua akan

dibuat daripada setiap kluster asal. Teknik ini dipanggil sebagai persampelan dua-peringkat.

Sebagi contoh, penyelidik akan membahagikan Malaysia mengikut kluster bandar. Ia

kemudiannya membahagikan bandar tersebut kepada kluster blok dan memilih secara

rawak rumah individu daripada kluster blok. Peringkat pertama ialah memilih bandar ujian

dan peringkat kedua memilih blok.

Persampelan kelompok mempunyai beberapa kebaikan. Dua daripada kebaikan

yang utama ialah selesa dan kos. Kelompok biasanya mudah diperolehi, dan kos

persampelan daripada keseluruhan populasi adalah dikurangkan kerana skop kajian telah

dikurangkan kepada kluster. Kos per unsur biasanya rendah di dalam persampelan kluster

atau kawasan di dalam kluster berbanding persampelan rawak berstrata disebabkan

penyenaraian unsur dan kos lokasi yang rendah. Masa dan kos menghubungi unsur

populasi juga dikurangkan, terutamanya jika melibatkan perjalanan disebabkan kluster

mengurangkan jarak di antara unsur sampel. Disamping itu pentabiran sampel survei boleh

diringkaskan. Kadangkala persampelan kelompok merupakan pendekan yang hanya boleh

dilakukan disebabkan kerangka persampelan bagi unsur populasi individu tidak diperolehi

dan oleh itu lain-lain teknik persampelan tidak boleh digunakan.

Persampelan kelompok juga mempunyai beberapa kelemahan. Jika unsur kluster

adalah sama, persampelan kluster mungkin secara statistik tidak cekap berbanding

persampelan rawak mudah. Di dalam kes yang lebih ekstrim, - apabila unsur kluster adalah

sama – persampelan daripada kluster mungkin tidak baik berbanding persampelann unit

tunggal daripada kluster. Selanjutnya, kos dan masalah analisis statistik adalah lebih besar

dngan persampelan kluster berbanding persampelan rawak mudah.

2.2 TABURAN PENSAMPELAN X

Di dalam bahagian ini, kita akan mengkaji min sampel, X , sebagai statistik. Min

sampel ialah statistik yang biasa digunakan di dalam statistik pentaabiran. Untuk mengira

dan menetapkan kebarangkalian terjadi sesuatu nilai bagi min sampel, penyelidik mesti

mengetahui taburan bagi min sampel. Satu cara untuk menguji taburan kebarangkalian

adalah mengambil populasi dengan taburan tertentu, memilih sampel rawak bagi saiz

tertentu, kira min sampel, dan cuba untuk menentukan bagaimana mereka bertaburan.

Katakan populasi finit yang kecil mengandungi hanya N = 8 angka:

54, 55, 59, 63, 64, 68, 69, 70

Menggunakan histogram, kita lihat bentuk taburan bagi populasi data.

Katakan kita mengambil semua kemungkinan sampel bersaiz n = 2 daripada

populasi ini dengan penggantian. Keputusannya adalah sebagaimana pasangan data

berikut:

(54,54) (55,54) (59,54) (63,54) (64,54) (68,54) (69,54) (70,54)

(54,55) (55,55) (59,55) (63,55) (64,55) (68,55) (69,55) (70,55)

(54,59) (55,59) (59,59) (63,59) (64,59) (68,59) (69,59) (70,59)

(54,63) (55,63) (59,63) (63,63) (64,63) (68,63) (69,63) (70,63)

(54,64) (55,64) (59,64) (63,64) (64,64) (68,64) (69,64) (70,64)

(54,68) (55,68) (59,68) (63,68) (64,68) (68,68) (69,68) (70,68)

(54,69) (55,69) (59,69) (63,69) (64,69) (68,69) (69,69) (70,69)

(54,70) (55,70) (59,70) (63,70) (64,70) (68,70) (69,70) (70,70)

Min bagi setiap sampel ini ialah

54.0 54.5 56.5 58.5 59.0 61.0 61.5 62.0

54.5 55.0 57.0 59.0 59.5 61.5 62.0 62.5

56.5 57.0 59.0 61.0 61.5 63.5 64.0 64.5

58.5 59.0 61.0 63.0 63.5 65.5 66.0 66.5

59.0 59.5 61.5 63.5 64.0 66.0 66.5 67.0

61.0 61.5 63.5 65.5 66.0 68.0 68.5 69.0

61.5 62.0 64.0 66.0 66.5 68.5 69.0 69.5

62.0 62.5 64.5 66.5 67.0 69.0 69.5 70.0

Sekali lagi, menggunakan histogram, kita boleh melihat bentuk taburan bagi min

sampel ini.

Perhatikan bentuk histogram bagi min sampel adalah lebih kurang sama bentuknya

histogram populasi. Min sampel kelihatannya memenuhi kearah pertengahan taburan dan

mengecil kearah hujung taburan.

Setakat ini, kita telah menguji populasi dengan taburannya. Walau bagaimanapun, min

sampel yang diambil dari populasi ini menghampiri taburan normal, terutamanya apabila

saiz sampel bertambah besar.

Teorem Had Memusat

Teorem had memusat membentuk potensi penggunaan taburan normal kepada

banyak masalah apabila saiz sampel adalah cukup besar. Min sampel yang hendak dikira

dari sampel rawak yang dipilih daripada populasi yang bertaburan normal adalah bertaburan

normal. Walau bagaimanapun, kebaikan sebenar teorem had memusat ialah bahawa

sampel data adalah diambil daripada populasi yang tidak bertaburan normal atau populasi

yang tidak diketahui bentuknya juga boleh dianalisis menggunakan taburan normal kerana

min sampel adalah bertaburan normal untuk sampel yang cukup besar saiznya. Lajur 1

Rajah 2.2 menunjukkan empat taburan populasi yang berbeza. Setiap lajur yang

bersebelahan menunjukkan bentuk taburan min sampel bagi saiz sampel yang tertentu.

Perhatikan dibaris bawah sekali bagi populasi yang bertaburan normal menunjukkan min

sampel adalah juga bertaburan normal apabila n = 2. Perhatikan juga bagi lain-lain taburan

populasi, taburan min sampel menghampiri keluk normal apabila n menjadi semangkin

besar. Bagi semua empat taburan, taburan min sampel menghampiri normal apabila n = 30.

Teorem Had Memusat

Jika sampel bersaiz n diambil secara rawak daripada populasi dan mempunyai min

dan sisihan piawai , min sampel X , adalah bertaburan normal bagi sampel saiz yang cukup besar (n 30) menurut bentuk taburan populasi. Jika populasi bertaburan normal, min sampel adalah bertaburan normal bagi sebarang saiz sampel.

Dari jangkaan matematik, ia boleh ditunjukkan bahawa min bagi min sampel ialah min populasi.

μX=μ

dan sisihan piawai bagi min sampel ialah sisihan piawai populasi dibahagikan dengan punca kuasadua saiz sampel.

σ X¿ σ√n

Rajah 2.2

Bentuk Taburan Min Sampel bagi Tiga Saiz Sampelyang diambil dari Empat Taburan Populasi yang Berbeza

2.3 ANGGARAN TITIK DAN ANGGARAN SELANG

Syarikat talipon cellular, memikirkan untuk mengubah struktur harga. Pelanggan

kelihatan sanggup untuk memperuntukkan lebih masa keatas talipon dan meninjau untuk

melihat harga yang terbaik. Untuk mendapatkan perancangan yang lebih baik, syarikat

talipon celluler mahu menentukan purata masa yang digunakan sebulan setiap pengguna

tetapi tidak mempunyai sumber yang ada untuk menguji bil pelanggan dan memperolehi

maklumat. Syarikat telah mengambil sampel 85 bil bulanan yang terbaru dan mendapati

min sampel masa panggilan ialah 153 minit. Min sampel ini adalah statistik, yang akan

digunakan untuk menganggar min populasi, yang merupakan parameter. Jika syarikat

menggunakan min sampel 153 minit sebagai penganggaran untuk min populasi, maka min

sampel tersebut ialah penganggaran titik.

Penganggaran titik ialah statistik yang diambil daripada sampel dan digunakan untuk

menganggarkan min populasi. Walau bagaimanapun, penganggaran titik ini hanya baik

sebagai perwakilan sampelnya sahaja. Jika sampel rawak yang lain diambil daripada

populasi, penganggaran titik yang diterbitkan daripada sampel tersebut adalah berlainan.

Disebabkan oleh variasi di dalam sampel statistik, penganggaran parameter populasi

dengan selang penganggaran biasanya lebih digemari untuk menggunakan penganggaran

titik. Penganggaran selang (selang keyakinan) adalah jeda nilai dimana penganalisis boleh

menyatakan dengan keyakinan tertentu dimana kedudukan parameter populasi. Selang

keyakinan boleh jadi dua atau satu bahagian.

Sebagai hasil teorem had memusat, formula Z yang berikut untuk min sampel boleh

digunakan apabila saiz sampel adalah besar, tidak kira bentuk taburan populasi, atau untuk

saiz sampel yang kecil dan bertaburan normal.

Z = X - μ

( σ√n )

Menyusun semula formula tersebut untuk menyelesaikan nilai memberikan

μ=X - Z σ√n

Disebabkan min sampel boleh jadi lebih besar daripada atau lebih kecil daripada min

populasi, Z boleh jadi positif atau negatif. Oleh itu formula di atas boleh disusun sebagai

X± Z σ√n

Menulis semula pernyataan di atas menghasilkan formula selang keyakinan untuk

menganggar dengan saiz sampel yang besar.

Alpha () adalah keluasan di bawah keluk normal dibahagian hujung taburan diluar

kawasan yang dikenalpasti sebagai selang keyakinan. Disini kita akan menggunakan

untuk mentukan nilai Z di dalam membina selang keyakinan sebagaimana ditunjukkan di

dalam Rajah 2.3. Disebabkan jadual normal piawai adalah berdasarkan keatas keluasan Z

di antara 0 dan Z/2, nilai Z adalah ditemui terletak dikawasan 0.5000 - α2 , yang merupakan

bahagian keluk normal di antara pertengahan keluk dan satu bahagian ekor. Cara lain untuk

menentukan kedudukan nilai Z ialah mengubah paras keyakinan daripada peratus kepada

perkadaran, dibahagikan dengan setengah, dan lihat semula jadual dengan nilai ini.

Keputusannya adalah sama.

Selang Keyakinan 100(1 - )% untuk Menganggar

X± Zα /2σ√n

atau

X− Zα /2σ√n

≤μ≤X+ Zα /2σ√n (8.1)

dimana

= keluasan di bawah keluk normal diluar kawasan selang keyakinan

α2 = keluasan di dalam satu ekor taburan diluar selang keyakinan

Formula selang keyakinan (2.3) menghasilkan selang yang kita rasakan yakin

dimana min populasi terletak. Adalah tidak pasti dimana min populasi terletak di dalam

selang tersebut melainkan kita mempunyai 100% selang keyakinan. Walau bagaimanapun,

kita boleh meletakkan kebarangkalian bahawa parameter (di dalam kes ini ialah ) terletak

di antara selang. Formula 2.3 boleh dinyatakan di dalam pernyataan kebarangkalian seperti

berikut:

Kebarangkalian(X− Zα /2

σ√n

≤μ≤X+ Zα /2σ√n ) = 1 -

Jika kita mahu membentuk selang keyakinan 95%, paras keyakinan ialah 95% atau

0.95. Kenyataan kebarangkalian yang ditunjukkan memberitahu kita terdapat 0.95

kebarangkalian min populasi adalah di dalam selang ini. Jika 100 selang seperti itu dibentuk

dengan mengambil sampel rawak daripada populasi, lebih kurang 95 daripada selang

tersebut melibatkan min populasi dan lima daripadanya bukan. Kebarangkalian

memberitahu kita kebolehjadian selang tertentu adalah satu yang termasuk di dalam min

populasi.

Sebagai contoh, di dalam masalah syarikat talipon cellular untuk menganggarkan

min populasi masa panggilan setiap pelanggan sebulan, bagi sampel 85 bil telah

mengenalpasti min sampel ialah 153 minit. Menggunakan min sampel ini, selang keyakinan

boleh dikira dimana penyelidik relatif yakin min populasi sebenar terletak. Untuk

melakukannya menggunakan Formula 8.1, nilai sisihan piawai populasi dan nilai Z ) sebagai

tambahan min sampel, 153, dan saiz sampel, 85) mesti diketahui. Katakan rekod lepas dan

kajian yang sama menunjukkan bahawa sisihan piawai populasi ialah 46 minit.

Nilai Z adalah ditentukan oleh paras keyakinan yang diperlukan. Selang dengan

100% keyakinan adalah terlalu luas dan tidak bermakna. Beberapa paras selang keyakinan

yang biasa digunakan oleh penyelidik adalah 95%, 95%, 98% dan 99%. Mengapakan

penyelidik tidak hanya memilih keyakinan yang tertinggi dan sentiasa menggunakan paras

tersebut? Ini disebabkan bahawa penggantian dantara saiz sampel, lebar selang, dan paras

keyakinan mesti dipertimbangkan. Sebagai contoh, apabila paras keyakinan meningkat,

selang semangkin luas, memberikan saiz sampel dan sisihan piawai tetap kekal.

Untuk masalah syarikat talipon cellular, katakan penyelidik menetapkan 90% selang

keyakinan bagi keputusannya. Rajah 2.4 menunjukkan taburan normal min sampel

berkaitan min populasi. Apabila menggunakan 90% paras keyakinan, ia telah memilih

selang tersebut dengan disekitar 95% dimana semua nilai min sampel akan jatuh dan

kemudian menggunakan lebar selang tersebut untuk membina selang disekitar min sampel

dimana ia yakin min populasi akan berada.

Untuk 95% keyakinan, = 0.05 dan α

2 = 0.025. Nilai Z/2 atay Z0.025 adalah ditemui

dengan melihat jadual taburan normal di bawah 0.5000 – 0.025 = 0.4750. Keluasan ini di

dalam jadual adalah berpadanan dengan nilai Z = 1.960. Terdapat cara lain untuk

menentukan nilai Z. Disebabkan taburan adalah simetri dan selang adalah sama dikedua-

dua belah bahagian min populasi, 12 (95 % )atau 0.4750, daripada keluasan adalah terletak

disatu bahagian min. Jadual A.3 menghasilkan nilai Z = 1.96 bagi bahagian keluk normal.

Oleh itu nilai Z untuk 95% selang keyakinan adalah sentiasa 1.96. Dengan lain perkataan,

semua kemungkinan nilai X disepanjang paksi mendatar rajah, 95% daripadanya

sepatutnya disekitar skor Z =1.96 daripada min populasi.

Penyelidik sekarang boleh melengkapkan masalah syarikat talipon cellular. Untuk

mencari 95% selang keyakinan bagi X = 153, = 46, n = 85 dan Z = 1.96, ia

menganggarkan purata masa panggilan dengan melibatkan nilai Z di dalam Formula 8.1

adalah.

153 - 1 .96 (46√85 )≤μ≤ 153 + 1 . 96 (46

√85 )153 – 9.78 153 + 9.78

143.22 162.78

Selang keyakinan ini dibina daripada penganggaran titik, dimana di dalam masalah

ini ialah 153 minit, dan ralat bagi penganggaran ini ialah 9.78 minit. Keputusan selang

keyakinan ialah 143.22 162.78. Penyelidik syarikat talipon cellular ini 95% yakin

bahawa purata masa panggilan untuk populasi ialah di antara 143.22 dan 162.78 minit.

95% keyakinan menunjukkan bahawa, jika penyelidik syarikat mengambil 100

sampel mengandungi 85 panggilan secara rawak dan menggunakan keputusan bagi setiap

sampel dan menjalankan 95% selang keyakinan, hampir 95 daripada 100 selang tersebut

akan mengandungi min populasi. Ia juga menunjukkan 5% daripada selang tidak

mengandungi min populasi. Penyelidik hanya perlu mengambil satu sampel dan mengira

selang keyakinan daripada maklumat sampel tersebut. Selang tersebut sama ada

mengandungi min populasi atau tidak.

Menganggar min populasi apabila sisihan piawai bagi populasi diketahui

Contoh 1Satu kajian telah dilakukan kepada syarikat di Malaysia yang menjalankan kajian di Cina.

Satu daripada soalan ialah: Telah berapa lamakah syarikat anda menjalankann perniagaan

dengan Cina? Satu sampel rawak 44 syarikat telah dipilih menghasilkan min 10.455 tahun.

Katakan sisihan piawai populasi bagi soalan ini ialah 7.7 tahun. Menggunakan maklumat ini,

jalankan selang keyakinan 90% min bilangan tahun syarikat di Malaysia telah menjalankan

perniagaan di Cina bagi populasi syarikat Malaysia yang menjalankan perniagaan di Cina.

Penyelesaian

Disini, n = 44, X = 10.455. dan = 7.7. Untuk menentukan nilai Z/2, bahagikan selang

keyakina 90% dengan dua atau 0.05 - α

2 = 0.500 – 0.0500. Taburan Z bagi X disekitar

mengandungi 0.4500 daripada kawasan sisetiap bahagian , atau (12 ) (90 % ) . Jadual A.3

menghasilkan nilai Z = 1.645 bagi keluasan 0.4500 (interpolasi di antara 0.4495 dan

0.4505). Selang keyakinan ialah

X - Z ( σ√n )≤ μ≤X+ Z ( σ

√n )10 .455 - 1 .645 ( 7 .7

√44 )≤μ≤ 10 . 455 + 1. 645( 7 . 7√44 )

10.455 – 1.91 10.455 + 1.91

8.545 12.365

Kebarangkalian (8.545 12.365 = 0.90

Oleh itu, penganalisis mempunyai keyakinan 90% menyatakan jika bancian terhadap

syarikat Malaysia yang menjalankan perniagaan di Cina diambil pada masa survei ini, min

populasi sebenar lama mereka menjalankan perniagaan di Cina adalah di antara 8.545 dan

12.365. Titik penganggaran ialah 10.455.

Contoh 2 Satu kajian telah dilakukan di dalam syarikat yang mempunyai 800 jurutera. Sampel rawak

50 jurutera ini mendapati purata umur sampel ialah 34.3 tahun. Rekod lama mendapati

sisihan piawai umur jurutera syarikat ialah 8 tahun. Lakukan selang keyakinan 98% untuk

menganggar unur semua jurutera di dalam syarikat ini.

Penyelesaian

Masalah ini ialah masalah finit. Saiz sampel, 50 adalah lebih besar daripada 5% populasi,

oleh itu faktor pembetulan perlu dilakukan. Di dalam kes ini N = 800, n = 50, X = 34.3 dan

= 8. Nilai Z bagi 98% selang keyakinan ialah 2.33 (0.98 dibahagi 2 menghasilkan 0.4900;

Nilai Z adalah diperolehi daripada Jadual A.3 dengan menggunakan 0.4900).

Menggantikannya kedalam Formula 8.2 dan menyelesaikan untuk selang keyakinan

memberikan

34 . 3 - 2 .33 ( 8√50 )(√750

799 )≤μ≤ 34 . 3 + 2 .33 ( 8√50 )(√750

799 )34.3 – 2.554 34.3 + 2.554

31.75 36.85

Tanpa faktor pembetulan finit, keputusannya adalah

34.3 – 2.64 34.3 + 2.64

31.66 36.94

Faktor pembetulan finit mengambil kira kenyataan bahawa populasi hanya 800 berbanding

infiniti. Sampel, n = 50 adalah perkadaran yang besar daripada 800 yang sepatutmua

populasi yang besar, dan oleh itu lebar selang keyakinan adalah dikurangkan.

Menganggar min dan sisihan piawai bagi populasi daripada data sampel

Contoh

Syarikat pakaian mengeluarkan jean untuk lelaki. Jean tersebut dibuat dan dijual sama ada

potongan biasa atau potongan ‘boot’. Dalam usaha untuk menganggar perkadaran pasaran

jean lelaki tersebut di Kuala Lumpur untuk jean potongan ‘boot’, penganalisis mengambil

sampel rawak 212 jean yang dijual oleh syarikat tersebut dari dua kedai di Kuala Lumpur.

Hanya 34 daripada jualan adalah jean potongan ‘boot’. Jalankan 90% selang keyakinan

untuk menganggar perkadaran populasi di Kuala Lumpur yang mengemari jean potongan

‘boot’.

PenyelesaianSampel saiz ialah 212, dan bilangan yang mengemari jean potongan ‘boot’ ialah 34.

Perkadaran sampel ialah p¿̂

¿= 34/212 = 0.16. Titik penganggaran bagi jean potongan ‘boot’

di dalam populasi ialah 0.16 atau 16%. Nilai Z untuk 90% selangan keyakinan ialah 1.645,

dan nilai p¿̂

¿ = 0.16 dan q¿̂

¿ = 1 – p¿̂

¿ = 1 – 0.16 = 0.84. Selang keyakinan yang dianggarkan

ialah

0 .16 - 1. 645 √(0 .16 )(0. 84 )212

≤ P ≤ 0 . 16 + 1 . 645 √ (0 .16 )(0 . 84 )212

0.16 – 0.04 P 0.16 + 0.04

0.12 P 0.20

Kebarangkalian (0.12 P 0.20) = 0.90

Anggaran penganalisis dengan kebarangkalian 0.90 bahawa perkadaran populasi

pembelian jean potongan ‘boot’ adalah di antara 0.12 dan 0.20. Paras selang keyakinan

ialah 90%.

Menganggar min populasi berdasarkan saiz sampel yang kecil

Taburan t

Gosset telah membangunkan taburan t, yang mana menerangkan sampel data di

dalam sampel bersaiz kecil apabila sisihan piawai tidak diketahui dan populasi bertaburan

normal. Formula bagi nilai t ialah:

t = X - μ

( S√n )

Taburan t sebenarnya adalah siri taburan disebabkan setiap saiz sampel mempunyai

taburan yang berbeza, oleh itu membuatkan banyak potensi jadual t. Untuk menjadikan nilai

t ini lebih bermakna, hanya nilai utama sahaja dipilih dan dibentangkan; setiap barisan di

dalam jadual mengandungi nilai daripada taburan t yang berbeza. Andaian disebalik

penggunaan teknik yang dibincangkan di dalam buku ini adalah untuk saiz sampel yang

kecil dan populasi adalah bertaburan normal. Jika populasi tidak bertaburan normal atau

tidak diketahui, teknik tidak berparameter perlu digunakan.

Ciri-ciri Tabutan t

Rajah 2.5 menunjukkan dua taburan t di atas taburan normal piawai. Sebagaimana

taburan normal, taburan t juga simetri, unimodel dan keluarga kepada keluk. Taburan t lebih

rata dipertengahan dan mempunyai lebih keluasan dihujung ekornnya berbanding dengan

taburan normal.

Menguji nilai taburan t mendapati taburan t menghampiri keluk taburan normal

apabila n menjadi semangkin besar. Taburan t adalah taburan yang bersesuaian untuk

digunakan pada sebarabng masa varian dan sisihan piawai populasi tidak diketahui, walau

apa pun saiz sampel. Walau bagaimanapun, disebabkan perbezaan di antara nilai jadual Z

dan t tidak berubah apabila sampel menjadi besar, kebanyakan penyelidik menggunakan

taburan Z untuk menganalisis sampel bersaiz besar apabila sisihan piawai atau varian tidak

diketahui. Di dalam buku ini, taburan t adalah digunakan hanya untuk masalah bersaiz kecil

(n < 30) disebabkan n menghampiri saiz 30 niali jadual t menghampiri nilai jadual Z.

Rajah 2.5

Perbandingan dua taburan t denga keluk normal piawai

Keluk normal piawai

Keluk t (n=25)Keluk t (n=10)

Selang Keyakinan unruk Menganggar :

Sampel Kecil dan Tidak Diketahui

X± tα /2,n-1S√n

X - tα /2,n-1S√n

≤μ≤X+ tα /2,n-1S√n

df = n - 1

KKP Nota MTE 3053 (TAJUK 2: TEORI PENSAMPELAN DAN ANGGARAN)

Documents

Transcript of KKP Nota MTE 3053 (TAJUK 2: TEORI PENSAMPELAN DAN ANGGARAN)