Statistik Non Parametrik

download Statistik Non Parametrik

of 11

Transcript of Statistik Non Parametrik

STATISTIK NONPARAMETRIK: Aplikasi Dalam Bidang Sosial Ekonomi Pertanian

BAB 1STATISTIK PARAMETRIK DAN NONPARAMETRIK1.1. Pembagian Ilmu Statistik Secara garis besar ilmu statistik dibagi menjadi 2 bagian, yaitu: 1. Statistik parametrik Statistik parametrik adalah ilmu statistik yang digunakan untuk data-data yang memiliki sebaran normal. Jika data tidak menyebar normal maka metode statistik nonparametrik dapat digunakan. Apa yang dapat dilakukan jika data tidak menyebar normal, namun statistik parametrik ingin tetap digunakan. Untuk kasus ini data sebaiknya ditransformasikan terlebih dahulu. Transformasi data perlu dilakukan agar data mengikuti sebaran normal. Transformasi dapat dilakukan dengan mengubah data ke dalam bentuk logaritma natural, menggunakan operasi matematik (membagi, menambah, atau mengali dengan bilangan tertentu), dan mengubah skala data dari nominal menjadi interval. Contoh metode statistik parametrik diantaranya adalah uji-z (1 atau 2 sampel), uji-t (1 atau 2 sampel), korelasi pearson, perancang percobaan (2-way ANOVA), dan lain-lain. 2. Statistik nonparametrik Statistik nonparametrik disebut juga statistik bebas sebaran.

1

Bab 1. Statistik Parametrik dan Nonparametrik

Statistik nonparametrik tidak mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik dapat digunakan pada data yang memiliki sebaran normal atau tidak. Statistik nonparametrik biasanya digunakan untuk melakukan analisis pada data nominal atau ordinal. Contoh metode statistik nonparametrik diantaranya adalah Chisquare test, Median test, Friedman test, dan lain-lain. 1.2. Langkah-Langkah Pemilihan Metode Statistik Kapan metode statistik nonparametrik digunakan? Metode pengujian ini digunakan bila salah satu syarat dalam statistik parametrik tidak terpenuhi. Syarat-syarat yang perlu diperhatikan untuk menentukan statistik apa yang akan digunakan dalam analisis, yaitu: 1. Apakah distribusi data diketahui? Jika distribusi data tidak diketahui maka statistik yang sesuai adalah statistik nonparametrik. Jika distribusi data diketahui, maka kita harus melihat jenis distribusi data tersebut. 2. Apakah data berdistibusi normal? Jika data tidak berdistribusi normal, maka statistik yang sesuai adalah statistik nonparametrik. Jika data berdistribusi normal, maka statistik yang sesuai adalah statistik parametrik. 3. Apakah sampel ditarik secara random? Jika sampel tidak ditarik secara random, maka statistik yang sesuai adalah statistik nonparametrik. Jika sampel ditarik secara random, maka statistik yang sesuai adalah statistik parametrik. 4. Apakah varians kelompok sama? Jika varians kelompok tidak sama, maka statistik yang sesuai adalah statistik nonparametrik. Jika varians kelompok sama, maka statistik yang sesuai adalah statistik parametrik.

2

STATISTIK NONPARAMETRIK: Aplikasi Dalam Bidang Sosial Ekonomi Pertanian

5. Bagaimana jenis skala pengukuran data? Jika skala pengukuran data nominal dan ordinal, maka statistik yang sesuai adalah statistik nonparametrik. Jika skala pengukuran data interval dan rasio, maka statistik yang sesuai adalah statistik parametrik. Langkah-langkah pemilihan metode statistik dapat dilihat pada Gambar 1.Distribusi populasi diketahui ?? Ya Distribusi populasi normal ?? Ya Sampel ditarik secara random ?? Ya Varians kelompok sama ?? Ya Interval dan Rasio Nominal dan Ordinal

Data

Tidak

Tidak

Tidak

STATISTIK NONPARAMETRIK

Tidak

STATISTIK PARAMETRIK

Skala pengukuran ??

Gambar 1. Bagan Alur Langkah-Langkah Pemilihan Metode Statistik 3

Bab 1. Statistik Parametrik dan Nonparametrik

Selain sebaran, salah satu indikator penggunaan metode statistik parametrik atau nonparametrik adalah jenis data. Distribusi normal merupakan bagian dari distribusi probabilitas yang kontinyu (continuous probability distribution), karena itu skala pengukurannya pun haruslah kontinyu. Jenis data yang memiliki skala pengukuran yang kontinyu adalah data rasio dan interval. Karena dalam pemilihan metode statistik jenis data merupakan salah satu indikator, maka perlu dijelaskan kembali pengertian dan jenis-jenis data. 1.3. Data dan Jenis-Jenis Data Data adalah ukuran dari variabel. Data diperoleh dengan mengukur nilai satu atau lebih variabel dalam sampel (atau populasi). Data dapat diklasifikasikan menurut jenis, menurut dimensi waktu, dan menurut sumbernya. 1.3.1. Data Menurut Jenis Menurut jenisnya, data terdiri dari data kuantitatif dan data kualitatif. a. Data kuantitatif adalah data yang diukur dalam suatu skala numerik (angka). Data kuantitatif dapat dibedakan menjadi: - Data interval, yaitu data yang diukur dengan jarak di antara dua titik pada skala yang sudah diketahui. Sebagai contoh: IPK mahasiswa (interval 0 hingga 4); usia produktif (interval 15 hingga 55 tahun); suhu udara dalam Celcius (interval 0 hingga 100 derajat). Data rasio, yaitu data yang diukur dengan suatu proporsi. Sebagai contoh: persentase jumlah pengangguran di Propinsi Sumatera Utara; tingkat inflasi Indonesia pada tahun 2000; Gini rasio; persentase penduduk miskin di Sumatera Utara; pertumbuhan ekonomi Sumatera Utara. 4

STATISTIK NONPARAMETRIK: Aplikasi Dalam Bidang Sosial Ekonomi Pertanian

b. Data kualitatif, adalah data yang tidak dapat diukur dalam skala numerik. Namun karena dalam statistik semua data harus dalam bentuk angka, maka data kualitatif umumnya dikuantifikasi agar dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasifikasikan data dalam bentuk kategori. Data kualitatif dapat dibedakan menjadi: - Data nominal, yaitu data yang dinyatakan dalam bentuk kategori. Sebagai contoh, industri di Indonesia oleh Biro Pusat Statistik digolongkan menjadi: Industri rumah tangga, dengan jumlah tenaga kerjanya 14 orang, yang diberi kategori 1. Industri kecil, dengan jumlah tenaga 5-19 orang, yang diberi kategori 2. Industri menengah, dengan jumlah tenaga kerja 20-100 orang, yang diberi kategori 3. Industri besar, dengan jumlah tenaga kerja lebih dari 100 orang, yang diberi kategori 4. Angka yang menyatakan kategori ini menunjukkan bahwa posisi data sama derajatnya. Dalam contoh di atas, angka 4 tidak berarti industri besar nilainya lebih tinggi dibanding industri kecil yang angkanya 1. Angka ini sekedar menunjukkan kode kategori yang berbeda. Data ordinal, yaitu data yang dinyatakan dalam bentuk kategori, namun posisi data tidak sama derajatnya karena dinyatakan dalam skala peringkat. Sebagai contoh, tingkat kosmopolitan petani suatu daerah diketegorikan: Sangat rendah diberi kode 1. Rendah diberi kode 2. Sedang diberi kode 3. Tinggi diberi kode 4. Sangat tinggi diberi kode 5. 5

Bab 1. Statistik Parametrik dan Nonparametrik

Dalam contoh di atas, angka 5 menunjukkan tingkat kosmopolitan yang tertinggi (besar nilainya lebih tinggi dibanding dengan tingkat 4, 3, 2, dan 1). Angka ini menunjukkan kode kategori dan nilai/derajat yang berbeda. 1.3.2. Data Menurut Dimensi Waktu Menurut dimensi waktu, data dapat digolongkan menjadi: a. Data runtut waktu (time-series), yaitu data yang secara kronologis disusun menurut waktu. Data runtut waktu digunakan untuk melihat perubahan dalam rentang waktu tertentu. Variasi antar variabel terjadi karena adanya perbedaan waktu. Data runtut waktu dibedakan menjadi: - Data harian, misalnya data Indeks Harga Saham setiap hari, data harga sembilan bahan-bahan pokok. - Data mingguan, misalnya data perkembangan harga beras dalam satu minggu (7 hari). Data bulanan, misalnya data tingkat inflasi, data suku bunga Bank Indonesia. Data kuartalan, misalnya data Produk Domestik Bruto suatu Negara. Data tahunan, misalnya data pendapatan nasional setiap tahun (12 bulan).

b. Data silang tempat (cross-section), yaitu data yang dikumpulkan pada suatu titik waktu. Data silang tempat digunakan untuk mengamati perilaku dalam periode yang sama. Variasi variabel terjadi karena adanya perbedaan antar pengamatan. Data ini biasanya lebih sesuai untuk mendukung penelitian atau kajian-kajian perilaku individu, perusahaan, atau wilayah. Misalnya: Data Sensus yang diterbitkan setiap 10 tahun sekali. Sebagai contoh: sensus penduduk untuk setiap kabupaten

6

STATISTIK NONPARAMETRIK: Aplikasi Dalam Bidang Sosial Ekonomi Pertanian

pada tahun 2000; sensus ekonomi dari setiap perusahaan di setiap kabupaten pada tahun 1996. - Data jumlah penduduk miskin pada setiap desa di Propinsi Sumatera Utara pada tahun tertentu. - Data pendapatan petani jagung pada suatu daerah tertentu. c. Data pooling, adalah kombinasi antara data runtut waktu dan silang tempat. 1.3.3. Data Menurut Sumbernya Berdasarkan sumbernya, data dapat digolongkan menjadi: a. Data internal dan data eksternal. Data internal yaitu data yang bersumber dari dalam organisasi. Data eksternal yaitu data yang bersumber dari luar organisasi. b. Data primer dan data sekunder. Data primer adalah data yang diperoleh melalui survey lapangan dengan menggunakan metode pengumpulan data tertentu. Data sekunder adalah data yang telah dikumpulkan oleh lembaga pengumpul data dan dipublikasikan kepada masyarakat pengguna data. Data sekunder akan lebih mempermudah dan mempercepat jalannya penelitian. Namun karena umumnya data sekunder dimaksudkan untuk konsumen peneliti dalam jumlah besar, seringkali data yang tersedia tidak sesuai benar dengan keinginan peneliti. Hal yang sering dikeluhkan apabila kita menggunakan data sekunder adalah: (1) ragam data statistik yang tersedia semakin banyak tetapi kelompok data yang dibutuhkan bagi suatu studi sering tidak cukup; (2) konsistensi dari data runtut waktu tidak selalu dapat dipertahankan; (3) angka-angka mengenai masalah tertentu yang dikeluarkan oleh berbagai sumber resmi tidak konsisten satu sama lain. Uji reliabilitas data, penyederhanaan, 7

Bab 1. Statistik Parametrik dan Nonparametrik

agregasi, dan penyesuaian mutlak diperlukan agar diperoleh hasil yang dapat dipertanggungjawabkan. Bagan klasifikasi data dapat dilihat pada Gambar 2. Interval Kuantitatif Rasio

Nominal Kualitatif Ordinal Runtut waktu Data Dimensi waktu Silang tempat Pooling

Internal Eksternal Sumber Primer Sekunder

Gambar 2. Bagan Klasifikasi Data 8

STATISTIK NONPARAMETRIK: Aplikasi Dalam Bidang Sosial Ekonomi Pertanian

1.4. Statistik Parametrik Parametrik berarti parameter. Parameter adalah indikator dari suatu distribusi hasil pengukuran. Indikator dari distribusi pengukuran berdasarkan statistik parametrik digunakan untuk parameter dari distribusi normal. Apa yang dimaksud dengan distribusi normal? Bagaimana mengetahui sebuah data berdistribusi normal atau tidak? Hal ini penting sekali untuk diketahui karena berdasarkan normal atau tidaknya distribusi ini baru dapat ditentukan apakah uji statistik parametrik atau nonparametrik yang digunakan. Distribusi normal dikenal juga dengan istilah Gaussian Distribution. Distribusi normal mengandung dua parameter, yaitu rata-rata (mea n =m) dan ragam (varians =s2). Parameter-parameter ini memberikan karakteristik yang unik pada suatu distribusi berdasarkan lokasi-nya (central tendency). Berbagai metode statistik mendasarkan perhitungannya pada kedua parameter tersebut. Penggunaan metode statistik parametrik mengikuti prinsipprinsip distribusi normal. Prinsip-prinsip dari distribusi normal adalah: a. Distribusi dari suatu sampel yang dijadikan obyek pengukuran berasal dari distribusi populasi yang diasumsikan terdistribusi secara normal. b. Sampel diperoleh secara random, dengan jumlah sampel yang dianggap dapat mewakili populasi. c. Distribusi normal merupakan bagian dari distribusi probabilitas yang kontinyu (continuous probability distribution). Impilkasinya, skala pengukuran pun harus kontinyu. Skala pengukuran yang kontinyu adalah skala rasio dan interval. Kedua skala ini memenuhi syarat untuk menggunakan uji statistik parametrik. 9

Bab 1. Statistik Parametrik dan Nonparametrik

Bila syarat-syarat ini semua terpenuhi, maka metode statistik parametrik dapat digunakan. 1.5. Statistik Nonparametrik Istilah nonparametrik pertama kali digunakan oleh Wolfowitz, pada tahun 1942. Metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistik parametrik, terutama yang berkaitan dengan distribusi normal. Istilah lain yang sering digunakan untuk statistik nonparametrik adalah statistik bebas distribusi (distribution-free statistics) dan uji bebas asumsi (assumption-free test). Statistik nonparametrik banyak digunakan pada penelitian-penelitian sosial. Data yang diperoleh dalam penelitian sosial pada umunya berbentuk kategori atau berbentuk rangking. Uji statistik nonparametrik ialah suatu uji statistik yang tidak memerlukan adanya asumsi-asumsi mengenai sebaran data populasi. Uji statistik ini disebut juga sebagai statistik bebas sebaran (distribution free). Statistik nonparametrik tidak mensyaratkan bentuk sebaran parameter populasi berdistribusi normal. Statistik nonparametrik dapat digunakan untuk menganalisis data yang berskala nominal atau ordinal karena pada umumnya data berjenis nominal dan ordinal tidak menyebar normal. Dari segi jumlah data, pada umumnya statistik nonparametrik digunakan untuk data berjumlah kecil (n < 30). 1.6. Keunggulan Statistik Nonparametrik Keunggulan statistik nonparametrik diantaranya: 1. Asumsi dalam uji-uji statistik nonparametrik relatif lebih longgar. Jika pengujian data menunjukkan bahwa salah satu atau beberapa asumsi yang mendasari uji statistik parametrik 10

STATISTIK NONPARAMETRIK: Aplikasi Dalam Bidang Sosial Ekonomi Pertanian

(misalnya mengenai sifat distribusi data) tidak terpenuhi, maka statistik nonparametrik lebih sesuai diterapkan dibandingkan statistik parametrik. 2. Perhitungan-perhitungannya dapat dilaksanakan dengan cepat dan mudah, sehingga hasil penelitian segera dapat disampaikan. 3. Untuk memahami konsep-konsep dan metode-metodenya tidak memerlukan dasar matematika serta statistika yang mendalam. 4. Uji-uji pada statistik nonparametrik dapat diterapkan jika kita menghadapi keterbatasan data yang tersedia, misalnya jika data telah diukur menggunakan skala pengukuran yang lemah (nominal atau ordinal). 5. Efisiensi statistik nonparametrik lebih tinggi dibandingkan dengan metode parametrik untuk jumlah sampel yang sedikit. 1.7. Keterbatasan Statistik Nonparametrik Disamping keunggulan, statistik nonparametrik juga memiliki keterbatasan. Beberapa keterbatasan statistik nonparametrik antara lain: 1. Jika asumsi uji statistik parametrik terpenuhi, penggunaan uji nonparametrik meskipun lebih cepat dan sederhana, akan menyebabkan pemborosan informasi. 2. Jika jumlah sampel besar, tingkat efisiensi nonparametrik relatif lebih rendah dibandingkan dengan metode parametrik. 3. Statistik nonparametrik tidak dapat dipergunakan untuk membuat prediksi (peramalan).

11