Post on 15-Nov-2015
description
REGRESI BERGANDA BINARY (LOGISTIC REGRESSION)
Regresi logit atau regresi logistic adalah model regresi yang
dipergunakan untuk mengukur pengaruh probabilitas atas
suatu peristiwa. Logaritma dari perbandingan suatu peristiwa
terjadi dengan tidak terjadi tersebut sebagai logit. Secara
umum persamaan regresi logit untuk satu variabel bebas
dapat dijelaskan sebagai berikut :
1101ln Xpp
Persamaan regresi logit untuk lebih dari satu variabel bebas,
dapat dijelaskan dalam persamaan berikut :
Keterangan:
nnXBXXpp ...........1ln 22110
ln[p/(1 p)} = Z = variabel dependen dengan skala nominal
0= konstanta; i= koefisien regresi
Xi= variabel bebas dengan data metrik maupun non-metrik
Karena variabel independen merupakan campuran antara variabel kontinyu (metrik) dan kategorikal (non-metrik), dalam regresi logistik tidak diperlukan asumsi normalitas data pada variabel independennya.
Jadi, regresi logistik umumnya digunakan jika asumsi multivariat, yaitu data harus berdistribusi normal, tidak terpenuhi.
* Logistic Regression bertujuan untuk mempredisksi besar variabel dependen yang
berupa variabel binary dengan menggunakan
data variabel independen yang sudah
diketahui besarnya.
Variabel binary adalah suatu variabel yang menggunakan data nominal.
Contoh: 1 = pria 2 = wanita
**Manajer PT. ANTIKKN ingin mengetahui faktor-faktor apakah yang memengaruhi konsumen
dalam menentukan spesifikasi pembelian.
*Untuk menjawab pertanyaan di atas, manajer melakukan kajian pustaka dan berhasil
mengidentifikasi faktor-faktor yang diduga
berpengaruh terhadap spesifikasi pembelian,
antara lain, X1 s.d. X7.
*Data hasil riset disimpan dalam file Hatco.
**Buka file Hatco. *Dari menu utama SPSS, pilih menu Analyze,
Regression, dan binary logistic.
*Pada isian Dependent, pilih variabel X11 . *Covariate, masukkan variabel-variabel X1 s.d.
X7.
*Option, aktifkan pilihan Hosmer-Lemeshow goodness of fit dan Iteration history.
*Klik OK untuk menjalankan SPSS.
Analysis: 1. Menilai kelayakan model regresi
Lihat output dari Hosmer dan Lemeshow.
Hipotesis:
H0: Tidak ada perbedaan antara klasifikasi
yang diprediksi dengan klasifikasi yang
diamati.
H1: Ada perbedaan antara klasifikasi yang
diprediksi dengan klasifikasi yang diamati.
Dasar pembuatan keputusan - Jika nilai. Sig > 0,05, H0 diterima
- Jika nilai. Sig < 0,05, H0 ditolak
Keputusan: Hasil uji Hosmer-lemeshow diperoleh nilai Sig 0,976. Karena
nilai Sig > 0,05, H0 diterima. Artinya, model regresi binary
layak dipakai untuk analisis selanjutnya karena tidak ada
perbedaan antara klasifikasi yang diprediksi dengan
klasifikasi yang diamati.
*Pengujian dilakukan dengan membandingkan nilai antara -2 Log Likelihood pada awal (Block Number=0) dengan nilai -2 Log Likelihood pada akhir (Block Number=1) .
*Terdapat penurunan nilai likelihood. Artinya, model yang dihipotesiskan fit dengan data.
-2 log Likelihood
Awal (Block Number = 0) Akhir (Block Number = 1)
134,602 24,759
*Kemampuan prediksi model regresi dinilai dengan menggunakan nilai chi-square goodness-of-fit dalam Tabel Omnibus Test Of Model Coefficients.
*Nilai chi-square 109,844 dengan Sig. 0,000. *Karena Sig. < 0,05, berarti variabel independen yang
dimasukkan dalam model akan menambah kemampuan prediksi model regresi logistik.
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 109.844 7 .000
Block 109.844 7 .000
Model 109.844 7 .000
*Koefisien determinasi ditunjukkan dengan koefisien Cox&Snell R2 dan Negelkerke R2.
*Koefisien berkisar antara 0 dan 1. Semakin mendekati 1 semakin besar kemampuan variabel independen dalam menjelaskan variabilitas variabel dependen.
Model Summary
Step -2 Log likelihood Cox & Snell R
Square Nagelkerke R
Square 1 24.759a .667 .901
a. Estimation terminated at iteration number 9 because parameter estimates changed by less than ,001.
5.Menguji koefisien regresi Untuk menentukan signifikansi konstanta dan setiap variabel
independen, dilakukan uji t.
Hasil uji t dapat dilihat dalam tabel Variable in the Equation. Hipotesis: H0: Koefisien regresi tidak signifikan
H1: Koefisien regresi signifikan
Keputusan: Jika nilai Sig. > 0,05, H0 diterima
Jika nilai Sig. < 0,05, H1 ditolak
Variables in the Equation
B S.E. Wald df Sig. Exp(B) Step 1a x1 -1.164 5.055 .053 1 .818 .312
x2 -1.571 5.007 .098 1 .754 .208
x3 2.231 .874 6.522 1 .011 9.310
x4 -2.100 1.758 1.427 1 .232 .122
x5 5.141 10.425 .243 1 .622 170.887
x6 5.086 2.981 2.911 1 .088 161.805
x7 -3.349 1.079 9.630 1 .002 .035
Constant -1.552 5.313 .085 1 .770 .212
a. Variable(s) entered on step 1: x1, x2, x3, x4, x5, x6, x7.
* Dari tabel tersebut terlihat variabel X3 (price flexibility) dan X7 (product quality) yang berpengaruh terhadap X11
(specification buying), sedangkan variabel lain tidak.
Penafsiran hasil Cara penafsiran koefisien regresi logistik adalah dengan
pendekatan probabilitas.
Angka (-), dianggap probabilitas 0. Angka (+) >1, dianggap probabilitas 1. Angka (+) di antara 0 s.d. 1 probabilitas sesuai dengan angka
masing-masing.
Contoh:
*Koefisien X3 sebesar 2,231 menunjukkan bahwa setiap perubahan 1 unit dalam X3, probabilitas konsumen melakukan
specification buying bertambah 100%.
*Sebaliknya, Koefisien X7 sebesar -3,35 menunjukkan bahwa setiap perubahan 1 unit dalam X7, probabilitas konsumen
melakukan specification buying berkurang 100%.
Classification Tablea
Observed
Predicted
Specification buying Percentage
Correct use of
specification buying
employs total value
analysis Step 1 Specification
buying use of specification buying
38 2 95,0
employs total value analysis 2 58 96,7
Overall Percentage 96,0
a. The cut value is ,500