LAPORAN PRAKTIKUM
METODE REGRESI
Modul 2
ANALISIS REGRESI BERGANDA PADA DATA
JUMLAH PENDUDUK MISKIN DAN FAKTOR-
FAKTOR YANG MEMPENGARUHI DI
INDONESIA PADA TAHUN 2013
Oleh :
Miranda Ita Febrina
1314030024
Zainal Abidin
1314030068
Asisten Dosen :
Mei Rizka Shovalina
Program Studi Diploma III
Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember
Surabaya
2015
ii
ABSTRAK
Penelitian yang menggunakan data populasi besar sangat sulit dilakukan. Untuk menyelesaikan masalah tersebut biasanya seorang peneliti menggunakan sebagian kecil dari populasi yakni sampel sebagai bahan untuk penelitian. Uji regresi linear berganda dilakukan menggunakan konsep hubungan antara variabel prediktor (x) yang jumlahnya lebih dari satu yaitu x1 dan x2 serta variabel respon (y). Analisis regresi linier berganda bertujuan untuk mengetahui korelasi, pengujian signifikansi parameter, dan koefisien determinasi dari variabel prediktor dan parameter tersebut terletak ada metode regresi. Dalam praktikum ini digunakan data sekunder yaitu jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun
2013. TAMBAHKAN LAGI YA NAL DARI KESIMPULAN DI BAB 5 Kata kunci : IIDN, Korelasi,Regresi Linear Berganda, Statistika Deskriptif,, Uji Parsial, Uji Serentak,
ii
DAFTAR ISI
HalamanHALAMAN JUDUL...............................................................................................i
ABSTRAK..............................................................................................................ii
DAFTAR ISI.........................................................................................................iii
DAFTAR TABEL...................................................................................................v
DAFTAR GAMBAR.............................................................................................vi
BAB I PENDAHULUAN
1.1 Latar Belakang....................................................................................1
1.2 Rumusan Masalah...............................................................................1
1.3 Tujuan Penelitian................................................................................2
1.4 Manfaat Penelitian..............................................................................2
1.5 Batasan Masalah.................................................................................3
BAB II TINJAUAN PUSTAKA
2.1 Karakteristik Data.................................................................................
2.2 Hubungan Antar Variabel.....................................................................
2.3 Regresi Linear Berganda.......................................................................
2.4 Uji Serentak..........................................................................................
2.5 Uji Parsial..............................................................................................
2.6 Pemeriksaan Asumsi IIDN...................................................................
2.7 Penduduk Miskin..................................................................................
BAB III METODOLOGI PENELITIAN
3.1 Sumber Data..........................................................................................
3.2 Variabel Penelitian................................................................................
3.3 Langkah Analisis Data..........................................................................
3.4 Diagram Alir.........................................................................................
BAB IV ANALISIS DATA DAN PEMBAHASAN
4.1 Karakteristik Data.................................................................................
4.2 Korelasi.................................................................................................
4.3 Analisis Regresi Linear Sederhana.......................................................
4.3.1 Model Analisis Regresi Linear Sederhana...................................
4.3.2 Pengujian Parameter Regresi secara Serentak.............................
4.3.3 Pengujian Parameter Regresi secara Parsial................................
4.4 Pemeriksaan Asumsi Residual..............................................................
4.4.1 Pemeriksaan Asumsi Residual Identik.........................................
4.4.2 Pemeriksaan Asumsi Residual Independen.................................
4.4.3 Pemeriksaan Asumsi Residual Berdistribusi Normal..................
BAB V KESIMPULAN
5.1 Kesimpulan...........................................................................................
5.2 Saran.....................................................................................................
DAFTAR PUSTAKA
LAMPIRAN
DAFTAR TABEL
Tabel 3.1 Variabel Penelitian....................................................................................
DAFTAR GAMBAR
Halaman
Gambar 3.1 Diagram Alir.....................................................................................11
DAFTAR LAMPIRAN
BAB IPENDAHULUAN
1.1 Latar Belakang
Analisis regresi linier berganda adalah analisis yang menggunakan konsep
hubungan antara variabel prediktor (x) yang jumlahnya lebih dari satu yaitu x1
dan x2 serta variabel respon (y). Analisis regresi linier berganda bertujuan untuk
mengetahui korelasi, pengujian signifikansi parameter, dan koefisien determinasi
dari variabel prediktor (x1,x2, …,, xn) serta parameter tersebut terletak pada suatu
model regresi.
Praktikum ini akan membahas apakah pengambilan sampel dari suatu
populasi sudah memenuhi regresi. Data yang digunakan dalam penelitian ini
adalah data sekunder yang diperoleh dari data website resmi Badan Pusat Statistik
tentang jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di
Indonesia pada tahun 2013.
Untuk menunjukkan bahwa sampel data yang diambil dari data jumlah
penduduk miskin dan faktor-faktor yang mempengaruhinya, dilakukan pengujian
regresi linear berganda. Data tersebut akan dianalisis menggunakan statistika
deskriptif, korelasi, metode regresi linier sederhana, dan asumsi residual IIDN.
1.2 Rumusan Masalah
Dari latar belakang di atas, dapat disimpulkan bahwa rumusan masalah
yang digunakan sebagai acuan untuk pengujian data adalah sebagai berikut.
1. Bagaimana hasil analisis statistika deskriptif tentang jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013?
2. Bagaimana hubungan antar variabel terhadap data jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013?
3. Bagaimana model regresi linear berganda terhadap data jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013?
4. Bagaimana hasil pemeriksaan asumsi IIDN terhadap data jumlah
penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada
tahun 2013?
1
1.3 Tujuan
Dari rumusan masalah di atas, dapat disimpulkan bahwa tujuan dari
praktikum ini adalah sebagai berikut.
1. Mengetahui hasil analisis statistika deskriptif tentang jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013
2. Mengetahui hubungan antar variabel terhadap data jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013
3. Mengetahui model regresi linear berganda terhadap data jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013
4. Mengetahui hasil pemeriksaan asumsi IIDN terhadap data jumlah
penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada
tahun 2013
1.4 Manfaat
Manfaat yang diperoleh dari percobaan ini adalah kita dapat mengetahui
apakah data yang digunakan sebagai penelitian merupakan data yang
memberikan gambaran tentang karakteristik data dan hubungan jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013.
Sehingga data yang diperoleh dapat dijadikan salah satu literatur bagi peneliti
yang ingin melakukan penelitian lebih lanjut.
1.5 Batasan Masalah
Batasan masalah yang dipakai pada praktikum kali ini adalah data yang
diperoleh berdasarkan survei Badan Pusat Statistik. Data yang digunakan yaitu
jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di Indonesia
pada tahun 2013.
BAB II
TINJAUAN PUSTAKA
2.1 Karakteristik Data
Karakteristik Data adalah metode-metode yang berkaitan dengan
pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi
yang berguna (Walpole, 1996).
a. Rata-rata
Rata – rata (mean) adalah nilai rata-rata dari beberapa buah data. Nilai
mean dapat ditentukan dengan membagi jumlah data dengan banyaknya data.
Berdasarkan definisi dari mean adalah jumlah seluruh data dibagi dengan
banyaknya data.
Dengan kata lain jika kita memiliki n data sebagai berikut maka mean data
tersebut dapat kita rumuskan sebagai berikut.
x=∑i=1
n
x i
n (2.1)
keterangan :
x = rata-rata sampel
xi = data ke-i
n = banyaknya data
(Walpole,1996).
b. Varians
Varians adalah rata-rata kuadrat selisih dari semua nilai data terhadap rata-
rata hitung sebagai berikut.
Data sampel
s2=∑i=1
n
( xi−x )2
( n−1 ) (2.2)
keterangan :
S2 : Varians suatu data sampel
x i : titik tengah interval ke i
x : nilai rata – rata suatu data sample
μx : nilai rata – rata suatu data populasi
n : jumlah frekuensi
(Walpole,1996).
c. Median
Nilai tengah (median) adalah nilai yang terletak di tengah-tengah data
yang sudah terurut atau nilai yang hasilnya diperoleh dari 50% banyaknya data.
Nilai tengah dihitung menggunakan rumus sebagai berikut.
Data tunggal :
Me=x n+12 jika n ganjil (2.3)
Me=x n
2+x n
2+1
2 jika n genap (2.4)
d. Maksimum dan Minimum
Maksimum adalah nilai terbesar dari suatu data. Minimum adalah nila
terkecil dari suatu data (Walpole,1996).
2.2 Hubungan Antar Variabel
Menganalisis korelasi digunakan untuk mengetahui hubungan antara
kedua variabel yang terdapat pada model regresi. Nilai dari korelasi adalah antara
1 sampai -1, jika nilai korelasi yang dihasilkan 1 artinya terdapat hubungan yang
kuat (saling berkaitan) antara variabel x dan variabel y, sebaliknya jika nilai
korelasi yang dihasilkan adalah -1 artinya hubungan antara x dan y berkorelasi
rendah. Sedangkan jika nilai korelasi yang dihasilkan adalah 0 artinya tidak ada
korelasi antara variabel x dan variabel y. Dapat juga diartikan bahwa semakin
besar nilai dari variabel x, maka semakin besar pula nilai dari variabel y, demikian
pula sebaliknya. Untuk meencari nilai korelasi digunakan rumus sebagai berikut :
r=n∑
i
n
x i y i−(∑i
n
xi )(∑i
n
yi )
√ [n∑i
n
xi2−(∑
i
n
x i )2][ n∑
i
n
y i2−(∑
i
n
y i)2
(2.5)
Sedangkan langkah-langkah pengujian korelasi adalah sebagai berikut :
Hipotesis :
H0 : ρxy=0
(tidak ada korelasi antara variabel X dan Y)
H1 : ρxy≠0
(ada korelasi antara variabel X dan Y)
Daerah kritis : tolak H0 jika thit>t(α/2,df)
Persamaan koefisien korelasi adalah :
thit=r xy(√n−2
rxy2
(2.6)
Scatterplot merupakan penampilan secara visual dalam konsep hubungan
2 variabel yang disajikan dalam bentuk diagram. Sacatterplot digunakan untuk
menunjukkan pola korelasi antara nilai-nilai variabel y dengan nilai-nilai variabel
x. Jika plot berkumpul di sekitar garis, maka variabel x dan variabel y dikatakan
mempunyai korelasi yang erat. Sebaliknya, jika plot menyebar maka variabel x
dan variabel y dikatakan tidak mempunyai korelasi.
2.3 Regresi Linear Berganda
Dalam regresi linear berganda terdapat sejumlah peubah bebas yang
dihubungkan dengan Y linear atau berpangkat satu dalam semua peubah bebas.
Jika peubah bebas itu X1, X1 , .... Xk (k ≥ 2) maka bentuk umum regresi linear
ganda Y atas X1, X1 , .... Xk adalah :
Y=b0+b1 X1+b2 X2+. ..+bk X k+ε(2.7)
Dengan struktur data sebagai berikut :
x=[1 x11 x12 ⋯ xk 1
1 x12 x22 ⋯ xk 2
1 x13 x23 ⋯ xk 3
⋮ ⋮ ⋮ ⋱ ⋮1 x1 n x2 n ⋯ xkn
] ;
β=[β0
β1
⋮βk
] ;
Y=[Y 1
Y 2
⋮Y k
];
ε=[ ε1
ε2
⋮ε k
]Taksiran model regresi linear berganda :
Y=b0+b1 X1+b2 X2+. ..+bk X k(2.8)
Menghitung koefisien regresi linear melalui pendekatan matriks
b = (XT X)-1 XT Y = (b0
b1
⋮bk
) (2.9)
2.3 Uji Serentak
Statistik uji yang dipakai untuk melakukan uji serentak ini adalah uji F.
Uji F dikenal juga dengan uji Anova (Analysis Of Varians) yaitu uji untuk melihat
bagaimanakah pengaruh semua variabel prediktornya secara bersama-sama
terhadap variabel terikatnya atau untuk menguji apakah model regresi yang kita
buat baik (signifikan) atau tidak baik (non signifikan). Jika model signifikan maka
model bisa digunakan untuk peramalan, sebaliknya jika non signifikan maka
model regresi tidak bisa digunakan untuk peramalan. Uji serentak merupakan uji
terhadap nilai-nilai koefisien regresi secara bersama-sama dengan hipotesa
hipotesisnya sebagai berikut :
1. H0 : β1=β2=. ..=βk=0
H1 : β j 0, j = 1,2,…,k
2. Tentukan taraf nyata
3. Daerah kritik penerimaan
− f(∝2 )(
v1 , v2 ) ≤F0≤ f (∝2 )(v1 , v2 )
4. Daerah kritik penolakan
F0< − f(∝2 )(
v1 , v2 ) atau F0 > f (∝2 )(v1 , v2 )
5. Statistik Uji
f h itung=¿ (2.10)
6. Kesimpulan
fhitung ≤ fα(v1,v2), H0 gagal tolak
fhitung > fα(v1,v2), Ho ditolak
Uji F dapat dilakukan dengan membandingkan F hitung dengan F tabel,
jika F hitung > dari F tabel, maka Ho di tolak dan H1 diterima dengan kata lain
persamaaan garis regresi tersebut tidak bisa kita terima sebagai penduga
hubungan antara variabel X dengan variabel Y. Bila bentuk hubungan antar
variabel X dengan variabel Y sudah dapat kita terima maka kita bisa mengetahui
seberapa besar keeratan hubungannya (korelasinya).
2.4 Uji Parsial
Statistik uji yang dipakai untuk melakukan uji parsial ini adalah statistik
uji T. Uji T digunakan untuk menguji bagaimana pengaruh masing-masing
variabel bebasnya secara sendiri-sendiri terhadap variabel terikatnya. Jika hasil
pada uji serentak menunjukkan bahwa H0 ditolak, maka perlu dilakukan uji
individu dengan
1. Hipotesis :
H0: β = 0
H1: β ≠ 0 atau H1: β < 0 atau H1: β >0
2. Tentukan taraf nyata
3. Daerah kritik penerimaan :
−t(∝2 )
≤ t0 ≤ t(∝2 )
4. Daerah penolakan:
t0< −t
(∝2 ) atau t0 > t(∝2 )
5. Uji statistik
thitung =
( b−β1 )
se/√∑ ( X−X )2 atau thitung =
(a−β0 )
se(√ 1n+ x2
∑ ( xi− x )2 )(2.11)
keterangan:
a = taksiran bagi β0
b = taksiran bagi β1
t = nilai sebaran t
6. Keputusan:
H0 ditolak jika thitung > tα/2(n-2) atau thitung < - tα/2(n-2)
2.5 Pemeriksaan Asumsi IIDN
Pemeriksaan Asumsi Residual IIDN (Identik, Independen, Distribusi
Normal) merupakan uji yang harus dilakukan apakah data yang digunakan
memenuhi ketiga asumsi tersebut dalam melakukan pengujian (Sudjana, 1996).
2.4.1 Pemeriksaan Asumsi Residual Identik
Memeriksa residual identik dilakukan untuk melihat apakah residual
memenuhi asumsi identik.Pemeriksaan asumsi residual identik dapat dilihat pada
gambar Versus Fits yang menjelaskan bahwa data tersebut memiliki titik-titik
yang menyebar secara acak dan tidak membentuk pola tertentu, sehingga dapat
dikatakan bahwa variabel respon dan variabel prediktornya adalah memiliki
residual yang identik.
1. Uji visual (residual versus fits)
Uji visual adalah pengujian yang dilakukan dengan melihat gambar grafik
hasil perhitungan residual versus fits. Jika grafik tidak berpola maka residual
memenuhi asumsi sifat identik.
2. Uji Glejser
Uji Glejser adalah uji untuk mengetahui apakah sebuah model regresi memiliki
indikasi asumsi klasik sebagai prasyarat melakukan analisis regresi dengan cara
meregresi absolut residual (Laporanpenelitian, 2015).
Hipotesis : H0: residual identik
H1: residual tidak identik
Daerah penolakan : Tolak H0 jika Fhitung>F(p,n-p-1)
Statistik Uji :
Fhitung= ¿MSRMSE
¿¿ (2.12)
2.4.2 Pemeriksaan Asumsi Residual Independen
Pemeriksaan asumsi residual independen dapat dilihat pada gambar
Versus Fits yang didapatkan bahwa grafik dari data tersebut tidak memiliki pola
tertentu, hal ini dapat terlihat pada titik-titik grafik cenderung bersifat naik turun,
dalam hal ini tidak ada autokorelasi antar residual.
1. Uji visual (residual versus order)
Uji visual adalah pengujian yang dilakukan dengan melihat gambar grafik
hasil perhitungan residual versus order.Jika grafik tidak berpola, maka
residualnya memenuhi asumsi sifat independen.
2. Uji Durbin-Watson
Uji Durbin-Watson adalah pengujian yang dilakukan untuk mengetahui
adanya autokorelasi antar variabel.Jika hasil pengujian menunjukkan bahwa tidak
ada autokorelasi antar variabel maka data dikatakan memenuhi asumsi residual
independen. Berikut proses pengujian Durbin-Watson.
Hipotesis :
H0 :ρ= 0 (Tidak ada autokorelasi antar residual/independen)
H1 :ρ≠ 0 (Ada autokorelasi antar residual/tidak independen)
Daerah penolakan : Jika d < dL, maka tolak H0
Jika dU ≤ d ≤ 4-dU maka gagal tolak H0
Jika 4-dU ≤ d ≤ 4-dL atau dL ≤ d ≤ dU maka tidak
ada kesimpulan.
Statistik Uji : d=
∑i=1
n
(ei+1−ei)2
∑i=1
n
ei (2.13)
2.4.3 Pemeriksaan Asumsi Residual berdistribusi Normal
Pemeriksaan asumsi residual berdistribusi normal dapat dilihat pada
gambar Normal Probability Plot yang dapat diketahui bahwa titik-titiknya
mendekati garis normal dan mengikuti garis linier.Pengujian asumsi residual
normal dapat dilakukan melalui uji Kolmogorov Smirnov.Uji Kolmogorov-
Smirnov biasa digunakan untuk memutuskan jika sampel berasal dari populasi
dengan distribusi tertentu.Uji Kolmogorov Smirnov untuk membandingkan
serangkaian data pada sampel terhadap distribusi normal serangkaian nilai untuk
mengetahui kenormalan distribusi beberapa data.
Hipotesis :
H0 :F0 (x) = F(x) (data berdistribusi normal)
H1 :F0 (x) ≠ F(x) (data tidak berdistribusi normal)
Daerah penolakan:
Tolak H0 jika │D│>q(1-α) dimana q merupakan nilai dari tabel Kolmogorov
Smirnov
Statistik Uji :
D= maksimal │F0(x) – SN (x) │ F0 (x) adalah fungsi distribusi kumulatif teoritis.
Sedangkan SN (x) = i/n merupakan fungsi peluang kumulatif pengamatan dari
suatu sampel random dengan i adalah pengamatan dan n adalah jumlah
pengamatan.
2.6 Penduduk Miskin
Penduduk yang memiliki rata-rata pengeluaran perkapita perbulan di bawah garis
kemiskinan. Garis kemiskinan merupakan penjumlahan dari garis kemiskinan
makanan dan garis kemiskinan non makan. Penduduk yang memiliki rata-rata
pengeluaran perkapita per bulan dibawah garis kemiskinan dikategorikan sebagai
penduduk miskin (bps, 2014).
BAB III
METODE PENELITIAN
3.1 Sumber Data
Sumber data pada penelitian ini adalah sumber data sekunder yang
diperoleh dari website resmi Badan Pusat Statistik tentang jumlah penduduk
miskin dan faktor-faktor yang mempengaruhinya di Indonesia pada tahun 2013.
Data di peroleh pada hari Rabu, 7 Oktober 2015, pukul 15:00 WIB di Jurusan
Statistika ITS.
3.2 Variabel Penelitian
Variabel yang akan diamati dari hasil percobaan yang telah dilakukan
adalah data jumlah penduduk miskin dan faktor-faktor yang mempengaruhinya di
Indonesia pada tahun 2013. Variabel pada praktikum ini adalah.
Tabel 3.1Variabel PenelitianNo
Variabel Keterangan
1 YJumlah Penduduk Miskin
2 X1Jumlah Pendapatan Pajak
3 X2Jumlah Belanja Barang dan Jasa
4 X3 Prosentase Buta Huruf5 X4 Angka Partisipasi
Sekolah6 X5 Jumlah Lowongan Kerja
7 X6Pengeluaran dan Pembiayaan
3.3 Langkah Analisis
Langkah analisis pada praktikum ini adalah sebagai berikut.
1. Memasukkan data pada software Minitab
2. Menganalisis dengan menggunakan statistika deskriptif
3. Menganalisis hubungan antar variabel
4. Menganalisis data dengan regresi linear berganda
5. Melakukan pengujian serentak
6. Melakukan pengujian parsial
7. Menganalisis data dengan pemeriksaan asummsi IIDN
8. Menarik kesimpulan
9. Membuat laporan.
3.4 Diagram Alir
Berdasarkan langkah analisis data yang dilakukan maka diagram alir
dalam praktikum ini dapat digambarkan sebagai berikut.
Mulai
Memasukkan data
Statistika deskriptif
Analisis Korelasi
Uji Linier Berganda
Gambar 3.1 Diagram Alir
Kesimpulan
Selesai
Uji Residual
DAFTAR PUSTAKA
Aridinanti, Lucia, dkk. 2007. Pengantar Metode Statistika. Surabaya: ITS Press.Draper, Smith. 1992.Analisis Regresi Terapan. PT. Gramedia Pustaka Utama.Nawari. 2010. Analisis Statistika Dengan MS Excel 2007 dan SPSS 17.
Jakarta:Elex Media Komputindo. Walpole, Ronald E. 1993. Pengantar Statistika Edisi ke-3. Jakarta: PT
Gramedia.Pustaka Utama.
Top Related