KELOMPOK8_KD2 ANALISIS REGRESI
-
Upload
zulegh-siti-zulaikah -
Category
Documents
-
view
216 -
download
0
description
Transcript of KELOMPOK8_KD2 ANALISIS REGRESI
ANALISIS KORELASI, ANALISIS REGRESI, DAN PEMERIKSAAN GALAT
Disusun Untuk Memenuhi Tugas 2 Mata Kuliah Komputasi Statistik
Dosen Pengampu: Getut Pramesti, S.Si., M.Si.
OLEH:
SELLYGUS CAHYANINGRATI W. (K1312064)
SETYANINGRUM NURUL H. (K1312065)
SITI ZULAIKAH (K1312067)
SRI SULASTRI NATALIA (K1312068)
PROGRAM STUDI PENDIDIKAN MATEMATIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS SEBELAS MARET
SURAKARTA
2015
BAB I
PENDAHULUAN
A. Uji Asumsi Pra Analisis Regresi
1. Uji Normalitas
Uji normalitas digunakan untuk mengetahui apakah data yang diperoleh berdistribusi
normal atau tidak. Untuk menguji normalitas ini digunakan metode Lilliefors.
Langkah-langkahnya sebagai berikut :
1) Hipotesis
H0 : sampel berasal dari populasi yang berdistribusi normal
H1 : sampel tidak berasal dari populasi yang berdistribusi normal
2) Taraf signifikan (α ) = 0,05
3) Statistik uji yang digunakan :
L = max │F(Zi) - S (Zi) │
Keterangan:
F(Zi) = P(Z≤Zi), Z ~ N(0,1)
Zi : skor standar, Zi=
(X i−X )s
s : standar deviasi
S(Zi) : proporsi cacah Z≤Z i terhadap seluruh cacah Z i
Xi : skor responden
4) Daerah kritik
DK = {L│L > Lα:n }dengan n adalah ukuran sampel.
Lα:n diperoleh dari tabel Lilliefors
5) Keputusan uji
H0 ditolak jika Z ∈ DK
6) Kesimpulan
Jika Ho tidak ditolak maka sampel berasal dari populasi yang berdistribusi
normal.
(Budiyono, 2004 : 170)
2. Uji Homogenitas
Uji homogenitas digunakan untuk mengetahui apakah populasi penelitian
mempunyai variansi yang sama atau tidak. Untuk menguji homogenitas ini digunakan
metode Bartlett dengan statistik uji chi kuadrat dengan prosedur sebagai berikut:
1) Hipotesis
Ho : σ 12=σ2
2= …= σ k
2 (sampel berasal dari populasi homogen)
H1 : Paling tidak ada satu i dan satu j sehingga σ i2≠σ j
2 dengan i≠j
(sampel berasal dari populasi tak homogen)
2) Taraf Signifikansi ( α ) = 0,05
3) Statistik Uji yang digunakan :
χ2=2 ,303C [ f . log RKG−∑
j=1
k
f j log S j2 ]
Keterangan:
χ2~ χ2(k-1)
k : banyaknya sampel
f : derajat kebebasan untuk RKG = N - k
N : banyaknya seluruh nilai ( pengukuran ).
fj : derajat kebebasan untuk Sj2 = nj - 1
j : l, 2, ..., k
nj : cacah pengukuran pada sampel ke-j
c =
1+1
3(k−1) [∑ 1f j
−1f ]
RKG =
∑ SS i
∑ f jSS j=∑ X j
2−(∑ X j)
2
n j
4) Daerah Kritik (DK)
DK={ χ2|χ2> χ2α :k−1}
5) Keputusan Uji
Ho ditolak jika χ 2 ∈DK
6) Kesimpulan
Jika H0 tidak ditolak maka populasi-populasi homogen.
(Budiyono, 2004 : 176-177)
3. Uji Independensi
Uji kebebasan ini digunakan untuk memeriksa kebebasan atau independensi dari
dua variabel (frekuensi observasi dan frekuensi harapan) sehingga kita dapat
menyimpulkan apakah kedua peubah tersebut saling bebas (tidak berpengaruh)
ataukah keduanya saling bertalian (berpengaruh).
Data untuk menguji kebebasan dua variabel tersebut disajikan dalam bentuk
Tabel Kontingensi atau Tabel Berkemungkinan yang umumnya berukuran r baris x k
kolom. Sebelum melakukan pengujian, terlebih dahulu kita harus mendefinisikan
Hipotesis Awal (H0) dan Hipotesis Alternatif (H1), yaitu:
H0 : variabel-variabel saling bebas
H1 : variabel-variabel tidak saling bebas
Tolak H0 apabila hasil perhitungan lebih besar dari tabel.
7) Analisis Korelasi
Korelasi linear berganda merupakan alat ukur mengenai hubungan yang
terjadi antara variabel yang terikat. (variabel Y) dan dua atau lebih variabel bebas (x1,
x2……xk). Analisis korelasinya menggunakan tiga koefisien korelasi yaitu koefisien
determinasi berganda, koefisien korelasi berganda, dan koefisien korelasi parsial.
1. Korelasi linear berganda dengan dua variabel bebas
a. Koefisien penentu berganda atau koefisien determinasi berganda
Koefisien determinasi berganda, disimbolkan KPB y.12 atau R2 merupakan
ukuran kesusaian garis regresi linear berganda terhadap suatu data. Rumus
KPBy.12 =
b. Koefisien korelasi berganda
Koefisien korelasi berganda disimbolkan ry12 merupakan ukuran keeratan
hubungan antara variabel terikat dan semua variabel bebas. Secara bersama-
sama. Rumus :
Ry.12 =
c. Koefisien korelasi parsial
Koefisien korelasi parsial merupakan koefisien korelasi antara dua variabel.
Jika variabel lainnya konstan, pada hubungan yang melibatkan lebih dari
dua variabel.
Ada 3 koefisien korelasi parsial untuk hubungan yang melibatkan 3 variabel
yaitu sebagai berikut :
1) Koefisien korelasi parsial antara y dan x1, apabila x2 konstan dirumuskan
ry.12 =
2) Koefisien korelasi parsial antara y dan x2, apabila x1 konstan dirumuskan
ry.12 =
3) Koefisien korelasi parsial antara x1 dan x2 apabila y konstan dirumuskan
R12y =
2. Korelasi linear berganda dengan 3 variabel bebas
a. Koefisien penentu berganda
KPB =
b. Koefisien korelasi berganda
ry123 =
C. Analisis Regresi
1. Hubungan liniear lebih dari dua variabel
Regresi artinya peramalan penaksiran atau pendugaan pertama kali
diperkenalkan pada tahun 1877 oleh Sir Francis Galtoon (1822-1911). Analisis
regresi digunakan untuk menentukan bentuk dari hubungan antar variabel. Tujuan
utama dalam penggunaan analisis itu adalah untuk meramalkan atau
memperkirakan nilai dari suatu variabel dalam hubungannya dengan variabel yang
lain. Disamping hubungan linear dua variabel, hubungan linear dari dua variabel
bisa juga terjadi misalnya; hubungan antara hasil penjualan dengan harga dan daya
beli.
Hubungan linear lebih dari dua variabel bila dinyatakan dalam bentuk
persamaan matematis adalah :
Y = a + b1x1 + b2x2 +……………bkxk +
Keterangan :
x, x1, x2……..xk = variabel-variabel
a, b1, b2……..bk = bilangan konstan (konstanta) koefisien variabel
2. Persamaan regresi linear berganda
Regresi linear berganda adalah regresi dimana variabel terikatnya (Y)
dihubungkan atau dijelaskan lebih dari satu variabel, mungkin dua, tiga dan
seterusnya variabel bebas (x, x1, x2……..xn ) namun masih menunjukkan diagram
hubungan yang linear.
Penambahan variabel bebas ini diharapkan dapat lebih menjelaskan
karakteristik hubungan yang ada walaupun masih saja ada variabel yang
terabaikan. Bentuk umum dari persamaan linear berganda dapat ditulis sebagai
berikut:
a. Bentuk stokastik
= a + b1x1 + b2x2 + b3x3 ……………bkxk + c
b. Bentuk non stokastik
= a + b1x1 + b2x2 + b3x3……………bkxk
Keterangan:
: Variabel terikat (nilai duga y)
a, b1, b2 b3……..bk : koefisien regresi
x1, x2 x3……..xk : variabel bebas
e : kesalahan pengganggu
8) Pemeriksaan Sisa atau Galat
Diantaranya yaitu dengan:
a. Menghitung residual terstandar dengan fungsi rsstandard
b. Mencari observasi yang diduga outlier (studentized residual)
c. Mencari DFBETAS
Observasi dicurigai jika nilai DFBETAS >1.
d. Mencari dengan DFFITS
Observasi dicurigai jika nilai DFFITS >1
e. Jarak Cook’s
Observasi dicurigai jika nilai Jarak Cook’s >1.
BAB II
PERMASALAHAN
KASUS:
Internal Reveneu Service mencoba menduga pajak aktual yang tertunda setiap bulan dari divisi
auditingnya. Diduga dua faktor yang mempengaruhi adalah jumlah jam kerja pegawai dan
jumlah jam kerja mesin (komputer). Untuk menganalisis seberapa besar kedua faktor tersebut
mempengaruhi besarnya pajak aktual yang tertunda (yang tidak dibayar) setiap bulan, dicatat
pajak setiap variabel selama 10 bulan. Hasilnya terlampir pada tabel :
Responden Y (RP 1000)
(Pajak aktual yang
tidak di bayar)
X1
(jam kerja pegawai)
X2
(jam kerja mesin/
komputer)
Januari 29 45 16
Februari 24 42 14
Maret 27 44 15
April 25 45 13
Mei 26 43 13
Juni 28 46 14
Juli 30 44 16
Agustus 28 45 16
September 28 44 15
Oktober 27 43 15
Lakulankah:
1. Uji asumsi pra analisis regresi
2. Analisis korelasi
3. Analisis regresi
4. Pemeriksaan sisa/ galat
terhadap data tersebut!
BAB III
PEMBAHASAN
A. Uji Asumsi Pra Analisis Regresi
1. Uji Keberartian
a. Uji Keberartian Regresi
> anova(fm)
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 7.4450 7.4450 6.495 0.038186 *
X2 1 14.1312 14.1312 12.328 0.009844 **
Residuals 7 8.0239 1.1463
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Uji keberartian Regresi antara Jam Kerja Pegawai (X1) dan Pajak aktual yang
tidak di bayar (Y)
i. Menyusun Hipotesis
H0 : Hubungan linier antara Jam Kerja Pegawai dan Pajak aktual yang tidak
di bayar tidak berarti
H1 : Hubungan linier antara Jam Kerja Pegawai dan Pajak aktual yang tidak
di bayar berarti
ii. Pilih tingkat signifikansi α = 0,05
iii.Daerah Kritis p < α
iv.Statistik Uji
F = 6.495 p = 0.038186
v. Hasil Uji
p= 0.038186 < α = 0.05
vi. Kesimpulan
Uji Keberartian Koefisien Regresi antara Jam Kerja Pegawai dan Pajak
aktual yang tidak di bayar berarti.
Uji keberartian Regresi antara Jam Kerja Mesin Komputer (X2) dan Pajak
Aktual yang tidak dibayar (Y)
i. Menyusun Hipotesis
H0 : Hubungan linier antara Jam Kerja Mesin Komputer dan Pajak aktual
yang tidak di bayar tidak berarti
H1 : Hubungan linier antara Jam Kerja Mesin Komputer dan Pajak aktual
yang tidak di bayar berarti
ii. Pilih tingkat signifikansi α = 0,05
iii.Daerah Kritis p < α
iv.Statistik Uji
F =12.328 ; p= 0.009844
v. Hasil Uji
Karena p= 0.009844< α = 0.05, maka H0 ditolak.
vi. Kesimpulan
Uji Keberartian Koefisien Regresi antara Jam Kerja Mesin Komputer dan
Pajak aktual yang tidak di bayar berarti.
2. Uji Indepensi antar Variabel Bebas
> cor(X1,X2)
[1] 0.1840943
> cor.test(X1,X2)
Pearson's product-moment correlation
data: X1 and X2
t = 0.52975, df = 8, p-value = 0.6107
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5039445 0.7291987
sample estimates:
cor
0.1840943
Sesuai kesepakatan beberapa literatur, yaitu suatu variabel bebas akan
independen dengan variabel bebas yang lain jika koefisien korelasinya kurang dari
0,8. Diperoleh nilai korelasi antara X1 dan X2 sebesar 0.1840943. Karena nilai
tersebut kurang dari 0,8 maka variabel X1 dan X2 independen.
3. Uji Normalitas
>shapiro.test(residuals(fm))
Shapiro-Wilk normality test
data: residuals(fm)
W = 0.94452, p-value = 0.6043
i. Menyusun Hipotesis
H0 : Residual berdistribusi normal
H1 : Residual tidak berdistribusi normal
ii. Pilih tingkat signifikansi α = 0,05
iii.Statistik Uji Shapiro-Wilk
W = 0.94452 p-value = 0.6043
iv. Hasil Uji
α = 0,05 < p-value = 0.6043
v. Kesimpulan
H0 diterima. Dengan kata lain
B. Analisis Korelasi
1. Pajak Aktual yang tidak dibayarkan (Y) dengan Jam kerja pegawai (X1)
> cor(Y,X1)
[1] 0.5015167
> cor.test(Y,X1)
Pearson's product-moment correlation
data: Y and X1
t = 1.6396, df = 8, p-value = 0.1397
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1872313 0.8596826
sample estimates:
cor
0.5015167
i. Menyusun Hipotesis
H0 : Tidak ada korelasi antara Jam Kerja Pegawai dan Pajak aktual yang tidak di
bayar (cor(X1,Y) = 0)
H1 : Terdapat korelasi antara Jam Kerja Pegawai dan Pajak aktual yang tidak di
bayar (cor(X1,Y) ≠ 0)
ii. Pilih tingkat signifikansi α = 5% = 0,05
iii.Daerah Kritis
P-value < α = 0,05
Karena p-value = 0.1397 >=0.05 maka H0 diterima
Dengan kata lain tidak terdapat korelasi antara Jam Kerja Pegawai dan Pajak
aktual yang tidak di bayar.
2. Pajak aktual yang tidak di bayar (Y) dan Jam Kerja Mesin Komputer (X)
> cor(Y,X2)
[1] 0.7714616
> cor.test(Y,X2)
Pearson's product-moment correlation
data: Y and X2
t = 3.4294, df = 8, p-value = 0.008963
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.2758006 0.9430284
sample estimates:
cor
0.7714616
i. Menyusun Hipotesis
H0 : Tidak ada korelasi antara Jam Kerja Mesin Komputer dan Pajak aktual yang
tidak di bayar (cor(Y,X2) = 0)
H1 : Terdapat korelasi antara antara berat badan dan umur (cor(Y,X2) ≠ 0)
ii. Pilih tingkat signifikansi α = 5% = 0,05
iii.Daerah Kritis
P-value < α = 0,05
Karena = 0.05 > p-value = 0.008963 maka H0 ditolak
Dengan kata lain terdapat korelasi antara Jam Kerja Mesin Komputer dan Pajak
aktual yang tidak di bayar
3. Berat Pajak Aktual yang tidak dibayarkan (Y) dengan Jam Kerja pegawai
(X1)dan Jam Kerja Mesin Komputer (X2)
> cor(Y,X1+X2)
[1] 0.8243243
> cor.test(Y,X1+X2)
Pearson's product-moment correlation
data: Y and X1 + X2
t = 4.1185, df = 8, p-value = 0.003351
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.4047913 0.9571659
sample estimates:
cor
0.8243243
i. Menyusun Hipotesis
H0 : Tidak ada korelasi ganda antara Pajak Aktual yang tidak dibayarkan dengan
Jam Kerja pegawai dan Jam Kerja Mesin Komputer (cor(Y,X1 & X2) = 0)
H1 : Terdapat korelasi ganda antara Pajak Aktual yang tidak dibayarkan dengan
Jam Kerja pegawai dan Jam Kerja Mesin Komputer (cor(Y,X1 & X2) ≠ 0)
ii. Pilih tingkat signifikansi α = 5% = 0,05
iii.Daerah Kritis
P-value < α = 0,05
Karena α = 0,05 > p-value = 0.003351 maka H0 ditolak
Dengan kata lain terdapat korelasi ganda antara Pajak Aktual yang tidak
dibayarkan dengan Jam Kerja pegawai dan Jam Kerja Mesin Komputer.
C. Analisis Regresi
1. Persamaan Regresi
Y = -13.8196 + 0.5637 X1 + 1.0995 X2
2. Hasil Regresi
> fm<-lm(Y~X1+X2)
> summary(fm)
Call:
lm(formula = Y ~ X1 + X2)
Residuals:
Min 1Q Median 3Q Max
-1.24668 -0.74702 -0.02321 0.51956 1.42706
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -13.8196 13.3233 -1.037 0.33411
X1 0.5637 0.3033 1.859 0.10543
X2 1.0995 0.3131 3.511 0.00984 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.071 on 7 degrees of freedom
Multiple R-squared: 0.7289, Adjusted R-squared: 0.
(i) Hipotesis
H-null : B = 0
H-alt : B ≠ 0
(ii) Daerah Kritis: p < 0.05
(iii) Statistik uji: F1 = 6.495; p1= 0.038186
F2 =12.328 ; p2= 0.009844
(iv) Hasil uji
p1= 0.038186 < α = 0.05 ; p2= p2= 0.009844< α = 0.05
(v) H-null ditolak H-null ditolak
(vi) Kesimpulan
X1 dan X2 mempunyai pengaruh terhadap Y
3. Uji Anova
> anova(fm)
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 7.4450 7.4450 6.495 0.038186 *
X2 1 14.1312 14.1312 12.328 0.009844 **
Residuals 7 8.0239 1.1463
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(i) Hipotesis
H-null : μ1=μ2
H-alt : μ1≠μ2
(ii) Daerah Kritis: p < 0.05
(iii) Statistik uji: F1 = 6.495; p1= 0.038186
F2 =12.328 ; p2= 0.009844
(iv) Hasil uji
p1= 0.038186 < α = 0.05 ; p2= p2= 0.009844< α = 0.05
(v) H-null ditolak H-null ditolak
(vi) Kesimpulan
X1 dan X2 mempunyai pengaruh yang berbeda terhadap Y
D. Pemeriksaan Sisa / Galat
> sres<-rstandard(fm)
> sres[1:10]
1 2 3 4 5 6
-0.14973264 -1.57144439 -0.46861538 -1.06428595 1.53821347 0.64108799
7 8 9 10
1.53842167 -1.24583375 0.52112131 0.09506472
Galat pada data pertama adalah -0.14973264
Galat pada data kedua adalah -1.57144439
Galat pada data ketiga adalah -0.46861538
Galat pada data keempat adalah -1.06428595
Galat pada data kelima adalah 1.53821347
Galat pada data keenam adalah 0.64108799
Galat pada data ketujuh adalah 1.53842167
Galat pada data kedelapan adalah -1.24583375
Galat pada data kesembilan adalah 0.52112131
Galat pada data kesepuluh adalah 0.09506472
Mencari observasi yang diduga outlier (studentized residual)
> sres[which(abs(sres)>2)]
named numeric(0)
Pada data ini tidak terdapat outlier.
Mencari DFBETAS
> dfb<-dfbetas(fm)
> head(dfb)
(Intercept) X1 X2
1 0.047703673 -0.03013471 -0.05430691
2 -1.464895245 1.35977696 0.23240092
3 -0.009608251 0.02077722 -0.04342257
4 0.222044696 -0.50691942 0.79613421
5 0.851722296 -0.49206007 -0.98353502
6 -0.391626465 0.48491900 -0.25582131
Pada X1 data ke 2 memiliki DFBETAS sebesar 1.35977696 > 1, maka observasi
tersbut dianggap mencurigakan.
Mencari dengan DFFITS
> dff<-dffits(fm)
> dff[1:10]
1 2 3 4 5 6
-0.08527224 -1.63884494 -0.15451423 -0.99111248 1.39151975 0.57858447
7 8 9 10
1.00897044 -0.80295127 0.17248903 0.04607053
Observasi dicurigai jika nilai DFFITS >1. Pada analisis tersebut ditemukan nilai
DFFITS > 1 yaitu pada data ke 5 (1.39151975 ) dan ke 7 (1.00897044).
Jarak Cook’s
> cooksD<-cooks.distance(fm)
> cooksD[1:10]
1 2 3 4 5 6
0.0028186923 0.6760134747 0.0089933140 0.3201926362 0.4984858567
0.1225408686
7 8 9 10
0.2620420210 0.1951348610 0.0111215249 0.0008243485
Observasi dicurigai jika nilai Jarak Cook’s >1. Pada analisis tersebut tidak
ditemukan nilai Jarak Cook’s > 1
BAB IV
KESIMPULAN
Dari analisis permasalah tersebut, dapat disimpulkan bahwa :
A. Uji Asumsi Pra Analisis Regresi
1. Uji Keberartian
a. Uji Keberartian Koefisien Regresi antara Jam Kerja Pegawai dan Pajak
aktual yang tidak di bayar berarti.
b. Uji Keberartian Koefisien Regresi antara Jam Kerja Mesin Komputer dan
Pajak aktual yang tidak di bayar berarti.
2. Uji Indepensi antar Variabel Bebas
Nilai korelasi antara X1 dan X2 sebesar 0.1840943. Karena nilai tersebut kurang
dari 0,8 maka variabel X1 dan X2 independen.
3. Uji Normalitas
Asumsi kenormalan dapat dipenuhi.
B. Analisis Korelasi
a. Terdapat korelasi antara Jam Kerja Pegawai dan Pajak aktual yang tidak di
bayar.
b. Terdapat korelasi antara Jam Kerja Mesin Komputer dan Pajak aktual yang
tidak di bayar
c. Terdapat korelasi ganda antara Pajak Aktual yang tidak dibayarkan dengan Jam
Kerja pegawai dan Jam Kerja Mesin Komputer
C. Analisis Regresi
1. Persamaan Regresi
Y = -13.8196 + 0.5637 X1 + 1.0995 X2
2. Hasil regresi
X1 dan X2 mempunyai pengaruh terhadap Y
3. Uji anova
X1 dan X2 mempunyai pengaruh yang berbeda terhadap Y
D. Pemeriksaan Sisa/ Galat
1. Menghitung residual terstandar dengan fungsi rsstandard
Galat pada data pertama adalah -0.14973264
Galat pada data kedua adalah -1.57144439
Galat pada data ketiga adalah -0.46861538
Galat pada data keempat adalah -1.06428595
Galat pada data kelima adalah 1.53821347
Galat pada data keenam adalah 0.64108799
Galat pada data ketujuh adalah 1.53842167
Galat pada data kedelapan adalah -1.24583375
Galat pada data kesembilan adalah 0.52112131
Galat pada data kesepuluh adalah 0.09506472
2. Mencari observasi yang diduga outlier (studentized residual)
Pada data ini tidak terdapat outlier.
3. Mencari DFBETAS
Pada X1 data ke 2 memiliki DFBETAS sebesar 1.35977696 > 1, maka
observasi tersebut dianggap mencurigakan.
4. Mencari dengan DFFITS
Observasi dicurigai jika nilai DFFITS >1. Pada analisis tersebut ditemukan nilai
DFFITS > 1 yaitu pada data ke 5 (1.39151975 ) dan ke 7 (1.00897044).
5. Jarak Cook’s
Observasi dicurigai jika nilai Jarak Cook’s >1. Pada analisis tersebut tidak
ditemukan nilai Jarak Cook’s > 1