Oleh: Bambang Widjanarko Otok
CLUSTER ANALYSIS CLUSTER ANALYSIS
Klasifikasi Metode Statistika
METODE STATISTIKA
HUBUNGAN PENGARUH
KORELASI REGRESI
TABEL KONTINGENSI
LOG-LINIER
REGRESI LOGISTIK
REGRESI PROBIT
REGRESI TOBIT
PERBEDAAN
Uji ZUji t
ANOVA
MANOVA
AnalisisTime Series
KLASIFIKASI
Analisis Cluster
Analisis Diskriminan
SKEMA Masalah Klasifikasi (Pengelompokkan)
KLASIFIKASI(PENGELOMPOKKAN)
KELOMPOKBELUM DIKETAHUI
KELOMPOKSUDAH DIKETAHUI
ANALISIS KELOMPOK(CLUSTER ANALYSIS)
ANALISIS DISKRIMINAN(DISCRIMINANT ANALYSIS)
REGRESI POHON(CART)
K-NN
REGRESI LOGISTIK,REGRESI ORDINAL
REGRESI POHON(CART)
NEURAL NETWORKNEURAL NETWORK
Multivariate Adaptive Regression Splines(MARS)
Mulivariate Adaptive Regression Splines(MARS)
Analisis kelompok digunakan untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa kelompok berdasarkan pengukuran variabel-variabel yang di amati, sehingga obyek dalam kelompok yang sama mirip dan antar kelompok tidak mirip
Analisis kelompok adalah suatu teknik yang digunakan untuk mengkombinasikan pengamatan ke dalam kelompok (cluster) dengan masing-masing kelompok (cluster) adalah homogen berkenaan dengan karakteristik tertentu. Ini menunjukkan bahwa pengamatan pada setiap kelompok adalah serupa untuk satu sama lain
Masing-Masing kelompok harus berbeda dari kelompok lainnya berkenaan dengan karakteristik yang sama; yang berarti pengamatan satu kelompok harus berbeda dari pengamatan lain kelompok
Pengertian Analisis Kelompok
Eksplorasi Data untuk mendapatkan gambaran tentang informasi yang ada dalam himpunan data tersebut
bahkan sampai pada pembangkitan hipotesis untuk melihat struktur populasinya
Reduksi Data untuk mewakili seluruh anggota kelompok tersebut dengan suatu informasi ringkasan dari
kelompok tersebut
Pelapisan atau pemisahan obyek-obyek Hasil pengelompokkan dari analisis kelompok dapat digunakan sebagai pelapisan atau
stratifikasi dalam penarikan sampel
Manfaat Pengelompokan
ANALISIS KELOMPOK(CLUSTER ANALYSIS)
HIERARKHI TAK HIERARKHI
Pautan Tunggal (Single Linkage/Nearest Neighbor) K-RATAAN
Pautan Lengkap (Complete Linkage/Farthest Neighbor)
Pautan Rataan(Average-Linkage Between Method)
Sentroid (Centroid Clustering)
Median Clustering
Ward’s Method
Klasifikasi METODE Analisis Kelompok
Tabel 1. Ukuran Ketakmiripan untuk data Interval
dk(i,j) = min (dki,dkj)Pautan Tunggal (Single Linkage/Nearest Neighbor)Pautan Lengkap (Complete Linkage/Farthest Neighbor)
dk(i,j) = maks (dki,dkj)
Pautan Rataan (Average Linkage/BAVERAGE) kj
ji
jki
ji
ijik d
nn
nd
nn
nd
),(
Sentroid (Centroid Clustering) ij2
ji
jikj
ji
jki
ji
ijik d
nn
nnd
nn
nd
nn
nd
)(
.),(
Median Clustering
Ward’s MethodMin ESS
TEKNIK PENGELOMPOKKAN
Misalkan ada himpunan obyek dan untuk tiap obyek diamati 2 peubah/variabel. Ingin diketahui apakah himpunan obyek tersebut mengelompok menjadi kelompok-kelompok di mana obyek dalam kelompok yang sama mirip dan antar kelompok tidak mirip satu dengan lainnya. Data tersaji sebagai berikut:
Observasi
Variabel
X1 X2
O1 5 5
O2 6 6
O3 15 14
O4 16 15
O5 25 20
O6 30 19
CONTOH 1:
Gunakan ukuran ketakmiripan Jarak Euclid Kuadrat dan beberapa teknik pengelompokkan
ObservasiVariabel
X1 X2
O1 5 5
O2 6 6
O3 15 14
O4 16 15
O5 25 20
O6 30 19
JARAK
PROXIMITY MATRIX
ObservasiObservasi
O1 O2 O3 O4 O5 O6
O1 0 2 181 221 625 821
O2 0 145 181 557 745
O3 0 2 136 250
O4 0 106 212
O5 0 26
O6 0
TEKNIK PENGELOMPOKKAN SENTROID
Observasi
Observasi
O1 O2 O3 O4 O5 O6
O1 0 2181
221
625
821
O2 0145
181
557
745
O3 0 2136
250
O4 0106
212
O5 0 26
O6 0
Kelompok
Pengelompokan
Variabel
X1 X2
1 O1,O2 5.5 5.5
2 O3 15 14
3 O4 16 15
4 O5 25 20
5 O6 30 19
Langkah 1:
Langkah 2:
Observasi
Observasi
O1,O2 O3 O4 O5 O6
O1, O2 0162.
00
200.50
590.50
782.50
O3 0 2135.
96
250.00
O4 0106.
00
212.00
O5 026.0
0
O6 0
Kelompok
Pengelompokan
Variabel
X1 X2
1 O1,O2 5.5 5.5
2 O3,O415.
514.
5
3 O5 25 20
4 O6 30 19
Observasi
Observasi
O1,O
2
O3,O
4
O5 O6
O1,O2 0181.
00
590.50
782.50
O3,O4 0120.
50
230.50
O5 026.0
0
O6 0
Kelompok
Pengelompokan
Variabel
X1 X2
1 O1,O2 5.5 5.5
2 O3,O415.
514.
5
3 O5,O627.
519.
5
Langkah 3:
Observasi
Observasi
O1,O
2
O3,O
4
O5,O
6
O1,O2 0181.
00
680.00
O3,O4 0169.
00
O5,O6 0
Kelompok
Pengelompokan
Variabel
X1 X2
1 O1,O2 5.5 5.5
2 (O3,O4),(O5,O6)21.
517
ObservasiObservasi
O1,O2 O3,O4,O5,O6
O1,O2 0 388.25
O3,O4,O5,O
6
0
Langkah 4:
Dendogram TEKNIK PENGELOMPOKKAN SENTROID
STUDI KASUS: Pengelompokan Wilayah Berdasarkan PDRB
Ambil 3 Kelompok
Deskripsi 3 Kelompok
DAFTAR PUSTAKAAitchison, J. and Aitken, C.G.G., 1976, Multivariate Binary Discriminantion by the Kernel Method, Biometrics, Vol 63, 413-420.Banks, D., Olszewski, R.T. and Maxion R.A 1999. Comparing Methods for Multivariate Nonparametric Regression. School of Computer Science, Carnegie Mellon University, Pittsburgh, PA, 15213.Breiman, L., Friedman, J., Olshen, R.A. and Stone, C. 1984. Classification and Regression Tress, Wadsworth, Belmont, CA.Caccuolus, T. 1973, Discriminant Analysis and Applications, Academic Press, New York.Chatfield, C., and Collins, A.J., 1980, Introduction to Multivariate Analysis, Chapman and Hall, New York.Dillon, W.R. 1978, On the Performance of Some Multinomial Classification Rules, Journal of American Statistical Association, 73, pp.305-313Dillon, W.R. and M. Goldstein, 1978, Multivariate Analysis Methods and Application, John Wiley & Sons, New York.Dudoit, S., Fridlyand, J. and Speed, T.P. 2002. Comparison of Discriminantion Methods for the Classifications of Tumors Using Gene Expression Data. Journal of the American Statistical Association, 97(457): 77 – 87.Habbema, J.D.F, 1976, Multivariate Discriminantion Method for Top Quark Analysis, Techonometrics, 39, 91-99.Hair, J. F. JR., Anderson, R.E., Tatham, R.L. and Black, W.C. 1998. Multivariate Data Analysis, Fifth Edition, Prentice-Hall, International, Inc.Holmstrom, L. and Sain, S.R. 1997. Multivariate Discriminant Methods for Top Quark Analysis, Technometrics, 39, 1, 91-99.Huberty, C.J. 1994. Applied Discriminant Analysis. A Wiley-Interscience Publication. John Wiley & Sons, Inc.Johnson RA and Wichern DW. 1992. Applied Multivariate Statistical Analysis, Prentice Hall, Englewood Chiffs, New Jersey.Manly, B.F.J. 1986. Multivariate Statistical Methods. A Primer Chapman & Hall. London.Michie, D., Spiegelhalter, D.J. and Taylor C.C. 1994. Machine Learning, Neural and Statistical Classification. Portier, K.M, 2001, Multivariate Statistical Methods, STA4702/5701.Sharma, S. 1996 . Applied Multivariate Techniques, John Wiley & Sons, Inc.
TERIMA KASIH
Top Related