Kecerdasan Buaasdtan
-
Upload
julius-sihotang -
Category
Documents
-
view
216 -
download
0
Transcript of Kecerdasan Buaasdtan
-
8/18/2019 Kecerdasan Buaasdtan
1/7
PERBANDINGAN IMPLEMENTASI DECISION TREE
DENGAN ALGORITMA C4.5 DAN C5.0
JULIUS SIHOTANG
DBC 113 174
Teknik Informatika Universitas Palangka Raya
Email : [email protected]
ABSTRAK
Pohon keputusan merupakan sebuah sistem atau cara yang manusia kembangkan untuk
membantu mencari solusi dan membuat keputusan dari masalah-masalah dengan
memperhitungkan berbagai macam faktor yang ada dalam masalah tersebut. Secara umum,
pohon keputusan adalah suatu pemodelan dari suatu persoalan yang terdiri dari serangkaian
keputusan yang mengarah ke solusi. Pada makalah ini akan dibahas mengenai perbedaan
implementasi teknik untuk menggunakan pohon keputusan dalam pengambilan keputusan dari
suatu masalah sesuai dengan teori keputusan baik algoritma C4.5 maupun algoritma C5.0.
Masalah yang dibahas adalah perbedaan kedua algoritma tersebut dalam menyelesaikan
permasalahan kredit. Simpul dalam pohon keputusan ini menyatakan keputusan dan faktor dari
luar, sedangkan u ung dari pohon keputusan menyatakan solusi. Setiap keputusan yang diambil
akan menghasilkan solusi yang berbeda pula.
Kata ku !" ! Pohon keputusan, pemodelan masalah, teori keputusan, solusi.
1. P# $a%u&uaKecer asan !uatan "#rtificial
Intelligence$ merupakan salah satu
%agian ari ilmu komputer yang
mempelajari %agaimana mem%uat mesin
"komputer$ apat melakukan pekerjaan
seperti se%aik yang ilakukan oleh
manusia %ahkan %isa le%ih %aik aripa a
yang ilakukan manusia. #plikasi atau
program kecer asan %uatan apat itulis
alam %ahasa komputer& %aik %ahasa '&Pascal& !asic& an %ahasa pemrograman
lainnya. Tetapi alam perkem%angan
selanjutnya& ikem%angkan %ahasa
pemrograman yang khusus untuk
aplikasi kecer asan %uatan& yaitu (IP)
an PR*(*+.
'. La $a(a T#)*"'.1. P# +a,-"&a K# utu(a
-
8/18/2019 Kecerdasan Buaasdtan
2/7
Pengam%ilan Keputusan a alah suatu proses
pemikiran alam rangka pemecahan suatu
masalah untuk memperoleh hasil akhir
untuk ilaksanakan. Kesalahan alam
pengam%ilan keputusan %isa %er ampak kepa a kerugian. ,isal alam perusahaan&
keputusan yang iam%il oleh pimpinan
perusahaan merupakan hasil pemikiran yang
harus ilaksanan oleh %a-ahannya atau
mereka yang harus ilaksanakan oleh
%a-ahannya atau mereka yang %ersangkutan
engan organisasi yang ia pimpin.
'.'. Data M" " +
ata ,ining merupakan proses yang
iulang an memerlukan interaksi manusia
alam prosesnya untuk menemukan pola
atau mo el %aru yang apat igeneralisasi
untuk masa yang akan atang& an
%ermanfaat jika igunakan untuk melakukan
suatu tin akan. ata mining %erisi pencarian
pola yang iinginkan alam ata%ase %esar
untuk mem%antu alam pengam%ilan
keputusan i-aktu yang akan atang. Pola/
pola ini ikenali oleh perangkat tertentu
yang apat mem%erikan suatu analisa ata
yang kemu ian apat ipelajari engan teliti
an %ermanfaat. an salah satu teknik ari
%agian ata mining a alah klasifikasi& yaitu
menentukan se%uah recor ata %aru ke
salah satu ari %e%erapa kategori atau klas
yang yang telah ifenisikan se%elumnya.
an salah satu %agian teknik ari klasifikasi
a alah pohon keputusan.
'.3. M#t)$# D#!"(") T*##
Pohon Keputusan merupakan representasi
se erhana ari teknik klasifikasi yang
merupakan proses pem%elajaran suatu fungsi
tujuan yang memetakan tiap himpunan
atri%ut ke satu ari kelas yang i efenisikanse%elumnya.
Pohon keputusan merupakan salah satu
meto e klasifikasi yang paling populer
karena mu ah untuk iinterpretasi oleh
manusia. engan kemampuannya untuk
mem/%reak o-n proses pengam%ilan
keputusan yang kompleks menja i le%ih
simple. Pohon keputusan juga apat
menemukan hu%ungan tersem%unyi antara
sejumlah calon varia%el input engan se%uah
varia%el target. )elain itu pohon keputusan
apat mema ukan antara eksplorasi ata an
pemo elan& sehingga sangat %aik se%agai
langkah a-al alam proses pemo elan.
+am%ar !lok iagram ,o el Klasifikasi
engan menggunakan meto e pohon
keputusan apat menghin ari munculnya
permasalahan engan menggunakan kriteria
yang jumlahnya le%ih se ikit pa a setiap
no e internal tanpa %anyak mengurangi
kualitas keputusan yang ihasilkan. an
kekurangan ari pohon keputusan
iantaranya a alah terja i overlap terutama
ketika kelas/kelas an kriteria yang
igunakan jumlahnya sangat %anyak an
-
8/18/2019 Kecerdasan Buaasdtan
3/7
kualitas hasil keputusan yang i apatkan
sangat tergantung pa a %agaimana pohon
terse%ut i esain.
,eto e ini igunakan untuk mempre iksi
nilai iskrit ari fungsi target& yang mana
fungsi pem%elajaran ipresentasikan oleh
se%uah ecision tree. ecision tree
merupakan himpunan I01T2E3.)etiap
path alam tree ihu%ungkan se%uah aturan&
imana presi ter iri ari sekumpulan no e
no e yang itemui& an kesimpulan ari
aturan ter iri atas kelas yang terhu%ung
enganleaf ari path.
Ter apat 4 jenis no e yang ter apat pa a
ecision tree& yaitu:
a.Root no e& merupakan no e paling atas&
pa ano e ini ti ak a a input an %isa ti ak
mempunyai output atau mempunyai outputle%ih ari satu.
%.Internal 3o e& merupakan no e
perca%angan. Pa a no e ini ter apat
perca%angan. Pa a no e ini ter apat satu
input an memiliki output mininmal ua.
c.(eaf no e atau terminal no e& merupakanno e akhir. Pa a no e ini ter apat satu input
an ti ak mempunyai output.
'.4. A&+)*"t,a C4.5
merupakan algoritma yang digunakan
untuk membuat Pohon Keputusan. alam
algoritma '5.6 untuk mem%angun pohon
keputusan hal pertama yang ilakukan yaitu
memilih atri%ut se%agai akar. Kemu ian
i%uat ca%ang untuk tiap/tiap nilai i alam
akar terse%ut. (angkah %erikutnya yaitu
mem%agi kasus alam ca%ang. Kemu ian
ulangi proses untuk setiap ca%ang sampai
semua kasus pa a ca%ang memiliki kelasyang sama
'.5. A&+)*"t,a C5.0
#lgoritma '6.7 merupakan merupakan
penyempurnaan ari algoritma ter ahulu
yang i%entuk oleh Ross 8uinlan pa a
tahun 9 ;
-
8/18/2019 Kecerdasan Buaasdtan
4/7
,enggunakan Teknik ata ,ining ecision
Tree oleh ogi usuf A& 0. Rian Pratikto&
Bivianne #. ) "Curusan Teknik In ustri&
Universitas Katolik Parahyangan$.
3.1. Ju* a& I /K&a(" "ka(" K*#$"t
Pa a jurnal pertama penulis melakukan
pengimplementasian algoritma '5.6.
)etelah ilakukan pengujian meto e
algoritma '5.6 Pa a rapi ,iner& maka
ter%entuk pohon keputusan seperti gam%ar.
Pa a gam%ar yang menja i akar ari pohon
keputusan yaitu -aktu. Pohon keputusan
iatas menghasilkan rule yang yang akan
iimplementasikan pa a program. Rules
terse%ut se%agai %erikut:
9. Cika -aktu =pen ek? an pen apatan
=%esar?& maka keterangan D (ancar.
. Cika -aktu =pen ek?& pen apatan =kecil?
an pinjaman =kecil?& maka keterangan D
(ancar.
4. Cika -aktu =pen ek?& pen apatan=kecil?
an pinjaman =se ang?& maka keterangan D
(ancar.
5. Cika -aktu =pen ek?& pen apatan
=se ang? ?& maka keterangan D (ancar.
6. Cika -aktu =se ang?& maka keterangan D
Ti ak (ancar.
Pa a jurnal pertama ini penulis melakukan
pengujian engan algoritma '5.6 imana
tingkat akurasinya tergolong "ood
Classification. !erikut merupakan etail
Rapi ,iner :
Kele%ihan :
Kele%ihan penggunaan meto e ecision tree
pa a jurnal pertama ini a alah tingkat
keakurasian pengam%ilan keputusan su ahsangatlah %aik& hal ini i asarkan pa a
tingkat perhitungan rapi minerF aerah
pengam%ilan keputusan nasa%ah yang
se%elumnya sangat luas an kompleks apat
i%uat se emikian se erhanaF eliminasi
perhitungan/perhitungan yang ti ak
iperlukan& karena pa a ecision tree
sample yang iuji hanya yang memenuhi
kriteria tertentu.
Kekurangan :
Kekurangan penggunaan meto e ecision
tree pa a jurnal pertama ini a alah apat
terja i overlap jika ter apat kelas/kelas
nasa%ah yang memiliki kriteria yang mirip.
-
8/18/2019 Kecerdasan Buaasdtan
5/7
2al ini juga menye%a%kan kalkulasi error
yang sangat %anyak saat system ijalankan.
3.'. Ju* a& II /P# # tua R#("k) K*#$"t
Pa a jurnal ke ua penulis melakukan pengimplementasian meto e ecision tree
engan #lgoritma '6.7 untuk menemukan
resiko kre it terha ap kemampuan client
alam menyelesaikan ke-aji%annya se%agai
pelaku kre it. Penilaian kemampuan
ilakukan engan %anyak kriteria tertentu
,o el cre it scoring yang akan
ikem%angkan a alah mo el yang
mempre iksi risiko kre it se%agai kre it
lancar an kre it macet. ,o el ini akan
igunakan pa a tahap skoring kre it. )etiap
pemohon kre it iharuskan mengisi
informasi/informasi yang selanjutnya akan
iproses pa a tahap skoring kre it.Informasi/informasi yang harus iisi oleh
pemohon kre it a alah:
9. Penghasilan& rata/rata penghasilan selama
tiga %ulan terkahir.
. 'icilan per %ulan& %esarnya pem%ayaran
yang harus ilakukan setiap %ulan.
4. Cumlah perio e pinjaman& jumlah perio e
pelunasan utang "pilihanannya a alah 9 &
5& 4G %ulan$.
5. Rekening koranHta%ungan& rata/rata
perputaran keuangan selama tiga %ulan
terkahir.
6. Umur& umur pemohon kre it.
G. Rekening tagihan telepon& rata/rata
tagihan telepon yang harus i%ayar alam
tiga %ulan terakhir.
-
8/18/2019 Kecerdasan Buaasdtan
6/7
D 5 an Rekening koran H Ta%ungan
957. 99. 56 then (ancar
Rule 6 for (ancar if Penghasilan JD
94777777 an P 66 an Cumlah
!ulan D 4G an Rekening koran H Ta%ungan
JD 957. 99. 56 an 'icilan per !ulan
.676.577 then (ancar
Rule G for ,acet if Penghasilan JD
94777777 an P JD66 then ,acet
Rule < for ,acet if Penghasilan JD
94777777 an P 66 an Cumlah !ulan
D 5 an Rekening koran H Ta%ungan JD
957. 99. 56 an 'icilan per !ulan JD
.676.577 then ,acet
Pemo elan pre iksi status kre it i%antu
engan soft-are 'lementine. #lgoritma
yang igunakan a alah algoritma '6.7.
#lgoritma '6.7 %ekerja engan melakukan
splitting pa a sampel %er asarkan varia%el
yang mem%erikan information gain
tertinggi. )etiap su% sampel i efinisikan
engan first split kemu ian melakukan split
kem%ali yang %iasanya i asarkan pa a
varia%el yang %er%e a an proses akan terus
%erulang hingga su% sampel ti ak apat
ilakukan split.
Kele%ihan :
Kele%ihan ari penggunaan algoritma '6.7
yaitu Luite ro%ust pa a keha iran masalah
seperti missing ata an jumlah yang %esar
ari input varia%el. ,o el yang ihasilkan
oleh algoritma '6.7 le%ih mu ah ipahami
aripa a mo el lainnya untuk
iinterpretasikan. ,o el pre iksi yang
ihasilkan %er asarkan ari training ata
se%anyak G7 ari total sampel yang a a.
Kekurangan :
Kekurangan ari algoritma '6.7 a alah
masih %anyak terja i overlap& jika
pengklasifikasian i sarkan pa a kriteria
yang telalu umum an kompleks. 2al ini
juga mem%uat system mu ah ter%e%ani
engan space penyimpanan yang cukup %anyak.
4. P# utu
alam menggunakan meto e ecision tree
algoritma '6.7 le%ih %aik i%an ing '5.6.
karena algoritma '6.7 apat melakukan penghematan memori le%ih %esar is%an ing
'5.6 se%anyak 7 le%ih cepat. Perhitungan
ini i asarkan pa a tautan jurnal yang
melakukan per%an ingan ke ua algoritma
melalui %e%erapa sample kompleks.
#lgoritme '6.7 tetap ianggap se%agai
algoritma yang sangat mem%antu alammelakukan klasifikasi ata karena
karakteristik ata yang iklasifikasi apat
iperoleh engan jelas %aik alam %entuk
struktur pohon keputusan maupun aturan if/
then& sehingga memu ahkan pengguna
alam melakukan penggalian informasi
terha ap ata yang %ersangkutan.
Da ta* Pu(taka
-
8/18/2019 Kecerdasan Buaasdtan
7/7
Pramu iono I. Pengantar ata ,ining:
,enam%ang Permata Pengetahuan i
+unung ata. 774
JUR(:http:HHikc. inus.ac.i HumumHikoHik
o/ atamining.Mip iakses tanggal 47ecem%er 796.
3ugroho& 0anuel.& Kristanto& 2arianto.& an
*slan& etli. Bali itas )uatu #lamat
menggunakan Pohon keputusan engan
#lgoritma I 4. Curnal Informatika&
Bolume 4 3omor #pril 77