IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY...
-
Upload
truongdieu -
Category
Documents
-
view
249 -
download
0
Transcript of IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY...
IMPLEMENTASI GABUNGAN
METODE HIERARCHY DAN ALGORITMA
K-MEANS DALAM CLUSTER DOKUMEN BERITA
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Oleh :
Marisa Dyah Anggraini
NIM. 201010370311064
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2015
LEMBAR PERSETUJUAN
IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA
K-MEANS DALAM CLUSTER DOKUMEN BERITA
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui
Pembimbing I
Yuda Munarko, S.Kom., M.Sc.
NIDN: 0706077902
Pembimbing II
Yufis Azhar, M.Kom.
NIDN: 0728088701
LEMBAR PENGESAHAN
IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN
ALGORITMA K-MEANS DALAM CLUSTER
DOKUMEN BERITA
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh:
Marisa Dyah Anggraini
NIM. 201010370311064
Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji
pada tanggal 16 Januari 2015
Menyetujui,
Mengetahui,
Ketua Jurusan Teknik Informatika
Yuda Munarko, S.Kom., M.Sc.
NIDN: 0706077902
Penguji I
Galih Wasis Wicaksono, S.Kom, M.Cs
NIDN: 0723028801
Penguji II
Agus Eko Minarno, M.Kom
NIDN : 0729118203
LEMBAR PERNYATAAN
Yang bertanda tangan di bawah ini:
NAMA : MARISA DYAH ANGGRAINI
NIM : 201010370311064
FAK. / JUR. : TEKNIK / TEKNIK INFORMATIKA
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul
“IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN
ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA”
beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis
orang lain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang
telah disebutkan sumbernya.
Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila
kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya
saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya
siap menanggung segala bentuk resiko/sanksi yang berlaku.
Mengetahui,
Dosen Pembimbing
Yuda Munarko, S.Kom., M.Sc.
NIDN: 0706077902
Malang, 9 Januari 2015
Yang Membuat Pernyataan
Marisa Dyah Anggraini
NIM: 201010370311064
iv
KATA PENGANTAR
Dengan mengucap puji dan syukur kehadirat Allah SWT, karena atas ridho
dan hidayah-Nya, sehingga penulis dapat menyelesaikan Tugas Akhir dengan
judul IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN
ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA, untuk
memenuhi persyaratan kelulusan program studi Strata 1 pada jurusan Teknik
Informatika di Univeristas Muhammadiyah Malang. Selain itu penulis juga dapat
mencoba menerapkan dan membandingkan pengetahuan dan keterampilan yang
diperoleh di bangku kuliah dengan kenyataan yang ada di lingkungan kerja.
Penulis merasa bahwa dalam menyusun laporan ini masih menemui
beberapa kesulitan dan hambatan di samping itu juga menyadari bahwa penulisan
laporan ini masih jauh dari sempurna dan masih banyak kekurangan lainnya,
maka dari itu penulis mengharapkan saran dan kritik yang membangun dari semua
pihak.
Malang. 9 Januari 2015
Penulis
v
DAFTAR ISI
HALAMAN JUDUL
LEMBAR PERSETUJUAN
LEMBAR PENGESAHAN
LEMBAR PERNYATAAN KEASLIAN
ABSTRAK ....................................................................................................... i
ABSTRACT ..................................................................................................... ii
LEMBAR PERSEMBAHAN ....................................................................... iii
KATA PENGANTAR ................................................................................... iv
DAFTAR ISI ................................................................................................... v
DAFTAR GAMBAR .................................................................................... vii
DAFTAR TABEL ........................................................................................ viii
DAFTAR GRAFIK ........................................................................................ ix
BAB I : PENDAHULUAN
1.1 Latar Belakang .......................................................................................... 1
1.2 Rumusan Masalah ..................................................................................... 2
1.3 Tujuan Penelitian ...................................................................................... 2
1.4 Batasan Masalah......................................................................................... 3
1.5 Metodologi ................................................................................................ 3
1.5.1. Studi Pustaka .................................................................................. 3
1.5.2. Analisis Kebutuhan ......................................................................... 3
1.5.3. Perancangan Sistem ........................................................................ 4
1.5.4. Implementasi Program .................................................................... 4
1.5.5. Pengujian Sistem ............................................................................ 4
1.5.6. Penyusunan Laporan ....................................................................... 5
1.6 Sistematika Penulisan................................................................................. 5
BAB II : LANDASAN TEORI
2.1 Knowledge Discovery in Database (KDD) ............................................... 7
2.2 Clustering .................................................................................................. 9
2.3 Metode Hierarchy .................................................................................... 10
2.4 Centroid Linkage Hierarchy Method (CLHM) ........................................13
2.5 Metode K-Means ..................................................................................... 14
vi
2.6 PHP (Hypertext Preprocessor) ............................................................... 15
2.7 MySQL .................................................................................................... 17
2.8 Unified Modeling Language (UML) ....................................................... 19
BAB III : ANALISIS DAN PERANCANGAN SISTEM
3.1 Analisis Kebutuhan Perangkat Lunak ......................................................22
3.1.1 Metode Analisis ............................................................................ 22
3.1.2 Hasil Analisis ................................................................................ 22
3.1.2.1 Analisis Kebutuhan Proses ............................................... 22
3.1.2.2 Analisis Kebutuhan Masukan ........................................... 23
3.1.2.3 Analisis Kebutuhan Keluaran ........................................... 23
3.1.2.4 Data Penelitian .................................................................. 23
3.1.3 Kebutuhan Antar Muka ................................................................ 25
3.1.4 Analisis Kebutuhan Perangkat Lunak .......................................... 26
3.1.5 Analisis Kebutuhan Minimum Perangkat Keras .......................... 26
3.2 Perancangan Perangkat Lunak ................................................................ 27
Metode Perancangan ............................................................................ 27
Hasil Perancangan ............................................................................... 27
BAB IV : IMPLEMENTASI DAN PENGUJIAN
4.1 Implementasi Perangkat Lunak ............................................................... 35
4.1.1. Batasan Implementasi ................................................................... 35
4.1.2. Implementasi Metode Hierarchy .................................................. 35
4.1.3. Implementasi Metode K-Means ................................................... 46
4.1.4. Implementasi Antar Muka ............................................................ 49
4.2 Pengujian Perangkat Lunak ............................................................ 53
4.2.1. Pengujian Fitur Perangkat Lunak ................................................. 53
4.2.2. Pengujian Performansi Algoritma ................................................ 54
BAB V : PENUTUP
5.1 Kesimpulan ...............................................................................................56
5.2 Saran ........................................................................................................ 56
DAFTAR PUSTAKA .................................................................................... 57
LAMPIRAN .................................................................................................. 59
BIOGRAFI PENULIS .................................................................................. 63
vii
DAFTAR GAMBAR
Gambar 2.1 Tahapan Knowledge Discovery in Database (KDD) ...................7
Gambar 2.2 Hierarchy Clustering...................................................................11
Gambar 2.3 Agglomerative ............................................................................12
Gambar 2.4 Teknik-teknik dalam analisis cluster...........................................12
Gambar 2.5 Ilustrasi Algoritma Centroid Linkage Hierarchy Method ..........14
Gambar 2.6 Hubungan komponen-komponen PHP ...................................... 16
Gambar 2.7 Hubungan dari ketiga komponen utama dari halaman web
dinamis ...................................................................................... 16
Gambar 3.1 Use Case diagram aplikasi ........................................................ 28
Gambar 3.2 Activity diagram tambah dokumen ............................................ 31
Gambar 3.3 Activity diagram edit dokumen ................................................. 31
Gambar 3.4 Activity diagram hapus dokumen .............................................. 31
Gambar 3.5 Activity diagram klasterisasi dokumen ...................................... 32
Gambar 3.6 Sequence diagram ..................................................................... 32
Gambar 3.7 DFD Level 0 .............................................................................. 33
Gambar 3.8 DFD Level 1 .............................................................................. 33
Gambar 3.9 Flowchart .................................................................................. 34
Gambar 3.10 Halaman Utama ....................................................................... 34
Gambar 4.1 Dendogram ................................................................................ 46
Gambar 4.2 Halaman Utama ......................................................................... 50
Gambar 4.3 Proses manipulasi konten .......................................................... 50
Gambar 4.4 Tampilan untuk menambah dokumen berita ............................. 50
Gambar 4.5 Tampilan edit dokumen berita ................................................... 51
Gambar 4.6 Tampilan setelah proses cluster dokumen ................................ 51
Gambar 4.7 Tampilan nilai centroid di setiap cluster .................................... 52
Gambar 4.8 Tampilan isi dari cluster ............................................................. 52
Gambar 4.12 Tampilan bantuan untuk user .................................................. 53
viii
DAFTAR TABEL
Tabel 3.1 List Keywords untuk Metadata .......................................................24
Tabel 3.2 Deskripsi Aktor ............................................................................. 28
Tabel 3.3 Deskripsi Use Case Deskripsi Use Case ....................................... 28
Tabel 3.4 Use Case Manage Dokumen ......................................................... 29
Tabel 3.5 Use Case Tambah Dokumen ......................................................... 29
Tabel 3.6 Use Case Edit Dokumen ............................................................... 29
Tabel 3.7 Use Case Hapus Dokumen .......................................................... 30
Tabel 3.8 Use Case Klasterisasi Dokumen ................................................... 30
Tabel 4.1 tabel tf.idf ...................................................................................... 36
Tabel 4.2 Iterasi 1 .......................................................................................... 41
Tabel 4.3 Agglomeration Schedule ............................................................... 41
Tabel 4.4 Nilai term cluster 4,5 .................................................................... 42
Tabel 4.5 Iterasi 2 .......................................................................................... 44
Tabel 4.6 Agglomeration Schedule ............................................................... 44
Tabel 4.7 Nilai term cluster 1,2,4,5 .............................................................. 44
Tabel 4.8 Iterasi 3 .......................................................................................... 45
Tabel 4.9 Agglomeration Schedule ............................................................... 45
Tabel 4.10 Tabel nilai centroid ..................................................................... 46
Tabel 4.11 Nilai centroid metode K-Means .................................................. 47
Tabel 4.12 Pengujian fitur pada perangkat lunak .......................................... 53
Tabel 4.13 Perhitungan akurasi ..................................................................... 54
Tabel 4.14 Perhitungan rata-rata prosentase akurasi ..................................... 55
ix
DAFTAR GRAFIK
Grafik 3.1 Frekuensi Keyword ..................................................................... 25
10
DAFTAR PUSTAKA
Andayani, Sri. 2007. Pembentukan cluster dalam Knowledge Discovery in
Database dengan Algoritma K-Means. FMIPA. UNY: Yogyakarta.
[Online]. Tersedia:
http://staff.uny.ac.id/sites/default/files/Pembentukan%20cluster%20dlm%20
KDD%20dgn%20Algoritma%20kmeans.pdf [Diakses 18 Januari 2014,
18:37]
Andre, Petrus. 2013. Konsep Dasar Belajar Bahasa Pemrograman PHP.
[Online]. Tersedia: http://www.andre.web.id/2013/10/belajar-php.html
[Diakses 16 April 2014, 13:16]
Damayanti, Nadia, Mubtadi’i, Nur Rosyid, dan Helen, Afrida. Temu Kembali
Informasi Berdasarkan Lokasi pada Dokumen yang Dikelompokkan
Menggunakan Metode Centroid Linkage Hierarchy. [Online]. Tersedia:
http://repo.eepis-its.edu/1115/1/7407040059.pdf [Diakses 18 Januari 2014,
14:31]
Eldira, Hervilorra. Web Mining untuk Pencarian Dokumen Bahasa Inggris
menggunakan Hill Climbing Automatic Cluster. [Online]. Tersedia:
http://repo.eepis-its.edu/733/1/1011.pdf [Diakses 18 Januari 2014, 14:23]
Hong, K. 2013. PHP & MYSQL TUTORIAL-REQUEST 2013. [Online]. Tersedia:
http://www.bogotobogo.com/php/php1.php [Diakses 16 April 2014, 12:59]
Karanjkar, Sushrut. 1998. Hierarchical Clustering. [Online]. Tersedia:
http://www-users.cs.umn.edu/~sushrut/research/pub/cover/node24.html
[Diakses 16 April 2014, 12:48]
Laboratorium Data Mining Jurusan Teknik Industri Fakultas Teknologi Industri
Universitas Islam Indonesia. 2014. Modul II CLUSTERING. [Online].
Tersedia: http://www.ss354.com/wp-content/uploads/2014/03/Data-Mining-
Modul-Clustering-Modul-Clustering.pdf [Diakses 18 Januari 2014, 18:40]
Minartiningtyas, Brigida Arie. 2013. Pengertian UML. [Online]. Tersedia:
http://informatika.web.id/pengertian-uml.htm [Diakses 18 April 2014,
19:40]
Pasaribu, Manaek Y.D. 2008. Analisa dan Implementasi Metode Hidden Markov
Model pada Intrusion Detection System (IDS). [Online]. Tersedia:
http://digilib.ittelkom.ac.id/index.php?option=com_content&view=article&i
11
d=210:kdd&catid=20:informatika&Itemid=14 [Diakses 18 Maret 2014,
18:29]
Prasetyo, Eko. 2012. DATA MINING-Konsep dan Aplikasi Menggunakan
MATLAB. Yogyakarta: ANDI
Prasetyo, Wahid Budi. 2013. Definisi dan Fungsi Mysql, Apache dan PHP.
[Online]. Tersedia: http://comput-techno.blogspot.com/2013/01/definisi-
dan-fungsi-mysql-apache-dan-php.html [Diakses 16 April 2014, 13:18]
Rahmawati, Lina, Abadyo, dan Lestari, Trianingsih Eni. Analisis Kelompok
dengan Menggunakan Metode Hierarki untuk Pengelompokan
Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Kesehatan. [Online].
Tersedia: http://jurnal-
online.um.ac.id/data/artikel/artikel1768E9E20B8E53209B2AAE90144ED6
6D.pdf [Diakses 16 April 2014, 12:51]
Santosa, Budi. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan
Bisnis, First Edition ed. Yogyakarta: Graha Ilmu
Universitas Kristen Duta Wacana. Analisis Cluster. [Online]. Tersedia:
http://lecturer.ukdw.ac.id/budsus/pdf/textwebmining/clustering.pdf
[Didownload 19 Januari 2014, 08:09]
Wibowo, Aan Tri. 2013. Pembuatan Aplikasi E-Commerce Pusat Oleh-Oleh Khas
Pacitan pada Toko Sari Rasa Pacitan. [Online]. Tersedia:
http://journal.ijns.org/index.php/ijns/article/view/47/46 [Diakses 16 April
2014, 13:09]
58