Post on 05-Apr-2018
7/31/2019 Slide DM 09 K-Nearest Neighbour
1/21
Data Mining
7/31/2019 Slide DM 09 K-Nearest Neighbour
2/21
Overview
NN adalah pendekatan untuk mencari kasusdengan menghitung antara kasus baru dengankasus lama, yaitu dengan berdasarkan kpdpencocokan bobot dari jumlah fitur yang ada.
Contoh; jika diinginkan mencari solusi terhadap seorang pasien
baru dengan menggunakan solusi dari pasienterdahulu.
Untuk mencari kasus pasien lain mana yang akan
digunakan, maka akan dihitung kedekatan kasuspasien baru dengan semua pasien lama.
7/31/2019 Slide DM 09 K-Nearest Neighbour
3/21
B
(lama)
A
(lama)
C
(baru) d1
d2
Dua pasien lama A dan B. Ketika ada pasien baru C,
maka akan dicari solusi dari pasien yg terdekat.
Seandainya d1 dan d2 adalah kedekatan antara C
dgn A dan B, maka solusi dari pasien B lah yg akan
digunakan sebagai solusi utk pasien baru C
7/31/2019 Slide DM 09 K-Nearest Neighbour
4/21
Rumus utk melakukan penghitungan
kedekatan antara dua kasus
n
f(Ti, Si) * Wii=1
Similarity (T,S) =
Wi Keterangan:
T : kasus baru
S : kasus yg ada dlm penyimpanan
n : jumlah atribut dlm setiap kasus i : atribut individu antara 1 s.d n
f : fungsi similarity atribut i antara kasus T dan kasus S
W : bobot yg diberikan pada atribut ke-i
7/31/2019 Slide DM 09 K-Nearest Neighbour
5/21
Kedekatan umumnya berada pada nilai antara
0 dan 1
Nilai 0 kedua kasus mutlak tdk mirip
Nilai 1
mirip dengan mutlak
7/31/2019 Slide DM 09 K-Nearest Neighbour
6/21
Contoh Kasus :
Untuk menentukan seorang calon nasabahakan bermasalah atau tdk bermasalah, kriteriayg diperlukan meliputi:
Jenis kelamin Pendidikan
Agama
Salah satu atribut merupakan data solusi peritem data yg disebut target atributmisalnyaatribut bermasalah dgn nilai ya atautidak
7/31/2019 Slide DM 09 K-Nearest Neighbour
7/21
Tabel Contoh Kasus
Algoritma NN
No Jenis kelamin Pendidikan Agama Bermasalah
1 L S1 ISLAM YA
2 P SMA KRISTEN TIDAK3 L SMA ISLAM TIDAK
4 L SMA KRISTEN ?
7/31/2019 Slide DM 09 K-Nearest Neighbour
8/21
Contoh
Berdasarkan tabel diatas akan dibuat bobotbagi masing-masing atribut terpilih yg bukan
atribut target/tujuan/dipengaruhi.
Pembobotan akan diberikan kpd atribut Jenis kelamin 0,5
Pendidikan 1
Agama 0,75 Kedekataan antara nilai-nilai dlm atribut juga
perlu didefinisikan.
7/31/2019 Slide DM 09 K-Nearest Neighbour
9/21
Kedekatan nilai atributjenis kelamin
Nilai1 Nilai2 kedekatan
L L 1P P 1
L P 0,5
P L 0,5
7/31/2019 Slide DM 09 K-Nearest Neighbour
10/21
Kedekatan nilai atribut pendidikan
Nilai1 Nilai2 kedekatan
S1 S1 1SMA SMA 1
S1 SMA 0,4
SMA S1 0,4
7/31/2019 Slide DM 09 K-Nearest Neighbour
11/21
Kedekatan nilai atribut Agama
Nilai1 Nilai2 kedekatan
Islam Islam 1Kristen Kristen 1
Islam Kristen 0,75
Kristen Islam 0,75
7/31/2019 Slide DM 09 K-Nearest Neighbour
12/21
Apabila terdpt kasus calon nasabah baru
Jensi kelamin : L
Pendidikan : SMA
Agama : Kristen
Apakah calon nasabah tsb akan bermasalahatau tidak ?
Caranya: Hitung kedekatan kasus baru dengankasus yang sudah ada (kasus yg sudahterjadi ada 3 kasus/record).
7/31/2019 Slide DM 09 K-Nearest Neighbour
13/21
Langkah 1 : Hitung kedekatan kasus
baru dengan kasus/record #1
A = Kedekatan nilai atribut jenis kelamin (kasus baru : L, Rec#1 : L) 1
B = Bobot atribut jenis kelamin 0,5
C = kedekatan nilai atribut pendidikan (kasus baru : SMA,Rec #1 : S1) 0,4
D = Bobot atribut pendidikan 1
E = Kedekatan nilai atribut agama ( Kristen, Islam) 0,75
F = Bobot atribut agama 0,75
7/31/2019 Slide DM 09 K-Nearest Neighbour
14/21
Hitung jarak kedekatan kasus 1/rec#1
Jarak = (A*B) + (C*D) + (E*F)
B+D+F
Jarak = (1 * 0,5) + (0,4 * 1) + (0,75 * 0,75)0,5 + 1 + 0,75
Jarak = 1,4625
2,25
Jarak = 0,65
7/31/2019 Slide DM 09 K-Nearest Neighbour
15/21
Langkah 2 : Hitung kedekatan kasus
baru dengan kasus/record #2
A = Kedekatan nilai atribut jenis kelamin (kasus baru : L, Rec#2 :P) 0,5
B = Bobot atribut jenis kelamin 0,5
C = kedekatan nilai atribut pendidikan (kasus baru : SMA,Rec #2 : SMA) 1
D = Bobot atribut pendidikan 1
E = Kedekatan nilai atribut agama ( Kristen, Islam) 0,75
F = Bobot atribut agama 0,75
7/31/2019 Slide DM 09 K-Nearest Neighbour
16/21
Hitung jarak kedekatan kasus/rec#2
Jarak = (A*B) + (C*D) + (E*F)
B+D+F
Jarak = (0,5* 0,5) + (1 * 1) + (0,75 * 0,75)0,5 + 1 + 0,75
Jarak = 1,8125
2,25
Jarak = 0,8
7/31/2019 Slide DM 09 K-Nearest Neighbour
17/21
Langkah 3 : Hitung kedekatan kasus
baru dengan kasus/record #3
A = Kedekatan nilai atribut jenis kelamin (kasus baru : L, Rec#3 : L) 1
B = Bobot atribut jenis kelamin 0,5
C = kedekatan nilai atribut pendidikan (kasus baru : SMA,Rec #3 : SMA) 1
D = Bobot atribut pendidikan 1
E = Kedekatan nilai atribut agama ( Kristen, Islam) 0,75
F = Bobot atribut agama 0,75
7/31/2019 Slide DM 09 K-Nearest Neighbour
18/21
Hitung jarak kedekatan kasus/rec#3
Jarak = (A*B) + (C*D) + (E*F)
B+D+F
Jarak = (1* 0,5) + (1 * 1) + (0,75 * 0,75)0,5 + 1 + 0,75
Jarak = 2,0625
2,25
Jarak = 0,9
7/31/2019 Slide DM 09 K-Nearest Neighbour
19/21
Langkah 4 : Memilih kasus dengan
kedekatan yg paling dekat
Berdasarkan langkah 1,2,3 diketahui nilai
masing-masing adalah:
Langkah 1 jarak=0,65
Langkah 2 jarak=0,8
Langkah 3 jarak=0,9
Maka kasus dengan kedekatan terdekat adalahnilai tertinggi 0,9
7/31/2019 Slide DM 09 K-Nearest Neighbour
20/21
Langkah 5 : Menggunakan klasifikasi
dari kasus dengan kedekatan terdekat
Berdasarkan langkah 4, maka klasifikasi dari
kasus 3 yang akan digunakna untuk
memprediksi kasus baru. Maka kemungkinan kasus nasabah baru akan
Tidak bermasalah.
7/31/2019 Slide DM 09 K-Nearest Neighbour
21/21
Selesai