Pemetaan Kecelakaan Lalu Lintas
Transcript of Pemetaan Kecelakaan Lalu Lintas
![Page 1: Pemetaan Kecelakaan Lalu Lintas](https://reader036.fdocument.pub/reader036/viewer/2022081820/577c86b21a28abe054c240be/html5/thumbnails/1.jpg)
8/20/2019 Pemetaan Kecelakaan Lalu Lintas
http://slidepdf.com/reader/full/pemetaan-kecelakaan-lalu-lintas 1/6
PEMETAAN KECELAKAAN LALU LINTAS BERBASIS
KLASIFIKASI NAIVE BAYES DENGAN PARAMETER
INFRASTRUKTUR JALAN
Wawan Yunanto1,2) Mochamad Hariadi 1) Mauridhi Hery Purnomo 1) 1) Jurusan Teknik Elektro ITS, Surabaya 60111, email: [email protected], [email protected]
2) Jurusan Komputer, Politeknik Caltex Riau, email: [email protected]
Abstrak – Keadaan infrastruktur jalan sangatmempengaruhi tingkat kecelakaan lalu lintas, namun
sulit untuk dicari seberapa besar pengaruh tersebut
secara manual karena ribuan data kecelakaan
muncul setiap tahunnya. Metode komputasi
memberikan kemudahan dalam mengestrak informasidari sekumpulan data yang besar sehinggainformasi-informasi tersembunyi yang terkandung di
dalamnya bisa didapatkan. Metode Naive Bayes
digunakan untuk klasifikasi data-data kecelakaan
lalu lintas secara cerdas dan hasilnya digunakan
untuk melakukan prediksi tingkat kecelakaan pada
berbagai macam infrastruktur jalan. Akurasi dari
prediksi yang dilakukan paling rendah adalah
28.37%, yaitu pada infrastruktur jalan berupa
simpang dan yang paling tinggi adalah 78.04% pada
infrastruktur jalan berupa arus lalu lintas. Hasil
prediksi ini kemudian dibandingkan dengan metode
klasifikasi lain yang umum digunakan, yaitu DecisionTree dan SVM.
Kata Kunci : kecelakaan lalu lintas, klasifikasi, naive
bayes, infrastruktur jalan
1. PENDAHULUAN
Badan Pusat Statistik [1] mencatat bahwa angka
kecelakaan lalu lintas yang terjadi di Indonesia masih
cukup tinggi seiring dengan pertumbuhan jumlah
kendaraan bermotor yang sangat pesat. Kecelakaan
melibatkan berbagai jenis kendaraan bermotor,
terjadi di berbagai jenis jalan, dan melibatkan pelaku/korban dari berbagai usia. Angka kecelakaan
yang terus meningkat membuat semua pihak merasa
perlu untuk dilakukan langkah-langkah pencegahan.
Supaya kebijakan yang dihasilkan relevan dengan
permasalahan yang dihadapi dalam upaya
menurunkan angka kecelakaan, maka kebijakan
tersebut harus didukung dengan informasi-informasi
yang berasal dari data-data kecelakaan yang selama
ini sudah terjadi.Kepolisian Republik Indonesia memiliki data-data
kecelakaan lalu lintas hasil dari pencatatan setiap
peristiwa kecelakaan yang terjadi. Data-data tersebut
perlu dikelola dalam suatu basis data untukmemudahkan proses penggalian informasi-informasi
yang ada didalamnya. Agar lebih mudah dipahami
maka informasi yang didapatkan dikelola
menggunakan suatu metode komputasi data miningyang membuat data-data kecelakaan menjadi sumber
untuk suatu model yang bisa digunakan untuk
memprediksi suatu kejadian.
Proses penggalian informasi bisa dilakukan dengan
berbagai cara, salah satunya adalah denganmelakukan klasifikasi data-data kecelakaan
berdasarkan parameter tertentu. Dengan
mengklasifikasikan data maka proses pencarian data
menjadi lebih mudah dan cepat karena data sudah
terkelompokan ke dalam kelas-kelas tertentu.
Klasifikasi bisa dilakukan secara manual dengan
menentukan parameter-parameter beserta nilainya
masing-masing atau dilakukan secara otomatis
dengan menggunakan metode-metode data mining.
Berdasarkan kebutuhan akan pencarian informasi
tentang kecelakaan yang melibatkan beberapa
kriteria yang tidak bisa ditentukan sebelumnya, maka
penggunakan metode data mining merupakan solusiyang layak untuk diajukan.
Penelitian ini mengusulkan penggunaan Naive Bayes
untuk klasifikasi data-data kecelakaan lalu lintas di
Indonesia yang sepanjang penelusuran penulis belum
pernah dilakukan sebelumnya. Klasifikasi dilakukan berdasarkan keadaan infrastruktur jalan dan hasilnya
diharapkan bisa digunakan untuk memprediksi
tingkat kecelakaan lalu lintas.
2. METODE NAIVE BAYES
Bayesian merupakan sebuah metode dalam bidang
probabilitas dan statistik, yang dinamai sesuai dengan penemunya, yaitu Thomas Bayes. Metode ini berawal
dari teori probabilitas dan ditambah dengan
kemampuan untuk menangani suatu ketidakpastian
yang memang sering terjadi di kehidupan [2].
Teorema Bayes dinotasikan seperti pada Persamaan
(1).
)(
)()|()|(
B P
A P A B P B A P (1)
Teorema Bayes merupakan suatu metode untuk
memperbaharui tingkat kepercayaan kita terhadap
kemungkinan terjadinya peristiwa A yang
dipengaruhi oleh peritiwa yang lain, misal B. Dalam
hal ini, P(A) biasanya disebut dengan prior
![Page 2: Pemetaan Kecelakaan Lalu Lintas](https://reader036.fdocument.pub/reader036/viewer/2022081820/577c86b21a28abe054c240be/html5/thumbnails/2.jpg)
8/20/2019 Pemetaan Kecelakaan Lalu Lintas
http://slidepdf.com/reader/full/pemetaan-kecelakaan-lalu-lintas 2/6
probability dari A, P(A|B) disebut posterior
probability dari A yang dipengaruhi B, sementara
P(B|A) disebut likelihood dari A yang dipengaruhi
B.
Menurut [3], probabilitas bersyarat memberikan
gambaran bahwa suatu kejadian itu bisa dipengaruhioleh kejadian yang lain, dan kejadian yang
mempengaruhi tersebut bisa juga dipengaruhi olehkejadian yang lain lagi. Jika hal itu berlaku terus
menerus, maka akan didapatkan rangkaian peristiwa
yang saling terkait dan memiliki hubungan sebab-
akibat. Peristiwa A menyebabkan terjadinya
peristiwa B, peristiwa B menyebakan terjadinya
peristiwa C, begitu seterusnya. Hal ini
menggambarkan kenyataan yang terjadi di dunia
nyata, banyak sekali peristiwa yang merupakan
kejadian sebab-akibat (causality). Masalah seperti di
atas menggambarkan suatu kumpulan peristiwa
beserta statusnya masing-masing dimana peristiwasatu menyebabkan terjadinya peristiwa yang lain,
begitu terus-menerus secara berantai membentuk
suatu rangkaian peristiwa, dan disebut sebagai jaring
sebab-akibat (causal network).
Dalam suatu graf, jika A parent dari B maka bobot
link antara A dan B diambil dari nilai P(B|A).Sekarang jika ada C yang ternyata juga parent dari B
maka P(B|C) juga menjadi bobot dari link antara C
dan B. Jadi ada 2 kejadian (A dan C) yang
mempengaruhi B, tetapi kita tidak mengetahui
bagaimana pengaruh A ke B berinteraksi dengan
pengaruh C ke B. Bisa saja 2 pengaruh tersebut
saling menguatkan, tetapi bisa juga saling berlawanan. Oleh karena itu diperlukan
penghitungan P(A|A,C), tetapi hal ini hanya bisa
dilakukan apabila dalam graf-nya tidak terdapat
siklus. Sebuah jaring sebab-akibat yang dihadirkan
dalam bentuk graf berarah tanpa siklus disebut
dengan Bayesian Network (BN), yang memodelkan
probabilitas hubungan antar variabel, bisa dipadukan
dengan teknik-teknik statistik dan sangat berguna
untuk analisa data [4].
Naive Bayes merupakan model yang sangat
sederhana sehingga memberikan keuntungan yang
sangat signifikan dibandingkan dengan model sebab-
akibat atau BN. Kesederhanaan tersebut bisadinotasikan dengan Persamaan (2).
i
in C A P C A A P )|()|,...,( 1 (2)
Hal ini menunjukan bahwa parameter yang
dibutuhkan jauh lebih sedikit daripada BN, yang
berarti data yang dievaluasi menjadi lebih sedikit
sehingga Naive Bayes bisa mempelajari data dengan
lebih cepat dibandingkan model lain.
Naive Bayes banyak digunakan dalam penelitian
yang behubungan dengan proses klasifikasi,
prediksi, dan deteksi. Referensi [5] menggunakan Naive Bayes untuk ¬anti-spam filtering dan hal inimerupakan awal dari perkembangan teknologi anti-
spam berbasis metaheuristic. Referensi [6]
melakukan perbaikan klasifikasi teks menggunakan
Naive Bayes. Masalah transportasi yang pernah
diteliti menggunakan metode Bayesian antara lain
tentang pemodelan informasi lalu lintas [7].
3. DESAIN SISTEM
Desain sistem bisa dilihat pada Gambar 1, terdiri
dari 3 bagian yaitu bagian penyimpanan data, bagian
klasifikasi data dan bagian prediksi kecelakaan lalu
lintas. Data kecelakaan lalu lintas disimpan dalam
aplikasi basis data Oracle Database. Proses
klasifikasi data dilakukan menggunakan Oracle Data
Miner yang dihubungkan dengan Oracle Database.
Klasifikasi dilakukan untuk mengelompokan data-
data kecelakaan sesuai dengan kelasnya masing-
masing berdasarkan parameter tertentu, yaitu
infrastruktur jalan.
Gambar 1: Desain Sistem Prediksi Kecelakaan Lalu Lintas
Detail dari proses-proses yang dilakukan mulai dariekstraksi sumber data sampai bisa diperoleh hasil
prediksi kecelakaan lalu lintas dihadirkan dalam
bentuk diagram alir pada Gambar 2.
3.1. Eksplorasi dan Transformasi Data Sumber
Sumber data kecelakaan lalu lintas yang digunakan
berbentuk dump file sehingga harus diekstrak
terlebih dahulu sebelum diolah. Ekstraksi dilakukandengan fasilitas import yang dimiliki Oracle
Database. Oracle Database mengharuskan setiap
data berada dalam skema salah satu usernya
Oracle
Database
Prediksi Kecelakaan
Lalu Lintas
BerdasarkanInfrastruktur Jalan
Naive Bayes Classifier
Data Exploration
Data Transformation
Data Classification
![Page 3: Pemetaan Kecelakaan Lalu Lintas](https://reader036.fdocument.pub/reader036/viewer/2022081820/577c86b21a28abe054c240be/html5/thumbnails/3.jpg)
8/20/2019 Pemetaan Kecelakaan Lalu Lintas
http://slidepdf.com/reader/full/pemetaan-kecelakaan-lalu-lintas 3/6
sehingga dump file yang sudah diekstrak akan
menjadi milik salah satu user di Oracle. Setelah
proses ekstraksi, data siap untuk diolah, baik secara
manual menggunakan bahasa pemrograman SQL
[8] atau menggunakan aplikasi-aplikasi client tools
yang dihubungkan dengan Oracle Database. Dalam penelitian ini digunakan client tool Oracle
Developer 3.0 untuk melakukan eksplorasi dan
transformasi data sumber yang sudah diekstrak
sebelumnya.
Gambar 2: Diagram Alir Sistem Prediksi Kecelakaan
Data hasil ekstraksi berupa kumpulan tabel berjumlah
284 yang mencakup data-data kecelakaan lengkap
dengan informasi yang berhubungan dengan
infrastruktur jalan, pengemudi, keadaan cuaca, danlain-lain. Dalam penelitian ini, prediksi dilakukandengan melihat korelasi antara kecelakaan yang terjadi
dengan kondisi infrastruktur jalan dimana kecelakaan
itu terjadi.
Informasi kecelakaan tercatat dalam tabel T_LP yang
berisi laporan dari masyarakat, polisi, ataupun pihak
lain. Tabel ini tidak menampung semua informasikecelakaan tetapi membagi informasi tersebut ke
dalam beberapa tabel lain sesuai dengan kaidah
normalisasi untuk keperluan pembuatan aplikasi.
Sedangkan untuk keperluan prediksi kecelakaan
menggunakan Naive Bayes diperlukan sebuah sumber
data yang menyatu dalam format tertentu, misalnyatabel, untuk kemudian diklasifikasi berdasarkan target
tertentu.
Transformasi data diperlukan untuk menyatukan
sumber-sumber data dari banyak tabel menjadi 1 tabel
saja. Transformasi dilakukan menggunakan query join
dan hasilnya langsung di-insert ke dalam tabel baru
yang diberi nama LAKA seperti yang terlihat pada
Gambar 3. Tidak semua informasi dilibatkan, hanya
data-data yang berhubungan dengan infrastruktur jalansaja.
create table LAKA asselectlp.id, lp.bln, lp.thnlp,lp.waktu_kejadian,lp.waktu_dilaporkan,lp.waktu_diterima, t_polres.namapolres, t_polda.nama polda, jl1jalan, kel, kec, berita, jasmani,t_jenislaka.nama jenis,t_gollaka.nama gol,t_statusjalan.nama statusjalan,t_kelasjalan.nama kelasjalan,t_tabraklari.nama tabraklari,t_keadaan.nama keadaan, t_waktu.namawaktu, t_penyebab.nama penyebab,t_kendaraan.nama kendaraan,t_jalan.nama jenisjalan,...t_lingkungan.nama lingkunganfromt_lp lp, t_polda, t_polres, t_jenislaka,t_gollaka, t_statusjalan, t_kelasjalan,t_tabraklari, t_keadaan, t_waktu,t_penyebab, t_kendaraan, t_jalan,t_alam, t_it, t_alinyemen,
t_jumlahlajur, t_pagarpengaman,t_penerangan, t_konstruksi, t_kualitas,t_permukaan, t_situasi, t_perbaikan,t_simpang, t_pengaturan, t_aruslantas,t_bataskec, t_cuaca, t_lokasi,t_lingkunganwherelp.id_polda = t_polda.id andlp.id_polres = t_polres.id andlp.jenislaka = t_jenislaka.id andlp.gollaka = t_gollaka.id andlp.statusjalan = t_statusjalan.id andlp.kelasjalan = t_kelasjalan.id..
.and lp.lokasi = t_lokasi.id andlp.lingkungan = t_lingkungan.id;
Gambar 3: Query Join
Tabel-tabel dieksplorasi untuk mencari informasi yang
selektif, sesuai dengan kebutuhan. Banyak dari tabel
tersebut yang merupakan hasil rekapitulasi dari tabel
lain sehingga bisa dikesampingkan. Informasi-
informasi lain yang tidak berhubungan dengan
infrastruktur jalan dan tidak berkaitan langsung dengankecelakaan lalu lintas (misal: user, polres, polsek) juga
dikesampingkan. Dari proses eksplorasi juga diketahui bahwa beberapa tabel ternyata belum terisi data sama
sekali, kemungkinan karena belum ada kecelakaan
yang berkaitan dengan data ini atau operator aplikasi
Ekstraksi Data Sumber
Transformasi data sumber
Query Join untuk membuat tabel baru
seba ai enam un hasil ekstraksi
Tabel baru dengan data bebas noise
Klasifikasi data dengan
metode Naïve Ba es
Data hasil klasifikasi
untuk rediksi
STOP
START
![Page 4: Pemetaan Kecelakaan Lalu Lintas](https://reader036.fdocument.pub/reader036/viewer/2022081820/577c86b21a28abe054c240be/html5/thumbnails/4.jpg)
8/20/2019 Pemetaan Kecelakaan Lalu Lintas
http://slidepdf.com/reader/full/pemetaan-kecelakaan-lalu-lintas 4/6
memang belum menginputkannya. Tabel yang seperti
ini juga dikesampingkan. Setelah diseleksi, terdapat 31
tabel yang harus dijoinkan sehingga menjadi 1 tabel
untuk proses klasifikasi.
Sebelum dilakukan proses klasifikasi, tabel LAKA
harus dibersihkan terlebih dahulu dulu dari data-datayang redundant, data-data yang kemungkinan memiliki
nilai sama tetapi dituliskan dalam bentuk yang berbeda. Beberapa data masih belum ada standarisasi
format, misal: laporan kecelakaan yang berasal dari
masyarakata kadang ditulis “laporan masyarakat” atau
“laporan masy” atau “lap masyarakat”, ketiga data
tersebut memiliki nilai sama sehingga harus
ditransformasikan ke bentuk yang konsisten, misal
dengan mengganti semuanya menjadi “laporan
masyarakat”. Data-data redundant bisa diamati dengan
melihat histogram dari data-data seperti pada Gambar
4. Langkah yang sama dilakukan untuk kolom-kolom
di tabel LAKA sampai semua data dalam keadaan bersih dari redundancy.
Gambar 4: Histogram Data Jenis Jalan
3.2. Klasifikasi Data Klasifikasi dilakukan pada data yang sudah bersih dari
redundancy sehingga menghasilkan prediksi yang
akurat. Aplikasi Oracle Data Miner yang integrasikan
ke dalam Oracle SQL Developer digunakan untuk
mengklasifikasikan data kecelakaan berdasarkaninfrastruktur jalan. Workflow digunakan untuk
menggambarkan aliran data mulai dari data sumber
sampai dengan hasil prediksi, seperti pada Gambar 5.
Setiap node dalam proses flow mempunyai fungsi
masing-masing. Node LAKA digunakan menunjuk
sumber data dari proses yang akan dilakukan, yaitutabel LAKA yang sudah bersih. Untuk memastikan
kebersihan sumber data, bisa dilakukan evaluasi
kembali menggunakan node Explore Data. Metode
klasifikasi Naive Bayes dilakukan pada node Class
Build, dengan menggunakan sumber data dari node
LAKA, setelah itu data hasil klasifikasi ditampung
untuk keperluan pembuatan aplikasi dalam node
LAKA_APPLY.
Data diambil dari laporan kecelakaan lalu lintas di
bulan Juli 2009 sampai bulan Desember 2010, dengan
jumlah 18.374 baris data. Klasifikasi Naive Bayesdilakukan dengan membagi data menjadi 60% untuk
data latih dan 40% sisanya sebagai data uji. Target
yang menjadi acuan dalam melalukan klasifikasi
adalah hal-hal yang berhubungan dengan infrastruktur
jalan berdasarkan sumber data, meliputi: status jalan,
kelas jalan, keadaan jalan, jenis jalan, profil jalan,
jumlah lajur, pagar pengaman, penerangan,
konstruksi, kualitas, permukaan, situasi, perbaikan,
simpang, pengaturan, arus lantas, batas kecepatan,
lokasi, dan lingkungan di sekitar jalan.
Gambar 5: Proses Flow
Klasifikasi dilakukan satu persatu sampai semua target
yang berhubungan dengan infrastruktur jalan selesai
diproses. Pemilihan target dilakukan di node Class
Build, sekaligus pembagian porsi data untuk data latih
dan data uji. Hasil dari setiap target dicatat prosentase
akurasinya.
3.3. Prediksi kecelakaan Lalu Lintas Data hasil klasifikasi membentuk suatu
pengelompokan data berdasarkan target masing-
masing. Setelah model terbentuk, selanjutnya adalah
melakukan pengujian terhadap model tersebutmenggunakan 40% data uji yang sudah disiapkan.
Hasilnya dicatat untuk setiap target berupa
infrastruktur jalan, kemudian hasilnya dianalisa untuk
melihat tingkat akurasi prediksi kecelakaan
berdasarkan infrastruktur jalan.Tabel 1 menunjukkan hasil prediksi berdasarkan profil
jalan, meliputi jumlah kasus untuk setiap nilai profil
jalan beserta prediksi benarnya. Hal ini dilakukan
untuk setiap target klasifikasi yang termasuk dalam
kategori infrastruktur jalan. Hasil prediksi juga
dihadirkan dalam bentuk grafik, untuk profil jalan bisa
dilihat pada Gambar 6.
Tabel 1. Hasil prediksi kecelakaan berdasarkan profil jalan
Profil JalanTotal Case
CountCorrect Prediction
(%)
Lurus Datar 6,192 60.11
Lurus Naik/Turun 339 37.46
Tikungan Datar 528 22.34
Tikungan Naik/Turun 228 57.02
Seluruh hasil prediksi benar dirata-rata berdasarkantarget masing-masing dan dihadirkan dalam bentukgrafik. Hal ini untuk memudahkan dalammembandingkan antara target satu dengan lainnya,tetapi untuk mengevaluasi setiap nilai dari targettertentu akan lebih baik jika menggunakan hasil detailseperti sebelumnya. Rata-rata hasil prediksi benar bisa
![Page 5: Pemetaan Kecelakaan Lalu Lintas](https://reader036.fdocument.pub/reader036/viewer/2022081820/577c86b21a28abe054c240be/html5/thumbnails/5.jpg)
8/20/2019 Pemetaan Kecelakaan Lalu Lintas
http://slidepdf.com/reader/full/pemetaan-kecelakaan-lalu-lintas 5/6
dilihat pada Tabel 2, sedangkan grafiknya bisa dilihat pada gambar 7.
Gambar 6: Prediksi berdasarkan profil jalan
Tabel 2. Hasil prediksi rata-rata berdasarkan infrastruktur jalan
No. Classification TargetAverage CorrectPrediction (%)
1 Status Jalan 49.64
2 Kelas Jalan 58.67
3 Keadaan Jalan 50.00
4 Jenis Jalan 46.75
5 Profil Jalan 44.23
6 Jumlah Lajur 46.51
7 Pagar Pengaman 73.38
8 Penerangan 53.60
9 Konstruksi Jalan 56.73
10 Kualitas Jalan 54.92
11 Permukaan Jalan 35.89
12 Situasi Jalan 43.85
13 Perbaikan Jalan 60.39
14 Simpang 29.37
15 Pengaturan Jalan 41.47
16 Arus Lantas 78.04
17 Batas Kecepatan 38.98
18 Lokasi 75.82
19 Lingkungan 31.45
4. HASIL DAN PEMBAHASAN
Prediksi yang dilakukan dengan menggunakan metode
Naive Bayes ini mempunyai tingkat akurasi yang
diambilkan dari tingkat prediksi benar untuk setiap
nilai dari target. Hasil ini akan dibandingkan denganmetode-metode klasifikasi lain yang juga sering
digunakan untuk kasus-kasus semacam ini. Metode-
metode tersebut diimplementasikan dengan tools yang
sama dan data yang sama dengan sebelumnya sehingga
menjaga tingkat kepercayaan akan hasil yang
diperoleh.
Metode-metode yang digunakan sebagai pembanding Naive Bayes pada penelitian ini merupakan 2 metode
supervised learning, yaitu: Support Vector Machine(SVM) dan Decision Tree (DT) [9]. Sama seperti
Naive Bayes, SVM dan DT diukur tingkat akurasinya
kemudian hasil dari ketiga metode tersebut dihadirkan
dalam Tabel 3.
Tabel 3. Tingkat akurasi NB, SVM, dan DT
No.
ClassificationTarget
NB(%)
SVM(%)
DT(%)
1 Status Jalan 49.64 36.52 53.82
2 Kelas Jalan 58.67 50.66 63.13
3 Keadaan Jalan 50.00 67.18 61.96
4 Jenis Jalan 46.75 31.73 42.01
5 Profil Jalan 44.23 34.27 41.59
6 Jumlah Lajur 46.51 40.23 51.10
7 Pagar Pengaman 73.38 75.45 73.59
8 Penerangan 53.60 48.41 54.62
9 Konstruksi Jalan 56.73 46.92 49.23
10 Kualitas Jalan 54.92 51.20 53.27
11 Permukaan Jalan 35.89 30.19 24.84
12 Situasi Jalan 43.85 37.66 29.92
13 Perbaikan Jalan 60.39 60.62 61.92
14 Simpang 29.37 23.00 27.98
15 Pengaturan Jalan 41.47 31.60 36.31
16 Arus Lantas 78.04 79.47 78.66
17 Batas Kecepatan 38.98 21.56 37.42
18 Lokasi 75.82 81.03 78.70
19 Lingkungan 31.45 19.50 31.76
Hasil pengujian menunjukan bahwa Naive Bayes tidak
selalu memberikan hasil terbaik, begitu juga dengan
SVM maupun Decision Tree. Masing-masing metode
mempunyai keunggulan dan kekurangan dalam
melakukan prediksi. Untuk melihat pola dari target-
target mana saja yang memberikan keuntungan padasuatu metode tertentu, dilakukan perbandingan pada
ketiga metode tersebut.
Gambar 7 menunjukan hasil perbandingan ketiga
metode, dengan Naive Bayes unggul di 9 target
infrastruktur jalan, yaitu: jenis jalan, profil jalan,
konstruksi jalan, kualitas jalan, permukaan jalan,
situasi jalan, simpang, pengaturan jalan, dan batas
kecepatan.
![Page 6: Pemetaan Kecelakaan Lalu Lintas](https://reader036.fdocument.pub/reader036/viewer/2022081820/577c86b21a28abe054c240be/html5/thumbnails/6.jpg)
8/20/2019 Pemetaan Kecelakaan Lalu Lintas
http://slidepdf.com/reader/full/pemetaan-kecelakaan-lalu-lintas 6/6
Gambar 7: Perbandingan tingkat akurasi NB, SVM, dan DT
SVM unggul di 4 target, yaitu: keadaan jalan, pagar pengaman, arus lalu lintas, dan lokasi. Sementara itu,
DT unggul di 6 target, yaitu: status jalan, kelas jalan,
jumlah lajur, penerangan, perbaikan jalan, dan
lingkungan. Hasil perbandingan menunjukan bahwa
Naive Bayes mempunyai performa yang relatif baik
untuk melakukan prediksi kecelakaan lalu lintas berdasarkan infrastruktur jalan, walaupun ada beberapa
target dimana Naive Bayes tidak menunjukan hasil
yang maksimal.
5. KESIMPULAN
Hasil prediksi dengan Naive Bayes menunjukan
bahwa tingkat akurasi rata-rata berkisar antara
29.3653% sampai dengan 78.0415%, ini
menunjukan bahwa tidak semua infrastruktur jalan
bisa digunakan sebagai parameter sebuah
kecelakaan terjadi karena masih ada hasil prediksi
yang berada di bawah 50%. Namun ini bukan
merupakan hasil final yang langsung
diimplementasikan. Prediksi kecelakaan lalu lintas
ini masih merupakan penelitian yang sedang
berjalan dan belum sepenuhnya selesai. Selaininfrastruktur jalan, masih ada hal lain yang menjadi
target, antara lain dari sisi kendaraan yang
mengalami kecelakaan, manusia yang
mengemudikan kendaraan tersebut, dan cuaca
dimana kecelakaan itu terjadi. Penelitian lebih lanjut
sangat diperlukan untuk melihat seberapa besar
korelasi antara target-target tersebut dengan
kecelakaan lalu lintas.
DAFTAR REFERENSI
[1] Badan Pusat Statistik, Jumlah Kecelakaan,
Koban Mati, Luka Berat, Luka Ringan, dan
Kerugian Materi yang Diderita Tahun 1992-
2009, Diakses pada 14 Desember 2011 dari
http://www.bps.go.id, 2010
[2] D. Heckerman, “A Toturial on Learning with
Bayesian Networks”, Book Chapter
Innovations in Bayesian Networks, Springer
Berlin, 2008, p.33-82
[3] K.B. Korb, A.E. Nicholson, Bayesian
Artificial Intelligence , CRC Press, 2011
[4] F.D. Jensen, T.D. Nielsen, Bayesian
Networks and Decision Graphs, Springer,
2007
[5] I. Androutsopoulos, J. Kautsias, K.V.Chandrinos, G. Paliouras, C. Spyropoulos,
“An Evaluation of Naïve Bayes Anti-Spam
Filtering”, 11th European Conference on
Machine Learning , 2000
[6] G. Qiang, “An Effective Algorithm for
Improving the Performance of Naïve Bayes
for Text Classification”, Second
International Conference on Computer
Research and Development , IEEE Computer
Society, 2010
[7] P. Haak, Modell ing Traffic Information using
Bayesian Networks, Delft University og
Technology, 2010
[8] C. Ordones, S.K. Pitchaimalai, “Bayesian
Classifier Programmed in SQL”, IEEE
Transactions on Knowledge and Data
Engineering , Vol. 22, No. 1, 2010
[9] D. Widiastuti, Analisa Perbandingan
Algoritma SVM, Naive Bayes, dan Decision
Tree dalam Mengklasifikasikan Serangan
(Attacks) pada Sistem Pendeteksi Intrusi,
Universitas Gunadarma, 2008