UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
PRAKTIKUM 4
ANALISA AR-MBA
(ASSOCIATION RULE - MARKET BASKET ANALYSIS)
Tujuan Praktikum
1. Mahasiswa dapat mengetahui salah satu metode asosiasi dalam data mining.
2. Memberikan pemahaman mengenai prosedurMarket Basket Analysis.
3. Mahasiswa dapat mengolah suatu data yang cukup besar sehingga data tersebut dapat
digunakan dengan menggunakan Association Rule.
Latar Belakang AR-MBA
Dewasa ini, penggunaan mesin pencatat dan pemroses transaksi berteknologi barcode telah
umum digunakan pada penjual eceran maupun kecil (toko atau swalayan). Dengan mesin ini,
penjual eceran dapat menyimpan data transaksinya dalam suatu basis data transaksi. Tiap
informasi pada transaksi memuat tanggal dan item apa saja yang dibeli. Data ini disebut
sebagai basket data. Market Basket Analysis (MBA) merupakan studi mengenai analisis
basket data.
Salah satu metode yang banyak digunakan dalam MBA adalah association rule
mining yang bertujuan menemukan aturan-aturan asosiasi di antara himpunan besar data item
dalam basis data transaksi. Apabila diimplementasikan dalam basis data transaksi, aturan-
aturan asosiasi ini akan sangat berguna dalam menentukan strategi bisnis seperti mendesain
katalog, menata layout, serta merancang kampanye pemasaran dan promosi.
Salah satu kemungkinan contoh dari asosiasi misalnya adalah bahwa 80% pelanggan
yang membeli produk A juga membeli produk B. Dalam hal ini produk A dan B disebut
dengan istilah frequent itemset. Dari frequent itemset tersebut kita dapat menentukan aturan
asosiasi antar item dalam frequent itemset.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Menggali aturan asosiasi dari basis data transaksi bukan merupakan masalah trivial.
Pertama, jumlah transaksi yang terdapat dalam basis data umumnya sangat banyak. Kedua,
jumlah kemungkinan frequent itemset meningkat secara eksponensial terhadap jumlah jenis
item. Terdapat berbagai algoritma yang dapat digunakan untuk aplikasi AR-MBA, antara lain
yaitu algoritma apriori dan algoritma FP-growth. Berikut penjelasan dari kedua algoritma
tersebut:
Algoritma Apriori
Algoritma apriori merupakan suatu algoritma untuk mengurangi ruang pencarian kombinasi
item, sehingga analisis dapat dilakukan dengan lebih cepat. Lebih lanjut lagi, aturan-aturan
yang dihasilkan dari algoritma apriori dapat diidentifikasi lagi untuk menentukan aturan
mana yang dapat memberikan informasi lebih banyak dengan menggunakan ukuran support
dan lift ratio. Kemudian, aturan-aturan asosiasi yang telah dihasilkan dapat digunakan
sebagai bahan pertimbangan untuk pengambilan keputusan dalam strategi bisnis. Adapun dua
proses utama yang dilakukan dalam algoritma Apriori (Han & Kamber, 2006), yaitu :
1. Join (penggabungan).
Pada proses ini setiap item dikombinasikan dengan item yang lainnya sampai
tidak terbentuk kombinasi lagi.
2. Prune (pemangkasan).
Pada proses ini, hasil dari item yang telah dikombinasikan tadi lalu dipangkas
dengan menggunakan minimum support yang telah ditentukan oleh user.
Algoritma FP-Growth
Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. Sehingga
kekurangan dari algoritma Apriori diperbaiki oleh algoritma FP-Growth. Frequent Pattern
Growth (FP-Growth) adalah salah satu alternatif algoritma yang dapat digunakan untuk
menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah
kumpulan data (David Samuel, 2008). Pada algoritma Apriori diperlukan generate candidate
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
untuk mendapatkan frequent itemsets. Akan tetapi, di algoritma FP-Growth generate
candidate tidak dilakuka karena FP-Growth menggunakan konsep pembangunan tree dalam
pencarian frequent itemsets. Hal tersebutlah yang menyebabkan algoritma FP-Growth lebih
cepat dari algoritma Apriori.
Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree
yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algoritma FP-growth dapat
langsung mengekstrak frequent Itemset dari FP-Tree. Penggalian itemset yang frequent
dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara membangkitkan
struktur data tree atau disebut dengan FP-Tree. Metode FP-Growth dapat dibagi menjadi 3
tahapan utama yaitu sebagai berikut (Han & Kamber 2006):
1. Tahap pembangkitan conditional pattern base,
2. Tahap pembangkitan conditional FP-Tree, dan
3. Tahap pencarian frequent itemset.
Association Rule
Asociation dalam data mining adalah pekerjaan untuk menentukan mana atribut yang akan
didapatkan bersamaan. Dalam dunia bisnis lazim dikenal istilah affinity analysis. Tugas dari
asociation rule adalah mencari aturan yang tidak mengcover untuk mengukur hubungan
antara dua atau lebih atribut.
Association Rule adalah bentuk jika “kejadian sebelumnya” kemudian
“konsekuensinya” (IF antecedent, THEN consequent). Bersamaan dengan perhitungan
aturan support dan confidence. Pola asosiasi menjadi salah satu fungsionalitas yang paling
menarik dalam penggalian data (Kumar dan Wahidabanu, 2007). Association Rule adalah
teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Contoh
dari Association Rule dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui
berapa besar kemungkinan seorang pembeli membeli roti bersamaan dengan susu. Dengan
pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang
tertentu (Suwarningsih, 2008).
Menurut Leo Susanto (2003) penggalian kaidah asosiasi mempunyai peranan penting
dalam proses pengambilan keputusan. Salah satu contoh penerapan Association Rule adalah
Market Basket Analysis. Association Rule menjadi terkenal karena aplikasinya untuk
menganalisa isi keranjang belanja di pasar swalayan, sehingga Association Rule juga sering
disebut dengan istilah Market Basket Analysis. Association Rule juga dikenal sebagai salah
satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya.
Konsep Market Basket Analysis
Gambar 1. Ilustrasi Penggunaan MBA
Market Basket Analysis merupakan salah satu contoh penerapan Association Rule.
Untuk menyampaikan ide mendasar dari Market Basket Analysis, dimulai dengan melihat
gambar keranjangan belanjaan pada Gambar 1 yang berisi bermacam-macam barang-
barang yang dibeli oleh seseorang disebuah supermarket. Keranjang ini berisi bermacam-
macam barang-barang seperti roti, susu, sereal, telur, mentega, gula, dan sebagainya.
Sebuah keranjang memberitahukan kepada kita tentang apa saja yang dibeli oleh seorang
konsumen dalam satu waktu. Sebuah daftar belanjaan yang lengkap yang diperoleh dari
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
semua konsumen memberikan kita informasi yang sangat banyak, dan ini dapat
menjelaskan barang-barang apa saja yang paling penting dari bisnis penjualan yaitu ”apa
barang yang dibeli oleh konsumen dan kapan”.
Setiap konsumen membeli seperangkat barang-barang yang berbeda, dalam jumlah
yang berbeda, dan dalam waktu yang berbeda. Market Basket Analysis menggunakan
informasi apa yang dibeli oleh konsumen-konsumen untuk menyediakan tanda atau
informasi yaitu siapa mereka dan mengapa mereka melakukan pembelian tersebut?
Market Basket Analysis menyediakan pengertian tentang barang dagangan dengan
memberitahukan kepada kita produk-produk mana yang memungkinkan untuk dibeli
secara bersamaan dan produk mana yang lebih disetujui untuk di promosikan. Karena
dalam Market Basket Analysis tidak hanya memahami kuantitas dari item yang dibeli
dalam keranjang itu, tapi bagaimana item yang dibeli dalam hubungannya satu dengan
yang lain. Informasi ini dapat digunakan dalam:
1. Lebih menguntungkan periklanan dan promosi. Market Basket Analysis
menggunakan iklan dan promosi agar lebih memahami bagaimana pembeli
menanggapi dan berkomunikasi atas produk-produk yang ditawarkan, karena tujuan
dari retailer adalah ”Bagaimana mengubah penjualan ini? Apa lagi yang dijual dan
apa yang diiklankan?”.
2. Penargetan yang lebih tepat dalam mengembalikan ROI (Return of Investment).
Market Basket Analysis digunakan untuk mengoptimalkan kampanye dan promosi
untuk peningkatan penjualan dan margin dengan penargetan lebih tepat.
3. Loyalitas kartu promosi dengan analisis longitudinal. Longitudinal pengguna Market
Basket Analysis memungkinkan pengecer untuk membeli karakter perilaku pelanggan
seiring waktu. Retailer menggunakan kartu loyalitas pelanggan untuk menangkap
lifecycle data sehingga mereka dapat menganalisis pelanggan dari masa pembelian
perilaku seperti belanja. Misalnya, satu mainan pengecer menjelaskan bahwa ia tidak
masuk akal untuk menjual satu mesin permainan (dengan sedikit margin) kecuali
pelanggan yang juga membeli aksesoris dan perangkat lunak
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
permainan (tinggi dengan margin). Mereka menggunakan Market Basket Analysis
terhadap loyalitas kartu data mereka secara keseluruhan untuk menentukan margin
pada video game dan penjualan untuk membuat ingatan promosi pelanggan dan
mempengaruhi pembeli untuk membeli permainan dan aksesoris dari mereka dan
tidak dari pengecer lain.
4. Menentukan tata letak toko yang baru (new store layouts) atau menarik lebih banyak
lalu lintas ke toko, menetapkan produk-produk mana yang akan diletakan dalam
tempat yang khusus. Market Basket Analysis juga menggunakan ruang untuk
meningkatkan perencanaan dan visual merchandising lintas untuk meningkatkan
penjualan.
5. Mengidentifikasi ketika persoalannya berpasangan/kupon (issue coupons). Untuk
meningkatkan penjualan atau menghabiskan barang yang menjadi inventory.
Definisi Market Basket Analysis
Bebrapa definisi dari MBA adalah sebagai berikut:
Market Basket Analysis adalah teknik matematis yang biasa digunakan oleh
marketing yang profesional untuk menyatakan kesamaan antara produk individu
atau produk kelompok.
Market Basket Analysis berkenaan dengan sekumpulan permasalahan bisnis yang
berkaitan untuk mengetahui point of sale dari data transaksi.
Market Basket Analysis adalah istilah umum untuk metodologi yang mempelajari
tentang komposisi keranjang belanjaan yang dibeli oleh rumah tangga selama 1 kali
berbelanja.
Market Basket Analysis adalah kumpulan kombinasi produk yang dibeli bersamaan.
Market Basket Analysis adalah analisis kecenderungan suatu item terbeli oleh
customer yang sama pada waktu yang bersamaan.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Tiga Level Market Basket Data
Market Basket Data adalah data transaksi yang menjelaskan tiga perbedaan entitas yang
mendasar yaitu :
1. Customers
2. Orders/pembelian
3. Items (barang-barang)
Dalam sebuah relational database, struktur data dari market basket data sering terlihat
sama. Data Struktur ini didalamnya terdapat empat entitas yang penting.
Gambar 2. Relational database
Permintaan adalah stuktur data yang fundamental untuk Market Basket Data.
Permintaan dapat berupa kejadian suatu pembelian oleh customer. Pembelian juga dapat
dilakukan melalui website, grosir, ataupun dari catalog. Semua ini dapat termasuk dalahm
sebuah pembelian, pembelian tambahan, tipe dari pembayaran, dan data lain yang termasuk
dalam suatu transaksi. Beberapa transaksi diberikan identitas khusus. Namun ada beberapa
identitas khusus tersebut harus digabungkan dengan data yang lainnya. Sebagai contoh, kita
perlu mengkombinasikan empat lahan untuk mendapatkan empat identitas khusus untuk
penjualan di toko. Waktu dimulai ketika customer membayar, chain ID, store ID dan lane ID.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Barang dalam suatu pembelian digambarkan dalam line items. Data ini termasuk harga
pembayaran barang, jumlah barang, pajak yang harus dibayar, mungkin juga termasuk harga
(yang digunakan untuk penghitungan margin). Meja barang (item table) biasanya mempunyai
hubungan dengan product reference table yang memberikan gambaran lebih jelas mengenai
produk yang ada. Gambaran informasinya termasuk hierachy produk dan informasi lain yang
mungkin memudahkan dalam menganalisis.
Customer table (meja customer) adalah meja pilihan dan harus bisa digunakan ketika
customer dapat di identifikasikan. Contoh, di dalam sebuah website, ada sebuah syarat dalam
melakukan registrasi atau ketika customer menggunakan kartu anggota (affinity card) dalam
melakukan pembayaran. Walaupun customer table mempunyai area yang menarik, tetapi
yang paling penting adalah identitas tersebut. Sebab ini merupakan dasi dari sebuah transaksi
setiap waktu. Pengenalan customer setiap saat membuat mungkin untuk dikenali secara
cepat, seperti frekuensi pembelian yang dilakukan oleh customer. Tiga level dari market
basket data yang penting yang secara cepat dapat memahami permintaan. Ada beberapa dasar
pengukuran yaitu:
1. Berapa rata-rata pembelian yang dilakukan customer?
2. Berapa rata-rata barang yang khusus setiap pembelian?
3. Berapa rata-rata barang setiap pembelian?
4. Untuk produk tertentu, proporsi customer apa yang telah membeli produk?
5. Untuk produk tertentu, berapa rata-rata dari pembelian setiap customer yang
termasuk dalam barang?
6. Untuk produk tertentu, berapa rata-rata jumlah pembelian dalam suatu pembelian
ketika produk dibeli?
Pengukuran ini memberikan gambaran untuk sebuah bisnis. Dalam beberapa kasus, ada
beberapa pembeli yang berulang, sehingga proporsi dari sebuah pembelian setiap customer
mendekati 1. Saran ini digunakan suatu perusahaan untuk meningkatkan penjualan setiap
customers. Atau jumlah dari produk setiap pembelian mendekati 1, penyaranan akan
kesempatan untuk penjualan silang selama proses pembelian.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4
: 28
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Hal ini dapat berguna untuk membandingkan pengukuran ini terhadap yang lainnya. Kita
telah menemukan bahwa jumlah pembelian dapat menjadi acuan untuk membedakan diantara
para customer (costumer yang sesungguhnya/membeli lebih sering dari pada hanya sekedar
customer). Gambar 2 menggambarkan tentang hubungan antar customer (jumlah barang
khusus setiap pembelian) dengan seberapa dalam hubungannya (jumlah yang dibeli) untuk
customer yang membeli lebih dari 1 barang. Data ini bisa berasal dari retailer yang kecil.
Bulatan yang paling besar menunjukan jumlah customer yang membeli dua barang sekaligus
dalam waktu yang bersamaan., dalam gambar juga dapat dilihat bulatan yang besar
menunjukan jumlah customer yang membeli barang yang sama dalam dua kali pembelian.
Customers yang baik–yaitu mereka yang melakukan pembelian kembali berulang kali.
Cenderung untuk membeli bermacam-macam barang dalam jumlah besar. Walaupun,
beberapa dari mereka kembali dan membeli barang yang sama sepeti ketika mereka pertama
kali membeli. Bagaimana retailer dapat mendorong customers untuk datang kembali dan
membeli lebih dan juga barang yang berbeda? Market Basket Analysis tidak dapat menjawab
pertanyaan ini, tetapi Market Basket Analysis dapat sedikit dorongan untuk meminta itu dan
mungkin menbeikan isyarat yang dapat membantu.
Support dan Confidence
Menurut Nofriansyah (2008), penting tidaknya suatu aturan asosiatif dapat diketahui
dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tersebut
dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan asosiatif.
Aturan asosiatif biasanya dinyatakan dalam bentuk :
{roti, mentega} → {susu} (support = 40%, confidence = 50%)
Yang artinya: ”50% dari transaksi di database yang memuat item roti dan mentega juga
memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat
ketiga item itu”. Dapat juga diartikan : "Seorang konsumen yang membeli roti dan mentega
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena
mewakili 40% dari catatan transaksi selama ini."
Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan asosiatif yang
memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence).
Metode Dasar Association Rule
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam
database, yang dapat dirumuskan sebagai berikut:
Contohnya pada database transaksi belanja pasar swalayan berikut:
Tabel 1. Data Transaksi
Diketahui bahwa jumlah transaksi yang memuat {roti, mentega} ada 4 (support 80%),
sedangkan jumlah transaksi yang memuat {roti, mentega, susu} ada 2 (support 40%), transaksi
yang memuat {buncis} hanya 1 (support 20%) dan sebagainya. Bila ditetapkan syarat
minimum dari nilai support untuk pola frekuensi tinggi dalam contoh ini adalah 30%,
diperoleh pola frekuensi tinggi yang memenuhi syarat minimum nilai support adalah :
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 2. Data Transaksi dengan Frekuensi Tertinggi
2. Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiatif yang
memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif
A→ B dengan menggunakan rumus berikut :
Bila syarat minimum untuk confidence dari contoh diatas adalah 50% maka salah satu contoh
aturan asosiatif yang dapat ditemukan adalah : {telur,susu} → {roti,mentega} dengan nilai
confidence:
Aturan assosiatif lain yang dapat ditemukan diantaranya adalah :
Tabel 3. Tabel Association Rule
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
3. Lift / Improvement Ratio
Lift Ratio adalah parameter penting selain support dan confidence dalam association rule. Lift
Ratio mengukur seberapa penting rule yang teleh terbentuk berdasarkan nilai support dan
confidence. Lift Ratio merupakan nilai yang menunjukkan kevalidan proses transaksi dan
memberikan informasi apakah benar produk A dibeli bersamaan dengan produk B. Lift /
Improvement Ratio dapat dihitung dengan rumus:
Sebuah transaksi dikatakan valid jika mempunyai nilai Lift / Improvement lebih dari 1, yang
berarti bahwa dalam transaksi tersebut, produk A dan B benar-benar dibeli secara bersamaan.
Pemanfaatan Aturan Asosiasi
Beberapa manfaat penggunaan aturan asosiasi khususnya dalam Market Basket Analysis
yaitu:
1. Untuk bagian pemasaran, peningkatan penjualan dapat dicapai dengan
mengorganisasikan ulang item-item sehingga item-item yang terjual bersama-sama
selalu ditemukan bersama. Hal ini akan memicu pembelian dan membantu memastikan
pelanggan untuk membeli sebuah item tidak lupa untuk membelinya karena tidak
melihatnya. Organisasi retail juga dapat memberikan kupon diskon untuk pembelian item
B jika pelanggan membeli item A (jika aturan asosiasi A => B merupakan aturan asosiasi
yang kuat).
2. Situs e-commerce juga dapat menggunakan aturan asosiasi untuk memberikan saran
(recommender system/suggestive sell) bagi pembeli berdasarkan item-item apa saja yang
sudah berada dalam keranjang belanja (shopping cart) mereka. Situs e-commerce
terkenal seperti Amazon.com menggunakan sistem pemberi saran ini untuk
meningkatkan penjualan.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
3. Untuk pemasaran langsung, promosi kepada pelanggan yang sudah ada lebih disukai,
karena data pembelian mereka telah diketahui. Perusahaan telah memiliki data para
pelanggan dalam basis datanya, dan mengetahui informasi yang signifikan mengenai
mereka. Setelah menjalankan Market Basket Analysis, staf pemasaran dapat
menghubungi pelanggan atau mengirimkan katalog produk untuk mempromosikan
produk yang kira-kira akan menarik untuk mereka beli dengan berdasarkan catatan
riwayat pembelian mereka. Amazon.com juga menggunakan sistem ini. Perusahaan
tersebut mengirimkan e-mail kepada pelanggan untuk menawarkan produk-produk yang
kemungkinan menarik untuk mereka beli dengan melihat produk apa saja yang telah
mereka beli sebelumnya.
Selain dalam bisnis retail, Market Basket Analysis juga dapat diaplikasikan dalam
bidang-bidang yang lain. Market Basket Analysis dapat digunakan dalam spam filtering,
fraud detection (pendeteksi kecurangan, dalam klaim asuransi misalnya), analisis pembelian
kartu kredit, analisis pola panggilan telepon, analisis penggunaan layanan telekomunikasi,
dan sebagainya.
Situs Google Reader yang merupakan aplikasi web di mana pengguna dapat
berlangganan feed dari situs-situs berita atau blog (pengguna akan dapat mengetahui apakah
sebuah situs sudah di-update atau belum tanpa harus mengunjungi masing-masing situs) juga
menggunakan Market Basket Analysis. Aturan asosiasi yang dihasilkan bersama daftar situs
yang dilanggani feed-nya digunakan untuk memberikan saran bagi pengguna mengenai situs
lain yang kira-kira menarik untuk ditambahkan dalam daftar feed.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Gambar 3. Flowchart Tahapan MBA
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
STUDI KASUS
Super Jaya Supermarket ingin melakukan identifikasi terhadap perilaku konsumen yang bertujuan
untuk menentukan kebijakan yang akan diterapkan ke depan. Metode yang akan digunakan adalah
AR-MBA dengan 30 data transaksi belanja Super Jaya Supermarket yang akan diidentifikasi
hubungan antara item dengan item yang lain dengan nilai minimal support 10% dan minimal
confidence 50%
Tabel 3. Rekapitulasi Data
No Jenis
1 frestea, nano
2 coca cola, champ, nano
3 good day, pronas corn beef, delmonte, yakult, bango kecap, indomilk
4 kratingdaeng, sampoerna, aqua
5 sariroti, roma, campina, nutrijel
6 aqua, tango, malboro
7 biore, ades, goal
8 ades, nu green tea, fruit tea
9 ultramilk, lifebuoy, Javana, Aqua, indomilk
10 alfa air pet, vit, coca cola, happy tos
11 miranda, forvita, segitiga biru, wall's, pocky, listerin
12 mamypoko, nescafe
13 nestle air pet, mie gemez, abc exo, root beer
14 frisian flag, pocky, tango, sari roti
15 aqua, citato
16 taro, tango, pulpy
17 ultramilk, hit, gatsby, indomilk
18 aqua, vidoran kids
19 aqua, antangin, sariroti
20 komix, frisian flag
21 aqua, teh kotak
22 aqua, sugus
23 indomilk, aqua, wall's, telur ayam
24 aqua, pocari
25 adem sari, goodtime, sampoerna
26 goodmood, yupi, mr hottest, lifebuoy
27 vit, campina, antangin, lifebuoy
28 monde, kraft, happydent
29 handyplast, sari kacang hijau, sosro, taro, frisian flag, indomilk
30 you c1000, aqua
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 4. Pembagian Departemen
Departemen Jenis Barang
Departemen 1 (bumbu
dapur dan bahan makanan) champ, pronas corn beef, delmonte, bango kecap, nutrijel, kunci
mas minyak goreng, segitiga biru, telur ayam, kraft, forvita
Departemen 2 (snack) sariroti, Roma, Tango, Happy Tos, Pocky, Citato, Goodtime, Mr Hottest, Monde, Taro, Mie gemez
Departemen 3 (rokok) Sampoerna, Malboro, Dunhill, Djarum
Departemen 4 (minuman
dan jelly)
Frestea, Cocacola, Sosro, Good day, nu green tea, fruit tea, javana,
nescafe, root beer, abc exo, pulpy, the kotak, pocari, goodmood, abc sari kacang hijau, you c1000, kratingdaeng
Departemen 5 (permen) Nano, Sugus, Yupi, happydent, chomp
Departemen 6 (sabun
mandi dan wajah) Goal, Biore, Lifebuoy, Miranda, Listerin, Gatsby, mamypoko
Departemen 7 (air mineral) Aqua, Vit, Nestle air pet, Ades, Alfa air pet
Departemen 8 (susu) Indomilk, Yakult, Frisian Flag, Ultra
Departemen 9 (ice cream) Wall's, Campina
Departemen 10 (obat-
obatan) handyplast, adem sari, komix, vidoran kids, antangin
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 5. Integrasi Data
Transaksi Item Set 1 DEPT 4, DEPT 5
2 DEPT 4, DEPT 1, DEPT 5
3 DEPT 4, DEPT 1, DEPT 8
4 DEPT 4, DEPT 3, DEPT 7
5 DEPT 2, DEPT 9, DEPT 1
6 DEPT 7, DEPT 2, DEPT 3
7 DEPT 6, DEPT 7
8 DEPT 7, DEPT 4
9 DEPT 8, DEPT 6, DEPT 4, DEPT 7
10 DEPT 7, DEPT 4, DEPT 2
11 DEPT 6, DEPT 1, DEPT 9, DEPT 2,
12 DEPT 6, DEPT 4
13 DEPT 7, DEPT 2, DEPT 4
14 DEPT 8, DEPT 2
15 DEPT 7, DEPT 2
16 DEPT 2, DEPT 4
17 DEPT 8, DEPT 10, DEPT 6
18 DEPT 7, DEPT 10
19 DEPT 7, DEPT 2, DEPT 10
20 DEPT 10, DEPT 8
21 DEPT 7, DEPT 4
22 DEPT 7, DEPT 5
23 DEPT 8, DEPT 7, DEPT 9, DEPT 1
24 DEPT 7, DEPT 4
25 DEPT 10, DEPT 2, DEPT 3
26 DEPT 4, DEPT 5, DEPT 2, DEPT 6
27 DEPT 7, DEPT 9, DEPT 10, DEPT 6
28 DEPT 2, DEPT 1, DEPT 5
29 DEPT 10, DEPT 4, DEPT 2, DEPT 8
30 DEPT 4, DEPT 7
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 6. Tranformasi Data
Transaksi dept.1 dept.2 dept.3 dept.4 dept.5 dept.6 dept.7 dept.8 dept.9 dept.10
1 0 0 0 1 1 0 0 0 0 0
2 1 0 0 1 1 0 0 0 0 0
3 1 0 0 1 0 0 0 1 0 0
4 0 0 1 1 0 0 1 0 0 0
5 1 1 0 0 0 0 0 0 1 0
6 0 1 1 0 0 0 1 0 0 0
7 0 0 0 0 0 1 1 0 0 0
8 0 0 0 1 0 0 1 0 0 0
9 0 0 0 1 0 1 1 1 0 0
10 0 1 0 1 0 0 1 0 0 0
11 1 1 0 0 0 1 0 0 1 0
12 0 0 0 1 0 1 0 0 0 0
13 0 1 0 1 0 0 1 0 0 0
14 0 1 0 0 0 0 0 1 0 0
15 0 1 0 0 0 0 1 0 0 0
16 0 1 0 1 0 0 0 0 0 0
17 0 0 0 0 0 1 0 1 0 1
18 0 0 0 0 0 0 1 0 0 1
19 0 1 0 0 0 0 1 0 0 1
20 0 0 0 0 0 0 0 1 0 1
21 0 0 0 1 0 0 1 0 0 0
22 0 0 0 0 1 0 1 0 0 0
23 1 0 0 0 0 0 1 1 1 0
24 0 0 0 1 0 0 1 0 0 0
25 0 1 1 0 0 0 0 0 0 1
26 0 1 0 1 1 1 0 0 0 0
27 0 0 0 0 0 1 1 0 1 1
28 1 1 0 0 1 0 0 0 0 0
29 0 1 0 1 0 0 0 1 0 1
30 0 0 0 1 0 0 1 0 0 0
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Langkah-langkah yang dilakukan dalam software adalah sebagai berikut:
1. Buka software rapid miner, klik New Process
2. Pilih File – Import Data – Import Excel Sheet
3. Kemudian cari data excel tersebut di dalam computer, pilih, klik Next
Gambar 4. Membuka Data
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
4. Klik Next
Gambar 5. Data Import Step 1
5. Klik Next
Gambar 6. Data Import Step 2
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
6. Klik Next
Gambar 7. Data Import Step 3
7. Klik Next
Gambar 8. Data Import Step 4
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
8. Simpan data di folder latihan1 dengan nama training
Gambar 9. Data Import Step 5
9. Klik Finish, akan muncul output seperti gambar di bawah ini
Gambar 10. Output Import Data
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
10. Kemudian drag file training ke dalam kotak Main Process
Gambar 11. Drag Training File
11. Cari Select Attributes, kemudian drag ke dalam kotak Main Process
Gambar 12. Drag Select Attribute
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
12. Hubungkan training dengan Select Attributes
Gambar 13. Menghubungkan Data Training dengan Select Attribute
13. Klik Select Attributes, ganti attribute filter by… dengan subset. Kemudian klik menu
Select Attributes di attributes. Pindahkan semua departemen ke dalam kotak sebelah
kanan
Gambar 14. Select Attributes: attributes
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
14. Cari Numerical to Binominal, kemudian drag ke dalam kotak Main Process
Gambar 15. Proses Drag Numerical to Binominal
15. Cari Remap Binominals, kemudian drag ke dalam kotak Main Process
Gambar 16. Proses Drag Remap Binominals
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
16. Hubungkan Select Attributes dengan Numerical to Binominal, dan Numerical to
Binominal dengan Remap Binominals. Kemudian ganti negative value dengan nilai 0
dan positive value dengan nilai 1
Gambar 17. Proses Numerical to Binominal, dan Numerical to Binominal
dengan Remap Binominals
17. Cari FP-Growth, kemudian drag ke dalam kotak Main Process
Gambar 18. Proses drag FP-Growth
18. Cari Create Association Rules, kemudian drag ke dalam kotak Main Process.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Lalu hubungkan Remap Binominals ke FP-Growth dan FP-Growth (fre) ke Create
Association Rules
Gambar 19. Proses Create Association Rules
19. Hubungkan FP-Growth (exa) ke res pertama (sebelah kanan) dan Create Association
Rules (rul) ke res kedua (sebelah kanan)
Gambar 20. Proses menghubungkan FP-Growth ke ras pertama dan
Create Association Rules ke res kedua
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
20. Klik FP-Growth, ganti min support dengan nilai 0.1, lalu uncheklist pada find min number
of itemset
Gambar 21. Min Support bernilai 0.1
21. Klik Create Association Rules kemudian ganti min confidence dengan nilai 0.5
Gambar 22. Min Confidence bernilai 0.5
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
22. Lalu klik Run, akan muncul output seperti gambar di bawah ini.
Gambar 23. Output
23. Rule yang valid adalah yang memiliki nilai Lift Ratio > 1
Gambar 25. Rule valid jika nilai Lift Ratio > 1
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Dari hasil output di atas, dapat diketahui rules sebagai berikut:
1. Dept. 1 akan terbeli bersama dengan Dept. 2, dengan tingkat kepercayaan 50% dan
didukung oleh 10% dari data keseluruhan.
2. Dept. 1 akan terbeli bersama dengan Dept. 9, dengan tingkat kepercayaan 50% dan
didukung oleh 10% dari data keseluruhan.
3. Dept. 5 akan terbeli bersama dengan Dept. 4, dengan tingkat kepercayaan 60% dan
didukung oleh 10% dari data keseluruhan.
4. Dept. 9 akan terbeli bersama dengan Dept. 1, dengan tingkat kepercayaan 75% dan
didukung oleh 10% dari data keseluruhan.
Knowledge yang didapatkan pada rule dapat digunakan untuk aplikasi berikut :
Pembuatan katalog dengan mendekatkan produk yang sering terbeli secara bersamaan didekatkan
dalam penyusunan katalog.
Pemilihan layout tempat belanja, dimana produk yang sering terbeli secara bersamaan didekatkan
tempat peletakannya.
Pembuatan kupon belanja, dengan membuat produk yang jarang terbeli sebagai bonus dari
pembelian produk yang sering terbeli.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Berikut ini contoh pembuatan katalog dengan mengambil rule yang ketiga yaitu Jika dept. 5 (permen)
terbeli maka memiliki kemungkinan 60% (nilai confidence) untuk membeli dept. 4 (minuman rasa).
Aturan ini cukup signifikan karena mewakili 10% (nilai support) dari semua transaksi. Lift ratio > 1.
Gambar 27. Katalog Berdasarkan Hasil Rules
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke Jumlah Halaman Mulai berlaku
: 4 : 4 : 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
DAFTAR PUSTAKA
David Samuel. 2008. Penerapan Stuktur FP-Tree dan Algoritma FPGrowth dalam Optimasi
Penentuan Frequent Itemset. Institut Teknologi Bandung.
Han Jiawei, and M. Kamber. 2006. Data Mining: Concepts and Techniques. Morgan
Kaufmann, USA.
Wiwin Suwarningsih. 2008. Penerapan Association Rule Mining untuk Perancangan Data
Mining BDP (Barang Dalam Proses) Obat. Pusat Penelitian Informatika LIPI.
Nofriansyah, Dicky. 2014. Konsep Data Mining vs Sistem Pendukung Keputusan. Yogyakarta:
Deepublish.
Top Related