BAB 2 LANDASAN TEORI - thesis.binus.ac.idthesis.binus.ac.id/Doc/Bab2/2012-1-00116-IF Bab 2.pdf ·...
Transcript of BAB 2 LANDASAN TEORI - thesis.binus.ac.idthesis.binus.ac.id/Doc/Bab2/2012-1-00116-IF Bab 2.pdf ·...
7
BAB 2
LANDASAN TEORI
2.1 Pengertian Data
Menurut Inmon (2002, p388), data adalah sebuah catatan dari fakta-fakta,
konsep-konsep, atau instruksi-instruksi pada sebuah media penyimpanan untuk
komunikasi, penarikan dan pemrosesan secara otomatis, serta presentasi sebagai
informasi yang dapat dimengerti oleh manusia.
Menurut Laudon (2010, p46), data adalah kumpulan fakta yang masih
mentah yang menjelaskan aktivitas-aktivitas yang terjadi dalam organisasi atau
lingkungan fisik, sebelum terorganisir dan disusun menjadi sebuah bentuk yang
dapat dimengerti dan digunakan oleh manusia.
Menurut Turban (2005, p38), data adalah deskripsi dasar dari benda,
peristiwa, aktivitas, dan transaksi yang direkam, dikelompokkan, dan disimpan
tetapi belum terorganisir untuk menyampaikan arti tertentu.
2.2 Pengertian Informasi
Menurut Inmon (2002, p391), informasi adalah data yang manusia pahami
dan evaluasi untuk menyelesaikan masalah atau membuat keputusan.
Menurut Laudon (2010, p46), informasi adalah data yang telah ditentukan
menjadi sebuah bentuk yang berarti dan berguna bagi kehidupan masyarakat.
Menurut Turban (2005, p38), informasi adalah data yang sudah diorganisasi
sehingga memiliki arti dan nilai untuk penerima.
8
2.3 Pengertian Database
Menurut Connolly dan Begg (2005, p15), database adalah suatu kumpulan
relasi-relasi logikal dari data dan deskripsi dari data, yang diciptakan untuk
memperoleh informasi yang dibutuhkan oleh suatu organisasi.
Menurut O’Brien (2005, p211), database adalah kumpulan terintegrasi dari
elemen data yang secara logika saling berhubungan. Database mengonsolidasikan
berbagai catatan yang dahulu disimpan dalam file-file terpisah ke dalam satu
gabungan umum elemen data yang menyediakan data untuk banyak aplikasi.
2.4 Pengertian Database Management System (DBMS)
Menurut O’Brien (2005, p222), DBMS adalah software utama dalam
pendekatan manajemen database, karena software tersebut mengendalikan
pembuatan, pemeliharaan, dan penggunaan database organisasi dan pemakai
akhir.
Menurut Connolly dan Begg (2005, p16), DBMS adalah sistem software
yang memungkinkan pengguna untuk mendefinisikan, menciptakan, memelihara,
dan mengontrol database.
2.5 Pengertian Online Transaction Processing (OLTP)
Menurut O’Brien (2005, p228), OLTP adalah sistem pemrosesan yang
terjadi secara real-time.
Menurut Connolly dan Begg (2005, p1205), OLTP adalah sistem yang
dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi
9
yang biasanya membuat perubahan kecil bagi data operasional organisasi, yaitu
data yang memerlukan penanganan operasi setiap hari.
2.6 Pengertian Online Analytical Processing (OLAP)
Menurut Connolly dan Begg (2005, p1205), OLAP adalah sintesis, analisis,
dan konsolidasi dinamis dari sejumlah besar data multidimensi.
Menurut O’Brien (2005, p446), OLAP adalah kemampuan sistem informasi
manajemen, sistem pendukung keputusan, dan sistem informasi eksekutif yang
mendukung pemeriksaan interaktif dan manipulasi atas sejumlah besar data dari
berbagai perspektif.
2.7 Data Warehouse
2.7.1 Pengertian Data Warehouse
Menurut Inmon (2005, p1151), data warehouse adalah kumpulan
data yang berorientasi subjek, terintegrasi, nonvolatile, dan time-variant
yang mendukung keputusan manajemen.
Menurut Kimball dan Caserta (2004, p23), data warehouse adalah
sebuah sistem yang mengekstrak, membersihkan, menyesuaikan, dan
mengirimkan data sumber ke dalam sebuah penyimpanan data dimensional
yang kemudian mendukung dan mengimplementasikan proses query dan
analisis untuk tujuan pengambilan keputusan.
10
2.7.2 Karakteristik Data Warehouse
Menurut Inmon (2002, p31), karakteristik dari data warehouse yaitu :
subjek oriented, integrated, nonvolatile, dan time variant.
2.7.2.1 Subjek Oriented
Dalam sistem operasional klasik, data berpusat pada aplikasi
fungsional perusahaan (kontrol stok, penjualan produk, tagihan
pelanggan), sedangkan pada data warehouse, datanya berpusat pada
subjek utama dari perusahaan (pelanggan, produk, dan penjualan).
Gambar 2.1 Subject Oriented (Inmon, 2002, p32)
11
2.7.2.2 Integrated
Dari semua aspek dalam data warehouse, integrasi
merupakan hal yang terpenting. Data diambil dari berbagai sumber
yang berbeda ke dalam data warehouse. Setelah data diambil, data
tersebut dikonversi, diformat kembali, disusun, diringkas, dan
sebagainya.
Pada Gambar 2.2 dapat dilihat bahwa integrasi terjadi ketika
data melewati lingkungan operasional berbasis aplikasi menuju data
warehouse.
Gambar 2.2 Integrated (Inmon, 2002, p33)
12
2.7.2.3 Nonvolatile
Gambar 2.3 Nonvolatile (Inmon, 2002, p34)
Gambar 2.3 menunjukkan bahwa data operasional dapat
diakses dan dimanipulasi, sedangkan data yang ada pada data
warehouse dapat dimuat, diambil, dan diakses, tetapi data tersebut
tidak dapat diperbaharui. Ketika data pada data warehouse diambil,
data tersebut berupa snapshot, format statik. Baris snapshot baru
akan ditulis ketika data operasional berubah. Untuk melakukan itu,
maka histori dari setiap baris data harus disimpan di dalam data
warehouse.
2.7.2.4 Time Variant
Time variant menyiratkan bahwa setiap unit dari data di
dalam data warehouse akurat pada beberapa saat dalam waktu
tertentu. Secara umum, sebuah record dapat diberi penanda waktu,
13
dan dapat juga menggunakan tanggal transaksi pada record
tersebut.
Gambar 2.4 Time Variant (Inmon, 2002, p35)
2.7.3 Perbandingan OLTP dan DWH
Menurut Connolly dan Begg (2005, p1153), perbandingan antara
OLTP dan data warehouse adalah sebagai berikut :
Tabel 2.1 Perbandingan antara OLTP dan Data Warehouse
OLTP Data Warehouse
Menyimpan data sekarang Menyimpan data historis
Menyimpan data yang detail Menyimpan detailed, lightly,
dan highly ringkasan data
Data bersifat dinamis Data bersifat statis
Proses berulang-ulang Proses sewaktu-waktu dan tidak
terstruktur secara heuristik
Hasil transaksi yang tinggi Hasil transaksi medium atau
bahkan rendah
14
Pola penggunaan dapat diprediksi Pola penggunaan tidak dapat
diprediksi
Berbasis transaksi Berbasis analisis
Berorientasi aplikasi Berorientasi subjek
Mendukung keputusan sehari-hari Mendukung dalam pengambilan
keputusan strategis
Menyediakan pengguna
operasional dalam jumlah yang
besar
Menyediakan pengguna
manajerial dalam jumlah yang
cenderung sedikit
2.7.4 Arsitektur Data Warehouse
Gambar 2.5 Arsitektur Data Warehouse (Connolly, 2005, 1157)
15
Komponen-komponen dari data warehouse menurut Connolly dan
Begg (2005, p1156), antara lain :
2.7.4.1 Operational Data
Sumber data untuk data warehouse disediakan dari :
a. Data operasional yang disimpan dalam hierarki generasi pertama
dan database jaringan.
b. Data departemen yang disimpan dalam sistem file paten seperti
VSAM, RMS, dan DBMS relasional seperti Informix dan
Oracle.
c. Data privat yang disimpan dalam workstation dan server privat.
d. Sistem eksternal seperti internet, database komersial, atau
database yang terasosiasi dengan pelanggan dan pemasok
organisasi.
2.7.4.2 Operational Data Store
Operational Data Store (ODS) adalah gudang dari data
operasional saat ini dan data operasional terintegrasi yang
digunakan untuk analisis. ODS biasanya dibuat ketika warisan
dari sistem operasional yang ditemukan tidak mampu mencapai
persyaratan pelaporan. ODS menyediakan pengguna kemudahan
dalam penggunaan database relasional. Pembangunan ODS dapat
membantu dalam membangun data warehouse karena ODS dapat
memasok data yang sudah diekstrak dari sistem sumber.
16
2.7.4.3 Load Manager
Load manager (disebut juga komponen front end)
melakukan seluruh operasi yang berasosiasi dengan ekstraksi dan
pengisian data ke dalam data warehouse. Data mungkin diekstrak
langsung dari sumber data atau umumnya penyimpanan data
operasional. Operasi yang dilakukan oleh load manager mungkin
memuat perubahan mudah dari data untuk menyiapkan data yang
akan dimasukkan ke dalam data warehouse. Ukuran dan
kompleksitas dari komponen bervariasi dan mungkin dibangun
menggunakan kombinasi dari loading tools dan program yang
dibuat.
2.7.4.4 Warehouse Manager
Warehouse manager melakukan semua operasi yang
berhubungan dengan manajemen data dalam data warehouse.
Komponen ini dibangun dengan perangkat-perangkat manajemen
data atau program yang dibuat. Operasi yang dilakukan oleh
warehouse manager antara lain :
a. Analisis data untuk memastikan konsistensi
b. Perubahan dan penggabungan sumber data dari penyimpanan
sementara ke dalam tabel data warehouse
c. Pembuatan indeks dan tampilan dari tabel
d. Generasi dari denormalisasi (jika diperlukan)
e. Generasi agregasi (jika diperlukan)
17
f. Membuat cadangan data dan arsip data.
2.7.4.5 Query Manager
Query manager (disebut juga komponen back end)
menampilkan segala operasi yang berhubungan dengan
manajemen dari user queries. Komponen ini dibuat dengan
menggunakan vendor perangkat pengaksesan data end-user,
perangkat memonitor data warehouse, fasilitas database, dan
program buatan. Kompleksitas dari query manager bergantung
pada fasilitas yang disediakan oleh perangkat pengaksesan data
end-user dan database.
2.7.4.6 Detail Data
Area ini menyimpan semua data detail dalam skema
database. Dalam banyak kasus, data detail tidak disimpan secara
online, tetapi dibuat tersedia dengan mengagregasikan data ke
level detail berikutnya. Pada sebuah basis data yang biasa, data
detail ditambahkan ke dalam warehouse untuk mendukung
pengagregasian data.
2.7.4.7 Lightly and Highly Summarized Data
Warehouse dari area ini menyimpan rangkuman data yang
telah didefinisikan oleh warehouse manager. Area ini bersifat
18
tidak tetap karena menjadi subjek yang berubah dalam basis yang
berjalan untuk merespon profil queries yang berubah.
2.7.4.8 Archive (Backup Data)
Area dalam data warehouse menyimpan detail dan
rangkuman data untuk tujuan pengarsipan dan backup. Data
dipindahkan ke dalam penyimpanan seperti magnetic tape atau
optical disk.
2.7.4.9 Metadata
Area dalam data warehouse menyimpan semua definisi
metadata yang digunakan oleh semua proses dalam data
warehouse. Metadata digunakan untuk beberapa tujuan, di
antaranya :
a. Proses extraction dan loading. Metadata digunakan untuk
memetakan sumber data ke tampilan umum data dalam data
warehouse.
b. Proses manajemen warehouse. Metadata digunakan untuk
membuat rangkuman tabel secara otomatis.
c. Bagian dari proses manajemen query. Metadata digunakan
untuk mengarahkan query ke sumber daya yang paling sesuai.
19
2.7.4.10 End-User Access Tools
Tujuan utama data warehouse adalah untuk menyediakan
informasi kepada pengguna bisnis demi tujuan pengambilan
keputusan strategis. Penguna ini berinteraksi dengan warehouse
melalui end-user access tools. Terdapat lima kategori end-user
access tools, yaitu:
a. Reporting and query tools, digunakan untuk menghasilkan
laporan operasional regional atau mendukung sejumlah
pekerjaan yang volumenya tinggi, seperti invoice (pesanan
pelanggan) dan cek gaji pegawai.
b. Application development tools, aplikasi yang menggunakan
perangkat data grafik untuk mendesain lingkungan client-
server.
c. Executive Information System (EIS) tools, akhir-akhir ini
ditujukan sebagai sistem informasi milik semua orang, yang
dibangun secara asli untuk mendukung pembuatan keputusan
strategis level tinggi. Bagaimana pun, fokus dari sistem yang
terbuka ini adalah untuk memasukkan dukungan kepada
seluruh manajemen level.
d. Online Analytical Processing (OLAP) tools, berdasarkan pada
konsep database multidimensional dan mengizinkan pengguna
yang berpengalaman untuk menganalisis data dengan tampilan
yang kompleks dan multidimensional. Aplikasi bisnis tipikal
untuk perangkat ini mencakup penilaian efektivitas dari sebuah
20
kampanye pemasaran, prediksi penjualan produk, dan
perencanaan kapasitas.
e. Data mining tools, data mining adalah proses menemukan
korelasi, pola, dan tren baru yang berharga dengan cara
menggali data dalam jumlah besar dengan teknik statistik,
matematik, dan artificial intelligence. Data mining memiliki
potensi untuk menggantikan kemampuan perangkat OLAP
dikarenakan daya tarik utama data mining adalah membangun
model prediksi dari model yang meninjau ke belakang.
2.7.5 Aliran Data dalam Data Warehouse
Gambar 2.6 Aliran Data dalam Data Warehouse (Connolly, 2005, p1162)
21
Menurut Connolly dan Begg (2005, p1161), data warehouse
berfokus pada lima manajemen arus data primer, yaitu :
2.7.5.1 Inflow
Proses yang berhubungan dengan extraction, transformation,
dan loading (ETL) data dari sumber data ke dalam data warehouse.
Proses inflow berperan dalam proses pengambilan data dari sumber
sistem dan memasukkannya ke dalam data warehouse. Cara lainnya
yaitu dengan memasukkan data ke dalam operational data store
(ODS) sebelum dikirim ke dalam data warehouse. Data harus
direkonstruksi untuk tujuan data warehouse. Proses rekonstruksi
dari data meliputi :
a. Membersihkan data yang kotor.
b. Restrukturisasi data yang dicocokkan dengan kebutuhan data
warehouse, contohnya menambah atau membuang field-field.
c. Memastikan sumber data konsisten dengan dirinya sendiri dan
data lainnya yang sudah ada di dalam data warehouse.
2.7.5.2 Upflow
Proses penambahan nilai ke data di dalam data warehouse
melalui proses meringkas, mengemas, dan menyalurkan data.
Aktivitas yang berhubungan dengan proses upflow meliputi :
a. Meringkas data dengan proses memilih, memperhitungkan,
menggabungkan, dan mengelompokkan data relasional ke dalam
tampilan yang lebih baik dan berguna bagi pengguna.
22
b. Pengepakan data dengan mengubah data yang detail ke dalam
format yang lebih berguna seperti spreadsheets, teks dokumen,
diagram, grafik, dan animasi.
c. Mendistribusikan data dalam kelompok-kelompok yang tepat
untuk meningkatkan ketersediaan agar dapat diakses.
2.7.5.3 Downflow
Proses pengarsipan dan backup data di dalam data
warehouse. Penyimpanan data lama memainkan peranan yang
penting dalam mempertahankan penampilan dan efektifitas dari
warehouse dengan mengirimkan data lama dengan nilai yang
terbatas ke sebuah tempat penyimpanan seperti magnetic tape atau
optical disk. Downflow dari data juga meliputi proses yang
memastikan bahwa kondisi sekarang dari data warehouse dapat
dibangun kembali jika terjadi kehilangan data, kegagalan software
atau hardware.
2.7.5.4 Outflow
Proses pembuatan data hingga tersedia bagi pengguna. Dua
aktivitas yang dilakukan dalam outflow meliputi :
1) Pengaksesan, berhubungan dengan proses memuaskan end-user
dengan menyediakan data yang dibutuhkan. Frekuensi dari
pengaksesan ini bervariasi mulai dari ad hoc secara rutin hingga
real time. Selain itu, dipastikan bahwa sumber sistem digunakan
23
dengan cara yang paling efektif di dalam penjadwalan
pengeksekusian terhadap query dari pengguna.
2) Pengiriman, berhubungan secara aktif dalam pengiriman
informasi ke workstation dari pengguna. Ini merupakan area baru
dari data warehouse dan sering dihubungkan dengan proses
publish dan subscribe. Data warehouse akan mempublikasikan
objek bisnis yang bermacam-macam dan pengguna akan
berlangganan terhadap objek bisnis yang dibutuhkan mereka.
2.7.5.5 Metaflow
Proses yang berhubungan dengan mengatur metadata.
Metaflow merupakan proses memindahkan metadata (data tentang
flow yang lainnya). Metadata merupakan deskripsi dari data yang
ditampung di dalam data warehouse, apa yang ada di dalamnya,
dari mana asalnya, dan apa yang telah dilakukan terhadap data
tersebut dengan cara cleansing, integrating, dan summarizing.
2.7.6 Anatomi Data Warehouse
Konsep awal dari penerapan arsitektur data warehouse yaitu bahwa
data warehouse mengambil data dari berbagai sumber dan
memindahkannya ke dalam pusat pengumpulan data yang besar. Konsep
ini sebenarnya lebih cenderung kepada sebuah lingkungan mainframe yang
terpusat.
24
Keunggulan teknologi Client Server memungkinkan data
warehouse diterapkan dalam berbagai macam cara untuk menampung
kebutuhan pemakai sistem secara lebih proporsional. Dalam suatu kasus,
misalkan pemakai tertentu perlu menggabungkan data dari sebuah sistem
pengumpulan data yang statis dengan data dari sistem operasional yang
dinamis hanya dengan sebuah query saja. Berikut ini adalah tiga jenis dasar
sistem data warehouse :
2.7.6.1 Data Warehouse Fungsional
Data warehouse fungsional merupakan data warehouse yang
dibuat lebih dari satu dan dikelompokkan berdasarkan fungsi-fungsi
yang ada di dalam perusahaan seperti fungsi keuangan (financial),
pemasaran, personalia, dan lain-lain.
Gambar 2.7 Data Warehouse Fungsional
(http://blog.ub.ac.id/usfita/2010/11/01/data-warehouse/)
Keuntungan dari bentuk data warehouse seperti ini adalah
sistem mudah dibangun dengan biaya yang relatif murah sedangkan
25
kerugiannya adalah resiko kehilangan konsistensi data dan
terbatasnya kemampuan dalam pengumpulan data bagi pengguna.
2.7.6.2 Data Warehouse Terpusat
Gambar 2.8 Data Warehouse Terpusat
(http://blog.ub.ac.id/usfita/2010/11/01/data-warehouse/)
Bentuk ini terlihat seperti bentuk data warehouse fungsional,
namun terlebih dahulu sumber data dikumpulkan dalam satu tempat
terpusat, kemudian data disebar ke dalam fungsinya masing-masing,
sesuai kebutuhan perusahaan.
Data warehouse terpusat ini, biasa digunakan oleh perusahaan
yang belum memiliki jaringan eksternal. Keuntungan dari bentuk
ini adalah data benar-benar terpadu karena konsistensinya yang
26
tinggi, sedangkan kerugiannya adalah biaya yang mahal serta
memerlukan waktu yang cukup lama untuk membangunnya.
2.7.6.3 Data Warehouse Terdistribusi
Pada data warehouse terdistribusi ini, digunakan gateway
yang berfungsi sebagai jembatan penghubung antara data
warehouse dengan workstation yang menggunakan sistem beraneka
ragam. Dengan sistem terdistribusi seperti ini memungkinkan
perusahaan dapat mengakses sumber data yang berada di luar lokasi
perusahaan (eksternal).
Gambar 2.9 Data Warehouse Terdistribusi
(http://blog.ub.ac.id/usfita/2010/11/01/data-warehouse/)
27
Keuntungannya adalah data tetap bersifat konsisten karena
sebelum data digunakan, data terlebih dahulu disesuaikan atau
mengalami proses sinkronisasi. Sedangkan kerugiannya adalah
lebih kompleks untuk diterapkan karena sistem operasi dikelola
secara terpisah, juga biayanya yang paling mahal dibandingkan
dengan dua bentuk data warehouse lainnya.
2.7.7 Keuntungan Data Warehouse
Menurut Connolly dan Begg (2005, p1152), kesuksesan dari
implementasi data warehouse dapat membawa keuntungan yang besar
terhadap perusahaan meliputi :
a. Pengembalian yang besar dari investasi
Sebuah perusahaan harus mengeluarkan biaya yang besar untuk
membangun dan mengimplementasi suatu data warehouse secara sukses.
Menurut survei Internation Data Corporation (IDC) pada tahun 1996
melaporkan bahwa rata-rata 3 tahun ROI (Return On Investment) dalam
data warehousing mencapai 401%, dengan lebih dari 90% perusahaan
mencapai lebih dari 40% ROI, setengah perusahaan mencapai 160% ROI,
dan seperempatnya mencapai lebih dari 600% ROI.
b. Keuntungan yang kompetitif
Keuntungan kompetitif dapat diperoleh dengan mendukung para
pengambil keputusan mengakses data yang dapat melihat apa yang
28
sebelumnya belum pernah dilihat dan diperkirakan sebelumnya. Contoh :
pelanggan, tren, dan permintaan.
c. Meningkatkan produktivitas dari para pengambil keputusan
Data warehouse dapat meningkatkan produktifitas para pengambil
keputusan dengan membuat suatu database yang terintegrasi dari data-
data yang konsisten, berorientasi pada subjek, dan bersifat sejarah.
Dengan adanya data warehouse, data dari berbagai sistem dapat
disatukan menjadi sebuah bentuk yang konsisten, yaitu dengan
mentransformasikan data tersebut menjadi informasi yang berguna untuk
para pengambil keputusan agar dapat melakukan analisis yang lebih
nyata, akurat, dan konsisten.
2.7.8 Perancangan Data Warehouse
Menurut Kimball (Connolly dan Begg, 2005, p1187), terdapat
sembilan tahap dalam metodologi perancangan data warehouse, yaitu :
2.7.8.1 Menentukan Proses
Proses (fungsi) mengacu pada subjek masalah dari data mart
tertentu. Data mart yang pertama kali dibangun haruslah tepat waktu,
sesuai dengan anggaran, dan dapat menjawab pertanyaan-pertanyaan
bisnis yang penting.
29
2.7.8.2 Menentukan Grain
Menentukan grain berarti memutuskan secara pasti apa yang
dinyatakan oleh record dari tabel fakta. Dengan terpilihnya grain
untuk tabel fakta, maka kita dapat mengidentifikasi dimensi.
Keputusan grain untuk tabel fakta juga menentukan grain untuk
setiap dimensi pada tabel fakta.
2.7.8.3 Mengidentifikasi dan Penyesuaian Dimensi
Dimensi menentukan konteks untuk memberikan pertanyaan
mengenai fakta-fakta dalam tabel fakta. Kumpulan dimensi yang
dibangun dengan baik membuat data mart dapat dimengerti dan
mudah untuk digunakan. Dimensi diidentifikasi dalam detail yang
cukup untuk mendeskripsikan data seperti client dan properties dari
grain yang tepat.
Jika ada dimensi yang muncul dalam dua data mart, maka
kedua data mart tersebut harus memiliki dimensi yang sama, atau
salah satu data mart adalah subset matematis dari data mart yang
lain. Hanya dengan cara ini dua data mart berbagi satu atau lebih
dimensi pada aplikasi yang sama. Ketika sebuah dimensi digunakan
oleh lebih dari satu data mart maka seluruh data warehouse akan
gagal, karena dua data mart tidak dapat digunakan pada saat yang
bersamaan.
30
2.7.8.4 Menentukan Fakta
Grain dari tabel fakta menentukan fakta mana yang dapat
digunakan pada data mart. Semua fakta harus dinyatakan
berdasarkan tingkatan yang tersirat oleh grain. Fakta tambahan dapat
ditambahkan ke dalam tabel fakta pada setiap waktu dengan catatan
fakta tersebut konsisten dengan grain dari tabel.
2.7.8.5 Menyimpan Perhitungan Awal dalam Tabel Fakta
Setelah dipilih, setiap fakta harus dikaji ulang untuk
menentukan apakah ada kemungkinan untuk melakukan prakalkulasi
yang muncul ketika fakta-fakta tersebut meliputi laporan untung rugi.
2.7.8.6 Menambahkan Atribut yang Dibutuhkan dalam Tabel Dimensi
Pada tahapan ini, tabel dimensi kembali dikaji dengan
menambahkan sebanyak mungkin deskripsi berbentuk teks. Deskripsi
teks harus intuitif dan dapat dimengerti oleh pengguna. Kegunaan
data mart ditentukan oleh cakupan dan sifat atribut pada tabel
dimensi.
2.7.8.7 Menentukan Durasi Database
Durasi mengukur seberapa lama tabel fakta dapat disimpan.
Pada banyak perusahaan, ada kebutuhan untuk melihat pada waktu
yang sama untuk periode satu atau dua tahun sebelumnya. Tabel
31
fakta yang sangat besar akan mengakibatkan munculnya minimal dua
masalah dalam data warehouse.
Pertama, meningkatnya kesulitan untuk menjadikan data lama
yang semakin bertambah sebagai sumber data. Semakin lama umur
data, semakin sulit dalam membaca dan menginterpretasikan data-
data tersebut. Kedua, kewajiban dalam versi lama dari dimensi
penting yang digunakan, bukan versi terbaru. Hal ini dikenal dengan
masalah ‘slowly changing dimension’.
2.7.8.8 Menelusuri Perubahan dari Dimensi secara Perlahan
Pada tahap ini, data warehouse memperhatikan proses dimensi
yang semakin tua seiring dengan berjalannya waktu. Untuk itu perlu
dilakukan update agar data warehouse selalu konsisten. Terdapat tiga
tipe perubahan dimensi secara perlahan, yaitu perubahan data secara
langsung atau update tabel dimensi, perubahan data membentuk
record baru dengan surrogate key yang berbeda, dan perubahan data
akan membentuk atribut atau kolom baru pada tabel dimensi.
2.7.8.9 Memutuskan Prioritas Query dan Tipe Query
Pada tahap ini dipertimbangkan masalah desain fisikal.
Masalah paling kritis yang muncul mempengaruhi persepsi pengguna
akhir dari data mart adalah urutan penyusunan tabel fakta pada disk
dan adanya ringkasan prapenyimpanan atau agregasi. Selain masalah
32
ini, ada lagi beberapa masalah fisikal yang mempengaruhi
administrasi, backup, performa pengindeksan, dan keamanan.
2.7.9 Pemodelan Dimensional
Menurut Connolly dan Begg (2005, p1183), pemodelan dimensional
adalah sebuah teknik perancangan logikal yang bertujuan untuk menyajikan
data ke dalam sebuah standar, bentuk intuitif yang dapat diakses dengan
performa yang tinggi. Setiap model dimensional terdiri dari sebuah tabel
dengan sebuah primary key komposit yang disebut dengan tabel fakta, dan
sekumpulan tabel yang lebih kecil yang disebut dengan tabel dimensi.
Setiap tabel dimensi memiliki sebuah primary key (non-komposit)
sederhana yang berkorespondensi tepat dengan satu key komposit pada tabel
fakta. Karakteristik dengan struktur seperti bintang ini disebut dengan star
schema atau star join.
Dalam pemodelan dimensional, semua natural keys diganti dengan
surrogate key. Ini berarti setiap join antara tabel fakta dan tabel dimensi
berdasarkan surrogate key, bukan natural key. Sebagai contoh, setiap cabang
mempunyai natural key yang dinamakan cabang_kode, dan mempunyai
surrogate key yang diberi nama cabangID.
Berikut adalah keuntungan pemodelan dimensional :
a. Efficiency
Konsitensi dari struktur database pokok memungkinkan
pengaksesan yang lebih efisien ke data dengan berbagai macam tools
termasuk report writers dan query tools.
33
b. Ability to handle changing requirement
Skema bintang dapat beradaptasi terhadap perubahan user’s
requirement, sama halnya dengan semua dimensi yang menyediakan
akses untuk tabel fakta. Ini berarti rancangan tersebut lebih mampu
menunjang ad hoc user queries.
c. Extensibility
Model dimensional dapat dikembangkan. Sebagai contoh,
perubahan-perubahan yang harus ditunjang oleh model dimensional
adalah :
i. Penambahan fakta baru selama fakta tersebut konsisten dengan
granularity dasar dari tabel fakta yang telah ada.
ii. Penambahan dimensi baru selama ada sebuah nilai tunggal dari
dimensi tersebut yang mendefinisikan setiap record fakta yang ada.
iii. Penambahan atribut dimensional baru.
iv. Pemecah record dimensional yang ada ke level granularity yang
lebih rendah dari titik tertentu dalam waktu ke depan.
d. Ability to model common business situation
Ada banyak standar pendekatan yang sedang berkembang untuk
menangani pemodelan situasi umum pada dunia bisnis. Setiap situasi ini
memiliki kumpulan alternatif yang dimengerti dan dapat secara khusus
diprogram di dalam report writers, query tools, dan antar muka lainnya.
Sebagai contoh slowly changing dimension merupakan dimensi konstan
34
seperti ‘cabang’ dan ‘staf’ yang dapat berkembang secara lambat dan
tidak serempak.
e. Predictable query processing
Aplikasi data warehouse melakukan proses drill down dengan
menambahan atribut dimensi dari sebuah skema bintang tunggal. Aplikasi
melakukan proses drill across dengan menghubungkan beberapa tabel
fakta dengan berbagai dimensi. Biarpun keseluruhan skema bintang
dalam model dimensional perusahaan kompleks, namun proses query
yang dilakukan dapat diprediksi karena pada level terendah, setiap tabel
fakta harus diquery secara independen.
2.7.9.1 Skema Bintang
Menurut Inmon (2002, p137), skema bintang adalah sebuah
struktur data di mana data didenormalisasi untuk mengoptimalkan
akses terhadap data; merupakan dasar dari rancangan data mart
multidimensi.
Menurut Connolly dan Begg (2005, p1163), skema bintang
adalah sebuah struktur logikal yang mempunyai tabel fakta berisi
data faktual yang berada di tengah, dan dikelilingi oleh tabel dimensi
yang berisi referensi data yang biasanya dapat didenormalisasi.
35
Gambar 2.10 Skema Bintang
2.7.9.2 Skema Snowflake
Menurut Connolly dan Begg (2005, p1184), skema snowflake
adalah sebuah variasi dari star schema di mana tabel dimensinya
tidak mengandung data yang terdenormalisasi sehingga tabel dimensi
boleh memiliki dimensi. Snowflake memiliki sebuah tabel fakta
sebagai pusatnya, dikelilingi tabel-tabel dimensi yang ternormalisasi.
36
Gambar 2.11 Skema Snowflake
2.7.9.3 Skema Starflake
Menurut Connolly dan Begg (2005, p1185), skema starflake
adalah struktur hybrid yang berisi campuran antara skema bintang
dan skema snowflake. Skema starflake memiliki tabel fakta sebagai
pusatnya, dikelilingi oleh tabel-tabel dimensi yang terdenormalisasi
dan ternormalisasi.
37
Gambar 2.12 Skema Starflake
2.7.10 Komponen Pemodelan Dimensional
2.7.10.1 Fakta
Menurut Kimball dan Ross (2002, p402), fakta adalah
sebuah ukuran performansi bisnis, biasanya berupa numerik
dan penjumlahan. Hal ini berlanjut pada pengertian dari tabel
fakta sebagai lokasi penyimpanan untuk fakta yang ada.
2.7.10.2 Tabel Fakta
Menurut Kimball dan Ross (2002, p402), tabel fakta
adalah sebuah skema bintang (dimensional table); pusat tabel
dengan pengukuran performansi bisnis dalam bentuk numerik
yang memiliki karakteristik berupa sebuah composite key, yang
38
tiap-tiap elemennya adalah foreign key yang didapat dari tabel
dimensi.
2.7.10.3 Dimensi
Menurut Kimball dan Ross (2002, p399), dimensi adalah
sebuah entitas independent pada sebuah model dimensional
yang berfungsi sebagai pintu masuk atau berperan sebagai
sebuah mekanisme untuk memecahkan pengukuran tambahan
yang ada pada tabel fakta dari pemodelan dimensional.
2.7.10.4 Tabel Dimensi
Menurut Kimball dan Ross (2002, p399), tabel dimensi
adalah sebuah tabel pada model dimensional yang memiliki
sebuah primary key tunggal dan kolom dengan atribut
deskriptif.
2.7.10.5 Surrogate Key
Menurut Kimball dan Ross (2002, p399), surrogate key
adalah key berupa integer yang secara sekuensial ditambahkan
sesuai keperluan pada staging area untuk membentuk sebuah
tabel dimensi dan elemen yang menggabungkannya dengan
tabel fakta.
Pada tabel dimensi, surrogate key bertindak sebagai
primary key. Sedangkan pada tabel fakta, surrogate key
39
bertindak sebagai foreign key yang menspesifikasikan dimensi.
Surrogate key pada data warehouse dibutuhkan untuk
menangani permasalahan yang timbul dari slowly changing
dimensions serta data yang hilang atau pun data yang tidak
dapat digunakan.
2.7.10.6 Granularity
Menurut Inmon (2002, p391), granularity adalah tingkat
detail yang terkandung pada setiap unit data. Semakin rinci
tingkat datanya, maka semakin rendah tingkat granularitynya.
Begitu juga sebaliknya, semakin rendah tingkat kerincian
datanya, maka semakin tinggi tingkat granularitynya.
2.7.11 ETL ( Extract, Transform, and Load )
Menurut Prabhu dan Venatesan (2007, p112), ETL adalah proses
migrasi dari database operasional menuju data warehouse. ETL
merupakan suatu proses yang diperlukan dalam membentuk struktur
model dimensi (dimensional model) dalam data warehouse yang terdiri
dari 3 tahap, yaitu :
2.7.11.1 Extract
Extract (ekstraksi) merupakan sebuah proses penarikan
data dari satu atau lebih sistem operasional sebagai sumber data
yang dibutuhkan oleh data warehouse yang akan digunakan di
dalam proses selanjutnya. (Pada umumnya data ditarik dari
40
sistem database OLTP, tetapi dapat juga berasal dari sumber-
sumber eksternal yang lain).
2.7.11.2 Transform
Setelah data diekstraksi, maka akan dilakukan proses
transformasi (transform), yaitu sebuah proses untuk mengolah
data sedemikian rupa, seperti membersihkan data (antara lain
dengan membenarkan ejaan yang salah, menyelesaikan konflik
domain, mengembalikan elemen yang hilang, dan
menyatukannya ke dalam sebuah format yang standar agar data
yang ada menjadi konsisten satu sama lain), menggabungkan
data dari berbagai sumber eksternal yang lain, menghilangkan
duplikasi data yang ada, dan juga memberikan surrogate key
(sebuah key yang menghubungkan struktur data warehouse dan
terpisah dari sistem sumber), selain itu data juga harus diagregasi
untuk mempercepat analisis.
2.7.11.3 Load
Setelah data telah ada dan telah ditransformasi sedemikian
rupa sesuai dengan kebutuhan, maka hasil dari data tersebut akan
disimpan dalam bentuk tabel dimensional yang berkualitas ke
dalam sebuah database relasional baik berupa data warehouse
maupun data mart. Proses penyimpanan data inilah yang
dinamakan dengan load.
41
Jadi, tujuan dari proses ETL ini adalah untuk mengumpulkan,
menyaring, mengolah, dan juga menggabungkan data-data dari berbagai
sumber eksternal yang ada serta menyimpannya ke dalam data
warehouse ataupun data mart.
2.8 Pengertian Pembelian
Menurut Stevenson (2009, p518), pembelian adalah proses mendapatkan
material, bagian-bagian, persediaan, dan layanan yang diperlukan untuk
memproduksi sebuah produk atau menyediakan sebuah layanan.
2.9 Pengertian Logistik
Menurut Chase (2006, p586), logistik adalah stok dari setiap barang atau
sumber daya yang digunakan dalam sebuah organisasi. Sistem persediaan
adalah serangkaian kebijakan dan pengendalian yang memonitor tingkat
persediaan dan menentukan tingkat apa yang harus dipertahankan, saat saham
harus diisi, dan berapa besar pesanan seharusnya.
Menurut Schroeder (2007, p332), logistik adalah stok dari barang-barang
yang digunakan untuk menfasilitasi produksi atau untuk meningkatkan
kepuasan pelanggan.
42
2.10 Pengertian Microsoft SQL Server
Mengacu pada pendapat Aldi Akbar (2011), SQL Server itu sendiri
adalah bahasa yang dipergunakan untuk mengakses data dalam basis
data relation. Bahasa ini secara de facto adalah bahasa standar yang digunakan
dalam manajemen basis data relasional.
Saat ini hampir semua server basis data yang ada mendukung bahasa ini
dalam manajemen datanya. SQL Server merupakan salah satu produk
dari Relational Database Management System (RDBMS). SQL Server
termasuk SQL Server Management Studio, sebuah produk yang terintegrasi
dengan fungsi untuk mengembangkan, menyebarkan, dan mengatasi masalah
database SQL Server, serta perangkat tambahan untuk fungsi sebelumnya.
2.11 Pengertian Microsoft Visual Basic
Menurut Patrice (2008, p4), Visual Basic adalah salah satu jenis dari
bahasa pemrograman. Seperti bahasa lisan atau tulisan lainnya, Visual Basic
memiliki peraturan-peraturan mengenai sintaks dan sekelompok seri dari kata-
kata yang tersedia yang dapat digunakan untuk membuat aplikasi yang
diinginkan oleh pengguna.
Visual Basic adalah sebuah pilihan yang terkenal bagi para pemula
karena beberapa orang menemukan bahwa penggunaan sintaksnya lebih
sederhana daripada sintaks yang terdapat dalam bahasa pemrograman lainnya.
Jika pernah menggunakan versi lama dari Visual Basic sebelumnya (seperti
Visual Basic 4.0, 5.0, atau 6.0), maka akan ditemukan beberapa konstruksi dan
43
antar muka pengguna yang cukup familiar dalam Visual Basic 2008. Visual
Basic 2008 adalah bahasa pemrograman yang bersifat orientasi subjek (OOP).
2.12 Metode Penyajian Data
2.12.1 Bar Chart
Gambar 2.13 Contoh Bar Chart (Aczel, 2002, p59)
Bar chart sering digunakan untuk menunjukkan data berkategori
di mana ketika tidak ada penekanan pada persentase dari total yang
direpresentasikan oleh setiap kategori. Bar chart dapat diplot secara
vertikal maupun horizontal. Skala pengukuran adalah nominal atau
ordinal. Bar chart dapat digunakan untuk menampilkan data kontinu
seperti ukuran sepatu atau warna mata, dan data diskontinu seperti
tinggi badan atau berat badan.
44
2.12.2 Line Chart
Gambar 2.14 Contoh Line Chart (Aczel, 2002, p60)
Line chart adala sebuah tipe grafik yang digunakan untuk
menampilkan informasi dalam rangkaian titik data yang dihubungkan
dengan segmen garis lurus. Line chart sering digunakan untuk
memvisualisasikan trend data dalam interval waktu atau dalam kurun
waktu tertentu, dengan demikian line chart sering digambarkan secara
kronologis.
2.12.3 Pie Chart
Pie chart adalah sebuah tampilan deskriptif sederhana dari data
yang merupakan jumlah dari total yang diberikan. Pie chart mungkin
adalah sebuah cara yang paling ilustratif untuk menampilkan kuantitas
sebagai persentase dari total yang diberikan. Total area dari sebuah pie
45
chart merepresentasikan 100% dari kuantitas (jumlah dari nilai
variabel pada seluruh kategori), dan ukuran dari setiap potongan
adalah persentase dari total yang direpresentasikan oleh kategori yang
ditunjukkan potongan. Pie chart biasanya digunakan untuk
mempresentasikan frekuensi atau data berkategori. Skala pengukuran
dapat berupa nominal atau ordinal.
Gambar 2.15 Contoh Pie Chart (Aczel, 2002, p41)