BAB 2 LANDASAN TEORI - thesis.binus.ac.idthesis.binus.ac.id/Doc/Bab2/2012-1-00116-IF Bab 2.pdf ·...

7

BAB 2

LANDASAN TEORI

2.1 Pengertian Data

Menurut Inmon (2002, p388), data adalah sebuah catatan dari fakta-fakta,

konsep-konsep, atau instruksi-instruksi pada sebuah media penyimpanan untuk

komunikasi, penarikan dan pemrosesan secara otomatis, serta presentasi sebagai

informasi yang dapat dimengerti oleh manusia.

Menurut Laudon (2010, p46), data adalah kumpulan fakta yang masih

mentah yang menjelaskan aktivitas-aktivitas yang terjadi dalam organisasi atau

lingkungan fisik, sebelum terorganisir dan disusun menjadi sebuah bentuk yang

dapat dimengerti dan digunakan oleh manusia.

Menurut Turban (2005, p38), data adalah deskripsi dasar dari benda,

peristiwa, aktivitas, dan transaksi yang direkam, dikelompokkan, dan disimpan

tetapi belum terorganisir untuk menyampaikan arti tertentu.

2.2 Pengertian Informasi

Menurut Inmon (2002, p391), informasi adalah data yang manusia pahami

dan evaluasi untuk menyelesaikan masalah atau membuat keputusan.

Menurut Laudon (2010, p46), informasi adalah data yang telah ditentukan

menjadi sebuah bentuk yang berarti dan berguna bagi kehidupan masyarakat.

Menurut Turban (2005, p38), informasi adalah data yang sudah diorganisasi

sehingga memiliki arti dan nilai untuk penerima.

8

2.3 Pengertian Database

Menurut Connolly dan Begg (2005, p15), database adalah suatu kumpulan

relasi-relasi logikal dari data dan deskripsi dari data, yang diciptakan untuk

memperoleh informasi yang dibutuhkan oleh suatu organisasi.

Menurut O’Brien (2005, p211), database adalah kumpulan terintegrasi dari

elemen data yang secara logika saling berhubungan. Database mengonsolidasikan

berbagai catatan yang dahulu disimpan dalam file-file terpisah ke dalam satu

gabungan umum elemen data yang menyediakan data untuk banyak aplikasi.

2.4 Pengertian Database Management System (DBMS)

Menurut O’Brien (2005, p222), DBMS adalah software utama dalam

pendekatan manajemen database, karena software tersebut mengendalikan

pembuatan, pemeliharaan, dan penggunaan database organisasi dan pemakai

akhir.

Menurut Connolly dan Begg (2005, p16), DBMS adalah sistem software

yang memungkinkan pengguna untuk mendefinisikan, menciptakan, memelihara,

dan mengontrol database.

2.5 Pengertian Online Transaction Processing (OLTP)

Menurut O’Brien (2005, p228), OLTP adalah sistem pemrosesan yang

terjadi secara real-time.

Menurut Connolly dan Begg (2005, p1205), OLTP adalah sistem yang

dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi

9

yang biasanya membuat perubahan kecil bagi data operasional organisasi, yaitu

data yang memerlukan penanganan operasi setiap hari.

2.6 Pengertian Online Analytical Processing (OLAP)

Menurut Connolly dan Begg (2005, p1205), OLAP adalah sintesis, analisis,

dan konsolidasi dinamis dari sejumlah besar data multidimensi.

Menurut O’Brien (2005, p446), OLAP adalah kemampuan sistem informasi

manajemen, sistem pendukung keputusan, dan sistem informasi eksekutif yang

mendukung pemeriksaan interaktif dan manipulasi atas sejumlah besar data dari

berbagai perspektif.

2.7 Data Warehouse

2.7.1 Pengertian Data Warehouse

Menurut Inmon (2005, p1151), data warehouse adalah kumpulan

data yang berorientasi subjek, terintegrasi, nonvolatile, dan time-variant

yang mendukung keputusan manajemen.

Menurut Kimball dan Caserta (2004, p23), data warehouse adalah

sebuah sistem yang mengekstrak, membersihkan, menyesuaikan, dan

mengirimkan data sumber ke dalam sebuah penyimpanan data dimensional

yang kemudian mendukung dan mengimplementasikan proses query dan

analisis untuk tujuan pengambilan keputusan.

10

2.7.2 Karakteristik Data Warehouse

Menurut Inmon (2002, p31), karakteristik dari data warehouse yaitu :

subjek oriented, integrated, nonvolatile, dan time variant.

2.7.2.1 Subjek Oriented

Dalam sistem operasional klasik, data berpusat pada aplikasi

fungsional perusahaan (kontrol stok, penjualan produk, tagihan

pelanggan), sedangkan pada data warehouse, datanya berpusat pada

subjek utama dari perusahaan (pelanggan, produk, dan penjualan).

Gambar 2.1 Subject Oriented (Inmon, 2002, p32)

11

2.7.2.2 Integrated

Dari semua aspek dalam data warehouse, integrasi

merupakan hal yang terpenting. Data diambil dari berbagai sumber

yang berbeda ke dalam data warehouse. Setelah data diambil, data

tersebut dikonversi, diformat kembali, disusun, diringkas, dan

sebagainya.

Pada Gambar 2.2 dapat dilihat bahwa integrasi terjadi ketika

data melewati lingkungan operasional berbasis aplikasi menuju data

warehouse.

Gambar 2.2 Integrated (Inmon, 2002, p33)

12

2.7.2.3 Nonvolatile

Gambar 2.3 Nonvolatile (Inmon, 2002, p34)

Gambar 2.3 menunjukkan bahwa data operasional dapat

diakses dan dimanipulasi, sedangkan data yang ada pada data

warehouse dapat dimuat, diambil, dan diakses, tetapi data tersebut

tidak dapat diperbaharui. Ketika data pada data warehouse diambil,

data tersebut berupa snapshot, format statik. Baris snapshot baru

akan ditulis ketika data operasional berubah. Untuk melakukan itu,

maka histori dari setiap baris data harus disimpan di dalam data

warehouse.

2.7.2.4 Time Variant

Time variant menyiratkan bahwa setiap unit dari data di

dalam data warehouse akurat pada beberapa saat dalam waktu

tertentu. Secara umum, sebuah record dapat diberi penanda waktu,

13

dan dapat juga menggunakan tanggal transaksi pada record

tersebut.

Gambar 2.4 Time Variant (Inmon, 2002, p35)

2.7.3 Perbandingan OLTP dan DWH

Menurut Connolly dan Begg (2005, p1153), perbandingan antara

OLTP dan data warehouse adalah sebagai berikut :

Tabel 2.1 Perbandingan antara OLTP dan Data Warehouse

OLTP Data Warehouse

Menyimpan data sekarang Menyimpan data historis

Menyimpan data yang detail Menyimpan detailed, lightly,

dan highly ringkasan data

Data bersifat dinamis Data bersifat statis

Proses berulang-ulang Proses sewaktu-waktu dan tidak

terstruktur secara heuristik

Hasil transaksi yang tinggi Hasil transaksi medium atau

bahkan rendah

14

Pola penggunaan dapat diprediksi Pola penggunaan tidak dapat

diprediksi

Berbasis transaksi Berbasis analisis

Berorientasi aplikasi Berorientasi subjek

Mendukung keputusan sehari-hari Mendukung dalam pengambilan

keputusan strategis

Menyediakan pengguna

operasional dalam jumlah yang

besar

Menyediakan pengguna

manajerial dalam jumlah yang

cenderung sedikit

2.7.4 Arsitektur Data Warehouse

Gambar 2.5 Arsitektur Data Warehouse (Connolly, 2005, 1157)

15

Komponen-komponen dari data warehouse menurut Connolly dan

Begg (2005, p1156), antara lain :

2.7.4.1 Operational Data

Sumber data untuk data warehouse disediakan dari :

a. Data operasional yang disimpan dalam hierarki generasi pertama

dan database jaringan.

b. Data departemen yang disimpan dalam sistem file paten seperti

VSAM, RMS, dan DBMS relasional seperti Informix dan

Oracle.

c. Data privat yang disimpan dalam workstation dan server privat.

d. Sistem eksternal seperti internet, database komersial, atau

database yang terasosiasi dengan pelanggan dan pemasok

organisasi.

2.7.4.2 Operational Data Store

Operational Data Store (ODS) adalah gudang dari data

operasional saat ini dan data operasional terintegrasi yang

digunakan untuk analisis. ODS biasanya dibuat ketika warisan

dari sistem operasional yang ditemukan tidak mampu mencapai

persyaratan pelaporan. ODS menyediakan pengguna kemudahan

dalam penggunaan database relasional. Pembangunan ODS dapat

membantu dalam membangun data warehouse karena ODS dapat

memasok data yang sudah diekstrak dari sistem sumber.

16

2.7.4.3 Load Manager

Load manager (disebut juga komponen front end)

melakukan seluruh operasi yang berasosiasi dengan ekstraksi dan

pengisian data ke dalam data warehouse. Data mungkin diekstrak

langsung dari sumber data atau umumnya penyimpanan data

operasional. Operasi yang dilakukan oleh load manager mungkin

memuat perubahan mudah dari data untuk menyiapkan data yang

akan dimasukkan ke dalam data warehouse. Ukuran dan

kompleksitas dari komponen bervariasi dan mungkin dibangun

menggunakan kombinasi dari loading tools dan program yang

dibuat.

2.7.4.4 Warehouse Manager

Warehouse manager melakukan semua operasi yang

berhubungan dengan manajemen data dalam data warehouse.

Komponen ini dibangun dengan perangkat-perangkat manajemen

data atau program yang dibuat. Operasi yang dilakukan oleh

warehouse manager antara lain :

a. Analisis data untuk memastikan konsistensi

b. Perubahan dan penggabungan sumber data dari penyimpanan

sementara ke dalam tabel data warehouse

c. Pembuatan indeks dan tampilan dari tabel

d. Generasi dari denormalisasi (jika diperlukan)

e. Generasi agregasi (jika diperlukan)

17

f. Membuat cadangan data dan arsip data.

2.7.4.5 Query Manager

Query manager (disebut juga komponen back end)

menampilkan segala operasi yang berhubungan dengan

manajemen dari user queries. Komponen ini dibuat dengan

menggunakan vendor perangkat pengaksesan data end-user,

perangkat memonitor data warehouse, fasilitas database, dan

program buatan. Kompleksitas dari query manager bergantung

pada fasilitas yang disediakan oleh perangkat pengaksesan data

end-user dan database.

2.7.4.6 Detail Data

Area ini menyimpan semua data detail dalam skema

database. Dalam banyak kasus, data detail tidak disimpan secara

online, tetapi dibuat tersedia dengan mengagregasikan data ke

level detail berikutnya. Pada sebuah basis data yang biasa, data

detail ditambahkan ke dalam warehouse untuk mendukung

pengagregasian data.

2.7.4.7 Lightly and Highly Summarized Data

Warehouse dari area ini menyimpan rangkuman data yang

telah didefinisikan oleh warehouse manager. Area ini bersifat

18

tidak tetap karena menjadi subjek yang berubah dalam basis yang

berjalan untuk merespon profil queries yang berubah.

2.7.4.8 Archive (Backup Data)

Area dalam data warehouse menyimpan detail dan

rangkuman data untuk tujuan pengarsipan dan backup. Data

dipindahkan ke dalam penyimpanan seperti magnetic tape atau

optical disk.

2.7.4.9 Metadata

Area dalam data warehouse menyimpan semua definisi

metadata yang digunakan oleh semua proses dalam data

warehouse. Metadata digunakan untuk beberapa tujuan, di

antaranya :

a. Proses extraction dan loading. Metadata digunakan untuk

memetakan sumber data ke tampilan umum data dalam data

warehouse.

b. Proses manajemen warehouse. Metadata digunakan untuk

membuat rangkuman tabel secara otomatis.

c. Bagian dari proses manajemen query. Metadata digunakan

untuk mengarahkan query ke sumber daya yang paling sesuai.

19

2.7.4.10 End-User Access Tools

Tujuan utama data warehouse adalah untuk menyediakan

informasi kepada pengguna bisnis demi tujuan pengambilan

keputusan strategis. Penguna ini berinteraksi dengan warehouse

melalui end-user access tools. Terdapat lima kategori end-user

access tools, yaitu:

a. Reporting and query tools, digunakan untuk menghasilkan

laporan operasional regional atau mendukung sejumlah

pekerjaan yang volumenya tinggi, seperti invoice (pesanan

pelanggan) dan cek gaji pegawai.

b. Application development tools, aplikasi yang menggunakan

perangkat data grafik untuk mendesain lingkungan client-

server.

c. Executive Information System (EIS) tools, akhir-akhir ini

ditujukan sebagai sistem informasi milik semua orang, yang

dibangun secara asli untuk mendukung pembuatan keputusan

strategis level tinggi. Bagaimana pun, fokus dari sistem yang

terbuka ini adalah untuk memasukkan dukungan kepada

seluruh manajemen level.

d. Online Analytical Processing (OLAP) tools, berdasarkan pada

konsep database multidimensional dan mengizinkan pengguna

yang berpengalaman untuk menganalisis data dengan tampilan

yang kompleks dan multidimensional. Aplikasi bisnis tipikal

untuk perangkat ini mencakup penilaian efektivitas dari sebuah

20

kampanye pemasaran, prediksi penjualan produk, dan

perencanaan kapasitas.

e. Data mining tools, data mining adalah proses menemukan

korelasi, pola, dan tren baru yang berharga dengan cara

menggali data dalam jumlah besar dengan teknik statistik,

matematik, dan artificial intelligence. Data mining memiliki

potensi untuk menggantikan kemampuan perangkat OLAP

dikarenakan daya tarik utama data mining adalah membangun

model prediksi dari model yang meninjau ke belakang.

2.7.5 Aliran Data dalam Data Warehouse

Gambar 2.6 Aliran Data dalam Data Warehouse (Connolly, 2005, p1162)

21

Menurut Connolly dan Begg (2005, p1161), data warehouse

berfokus pada lima manajemen arus data primer, yaitu :

2.7.5.1 Inflow

Proses yang berhubungan dengan extraction, transformation,

dan loading (ETL) data dari sumber data ke dalam data warehouse.

Proses inflow berperan dalam proses pengambilan data dari sumber

sistem dan memasukkannya ke dalam data warehouse. Cara lainnya

yaitu dengan memasukkan data ke dalam operational data store

(ODS) sebelum dikirim ke dalam data warehouse. Data harus

direkonstruksi untuk tujuan data warehouse. Proses rekonstruksi

dari data meliputi :

a. Membersihkan data yang kotor.

b. Restrukturisasi data yang dicocokkan dengan kebutuhan data

warehouse, contohnya menambah atau membuang field-field.

c. Memastikan sumber data konsisten dengan dirinya sendiri dan

data lainnya yang sudah ada di dalam data warehouse.

2.7.5.2 Upflow

Proses penambahan nilai ke data di dalam data warehouse

melalui proses meringkas, mengemas, dan menyalurkan data.

Aktivitas yang berhubungan dengan proses upflow meliputi :

a. Meringkas data dengan proses memilih, memperhitungkan,

menggabungkan, dan mengelompokkan data relasional ke dalam

tampilan yang lebih baik dan berguna bagi pengguna.

22

b. Pengepakan data dengan mengubah data yang detail ke dalam

format yang lebih berguna seperti spreadsheets, teks dokumen,

diagram, grafik, dan animasi.

c. Mendistribusikan data dalam kelompok-kelompok yang tepat

untuk meningkatkan ketersediaan agar dapat diakses.

2.7.5.3 Downflow

Proses pengarsipan dan backup data di dalam data

warehouse. Penyimpanan data lama memainkan peranan yang

penting dalam mempertahankan penampilan dan efektifitas dari

warehouse dengan mengirimkan data lama dengan nilai yang

terbatas ke sebuah tempat penyimpanan seperti magnetic tape atau

optical disk. Downflow dari data juga meliputi proses yang

memastikan bahwa kondisi sekarang dari data warehouse dapat

dibangun kembali jika terjadi kehilangan data, kegagalan software

atau hardware.

2.7.5.4 Outflow

Proses pembuatan data hingga tersedia bagi pengguna. Dua

aktivitas yang dilakukan dalam outflow meliputi :

1) Pengaksesan, berhubungan dengan proses memuaskan end-user

dengan menyediakan data yang dibutuhkan. Frekuensi dari

pengaksesan ini bervariasi mulai dari ad hoc secara rutin hingga

real time. Selain itu, dipastikan bahwa sumber sistem digunakan

23

dengan cara yang paling efektif di dalam penjadwalan

pengeksekusian terhadap query dari pengguna.

2) Pengiriman, berhubungan secara aktif dalam pengiriman

informasi ke workstation dari pengguna. Ini merupakan area baru

dari data warehouse dan sering dihubungkan dengan proses

publish dan subscribe. Data warehouse akan mempublikasikan

objek bisnis yang bermacam-macam dan pengguna akan

berlangganan terhadap objek bisnis yang dibutuhkan mereka.

2.7.5.5 Metaflow

Proses yang berhubungan dengan mengatur metadata.

Metaflow merupakan proses memindahkan metadata (data tentang

flow yang lainnya). Metadata merupakan deskripsi dari data yang

ditampung di dalam data warehouse, apa yang ada di dalamnya,

dari mana asalnya, dan apa yang telah dilakukan terhadap data

tersebut dengan cara cleansing, integrating, dan summarizing.

2.7.6 Anatomi Data Warehouse

Konsep awal dari penerapan arsitektur data warehouse yaitu bahwa

data warehouse mengambil data dari berbagai sumber dan

memindahkannya ke dalam pusat pengumpulan data yang besar. Konsep

ini sebenarnya lebih cenderung kepada sebuah lingkungan mainframe yang

terpusat.

24

Keunggulan teknologi Client Server memungkinkan data

warehouse diterapkan dalam berbagai macam cara untuk menampung

kebutuhan pemakai sistem secara lebih proporsional. Dalam suatu kasus,

misalkan pemakai tertentu perlu menggabungkan data dari sebuah sistem

pengumpulan data yang statis dengan data dari sistem operasional yang

dinamis hanya dengan sebuah query saja. Berikut ini adalah tiga jenis dasar

sistem data warehouse :

2.7.6.1 Data Warehouse Fungsional

Data warehouse fungsional merupakan data warehouse yang

dibuat lebih dari satu dan dikelompokkan berdasarkan fungsi-fungsi

yang ada di dalam perusahaan seperti fungsi keuangan (financial),

pemasaran, personalia, dan lain-lain.

Gambar 2.7 Data Warehouse Fungsional

(http://blog.ub.ac.id/usfita/2010/11/01/data-warehouse/)

Keuntungan dari bentuk data warehouse seperti ini adalah

sistem mudah dibangun dengan biaya yang relatif murah sedangkan

25

kerugiannya adalah resiko kehilangan konsistensi data dan

terbatasnya kemampuan dalam pengumpulan data bagi pengguna.

2.7.6.2 Data Warehouse Terpusat

Gambar 2.8 Data Warehouse Terpusat


Bentuk ini terlihat seperti bentuk data warehouse fungsional,

namun terlebih dahulu sumber data dikumpulkan dalam satu tempat

terpusat, kemudian data disebar ke dalam fungsinya masing-masing,

sesuai kebutuhan perusahaan.

Data warehouse terpusat ini, biasa digunakan oleh perusahaan

yang belum memiliki jaringan eksternal. Keuntungan dari bentuk

ini adalah data benar-benar terpadu karena konsistensinya yang

26

tinggi, sedangkan kerugiannya adalah biaya yang mahal serta

memerlukan waktu yang cukup lama untuk membangunnya.

2.7.6.3 Data Warehouse Terdistribusi

Pada data warehouse terdistribusi ini, digunakan gateway

yang berfungsi sebagai jembatan penghubung antara data

warehouse dengan workstation yang menggunakan sistem beraneka

ragam. Dengan sistem terdistribusi seperti ini memungkinkan

perusahaan dapat mengakses sumber data yang berada di luar lokasi

perusahaan (eksternal).

Gambar 2.9 Data Warehouse Terdistribusi


27

Keuntungannya adalah data tetap bersifat konsisten karena

sebelum data digunakan, data terlebih dahulu disesuaikan atau

mengalami proses sinkronisasi. Sedangkan kerugiannya adalah

lebih kompleks untuk diterapkan karena sistem operasi dikelola

secara terpisah, juga biayanya yang paling mahal dibandingkan

dengan dua bentuk data warehouse lainnya.

2.7.7 Keuntungan Data Warehouse

Menurut Connolly dan Begg (2005, p1152), kesuksesan dari

implementasi data warehouse dapat membawa keuntungan yang besar

terhadap perusahaan meliputi :

a. Pengembalian yang besar dari investasi

Sebuah perusahaan harus mengeluarkan biaya yang besar untuk

membangun dan mengimplementasi suatu data warehouse secara sukses.

Menurut survei Internation Data Corporation (IDC) pada tahun 1996

melaporkan bahwa rata-rata 3 tahun ROI (Return On Investment) dalam

data warehousing mencapai 401%, dengan lebih dari 90% perusahaan

mencapai lebih dari 40% ROI, setengah perusahaan mencapai 160% ROI,

dan seperempatnya mencapai lebih dari 600% ROI.

b. Keuntungan yang kompetitif

Keuntungan kompetitif dapat diperoleh dengan mendukung para

pengambil keputusan mengakses data yang dapat melihat apa yang

28

sebelumnya belum pernah dilihat dan diperkirakan sebelumnya. Contoh :

pelanggan, tren, dan permintaan.

c. Meningkatkan produktivitas dari para pengambil keputusan

Data warehouse dapat meningkatkan produktifitas para pengambil

keputusan dengan membuat suatu database yang terintegrasi dari data-

data yang konsisten, berorientasi pada subjek, dan bersifat sejarah.

Dengan adanya data warehouse, data dari berbagai sistem dapat

disatukan menjadi sebuah bentuk yang konsisten, yaitu dengan

mentransformasikan data tersebut menjadi informasi yang berguna untuk

para pengambil keputusan agar dapat melakukan analisis yang lebih

nyata, akurat, dan konsisten.

2.7.8 Perancangan Data Warehouse

Menurut Kimball (Connolly dan Begg, 2005, p1187), terdapat

sembilan tahap dalam metodologi perancangan data warehouse, yaitu :

2.7.8.1 Menentukan Proses

Proses (fungsi) mengacu pada subjek masalah dari data mart

tertentu. Data mart yang pertama kali dibangun haruslah tepat waktu,

sesuai dengan anggaran, dan dapat menjawab pertanyaan-pertanyaan

bisnis yang penting.

29

2.7.8.2 Menentukan Grain

Menentukan grain berarti memutuskan secara pasti apa yang

dinyatakan oleh record dari tabel fakta. Dengan terpilihnya grain

untuk tabel fakta, maka kita dapat mengidentifikasi dimensi.

Keputusan grain untuk tabel fakta juga menentukan grain untuk

setiap dimensi pada tabel fakta.

2.7.8.3 Mengidentifikasi dan Penyesuaian Dimensi

Dimensi menentukan konteks untuk memberikan pertanyaan

mengenai fakta-fakta dalam tabel fakta. Kumpulan dimensi yang

dibangun dengan baik membuat data mart dapat dimengerti dan

mudah untuk digunakan. Dimensi diidentifikasi dalam detail yang

cukup untuk mendeskripsikan data seperti client dan properties dari

grain yang tepat.

Jika ada dimensi yang muncul dalam dua data mart, maka

kedua data mart tersebut harus memiliki dimensi yang sama, atau

salah satu data mart adalah subset matematis dari data mart yang

lain. Hanya dengan cara ini dua data mart berbagi satu atau lebih

dimensi pada aplikasi yang sama. Ketika sebuah dimensi digunakan

oleh lebih dari satu data mart maka seluruh data warehouse akan

gagal, karena dua data mart tidak dapat digunakan pada saat yang

bersamaan.

30

2.7.8.4 Menentukan Fakta

Grain dari tabel fakta menentukan fakta mana yang dapat

digunakan pada data mart. Semua fakta harus dinyatakan

berdasarkan tingkatan yang tersirat oleh grain. Fakta tambahan dapat

ditambahkan ke dalam tabel fakta pada setiap waktu dengan catatan

fakta tersebut konsisten dengan grain dari tabel.

2.7.8.5 Menyimpan Perhitungan Awal dalam Tabel Fakta

Setelah dipilih, setiap fakta harus dikaji ulang untuk

menentukan apakah ada kemungkinan untuk melakukan prakalkulasi

yang muncul ketika fakta-fakta tersebut meliputi laporan untung rugi.

2.7.8.6 Menambahkan Atribut yang Dibutuhkan dalam Tabel Dimensi

Pada tahapan ini, tabel dimensi kembali dikaji dengan

menambahkan sebanyak mungkin deskripsi berbentuk teks. Deskripsi

teks harus intuitif dan dapat dimengerti oleh pengguna. Kegunaan

data mart ditentukan oleh cakupan dan sifat atribut pada tabel

dimensi.

2.7.8.7 Menentukan Durasi Database

Durasi mengukur seberapa lama tabel fakta dapat disimpan.

Pada banyak perusahaan, ada kebutuhan untuk melihat pada waktu

yang sama untuk periode satu atau dua tahun sebelumnya. Tabel

31

fakta yang sangat besar akan mengakibatkan munculnya minimal dua

masalah dalam data warehouse.

Pertama, meningkatnya kesulitan untuk menjadikan data lama

yang semakin bertambah sebagai sumber data. Semakin lama umur

data, semakin sulit dalam membaca dan menginterpretasikan data-

data tersebut. Kedua, kewajiban dalam versi lama dari dimensi

penting yang digunakan, bukan versi terbaru. Hal ini dikenal dengan

masalah ‘slowly changing dimension’.

2.7.8.8 Menelusuri Perubahan dari Dimensi secara Perlahan

Pada tahap ini, data warehouse memperhatikan proses dimensi

yang semakin tua seiring dengan berjalannya waktu. Untuk itu perlu

dilakukan update agar data warehouse selalu konsisten. Terdapat tiga

tipe perubahan dimensi secara perlahan, yaitu perubahan data secara

langsung atau update tabel dimensi, perubahan data membentuk

record baru dengan surrogate key yang berbeda, dan perubahan data

akan membentuk atribut atau kolom baru pada tabel dimensi.

2.7.8.9 Memutuskan Prioritas Query dan Tipe Query

Pada tahap ini dipertimbangkan masalah desain fisikal.

Masalah paling kritis yang muncul mempengaruhi persepsi pengguna

akhir dari data mart adalah urutan penyusunan tabel fakta pada disk

dan adanya ringkasan prapenyimpanan atau agregasi. Selain masalah

32

ini, ada lagi beberapa masalah fisikal yang mempengaruhi

administrasi, backup, performa pengindeksan, dan keamanan.

2.7.9 Pemodelan Dimensional

Menurut Connolly dan Begg (2005, p1183), pemodelan dimensional

adalah sebuah teknik perancangan logikal yang bertujuan untuk menyajikan

data ke dalam sebuah standar, bentuk intuitif yang dapat diakses dengan

performa yang tinggi. Setiap model dimensional terdiri dari sebuah tabel

dengan sebuah primary key komposit yang disebut dengan tabel fakta, dan

sekumpulan tabel yang lebih kecil yang disebut dengan tabel dimensi.

Setiap tabel dimensi memiliki sebuah primary key (non-komposit)

sederhana yang berkorespondensi tepat dengan satu key komposit pada tabel

fakta. Karakteristik dengan struktur seperti bintang ini disebut dengan star

schema atau star join.

Dalam pemodelan dimensional, semua natural keys diganti dengan

surrogate key. Ini berarti setiap join antara tabel fakta dan tabel dimensi

berdasarkan surrogate key, bukan natural key. Sebagai contoh, setiap cabang

mempunyai natural key yang dinamakan cabang_kode, dan mempunyai

surrogate key yang diberi nama cabangID.

Berikut adalah keuntungan pemodelan dimensional :

a. Efficiency

Konsitensi dari struktur database pokok memungkinkan

pengaksesan yang lebih efisien ke data dengan berbagai macam tools

termasuk report writers dan query tools.

33

b. Ability to handle changing requirement

Skema bintang dapat beradaptasi terhadap perubahan user’s

requirement, sama halnya dengan semua dimensi yang menyediakan

akses untuk tabel fakta. Ini berarti rancangan tersebut lebih mampu

menunjang ad hoc user queries.

c. Extensibility

Model dimensional dapat dikembangkan. Sebagai contoh,

perubahan-perubahan yang harus ditunjang oleh model dimensional

adalah :

i. Penambahan fakta baru selama fakta tersebut konsisten dengan

granularity dasar dari tabel fakta yang telah ada.

ii. Penambahan dimensi baru selama ada sebuah nilai tunggal dari

dimensi tersebut yang mendefinisikan setiap record fakta yang ada.

iii. Penambahan atribut dimensional baru.

iv. Pemecah record dimensional yang ada ke level granularity yang

lebih rendah dari titik tertentu dalam waktu ke depan.

d. Ability to model common business situation

Ada banyak standar pendekatan yang sedang berkembang untuk

menangani pemodelan situasi umum pada dunia bisnis. Setiap situasi ini

memiliki kumpulan alternatif yang dimengerti dan dapat secara khusus

diprogram di dalam report writers, query tools, dan antar muka lainnya.

Sebagai contoh slowly changing dimension merupakan dimensi konstan

34

seperti ‘cabang’ dan ‘staf’ yang dapat berkembang secara lambat dan

tidak serempak.

e. Predictable query processing

Aplikasi data warehouse melakukan proses drill down dengan

menambahan atribut dimensi dari sebuah skema bintang tunggal. Aplikasi

melakukan proses drill across dengan menghubungkan beberapa tabel

fakta dengan berbagai dimensi. Biarpun keseluruhan skema bintang

dalam model dimensional perusahaan kompleks, namun proses query

yang dilakukan dapat diprediksi karena pada level terendah, setiap tabel

fakta harus diquery secara independen.

2.7.9.1 Skema Bintang

Menurut Inmon (2002, p137), skema bintang adalah sebuah

struktur data di mana data didenormalisasi untuk mengoptimalkan

akses terhadap data; merupakan dasar dari rancangan data mart

multidimensi.

Menurut Connolly dan Begg (2005, p1163), skema bintang

adalah sebuah struktur logikal yang mempunyai tabel fakta berisi

data faktual yang berada di tengah, dan dikelilingi oleh tabel dimensi

yang berisi referensi data yang biasanya dapat didenormalisasi.

35

Gambar 2.10 Skema Bintang

2.7.9.2 Skema Snowflake

Menurut Connolly dan Begg (2005, p1184), skema snowflake

adalah sebuah variasi dari star schema di mana tabel dimensinya

tidak mengandung data yang terdenormalisasi sehingga tabel dimensi

boleh memiliki dimensi. Snowflake memiliki sebuah tabel fakta

sebagai pusatnya, dikelilingi tabel-tabel dimensi yang ternormalisasi.

36

Gambar 2.11 Skema Snowflake

2.7.9.3 Skema Starflake

Menurut Connolly dan Begg (2005, p1185), skema starflake

adalah struktur hybrid yang berisi campuran antara skema bintang

dan skema snowflake. Skema starflake memiliki tabel fakta sebagai

pusatnya, dikelilingi oleh tabel-tabel dimensi yang terdenormalisasi

dan ternormalisasi.

37

Gambar 2.12 Skema Starflake

2.7.10 Komponen Pemodelan Dimensional

2.7.10.1 Fakta

Menurut Kimball dan Ross (2002, p402), fakta adalah

sebuah ukuran performansi bisnis, biasanya berupa numerik

dan penjumlahan. Hal ini berlanjut pada pengertian dari tabel

fakta sebagai lokasi penyimpanan untuk fakta yang ada.

2.7.10.2 Tabel Fakta

Menurut Kimball dan Ross (2002, p402), tabel fakta

adalah sebuah skema bintang (dimensional table); pusat tabel

dengan pengukuran performansi bisnis dalam bentuk numerik

yang memiliki karakteristik berupa sebuah composite key, yang

38

tiap-tiap elemennya adalah foreign key yang didapat dari tabel

dimensi.

2.7.10.3 Dimensi

Menurut Kimball dan Ross (2002, p399), dimensi adalah

sebuah entitas independent pada sebuah model dimensional

yang berfungsi sebagai pintu masuk atau berperan sebagai

sebuah mekanisme untuk memecahkan pengukuran tambahan

yang ada pada tabel fakta dari pemodelan dimensional.

2.7.10.4 Tabel Dimensi

Menurut Kimball dan Ross (2002, p399), tabel dimensi

adalah sebuah tabel pada model dimensional yang memiliki

sebuah primary key tunggal dan kolom dengan atribut

deskriptif.

2.7.10.5 Surrogate Key

Menurut Kimball dan Ross (2002, p399), surrogate key

adalah key berupa integer yang secara sekuensial ditambahkan

sesuai keperluan pada staging area untuk membentuk sebuah

tabel dimensi dan elemen yang menggabungkannya dengan

tabel fakta.

Pada tabel dimensi, surrogate key bertindak sebagai

primary key. Sedangkan pada tabel fakta, surrogate key

39

bertindak sebagai foreign key yang menspesifikasikan dimensi.

Surrogate key pada data warehouse dibutuhkan untuk

menangani permasalahan yang timbul dari slowly changing

dimensions serta data yang hilang atau pun data yang tidak

dapat digunakan.

2.7.10.6 Granularity

Menurut Inmon (2002, p391), granularity adalah tingkat

detail yang terkandung pada setiap unit data. Semakin rinci

tingkat datanya, maka semakin rendah tingkat granularitynya.

Begitu juga sebaliknya, semakin rendah tingkat kerincian

datanya, maka semakin tinggi tingkat granularitynya.

2.7.11 ETL ( Extract, Transform, and Load )

Menurut Prabhu dan Venatesan (2007, p112), ETL adalah proses

migrasi dari database operasional menuju data warehouse. ETL

merupakan suatu proses yang diperlukan dalam membentuk struktur

model dimensi (dimensional model) dalam data warehouse yang terdiri

dari 3 tahap, yaitu :

2.7.11.1 Extract

Extract (ekstraksi) merupakan sebuah proses penarikan

data dari satu atau lebih sistem operasional sebagai sumber data

yang dibutuhkan oleh data warehouse yang akan digunakan di

dalam proses selanjutnya. (Pada umumnya data ditarik dari

40

sistem database OLTP, tetapi dapat juga berasal dari sumber-

sumber eksternal yang lain).

2.7.11.2 Transform

Setelah data diekstraksi, maka akan dilakukan proses

transformasi (transform), yaitu sebuah proses untuk mengolah

data sedemikian rupa, seperti membersihkan data (antara lain

dengan membenarkan ejaan yang salah, menyelesaikan konflik

domain, mengembalikan elemen yang hilang, dan

menyatukannya ke dalam sebuah format yang standar agar data

yang ada menjadi konsisten satu sama lain), menggabungkan

data dari berbagai sumber eksternal yang lain, menghilangkan

duplikasi data yang ada, dan juga memberikan surrogate key

(sebuah key yang menghubungkan struktur data warehouse dan

terpisah dari sistem sumber), selain itu data juga harus diagregasi

untuk mempercepat analisis.

2.7.11.3 Load

Setelah data telah ada dan telah ditransformasi sedemikian

rupa sesuai dengan kebutuhan, maka hasil dari data tersebut akan

disimpan dalam bentuk tabel dimensional yang berkualitas ke

dalam sebuah database relasional baik berupa data warehouse

maupun data mart. Proses penyimpanan data inilah yang

dinamakan dengan load.

41

Jadi, tujuan dari proses ETL ini adalah untuk mengumpulkan,

menyaring, mengolah, dan juga menggabungkan data-data dari berbagai

sumber eksternal yang ada serta menyimpannya ke dalam data

warehouse ataupun data mart.

2.8 Pengertian Pembelian

Menurut Stevenson (2009, p518), pembelian adalah proses mendapatkan

material, bagian-bagian, persediaan, dan layanan yang diperlukan untuk

memproduksi sebuah produk atau menyediakan sebuah layanan.

2.9 Pengertian Logistik

Menurut Chase (2006, p586), logistik adalah stok dari setiap barang atau

sumber daya yang digunakan dalam sebuah organisasi. Sistem persediaan

adalah serangkaian kebijakan dan pengendalian yang memonitor tingkat

persediaan dan menentukan tingkat apa yang harus dipertahankan, saat saham

harus diisi, dan berapa besar pesanan seharusnya.

Menurut Schroeder (2007, p332), logistik adalah stok dari barang-barang

yang digunakan untuk menfasilitasi produksi atau untuk meningkatkan

kepuasan pelanggan.

42

2.10 Pengertian Microsoft SQL Server

Mengacu pada pendapat Aldi Akbar (2011), SQL Server itu sendiri

adalah bahasa yang dipergunakan untuk mengakses data dalam basis

data relation. Bahasa ini secara de facto adalah bahasa standar yang digunakan

dalam manajemen basis data relasional.

Saat ini hampir semua server basis data yang ada mendukung bahasa ini

dalam manajemen datanya. SQL Server merupakan salah satu produk

dari Relational Database Management System (RDBMS). SQL Server

termasuk SQL Server Management Studio, sebuah produk yang terintegrasi

dengan fungsi untuk mengembangkan, menyebarkan, dan mengatasi masalah

database SQL Server, serta perangkat tambahan untuk fungsi sebelumnya.

2.11 Pengertian Microsoft Visual Basic

Menurut Patrice (2008, p4), Visual Basic adalah salah satu jenis dari

bahasa pemrograman. Seperti bahasa lisan atau tulisan lainnya, Visual Basic

memiliki peraturan-peraturan mengenai sintaks dan sekelompok seri dari kata-

kata yang tersedia yang dapat digunakan untuk membuat aplikasi yang

diinginkan oleh pengguna.

Visual Basic adalah sebuah pilihan yang terkenal bagi para pemula

karena beberapa orang menemukan bahwa penggunaan sintaksnya lebih

sederhana daripada sintaks yang terdapat dalam bahasa pemrograman lainnya.

Jika pernah menggunakan versi lama dari Visual Basic sebelumnya (seperti

Visual Basic 4.0, 5.0, atau 6.0), maka akan ditemukan beberapa konstruksi dan

43

antar muka pengguna yang cukup familiar dalam Visual Basic 2008. Visual

Basic 2008 adalah bahasa pemrograman yang bersifat orientasi subjek (OOP).

2.12 Metode Penyajian Data

2.12.1 Bar Chart

Gambar 2.13 Contoh Bar Chart (Aczel, 2002, p59)

Bar chart sering digunakan untuk menunjukkan data berkategori

di mana ketika tidak ada penekanan pada persentase dari total yang

direpresentasikan oleh setiap kategori. Bar chart dapat diplot secara

vertikal maupun horizontal. Skala pengukuran adalah nominal atau

ordinal. Bar chart dapat digunakan untuk menampilkan data kontinu

seperti ukuran sepatu atau warna mata, dan data diskontinu seperti

tinggi badan atau berat badan.

44

2.12.2 Line Chart

Gambar 2.14 Contoh Line Chart (Aczel, 2002, p60)

Line chart adala sebuah tipe grafik yang digunakan untuk

menampilkan informasi dalam rangkaian titik data yang dihubungkan

dengan segmen garis lurus. Line chart sering digunakan untuk

memvisualisasikan trend data dalam interval waktu atau dalam kurun

waktu tertentu, dengan demikian line chart sering digambarkan secara

kronologis.

2.12.3 Pie Chart

Pie chart adalah sebuah tampilan deskriptif sederhana dari data

yang merupakan jumlah dari total yang diberikan. Pie chart mungkin

adalah sebuah cara yang paling ilustratif untuk menampilkan kuantitas

sebagai persentase dari total yang diberikan. Total area dari sebuah pie

45

chart merepresentasikan 100% dari kuantitas (jumlah dari nilai

variabel pada seluruh kategori), dan ukuran dari setiap potongan

adalah persentase dari total yang direpresentasikan oleh kategori yang

ditunjukkan potongan. Pie chart biasanya digunakan untuk

mempresentasikan frekuensi atau data berkategori. Skala pengukuran

dapat berupa nominal atau ordinal.

Gambar 2.15 Contoh Pie Chart (Aczel, 2002, p41)

BAB 2 LANDASAN TEORI - thesis.binus.ac.idthesis.binus.ac.id/Doc/Bab2/2012-1-00116-IF Bab 2.pdf ·...

Documents

Transcript of BAB 2 LANDASAN TEORI - thesis.binus.ac.idthesis.binus.ac.id/Doc/Bab2/2012-1-00116-IF Bab 2.pdf ·...