BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model...
Transcript of BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model...
7
BAB II
LANDASAN TEORI
2.1. Data
Data adalah sebuah rekaman dari fakta-fakta, konsep-konsep, atau instruksi-
instruksi pada media penyimpanan untuk komunikasi perolehan, dan pemrosesan
dengan cara otomatis dan presentasi sebagai informasi yang dapat dimengerti oleh
manusia (Inmon, 2005).
Pendapat lain mengatakan, bahwa data merupakan sebuah rekaman dari
fakta, konsep, atau instruksi yang harus diproses untuk menjadi sebuah informasi
yang dapat dimerti oleh manusia. Tempat penyimpanan data bisa di media
penyimpanan berupa media komputer yang bisa menyimpan data berupa video,
gambar, suara, dan teks. Maka dari itu pengertian data pada era ini dapat diperluas
menjadi data berupa fakta, konsep, instruksi, grafik, suara, serta video (Hariyanto,
2004).
Dari kedua pendapat di atas yang dimaksud data pada penelitian ini adalah
rekaman berupa fakta, konsep, instruksi, grafik, suara, dan video.
2.2. Informasi
Informasi adalah data yang dikelola untuk digunakan sebagai proses
pengambil keputusan (Bodnar, 2000). Informasi juga memiliki tujuan tertentu.
Tujuan tersebut adalah untuk menghasilkan sebuah keputusan yang berdasar
(Meliono, 1990).
Secara umum informasi dapat diartikan sebagai sebuah data yang dikelola
dan diproses sehingga memiliki tujuan tertentu untuk menghasilkan sebuah
keputusan yang berdasarkan fakta yang ada di dunia nyata yang berjalan
berdasarkan siklus informasi yang dimulai dari dasar data yang kemudia di proses
sehingga menghasilkan output informasi yang bisa digunakan sebagai keputusan
tindakan.
8
.
Gambar 2.1 Siklus Informasi (Sutabri, 2005)
2.3. Sistem Informasi
Sistem informasi adalah suatu sistem dalam suatu organisasi yang
mempertemukan kebutuhan pengolahan transaksi harian, mendukung operasi,
bersifat manajerial, kegiatan strategi, dan menyediakan pihak luar tertentu
(outsourcing) dengan laporan-laporan yang diperlukan (Jogiyanto, 2005).
Sekumpulan strategi, kegiatan prosedural, dan kegiatan manajerial yang dilakukan
oleh organisasi ini dilaksanakan untuk mencapai suatu tujuan yaitu pengambil
keputusan dan mengendalikan kegiatan organisasi.
2.4. Database
Database ialah koleksi atau kumpulan data yang mekanis, terbagi(shared),
terdefinisi secara formal dan juga dikontrol terpusat pada suatu organisasi (Everest,
1974). Di lain pendapat database memiliki definisi yaitu koleksi “data operasional”
yang tersimpan dan juga dipakai oleh sistem aplikasi dari suatu organisasi (Date,
2003). Dari kedua pendapat itu dapat ditarik kesimpulan bahwa database
merupakan sebuah sistem aplikasi yang menyimpan semua koleksi data operasional
maupun mekanis yang digunakan pada suatu organisasi dan dikontrol terpusat.
9
2.5. Data Warehouse
2.5.1. Pengertian Data Warehouse
Data Warehouse adalah koleksi data hasil kelola dari database OLTP
(Online Transaction Processing) menjadi OLAP (Online Analytical Processing)
dan menghasilkan sebuah data mart. Data warehouse juga mempunyai sifat
berorientasi subjek, terintegrasi, time-variant, dan bersifat tetap (nonvolatile) dari
koleksi data dalam mendukung proses pengambilan keputusan manajemen (Inmon,
2005). Sedangkan menurut pendapat lain data warehouse merupakan basis data
yang bersifat analisis dan read-only yang digunakan sebagai fondasi dari sistem
penunjang keputusan (Poe, 1996). Menurut Paul Lane, data warehouse merupakan
database relasional yang dirancang lebih untuk query dan analisis proses transaksi,
biasanya mengandung sejarah data transaksi dan mungkin juga data dari sumber
lain. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi
dan memungkinkan organisasi untuk menggabungkan / konsolidasi data dari
berbagai sumber. Dari ketiga pendapat tersebut dapat disimpulkan bahwa data
warehouse adalah sebuah koleksi data bersifat analisis dan read-only yang
disimpan dalam kurun waktu tertentu lalu diproses secara analitik untuk
pengambilan keputusan manajemen. Dari kesimpulan itu muncul sebuah ide bahwa
sebuah tabel yang berisikan transaksi atau biasa disebut dengan tabel fakta selalu
memiliki dimensi-dimensi yang memperjelas data-data yang ada di tabel fakta.
Salah satu dimensi yang selalu ada adalah dimensi waktu karena sifat data
warehouse yang time-variant.
2.5.2. Karakteristik Data Warehouse
Menurut Inmon, data warehouse memiliki beberapa karakteristik yang
selalu ada, yang pertama adalah subject oriented, integrated, nonvolatile, dan time-
variant
2.5.2.1. Subject Oriented
Data warehouse memiliki ciri subject-oriented yang berarti dalam desain
sistem untuk menganalisis didasari oleh subjek-subjek tertentu yang berkaitan
dengan organisasi. Misalnya untuk organisasi asuransi subjek yang terkait dan
dalam skala mayor adalah pelanggan, kebijakan, dan klaim. Untuk penjualan,
10
subjek yang berskala mayor contohnya adalah transaksi penjualan, produk, toko
atau cabang. Dapat ditarik kesimpulan bahwa setiap organisasi maupun perusahaan
memiliki subjek tertentu yang berhubungan dengan operasional sistem. Dalam studi
kasus saya, perpustakaan memiliki subjek berupa peminjam buku, transaksi
peminjaman, transaksi pengembalian, dan buku yang dipinjamkan.
2.5.2.2. Integration
Dalam sistem data warehouse sangat memungkinkan untuk mendapatkan
sumber database operasional dari luar (external source). Dari kejadian ini
menimbulkan kemungkinan adanya perbedaan satuan antara database operasional
(internal source) dengan database-database dari luar. Maka dari itu dilakukanlah
sebuah integrasi pada satuan bilangan tertentu. Misalnya jika di internal memiliki
satuan ukur panjang dengan satuan cm, sedangkan di external source menggunakan
mm, maka bisa di pilih salah satu satuan yang menjadi patokan sehingga semua
satuan terintegrasi menjadi satu dan sama.
Berikut adalah gambaran kasus lain.
Gambar 2.2 Contoh kasus integrasi dari berbagai satuan pada database operasional lalu diintegrasi pada
data warehouse (Inmon, 2005)
2.5.2.3. Nonvolatile
Database operasional sering kali mengalami manipulasi data seperti insert,
delete, dan update data. Setiap kali ada data baru, maka akan dilakukan
11
penambahan data pada waktu itu juga. Demikian dengan menghapus dan mengedit
data. Data operasional yang ada di database berubah secara real-time. Data
dimanipulasi dan saat itu juga data berubah. Berbeda dengan data warehouse, data
warehouse hanya melakukan load (mengambil) data dari database operasional
sehingga dapat diakses oleh pengguna. Jadi setiap perubahan yang ada di database
operasional tidak langsung dirubah di data warehouse melainkan akan berubah
ketika data warehouse melakukan load dari database operasional dan diakses oleh
pengguna sistem data warehouse. Data warehouse tidak berubah (nonvolatile)
namun biasanya setiap adanya perubahan yang ada di database operasional akan
membuat data warehouse menyerap data yang baru kemudian secara incremental
disatukan dengan data sebelumnya. Ini disebabkan data warehouse hanya memiliki
dua fungsi manipulasi data, yaitu load data dan access data.
Gambar 2.3 Ilustrasi kerja database operasional dan data warehouse ketika terjadi manipulasi data (insert,
update, delete). (Inmon, 2005)
2.5.2.4. Time-variant
Database operasional selalu berhubungan dengan kegiatan manipulasi data
yang terjadi pada saat itu juga (real-time). Sedangkan data warehouse selalu
menyerap apa pun yang telah di-load oleh data warehouse dari awal terbentuknya
data warehouse hingga yang paling terbaru. Semua data akan dijadikan bahan
analisis dan pengambil keputusan yang valid pada rentan waktu tertentu, misalnya
harian, mingguan, bulanan, tahunan, dan nilai waktu lainnya. Database operasional
bisa bekeja dan tetap valid meskipun ada atau tidak adanya elemen waktu pada
datanya. Sedangkan pada data warehouse elemen waktu harus jelas untuk menjaga
12
kevalidan data pada rentang waktu tertentu karena record data pada data warehouse
rentang waktunya lebih besar daripada database operasional demi kepentingan
analisis data secara periodik.
Karena rentang waktu kevalidan database operasional dan data warehouse
berbeda menyebabkan time horizon dari database operasional berlaku dari data
yang terkini hingga 60-90 hari kemudian. Sedangkan untuk data warehouse
memiliki time horizon 5-10 tahun (Inmon, 2005).
Gambar 2.4 Perbandingan time variancy dari database operasional dengan data warehouse (Inmon, 2005)
2.5.3. Struktur Data Warehouse
Struktur data warehouse terdiri dari older level of detail, current level of
detail, lightly summarized data, dan highly summarized data. Current level of detail
adalah sebuah level data dimana data mengalir ke data warehouse dari database
operasional. Setelah data warehouse me-load data yang baru lagi dari database
operasional, maka data yang tadinya current level of detail berubah menjadi older
level of detail. Older level of detail adalah data historik dari current level of detail
yang masih disimpan sebagai back-up dan historik data secara keseluruhan. Setelah
data tersimpan di data warehouse, maka dilakukan rangkuman data sehingga
terbentuklah lightly summarized data. Lightly summarized data sendiri adalah hasil
rangkuman data yang masih bisa dibilang terkini. Jika sudah melampaui waktu
tertentu maka lightly summarized data akan berubah menjadi highly summarized
data.
13
Gambar 2.5 Struktur data warehouse (Inmon, 2005)
2.5.4 Data Mart yang Bisa Dihasilkan oleh Proses Data Warehouse
Data mart yang bisa didapatkan dalam proses data warehouse pada
penelitian ini adalah:
1. Perbandingan persentase pengembalian buku tiap tahun.
2. Penunjang data pengadaan buku dari frekuensi tipe-tipe buku yang sering
dipinjam.
2.6. Perbedaan OLAP dan OLTP
OLTP atau biasa disebut dengan Online Transaction Processing adalah
sebuah sistem yang memiliki orientasi fungsi berupa proses pada segala transaksi
yang terjadi. OLTP terjadi pada sebuah jaringan komputer yang memiliki sebuah
sistem penyimpanan data untuk mencatat semua kegiatan dan proses transaksi yang
terjadi pada instansi atau organisasi yang terkait. Seperti misalnya penjaga
perpustakaan yang memasukkan setiap kegiatan peminjaman yang terjadi ketika
buku perpustakaan dipinjam oleh anggota perpustakaan. Kegiatan OLTP lebih
bersifat pendek dan cepat yang dapat dimanipulasi datanya pada saat itu juga.
Karena disetiap ada proses transaksi, data akan di-update untuk memperoleh
kevalidan data. Sedangkan OLAP atau biasa disebut dengan Online Analytical
Processing adalah sebuah kegiatan yang bersifat managerial dimana terdapat query-
query kompleks yang berfungsi untuk menarik hasil analisis. Hasil analisis inilah
14
yang akan dijadikan sebagai pengambil keputusan yang dilakukan oleh manager
instansi atau orang yang mengatur dan mengontrol instansi tersebut.
2.7. Model Dimensional
Model dimensional merupakan rancangan logikal suatu sistem yang
bertujuan untuk mendapatkan akses data dalam bentuk standar, intuitif, dengan
performa tinggi. Model dimensional terbentuk dari beberapa entitiy relation (ER)
yang ditandai dengan adanya primary key dan foreign key. Terdapat dua model
dimensional yang sering digunakan dalam praktek data warehouse, yaitu star
schema dan snowflake karena mudah dimengerti dan query yang digunakan
memiliki performa superior dengan meminimalisasi tabel-tabel join.
2.7.1. Star Schema
Star Schema adalah skema yang tabel dimensinya terpusat pada sebuah
tabel fakta. Setiap tabel dimensi terbentuk dari hasil collapse (penggabungan) tanpa
adanya normalisasi sehingga bisa saja terbentuk sebuah tabel dimensi yang
redundan. Pada model ini tabel dimensi hanya terhubung dengan tabel fakta.
Tabel Fakta
Tabel fakta merupakan tabel yang memiliki atribut transaksi ataupun atribut
hasil agregasi yang memiliki nilai yang dapat dikomputasi. Selain memiliki atribut
transaksi juga memiliki foreign key dari setiap tabel dimensi yang terhubung pada
tabel fakta.
Tabel Dimensi
Tabel dimensi merupakan tabel yang memperjelas subjek yang ada pada
tabel fakta. Primary key pada tabel dimensi selalu ada dalam tabel fakta yang
berhubungan langsung.
2.7.2. Snowflake Schema
Snowflake Schema adalah sebuah skema data warehouse yang memiliki
tabel fakta dan dimensi sama seperti star schema namun pada Snowflake Schema
tidak ada redundansi karena pada proses collapse (penggabungan) tabel dimensi
dilakukan normalisasi sehingga tidak ada atribut yang redundan. Ini menyebabkan
beberapa tabel dimensi tidak berhubungan langsung dengan tabel fakta namun tetap
berhubungan dengan tabel dimensi yang masih memiliki entity relation.
15
2.8. ETL
Kepanjangan dari ETL adalah extract, transform, dan load. Proses ETL
berfungsi sebagai mengubah jenis data agar terintegrasi yang awalnya di-extract
dari database operasional lalu pada aplikasi ETL (seperti talend) akan mengalami
perubahan jenis data lalu di-load ke bentuk data warehouse OLAP sehingga user
bisa memulai analisis data dari OLAP itu untuk kebutuhan pengambilan keputusan.
2.9. Nine Step Design Method
Menurut Kimball et al (2002), data warehouse dirancang dengan sembilan
cara yaitu:
2.9.1. Memilih Proses Bisnis yang Bersangkutan dengan Kebutuhan
Data warehouse memiliki karakteristik subject-oriented yang berarti kita
harus menentukan subyek permasalahan yang akan dianalisis lalu kita bisa
mengidentifikasi proses bisnis yang sesuai dengan permasalahan sehingga
terbentuk batasan-batasan dalam pembuatan data warehouse.
2.9.2. Menentukan Grain Bersumberkan Proses Bisnis
Maksud dari grain sendiri adalah cikal bakal tabel fakta yang ada pada tabel
OLAP. Grain ditentukan pada database operasional dengan mempertimbangkan
tabel tersebut memiliki fungsi transaksi yang terbentuk karena telah ada atribut
transaksi maupun ditabel tersebut bisa dilakukan agregasi atribut.
2.9.3. Mengidentifikasi dan Menyesuaikan Tabel Dimensi dengan yang Lain
Setelah kita menentukan cikal bakal tabel fakta, selanjutnya kita
menentukan cikal bakal tabel dimensi yang akan dimasukkan pada OLAP. Setelah
terbentuk cikal bakal tabel dimensi, tentu primary key yang ada pada tabel dimensi
akan menjadi sebuah identifikasi suatu tabel dimensi
2.9.4. Memilih Data-Data Fakta
Setelah memilih cikal bakal fakta, akan ditambahkan fakta-fakta yang akan
mengisi setiap tabel fakta yang sesuai dengan grain yang telah ditentukan.
2.9.5. Menyimpan Kalkulasi Awal dalam Tabel Fakta
Seperti yang telah dijelaskan sebelumnya, bahwa setiap tabel fakta selalu
ada transaksi yang dapat dihitung, pada tahap inilah perhitungan dilakukan.
16
2.9.6. Melihat Kembali Tabel Dimensi
Pada tahap ini dilakukan pelengkapan keterangan pada tabel dimensi
selengkap-lengkapnya sehingga dapat dipahami dengan mudah oleh penggunanya.
2.9.7. Memilih Durasi Database
Pada tahap ini yang dilakukan adalah memberi batasan waktu analisis dan
range analisis yang akan dilakukan.
2.9.8. Menelusuri Perubahan-Perubahan yang Terjadi pada Dimensi
Pada tahap ini dilakukan pengecekan pada tabel dimensi. Hal-hal yang biasa
berubah pada tabel dimensi adalah:
1. Atribut dimensi yang berubah tertulis ulang
2. Atribut dimensi yang berubah menimbulkan dimensi baru
3. Atribut dimensi yang berubah menimbulkan alternatif sehingga atribut
sebelumnya dan yang baru dapat diakses bersamaan pada dimensi yang sama.
2.9.9. Memutuskan Prioritas Query, Tipe Query, dan Memilih Physical Design
Pada tahap ini difokuskan untuk memilih Physical Design, query, dan query
type yang sesuai dengan kasus yang terjadi.
2.10. Tools Pembuatan Data Warehouse
Untuk pembuatan data warehouse sendiri dibutuhkan alat / aplikasi yang
digunakan untuk membantu dalam pembuatannya. Dalam kasus saya, saya
menggunakan penyimpanan database berupa MySQL, untuk proses ETL
menggunakan aplikasi talend, dan untuk keluaran data mart-nya saya menggunakan
pivot table yang biasanya bisa menggunakan program Ms. Excel.
2.11. Perpustakaan Daerah Kabupaten Lumajang
Perpustakaan adalah tempat untuk menyimpan dan membagikan informasi
pada halayak umum. Beberapa peranan perpustakaan pada kehidupan manusia
adalah sebagai sarana simpan karya manusia, sebagai fungsi informasi, sebagai
fungsi rekreasi, fungsi pendidikan, dan fungsi kultural.
Perpustakaan Daerah Kabupaten Lumajang memiliki dua macam proses
bisnis yang berkaitan dengan data warehouse dalam penelitian ini yaitu proses
17
bisnis peminjaman dan pengembalian. Pada Perpustakaan Daerah Kabupaten
Lumajang tidak terdapat sistem denda dikarenakan tidak ada peraturan daerah
(perda) yang mengharuskan adanya denda.
Gambar 2.6 Proses bisnis peminjaman buku perpustakaan
Gambar 2.7 Proses bisnis pengembalian buku perpustakaan
18