Official Site of EKA FITRI RAHAYU - Gunadarma...
Transcript of Official Site of EKA FITRI RAHAYU - Gunadarma...
1
PENGANTAR BASIS DATA I
I. Pendahuluan
Sebuah sistem database tidak lain adalah sistem penyimpanan catatan secara
terkomputerisasi. Database itu sendiri dapat dipandang sebagai suatu jenis filling cabinet
elektronik. Database merupakan sebuah tempat penyimpanan untuk file-file data yang
terkomputerisasi. Seorang user dari sistem dapat melakukan operasi-operasi terhadap file-file
tersebut. Operasi yang dapat dilakukan antara lain :
1. Menambah file baru ke dalam database2. Menambah data ke dalam file yang sudah ada3. Mengambil (retrieve) dari file yang sudah ada4. Merubah data dari file yang sudah ada5. Menghapus data dari file yang sudah ada6. Menghapus file dari database
Basis data meneyediakan fasilitas atau mempermudah dalam menghasilkan informasi yang digun akan pemakai untuk mendukung pengambilan keputusan. Hal inilah yang menjadikan alas an dari penggunaan teknologi basis data pada saat sekarang (dunia bisnis). Berikut contoh penggunaan aplikasi basis data dalam dunia bisnis :
Bank : Pengelolaan data nasabah, akunting, semua transaksi perbankan Bandara : Pengelolaan data reservasi, penjadualan Universitas : Pengelolaan pendaftaran, alumni Pabrik : Pengelolaan data produksi, persediaan barang, pemesanan, agen Penjualan : Pengelolaan data customer, produk, penjualan Kepegawaian : Pengelolaan data karyawan, gaji, pajak Telekomunikasi : Pengelolaan data tagihan, jumlah pulsa
II. Sistem Pemrosesan File / Sistem Pengorganisasian Tradisional
Sebelumnya sistem yang digunakan untuk mengatasi semua permasalahan bisnis,
menggunakan pengelolaan data secara tradisional dengan cara menyimpan record-record
pada file-file yang terpisah, yang disebut juga sistem pemrosesan file. Dimana masing-
masing file diperuntukan hanya untuk satu program aplikasi saja
2
Gambar 1. Ilustrasi Sistem Pemrosesan File
Kelemahan dari sistem pemrosesan file antara lain :
1. Timbulnya data rangkap (redundancy data) dan ketidakkonsistenan data (inconsistency
data)
Karena file-file dan program aplikasi disusun oleh programmer yang berbeda, sejumlah
informasi mungkin memiliki duplikasi dalam beberapa file. Sebagai contoh nama mata kuliah
dan sks dari mahasiswa dapat muncul pada suatu file yang memiliki record-record mahasiswa
dan juga pada suatu file yang terdiri dari record-record matakuliah. Kerangkapan data seperti
ini dapat menyebabkan pemborosan tempat penyimpanan data.Ketidakkonsistenan data
misalnya apabila terjadi perubahan jumlah sks mata kuliah, sedangkan perubahan hanya
diperbaiki pada file mata kuliah dan tidak diikuti perbaikan pada file mahasiswa. Hal ini
mengakibatkan kesalahan dalam laporan nilai mahasiswa.
2. Kesukaran dalam mengakses data
Munculnya permintaan-permintaan baru yang tidak diantisipasi sewaktu membuat program
aplikasi, sehingga tidak memungkinkan untuk pengambilan data. Misalnya pada file
mahasiswa tdak tersimpan data nilai sedangkan ada permintaan yang membutuhkan laporan
data mahasiswa beserta nilainya, hal ini menimbulkan kesulitan untuk mengakses data nilai.
3. Data terisolir (Isolation Data)
Karena data tersebar dalam berbagai file, dan file-file mungkin dalam format-format yang
berbeda, akan sulit menuliskan program aplikasi baru untuk mengambil data yang sesuai.
3
4. Masalah pengamanan (Security Problem)
Tidak semua pemakai diperbolehkan mengakses seluruh data. Bagian Mahasiswa hanya
boleh mengakses file mahasiswa. Bagian Mata kuliah hanya boleh mengakses file mata
kuliah, tidak boleh mengakses file mahasiswa.Tetapi sejak program-program aplikasi
ditambahkan secara ad-hoc maka sulit melaksanakan pengamanan seperti yang diharapkan.
5. Data Dependence
Terjadi ketergantungan pada satu program aplikasi. Apabila terjadi perubahan atau kesalahan
pada program aplikasi maka pemakai tidak dapat mengakses data.
III. Sistem Pemrosesan Database / Sistem Pengorganisasian Database Kontemporer
Databse adalah susunan record data operasional lengkap dari suatu organisasi/perusahaan
yang diorganisir dan disimpan secara terintegrasi dengan menggunakana metode tertentu
dalam komputer sehingga mampu memenuhi informasi optimal diperlukan oleh user. Sistem
database adalah sistem penyusunan database.
Gambar 2. Ilustrasi Sistem Pemrosesan Database
Tujuan database adalah :
1. Kontrol data agar tidak terjadi kerangkapan data2. Standarisasi dalam format data dan program aplikasi yang digunakan3. Meningkatkan kerja sistem
4
Konsep Dasar Basis Data
Data adalah representasi fakta dunia nyata yang mewakili suatu objek seperti manusia
(pegawai, mahasiswa, pembeli dll), barang, hewan, peristiwa, konsep, keadaan dsb yang
direkam dalam bentuk angka, huruf, symbol, teks, gambar, bunyi atau kombinasinya.
Basis Data adalah sekumpulan data yang terintegrasi yang diorganisasikan untuk memenuhi
kebutuhan para pemakai dalam suatu organisasi.
DBMS (Database Management Sytem) adalah perangkat lunak yang menangani semua pengaksesan ke basis data
Tujuan DBMS adalah : Efisiensi dan kenyamanan dalam memperoleh dan menyimpan informasi dalam database
Sistem Basis Data terdiri dari basis data dan DBMS
Konsep Database adalah integrasi logis dari record-record dalam banyak file
Tujuan utamanya meminimalkan pengulangan dan mencapai independensi data
Data redundancy
Duplikasi data, data yang sama disimpan dalam beberapa file
Data inconsistency
Duplikasi data akan mengakibatkan data menjadi tidak konsisten
Data independence
Kemampuan untuk membuat perubahan dalam struktur data tanpa membuat perubahan
pada program yang memproses data
Komponen Sistem Database
Database Application
Database Management
System (DBMS)
Database
5
1. Data
Didalam database, data :
- Disimpan secara terintegrasi (integrated), artinya database merupakan gabungan dari
berbagai macam file aplikasi yang berbeda yang disusun dengan menghilangkan
bagian-bagian yang rangkap (redundant). Sebagai alat penghubung digunakan key.
- Dipakai secara bersama-sama (shared), artinya masing-masing bagian dari suatu data
dapat digunakan atau diakses bersama-sama dalam waktu yang bersamaan oleh user
untuk aplikasi yang berbeda.
2. Perangkat keras (Hardware)
Mencakup peralatan atau peramgkat computer yang digunakan untuk pengelolaan sistem
database. Contoh : alat I/O, komunikasi data dsb
3. Perangkat lunak (Software)
Sebagai penghubung antara pemakai (user) dan database, Contoh : DBMS
4. Pemakai (User)
Dibagi menjadi 4 kategori :
a. Sytem Engineer
Tenaga ahli yang bertanggung jawab atas pemasangan Sistem database, dan juga
mengadakan peningkatan dan melaporkan kesalahan dari sistem tsb kepada pihak penjual.
b. Databse Administrator DBA)
Tenaga ahli yang mempunyai tugas untuk mengontrol sistem database secara keseluruhan,
meramalkan kebutuhan akan sistem database, merencanakannya dan mengaturnya.
c. Programmer
Membuat program aplikasi yang diperlukan oleh pemakai akhir dengan menggunakan
database dan bahasa pemrograman
d. Pemakai akhir (End-user)
Tenaga yang menggunakan atau mengakses (retrieve, create, delete, modify) database dari
terminal sesuai dengan haknya dengan menggunakan query language atau program aplikasi
yang disediakan oleh programmer.
Pemakai akhir (End-User) dapat dibagi menjadi 2 :- pengguna aplikasi : adalah orang yang mengoperasikan program
aplikasi yang dibuat oleh pemrogram aplikasi.- pengguna interaktif : adalah orang yg dpt memberikan perintah-
perintah pada antar muka basisdata, misalnya SELECT, INSERT dsbHierarki Data Dalam Database
6
1. Database, kumpulan file yg saling terkait satu sama lain
2. File, kumpulan record yg saling terkait & memiliki format field yg sama & sejenis
3. Record, kumpulan field
4. Field, atribut dari record yg menunjukkan item dari data seperti nama,alamat dsb
5. Byte, atribut dari field yg berupa huruf yg membentuk nilai dari sebuah field
6. Bit, bagian terkecil dari data scr keseluruhan, berupa karakter ASCII 0 atau 1
komponen pembentuk byte
Level Abstraksi Data
1. Level penyajian penampakan, representasi hasil pengolahan database menggunakan
SI dlm format yg mudah dipahami pemakai
2. Level konseptual, memperlihatkan file-file data yg dibuat & hubungannya satu sama
lain dlm lingkungan database
3. Level fisik, absraksi data yg memperlihatkan struktur & jenis data serta bagaimana
data tsb disimpan & diorganisasikan dlm media penyimpanan
Ilustrasi Hierarki & Abstraksi Data
Keuntungan Pemakaian Database
7
1. Terkontrolnya kerangkapan data (Mengurangi redundancy)
- Pada non database
Setiap program aplikasi mempunyai file tersendiri sehingga banyak field yang terulang
kembali pada file lain. Hal ini akan membuang ruang storage.
-Database
Hanya mencantumkan satu kali saja field yang sama yang dapat dipakai oleh semua aplikasi
yang memerlukannya.
2. Terpeliharanya keselarasan (ke-konsistenan) data
Apabila ada perubahan data pada aplikasi yang berbeda maka secara otomatis perubahan itu berlaku untuk keseluruhan
3. Data dapat dipakai secara bersama (shared)
Data dapat dipakai secara bersama-sama oleh beberapa program aplikasi (secara batch maupun on-line) pada saat bersamaan.
4. Dapat diterapkan standarisasi
Dengan adanya pengontrolan yang terpusat maka DBA dapat menerapkan standarisasi data yang disimpan sehingga memudahkan pemakaian, pengiriman maupun pertukaran data.
5. Keamanan data terjamin
DBA dapat memberikan batasan-batasan pengaksesan data, misalnya dengan memberikan password dan pemberian hak akses bagi user (mis : modify, delete, insert, retrieve)
6. Terpeliharanya integritas data
Jika kerangkapan data dapat dikontrol dan ke-konsistenan data dapat dijaga maka data menjadi akurat.
7. Terpeliharanya keseimbangan (keselarasan) antara kebutuhan data yang berbeda dalam setiap aplikasi. Struktur database diatur sedimikian rupa sehingga dapat melayani pengaksesan data dengan cepat
8. Data independence (kemandirian data)
Dapat digunakan untuk bermacam-macam program aplikasi tanpa harus merubah format data yang sudah ada.
Kerugian dari Sistem Database
8
1. Storage yang digunakan besar2. Dibutuhkan tenaga yang trampil dalam mengelola data3. Software (perangkat lunaknya) mahal4. Kerusakan pada sistem database dapat mempengaruhi departemen lain yang terkait.
Perbedaan antara file manajemen tradisional dan file manajemen database
File Manajemen Tradisional File Manajemen Database
1. Sifat : program oriented
Suatu susunan data dalam file dirancang untuk satu program aplikasi. Terjadi saling ketergantungan yang tinggi
1. Sifat : data oriented
Database dapat diubah struktur penyimpanan maupun cara pengaksesan tanpa merubah program aplikasi yang ada
2. Kaku
Apabila format fisik file berubah maka program aplikasi harus berubah juga
2. Luwes
Database dapat digunakan secara umum oleh program aplikasi apa saja tanpa memperhatikan struktur datanya.
3. Kerangkapan data
Setiap program aplikasi mempunyai file data sendiri sehingga mengakibatkan kerangkapan data antara yang satu dengan yang lain tidak selaras.
3. Terkontrolnya kerangkapan data
Dengan adanya satu sistem file dengan pengontrolan terpusat maka kerangkapan data dapat terkontrol sehingga penjamin keselarasan data.
Beberapa istilah yang digunakan pada Database
1. Enterprise
Suatu bentuk organisasi seperti : bank, universitas, rumah sakit, pabrik dsb.
Data yang disimpan dalam basis data merupakan data operasional dari suatu enterprise.
Contoh data operasional :
- Data keuangan
- Data mahasiswa
- Data pasien
2. Entitas
Suatu obyek yang dapat dibedakan dari lainnya yang dapat diwujudkan dalam basis data
Contoh entitas dalam lingkungan Bank terdiri dari : nasabah, simpanan, hipotik
Contoh entitas dalam lingkungan pabrik terdiri dari : supplier, part, shipment
Kumpulan dari entitas disebut Himpunan Entitas, contoh semua nasabah, semua supplier
3. Atribut (Elemen data)
9
Karakteristik dari entitas tsb.
Contoh entitas nasabah, atributnya terdiri dari : kode nasabah, nama nasabah, alamat nasabah
4. Nilai Data (Data Value)
Isi data/ informasi yang tercakup dalam setiap elemen data
Contoh atribut nama nasabah dapat berisi nilai data : Nina, Rika, Titin dsb.
5. Kunci elemen Data (Key Data Elemen)
Tanda pengenal yang secara unik mengidentifikasikan entitas dari suatu kumpulan entitas.
Contoh entitas nasabah yang mempunyai atribut-atribut Kode Nasabah, Nama Nasabah,
Alamat Nasabah dsb menggunakan kunci elemen data kode nasabah.
6. Record Data
Kumpulan isi elemen data (atribut) yang saling berhubungan
Contoh : kumpulan Atribut Kode Nasabah, Nama Nasabah, Alamat Nasabah berisikan
“931109”, “Nina”, “J. Sudirman 63A”
Contoh informasi dari suatu enterprise
ENTITAS ATRIBUT NILAI DATA
Pelanggan Kode PelangganNama PelangganAlamat
123HPT. Maju TerusJl. Salemba 53
Rekening Kode RekeningJenis RekeningJumlah Rekening
63H250Cek1.000.000
Penyalur Kode PenyalurNama PenyalurAlamat
3H20PT. Jaya ElektronikJL. Margonda Raya 100
Penemuan Pengetahuan Dalam Database
I.Data Ware Housing/Gudang data
• Merupakan kumpulan data dari berbagai sumber yang disimpan dalam suatu gudang
data (repository) dalam kapasitas besar dan digunakan untuk proses pengambilan
keputusan
• Perkembangan dari konsep database yang menyediakan sumber daya data yang lebih
baik
• Sangat besar, berkualitas tinggi dan mudah di ambil
10
KARAKTERISTIK DATA WAREHOUSE
1.Subject Oriented
Pada sistem operasional, data disimpan berdasarkan aplikasi. Set data hanya terdiri
dari data yang dibutuhkan oleh fungsi yang terkait dan aplikasinya. Sedangkan pada data
warehouse, data disimpan berdasarkan berdasarkan subjeknya. Misalnya untuk sebuah
perusahaan manufaktur subjek bisnis yang penting, yaitu penjualan, pengangkutan, dan
penyimpanan barang.
2. Integrated
Data yang tersimpan dalam data warehouse berasal dari sumber-sumber terpisah ke
format konsisten dan saling terintegrasi
3.Time variant
Pada data warehouse, data yang tersimpan adalah data historis dalam kurun waktu
tertentu, bukan data terkini. Oleh karena itu data yang tersimpan mengandung keterangan
waktu, misalnya tanggal, minggu, bulan, catur wulan, dan sebagainya.
Karakteristik time variant pada data warehouse memiliki karakteristik sebagai berikut :
• Melakukan analisa terhadap hal di masa lalu.
• Mencari hubungan antara informasi dengan keadaan saat ini.
• Melakukan prediksi hal yang akan datang.
4. Non-volatile.
Data tidak diupdate secara real time tapi di refresh dari sistem operasional.Secara
reguler dan kotinyu meresap data baru secara incremental disatukan dengan data sebelumnya
II.Data Mart
• Suatu bagian pada data warehouse yang medukung pembuatan laporan dan analisa
data pada satu unit,bagian atau operasi pada suatu perusahaan.
• Miniature data warehouse
• Memberikan informasi kepada segmen fungsional organisasi
III.Data Mining
• Data mining adalah serangkaian proses untuk menggali suatu basis data menjadi informasi yang lebih berharga.
• Data mining biasa juga dikenal nama lain seperti Knowledge discovery (mining) in database (KDD), ekstaksi pengetahuan (knowledge extraction), Analisa data/pola dan kecerdasan bisnis (business intelligence) dan merupakan alat yang penting untuk memanipulasi data untuk penyajian informasi sesuai kebutuhan user dengan tujuan
11
untuk membantu dalam analisis koleksi pengamatan perilaku , secara umum definisi data mining dapat diartikan sebagai berikut :
Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar Ekstraksi dari suatu informasi yang berguna atau menarik (non-trivial), implicit,
sebelumnya belum diketahui potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam jumlah besar.
Ekplorasi dari analisa secara otomatis atau semiotomatis terhadap data dalam jumlah besar untuk mencari pola atau aturan yang berarti.
Solusi yang diberikan Datamining• Menebak target pasar, megelompokkan model-model pembeli dan melakukan
klasifikasi dengan karakteristik yang diinginkan• Melihat pola beli dari waktu ke waktu, melihat pola beli pembeli dari waktu ke
waktu• Cross market analysis, melihat hubungan antara 1 produk dengan produk lainnya• Profil pelanggan, Data mining bisa membantu pengguna untuk melihat profil
pembeli sehingga dapat diketahui kelompok pembeli tertentu cenderung kepada suatu produk apa saja.
• Informasi summary, Data mining dapat membuat laporan summary yang bersifat multi dimensi dan dilengkapi dengan informasi statistik lainnya.
Konsep Data Mining
Data mining sangat perlu dilakukan terutama dalam mengelola data yang sangat besar untuk memudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi penggunanya.
Alasan utama mengapa data mining sangat menarik perhatian industri informasi dalam beberapa tahun belakangan ini adalah :
• Tersedianya data dalam jumlah yang besar
• Semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran/berjumlah besar, informasi ini yang nantinya sangat berguna untuk pengembangan, berikut langkah-langkahnya :
12
1. Data cleaning (untuk menghilangkan noise data yang tidak konsisten) Data integration (di mana sumber data yang terpecah dapat disatukan)
2. Data selection (dimana data yang relevan dengan tugas analisis dikembalikan ke dalam database)
3. Data transformation (dimana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)
4. Knowledge Discovery (proses esensial dimana metode yang intelejen digunakan untuk mengekstrak pola data)
5. Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)
6. Knowledge presentation (dimana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambangkan kepada user)