DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA...

33
DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA DATA SATELIT MEGGUNAKAN ALGORITMA REGRESI BAYES BERBASIS BIG DATA BAYU SETYATMOKO 2213206712 DOSEN.PEMBIMBING MOCHAMAD HARIADI,ST., M.Sc., Ph.D Dr. I KETUT EDDY PURNAMA, ST., MT PROGRAM MAGISTER BIDANG KEAHLIAN TELEMATIKA JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNOLOGI INDUSTRI INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2014

Transcript of DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA...

Page 1: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA DATA SATELIT MEGGUNAKAN ALGORITMA REGRESI BAYES BERBASIS BIG DATA BAYU SETYATMOKO 2213206712

DOSEN.PEMBIMBING MOCHAMAD HARIADI,ST., M.Sc., Ph.D Dr. I KETUT EDDY PURNAMA, ST., MT

PROGRAM MAGISTER BIDANG KEAHLIAN TELEMATIKA JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNOLOGI INDUSTRI INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2014

Page 2: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

ii

Page 3: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

LEMBAR PENGESAHANPROPOSAL TESIS

Judul : PREDIKSI CUACA PADA DATA SATELIT MENGGUNAKANALGORITMA REGRESI BAYES BERBASIS BIGDATA

Oleh : Bayu SetyatmokoNRP : 2213206712

Telah diseminarkan pada:

Hari : JumatTanggal : 27 Juni 2014Tempat : B.201

Mengetahui/menyetujui:

Dosen Penguji:

1. Dr. Surya Sumpeno, ST., M.ScNIP: 196906131997021003

2. Dr. Supeno Mardi S.N., ST., MT.NIP: 197003131995121001

Calon Dosen Pembimbing:

1. Mochamad Hariadi, ST., M.Sc., Ph.DNIP: 196912091997031002

2. Dr. I Ketut Eddy Purnama, ST., MT.NIP: 196907301995121001

iii

Page 4: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

iv

Page 5: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

PREDIKSI CUACA PADA DATA SATELIT MENGGUNAKANALGORITMA REGRESI BAYES BERBASIS BIGDATA

Nama Mahasiswa : Bayu SetyatmokoNRP : 2213206712Pembimbing I : Mochamad Hariadi, ST., M.Sc., Ph.DPembimbing II : Dr. I Ketut Eddy Purnama, ST., MT.

ABSTRAK

Indonesia adalah salah satu negara di dunia yang paling rentan terhadapbencana alam. Kondisi ini harus diimbangi dengan upaya ”mitigasi bencana”. Salahsatu upaya yang harus dilakukan adalah pemanfaatan teknologi terkini seperti da-ta citra dari ”satelit remote sensing dan data spasial sebagai upaya pencegahan danpenanganan bencana alam. Beberapa aspek penting sebagai upaya pencegahan ben-cana alam adalah peningkatan kualitas metode peringatan dini dan sprediksi yangakurat sebelum bencana alam terjadi. Selain berguna dalam pencegahan bencana,prediksi cuaca yang akurat dan cepat juga sangat bermanfaat bagi nelayan, petanidan seorang pilot.

Permasalahan utama pengolahan data satelit adalah butuh waktu lama un-tuk mengolah unstructure data (variety), terlebih lagi jika ukuran datanya besar(volume). Ukuran data satelit yang bertambah besar dengan cepat adalah akibat pe-riode akusisi data yang sering bahkan hingga tiap 15 menit sekali (velocity). Sehing-ga pendekatan memindahkan data ke sebuah server datawarehouse untuk menganal-isa data sudah tidak dapat dilakukan lagi. Sebab kapasitas storage dan bandwidthjaringan yang terbatas sudah tidak sanggup lagi untuk menampung data tersebut.

Maka diperlukan sebuah pendekatan baru, bukan lagi data yang datang kelokasi server komputasi tapi justru proses komputasi yang mendatangi lokasi data.Pendekatan inilah yang digunakan oleh framework komputasi Bigdata, yang salahsatu contohnya adalah hadoop. Jadi saat proses prediksi cuaca menggunakan algo-ritma regresi bayes di jalankan diatas platform hadoop, diharapkan proses prediksicuaca dapat berjalan dengan cepat dan menghasilkan prediksi cuaca yang akurat.

Kata kunci: prakiraan cuaca, remote sensing, bigdata, regresi bayes.

v

Page 6: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

vi

Page 7: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

WEATHER PREDICTION ON SATELLITE DATA USINGBAYESIAN REGRESSION ALGORITHM BASED ON BIGDATA

Name : Bayu SetyatmokoNRP : 2213206712Supervisor : Mochamad Hariadi, ST., M.Sc., Ph.D

ABSTRACT

Indonesia is one of the world most vulnerable countries to natural disasters.This condition must be balanced with efforts ”disaster mitigation”. One effort thatmust be done is to use the latest technology such as image data from the ” remotesensing satellite” and ”spatial data” as the prevention and management of naturaldisasters. Some important aspects as disaster prevention method is to increase thequality of early warning and prediction methods are accurate before a natural disas-ter occurs. In addition to be useful in the prevention of disasters, weather predictionsare accurate and fast is also very useful for fishermen, farmers and a pilot.

The main problem is the satellite data processing takes a long time to pro-cess the unstructure data (variety), especially if large data size (volume). Satellitedata size grew quickly is due to the data acquisition period is often even up to every15 minutes once (velocity). So the approach to move data to a datawarehouse serverto analyze the data is not possible anymore. Because the capacity of the ”storage”and network limited ”bandwidth” are no longer able to accommodate the data.

It would require a new approach, not to mention the data that comes to thelocation of the server but instead the computational process went to the location ofdata. This is the approach used by computational framework Bigdata, which oneexample is hadoop. So when the weather predictions using Bayes regression al-gorithms run on hadoop platform, expected weather prediction process can be runquickly and produce accurate weather predictions.

Keywords: weather forecast, remote sensing, bigdata, bayesian regression

vii

Page 8: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

viii

Page 9: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Daftar Isi

Lembar Pengesahan iii

Abstrak v

Daftar Isi ix

Daftar Gambar xi

Daftar Tabel xiii

1 PENDAHULUAN 11.1 Latar Belakang . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Rumusan Permasalahan . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.4 Tujuan Dan Manfaat Penelitian . . . . . . . . . . . . . . . . . . . . 3

1.4.1 Tujuan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4.2 Manfaat . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.5 Hipotesa Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . 31.6 Metodologi Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . 31.7 Sistematika Penulisan . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 KAJIAN PUSTAKA 72.1 Konsep Remote Sensing (Penginderaan Jarak Jauh) . . . . . . . . . 72.2 Konsep Algoritma Regresi Bayes . . . . . . . . . . . . . . . . . . . 82.3 Konsep Framework Bigdata (Hadoop dan Mapreduce) . . . . . . . 10

3 METODE PENELITIAN 153.1 Tahapan Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2 Metode Akusisi Dataset dan Preprocessing Dataset . . . . . . . . . 153.3 Metode Validasi Data Prediksi Cuaca . . . . . . . . . . . . . . . . . 163.4 Jadwal Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Daftar Pustaka 19

ix

Page 10: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

x

Page 11: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Daftar Gambar

2.1 Prinsip Kerja Satelit Remote Sensing . . . . . . . . . . . . . . . . . 72.2 Spektrun Frekuensi Gelombang Elektromagnetik . . . . . . . . . . 82.3 Data Gambar Satelit Remote Sensing . . . . . . . . . . . . . . . . . 82.4 Karakteristik Big Data . . . . . . . . . . . . . . . . . . . . . . . . 112.5 Framework Komputasi Hadoop . . . . . . . . . . . . . . . . . . . . 122.6 Arsitektur Hadoop Distributed File System (HDFS) . . . . . . . . . 132.7 Alur Proses Mapreduce . . . . . . . . . . . . . . . . . . . . . . . . 13

3.1 Data Satelit GOES (IR4) Badai Wilma (2005) . . . . . . . . . . . . 16

xi

Page 12: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

xii

Page 13: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Daftar Tabel

3.1 Jadwal Kegiatan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

xiii

Page 14: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

xiv

Page 15: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Kondisi negara Indonesia yang berpotensi mengalami bencana alam harusdiikuti dengan kesiapan sumber daya manusia dalam melakukan upaya mitigasibencana. Mitigasi bencana adalah serangkaian upaya untuk mengurangi resikobencana, baik melalui pembangunan fisik maupun penyadaran dan peningkatan ke-mampuan menghadapi ancaman bencana (Undang-undang No 24 Tahun 2007 danPP No 21 Tahun 2008).

Dalam rangka melakukan upaya mitigasi bencana pemerintah Indonesiabanyak mengeluarkan regulasi dan mendirikan lembaga yang menjalan regulasitersebut. Salah satu regulasi tersebut adalah Undang-Undang No 21 Tahun 2013Tentang Keantariksaan yang menyatakan bahwa LAPAN (Lembaga Penerbangandan Antariksa) berkewajiban menyediakan data pengideraan jarak jauh dengan tutu-pan awan minimal dan bebas awan setiap tahunnya untuk seluruh wilayah indonesiakedalam Sistim Jaringan Data Spasial Nasional (pasal 20), dan berkewajiban pulamengupayakan terjadinya alih teknologi keantariksaan (pasal 25).

Sedangkan institusi yang diberi tugas untuk mengelola informasi geospasialdan mengelola Jaringan Data Spatial Nasional (JDSN) adalah Badan InformasiGeospasial (BIG) sebagai pengganti Badan Koordinasi Survei dan Pemetaan Na-sional (Bakorsurtanal). Bahkan dalam Perpres No.85 Tahun 2007 yang diperkuatoleh Undang-Undang No.4 Tahun 2011 mewajibkan Pemerintah Daerah memban-gun JDSN dan menggunakan informasi geospasial yang akurat dalam pengambilankeputusan. Yang tidak kalah pentingnya adalah lembaga khusus yang ditugaskanmengelola bidang meteorologi, klimatologi, kualitas udara dan geofisika yang dike-nal dengan nama Badan Meteorologi Klimatologi dan Geofisika (BMKG).

Sayangnya belum banyak instansi pemerintah daerah yang tertarik me-manfaatkan informasi yang telah dhasilkan oleh lembaga seperti LAPAN, BIG danBMKG. Kurangnya antusias dari pemerintah daerah bisa jadi dikarenakan kurangnyasosialisasi dan proses alih teknologi ke pemerintah daerah. Sebagai contoh adalahrendahnya pemanfaatan data satelit remote sensing, padahal tidak sedikit biaya yangdikeluarkan pemerintah untuk mengakusisi data satelit remote sensing. Beberapadata satelit yang sudah berhasil diakusisi datanya oleh pemerintah Indonesia adalahdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain.

Salah satu pemanfaatan data satelit diantaranya adalah pada prediksi cuaca

1

Page 16: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

(kondisi alam setiap harinya) dan pemodelan iklim (kondisi alam dalam periodetertentu). Prediksi cuaca yang akurat dan cepat sangat bermanfaat bagi institusipemerintah dalam mitigasi bencana, bermanfaat bagi petani untuk menentukan polatanam pertanian dan bermanfaat bagi nelayan untuk menentukan saat yang tepatuntuk berlayar mencari ikan.

Namun untuk mengimplementasikan prediksi cuaca yang akurat dan cepatdibutuhkan sarana berupa Super Computer untuk melakukan proses High Perfor-mance Computing (HPC) dengan harga yang mahal dan tidak terjangkau oleh anggaranpemerintah daerah. Salah satu alternatif solusi yang dapat digunakan adalah meng-gunakan Framework Distributed Computing berbasis Bigdata yang hanya membu-tuhkan komputer standar (commodity hardware).

Permasalahan lainnya adalah lamanya waktu yang dibutuhkan untuk men-golah data citra satelit (variety), terlebih lagi jika ukuran datanya besar (volume).Ukuran data satelit yang bertambah besar dengan cepat adalah akibat periode aku-sisi data yang sering bahkan hingga tiap 15 menit sekali (velocity). Sehingga pen-dekatan memindahkan data ke server datawarehouse untuk menganalisa data sudahtidak dapat dilakukan lagi. Sebab kapasitas storage dan bandwidth jaringan yangterbatas sudah tidak sanggup lagi untuk menampung data tersebut.

Maka diperlukan sebuah pendekatan baru, bukan lagi data yang datang kelokasi server komputasi tapi justru proses komputasi yang mendatangi lokasi data.Pendekatan inilah yang digunakan oleh framework komputasi Bigdata, yang salahsatu contohnya adalah hadoop. Jadi saat proses prediksi cuaca menggunakan algo-ritma regresi bayes di jalankan diatas platform hadoop, diharapkan proses prediksicuaca dapat berjalan dengan cepat dan menghasilkan prediksi cuaca yang akurat.

1.2 Rumusan Permasalahan

Prediksi cuaca yang akurat pada data satelit (unstructure data) dengan uku-ran data besar membutuhkan waktu pemrosesan data yang lama serta membutuhkaninfrastruktur komputer dengan harga yang mahal.

1.3 Batasan Masalah

1. Data satelit yang digunakan dalam penelitian adalah data yang berasal darisatelit cuaca (misal AVHRR, GOES, MTSAT, MODIS, dll).

2. Algoritma yang dipergunakan untuk memprediksi cuaca adalah algoritma re-gresi bayes dengan menggunakan dua parameter yang diteliti yaitu suhu, ko-

2

Page 17: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

ordinat lokasi di bumi dan waktu.3. Framework komputasi Bigdata yang dipergunakan adalah Apache Hadoop

Stack, yang meliputi HDFS (Hadoop File System), Mapreduce, Mahout, Pig,Hue, Hive, HBase, HCatalog, Oozie, Sqoop, Zookepper, Flume, Storm, Spark,dsb.

4. Lokasi yang dijadikan obyek penelitian prediksi cuaca adalah kota surabaya.

1.4 Tujuan Dan Manfaat Penelitian

1.4.1 Tujuan

Penelitian ini bertujuan untuk menghasilkan prediksi cuaca yang akuratdengan waktu pemrosesan data satelit yang relatif cepat dan menggunakan infra-struktur komputer standar (commodity hardware).

1.4.2 Manfaat

Hasil penelitian ini bermanfaat bagi Badan Meteorologi Klimatologi danGeofisika (BMKG) untuk meningkatkan kemampuan pelayanan informasi prediksicuaca yang cepat dan akurat pada jaringan Automatic Weather Station (AWS).

1.5 Hipotesa Penelitian

Data satelit remote sensing dengan ukuran file 20MB hingga 2GB denganperiode akusisi data 15 menit (ukuran dataset 1 hari sekitar 100GB, ukuran dataset 1bulan sekitar 3TB, maka ukuran dataset 3 tahun sekitar 100TB) akan menghasilkandata yang berukuran sangat besar. Sehingga proses analisa data satelit membu-tuhkan waktu yang cukup lama. Diharapkan prediksi cuaca dengan algoritma re-gresi bayes berbasiskan bigdata dapat mempercepat proses analisa data satelit danmenghasilkan prediksi cuaca yang akurat.

1.6 Metodologi Penelitian

Pada penelitian ini digunakan metode sebagai berikut :

1. Akusisi data satelit cuaca GOES (Geostationary Operational EnvironmentalSatellites) menggunakan dataset milik NASA yang dapat diakses secara bebasdi http://www.ghcc.msfc.nasa.gov/GOES/.

3

Page 18: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

2. Preprocessing dataset GOES (pada channel / band 4 yang berisi data ther-mal infrared) menggunakan aplikasi opensource ENVI atau Quantum-GIS(dengan metode Physical Split Window) untuk mendapatkan Land SurfaceTemperature (LST).

3. Hasil preprocessing dataset GOES yang berupa data suhu dan koordinat lokasidibumi akan dipindahkan kedalam HDFS (Hadoop Distribution File System).

4. Proses prediksi suhu pada hari yang akan datang berdasarkan data suhu padahari-hari yang lalu menggunakan algoritma regresi bayes berbasiskan bigda-ta.

5. Visualisasi hasil prediksi suhu saat ini secara geospatial di permukaan bumidan berubah secara dinamis saat ada pediksi suhu yang baru selesai diproses.

6. Proses analisa dan validasi hasil prediksi cuaca dengan dengan cara dibandikandengan data real yang dimiliki oleh BMKG kota surabaya.

7. Mengambil kesimpulan berdasarkan hasil penelitian yang diperoleh.

1.7 Sistematika Penulisan

Dalam penelitian ini digunakan sistem pembahasan sebagai berikut:

• Bab I Pendahuluan

Berisi latar belakang, perumusaan masalah, batasan masalah, tujuan dan man-faat penelitian, hipotesa penelitian, metoda penelitian dan sistematika penulisan.

• Bab II Kajian Pustaka Dan Dasar Teori

Berisi kajian pustaka mengenai konsep remote sensing, konsep algoritma re-gresi bayes, Konsep Framework Bigdata (Hadoop dan Mapreduce).

• Bab III Metodologi Penelitian

Menguraikan metode penelitian yang digunakan mulai dari tahapan akusisidata satelit cuaca GOES milik NASA, preprocessing data satelit, memindahkanhasil preprocessing data satelit Ke HDFS, proses prediksi cuaca menggu-nakan algoritma regresi bayes berbasis bigdata, visualisasi hasil prediksi cua-ca, hingga analisa dan validasi hasil prediksi cuaca dengan cara memband-ingkan hasil prediksi cuaca dengan data real yang dimiliki oleh BMKG kotasurabaya.

4

Page 19: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

• Bab IV Hasil Penelitian Dan Pembahasan

Menguraikan hasil penelitian yang dilakukan beserta pembahasannya.

• Bab V Kesimpulan Dan Saran

Berisi kesimpulan yang didapatkan dari hasil penelitian dan saran untuk pengem-bangan penelitian.

5

Page 20: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

6

Page 21: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

BAB 2KAJIAN PUSTAKA

2.1 Konsep Remote Sensing (Penginderaan Jarak Jauh)

Definisi remote sensing adalah aktifitas merekam atau mengamati (sens-ing) sebuah obyek atau kejadian dari kejauhan (remote). Dalam bahasa Indonesiakemudian diterjemahkan menjadi penginderaan jarak jauh (inderaja). Prinsip ker-ja satelit remote sensing adalah sama dengan prinsip mata manusia saat mengenalisebuah obyek.

Pada satelit remote sensing menggunakan radiasi elektromagnetik sebagaipembawa informasi. Output dari satelit remote sensing biasanya adakah berupasebuah data gambar dari obyek yang diamati. Namun data gambar ini tidak dapatlangsung dipergunakan karena harus diolah lebih dahulu untuk dapat menghasilkaninformasi yang dibutuhkan. Prinsip kerja satelit remote sensing dapat digambarkansebagai berikut :

Gambar 2.1 Prinsip Kerja Satelit Remote Sensing

Data yang disimpan oleh satelit remote sensing adalah data gelombangelektromagnetik yang dipantulkan kembali oleh obyek yang diamati. Karena spek-trum dari frekuensi gelombang elektromagnetik tidak semuanya bisa dilihat olehindera penglihatan manusia, maka data gambar perlu diolah lebih dahulu menjadisebuah informasi yang dapat dimengerti oleh manusia.

7

Page 22: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Adapun spektrum gelombang elektromagnetik dapat digambarkan sebagaiberikut:

Gambar 2.2 Spektrun Frekuensi Gelombang Elektromagnetik

Sedangkan bentuk data gambar dari hasil penginderaan satelit remote sens-ing juga memiliki spektrum frekuensi yang dapat dilihat sebagai berikut :

Gambar 2.3 Data Gambar Satelit Remote Sensing

Jadi agar data gambar dari satelit remote sensing dapat menghasilkan infor-masi seperti suhu, tekanan udara, tutupan awan, maka harus dilakukan proses peng-gabungan layer-layer gambar satelit tadi menjadi satu kesatuan. Biasanya prosesimage processing akan memakan waktu yang lama, sebab akan ada beberapa pros-es koreksi data gambar sesuai dengan kualitas data satelit.

2.2 Konsep Algoritma Regresi Bayes

Analisis regresi adalah analisis statistika yang bertujuan memodelkan hubun-gan antara variabel prediktan (respon) dengan variabel penjelas. Secara umum mod-

8

Page 23: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

el yang menggambarkan hubungan antara variabel penjelas (X) dengan variabel re-spons (Y) adalah sebagai berikut :

Dalam bentuk matrix model regresi dapat dinyatakan sebagai berikut :

Kriteria yang digunakan untuk menentukan kebaikan model regresi adalahRMSE dan R2. Nilai RMSE menunjukkan keakuratan suatu model, sehingga modelyang baik adalah model dengan nilai RMSE kecil. Nilai RMSE dari suatu modeldiperoleh dari persamaan berikut :

Sedangkan R2 menunjukkan proporsi keragaman. Semakin besar nilai R2suatu model, maka model tersebut semakin baik. Nilai R2 dapat dihitung dari :

Regresi bayes sebanarnya dikembangkan dari teorema bayes. Teoremabayes sering digunakan sebagai dasar penaksiran parameter suatu model. Dalamteorema bayes, besaran dapat disajikan sebagai berikut :

Dengan P() adalah distribusi prior, ”L(x—)” adalah likehood dari sam-pel, dan P(—x) adalah distribusi posterior dari . Pembaharuan informasi prior pa-da parameter menggunakan informasi sampel yang terdapat dalam data (melaluifungsi likehood), sehingga diperoleh informasi posterior yang akan digunakan un-tuk pengambilan keputusan.

9

Page 24: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Pendekatan bayes dalam regresi dilakukan dengan membentuk sebaranposterior dari parameter. Posterior ini merupakan hasil kali prior dengan fungsikemungkinan yang dapat disajikan sebagai berikut :

Dengan demikian fungsi priornya adalah :

Sedangkan fungsi kemungkinan dari fungsi regresi normal ganda adalahsebagai berikut :

2.3 Konsep Framework Bigdata (Hadoop dan Mapreduce)

Bigdata adalah sebuah istilah yang mewakili kondisi suatu dataset yangbegitu besar dan kompleks sehingga menjadi sulit untuk melakukan proses anal-isa terhadap data jika dilakukan dengan pendekatan proses analisa datawarehousetradisional yang ada saat ini. Ada 3 karakteristik yang ada di Bigdata yaitu :

1. Volume : Ukuran data yang besar, saat ini satuan terkecil dari sebuah Bigdatasudah mencapai satuan Tera.

2. Variety : Jenis data yang bervariasi mulai data terstruktur (data di dalam se-buah database), data semi terstruktur (misal data excel, xml, dsb), dan datatidak terstruktur (misal data gambar, data video, dsb).

3. Velocity : Perubahan ukuran data yang begitu cepat, sudah tidak secara linierlagi bahkan sudah secara eksponensial.

10

Page 25: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Karateristik sebuah Bigdata dapat digambarkan sebagai berikut :

Gambar 2.4 Karakteristik Big Data

Kondisi ledakan data yang terjadi saat ini adalah adanya fenomena di-mana penyumbang data terbesar adalah berasal dari user bukan dari vendor penye-dia layanannya. Sebagai contohnya adalah fenomena media sosial yang menjamurdi internet saat ini, seperti facebook, twitter, dsb. Maka pendekatan untuk me-mindahkan data yang begitu besar ke server datawarehouse (untuk dianalisa) sudahtidak bisa dilakukan lagi, karena adanya keterbatasan kapasitas storage dan band-width jaringan komputer. Jadi diperlukan pendekatan baru yaitu menjalakan proseskomputasi di lokasi server tempat data disimpan. Maka munculah beberapa frame-work komputasi Bigdata, yang paling banyak digunakan saat ini adalah frameworkkomputasi Apache Hadoop.

Apache hadoop adalah sebuah opensource framework untuk menyimpandan memproses dataset berukuran besar pada komputer biasa (commodity hard-ware) atau pada sebuah computer cluster yang besar (sebuah cluster terbesar milikgoogle saat ini sudah memiliki sekitar 4000 komputer). Jadi Apache Hadoop memi-liki beberapa keunggulan dalam hal scalability, distributed, data intensive comput-ing dan fault tolerant.

Apache Hadoop memiliki beberapa modul dasar sebagai berikut :

1. Hadoop Common : yang berisi library dan utiliy yang dibutuhkan oleh hadoop.2. Hadoop Distributed File System (HDFS) : sebuah distributed file system tem-

pat penyimpanan data pada sebuah komputer biasa yang bertanggung jawabuntuk mendistribusikan data dan hasil komputasi keseluruh komputer yangada dalam satu cluster.

11

Page 26: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

3. Hadoop YARN : sebuah resource management yang bertanggung jawab men-gelola komputer yang akan menjalankan proses komputasi.

4. Hadoop Mapreduce : sebuah model pemrograman pada pemrosesan databerukuran besar yang lokasi datanya menyebar.

Sedangkan framework hadoop dapat digambarkan seperti gambar berikut:

Gambar 2.5 Framework Komputasi Hadoop

Hadoop mapreduce adalah sebuah model pemrograman yang dikhususkanuntuk menangani pemrosesan dataset besar secara paralel dan juga dikhususkan un-tuk menangani algoritma pada data yang terdistribusi dalam sebuah cluster. Mapre-duce memiliki 5 langkah dasar dalam memproses data :

1. Menyiapkan data map() input : pada tahap ini disiapkan sebuah map proces-sor yang berisi data input yang diasosiasikan dengan sebuah K1 key value.

2. Menjalanka user map() code : pada tahap ini menjalankan code map() yangdibuat user pada tiap K1 key value, dan masing-masing akan menghasilkanK2 key value.

3. Melakukan shuffle data map ouput untuk diberikan pad reduce processor : pa-da tahap ini disiapkan sebuah reduce processoryang telah diasosiasikan den-gan K2 key value.

4. Menjalankan user reduce() code : pada tahap ini dijalankan program reduce()yang dibuat user pada tiap K2 key value hasil proses map pada tahap sebelum-nya.

5. Menghasilkan final output : pada tahap ini system mengumpulkan semuahasil dari proses reduce dan diurutkan berdasarkan K2 key value.

Karena tahapan mapreduce bersifat berurutan, maka tahap berikutnya baruakan dijalankan jika tahap sebelumnya telah diselesaikan seluruhnya. Kadang data

12

Page 27: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

input sudah terdistribusi di dalam satu cluster (shard) maka hal ini akan meringankanproses map karena tinggal melakukan proses asosiasi datanya saja. Arsitektur se-buah Hadoop Distributed File System (HDFS) dapat digambarkan sebagai berikut:

Gambar 2.6 Arsitektur Hadoop Distributed File System (HDFS)

Sedangkan alur proses mapreduce dapat digambarkan sebagai berikut :

Gambar 2.7 Alur Proses Mapreduce

13

Page 28: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

14

Page 29: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

BAB 3METODE PENELITIAN

3.1 Tahapan Penelitian

Secara umum tahapan penelitian yang dilakukan adalah sbb:

1. Akusisi data satelit cuaca GOES (Geostationary Operational EnvironmentalSatellites) menggunakan dataset milik NASA yang dapat diakses secara bebasdi http://www.ghcc.msfc.nasa.gov/GOES/.

2. Preprocessing dataset GOES (pada channel / band 4 yang berisi data ther-mal infrared) menggunakan aplikasi opensource ENVI atau Quantum-GIS(dengan metode Physical Split Window) untuk mendapatkan Land SurfaceTemperature (LST).

3. Hasil preprocessing dataset GOES yang berupa data suhu dan koordinat lokasidibumi akan dipindahkan kedalam HDFS (Hadoop Distribution File System).

4. Proses prediksi suhu pada hari yang akan datang berdasarkan data suhu padahari-hari yang lalu menggunakan algoritma regresi bayes berbasiskan bigda-ta.

5. Visualisasi hasil prediksi suhu saat ini secara geospatial di permukaan bumidan berubah secara dinamis saat ada pediksi suhu yang baru selesai diproses.

6. Proses analisa dan validasi hasil prediksi cuaca dengan dengan cara dibandikandengan data real yang dimiliki oleh BMKG kota surabaya.

7. Mengambil kesimpulan berdasarkan hasil penelitian yang diperoleh.

3.2 Metode Akusisi Dataset dan Preprocessing Dataset

Akusisi data satelit GOES milik NASA dapat dilakukan dengan cara men-download dataset tersebut di http://www.ghcc.msfc.nasa.gov/GOES/ atau dapat ju-ga membuat permintaan resmi kepada NASA melalu email. Data satelit GOESmemiliki beberapa channel / band sebagai berikut :

1. Channel 1 (VIS) : ”Visible” Imagery.2. Channel 2 (IR2) : Short wave or Mid Infrared.3. Channel 3 (WV) : Water Vapor, GOES - 10 (West)4. Channel 3 (IR3) : Split-Window Infrared, GOES - 12 (East).5. Channel 4 (IR4) : Long wave or Thermal Infrared.6. Channel 5 (IR5) : Split-Window Infrared, GOES - 10 (West).7. Channel 5 (IR5) : Water Vapor, GOES - 12 (East).

15

Page 30: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Sedangkan bentuk file format data satelit GOES bisa bermacam-macam,diataranya adalah file format JPEG, GIF, HDF, dan McIDAS AREAS. File tadidapat dibaca dan diolah menggunakan software ENVI atau Quantum-GIS untukmendapatkan informasi yang diinginkan.

Khusus untuk data Land Surface temperature dapat diperoleh dengan meng-gunakan data satelit GOES channel 4 (IR4 atau data termal infrared) yang kemudiandiolah menggunakan metode Physical Split Window (PSW) dengan bantuan soft-ware ENVI atau Quantum-GIS. Adapun citra satelit GOES channel 4 (IR) adalahsebagai berikut :

Gambar 3.1 Data Satelit GOES (IR4) Badai Wilma (2005)

3.3 Metode Validasi Data Prediksi Cuaca

Validasi data prediksi cuaca dilakukan secara kuantitatif dengan metodestatistik yaitu dengan cara menghitung nilai korelasi dan RSME (Root Mean SquareError) sebagai berikut :

Dengan F = forecast (nilai prediksi) dan O = observation (nilai penga-matan), hasil prediksi disebut baik jika memiliki nilai korelasi yang tinggi dan nilaiRMSE yang rendah.

16

Page 31: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

3.4 Jadwal Penelitian

Tabel 3.1 Jadwal Kegiatan

KegiatanJuli Agustus September Oktober

2014 2014 2014 2014

Studi Literatur

Pengunpulan dan PengolahanData

Analisa Data

Implementasi

Analisa Hasil Pengujian

Penulisan Laporan

17

Page 32: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

[Halaman ini sengaja dikosongkan.]

18

Page 33: DRAFT PROPOSAL TESIS PREDIKSI CUACA PADA …bayu.jvnix.com/files/s2cioits/proposal_tesis_bayu_2014.pdfdata satelit NOAA19, Landsat8, SPOT5, dan lain-lain. Salah satu pemanfaatan data

Daftar Pustaka

[1] Chand, Savin S. and Walsh, Kevin J.E., 2010, , A Bayesian Regression Approach

to Seasonal Prediction of Tropical Cyclones Affecting the Fiji Region, American

Meteorological Society, Journal Of Climate, Volume 23, 2010.,

[2] McFadden, Jonathan. and Miranowski, John., 2014Climate Change and US Corn

Yields: A Dynamic Bayesian Approach, Department of Economics, Iowa State

University,

[3] Kurniawan , Roni. dan Permana, Donaldi Sukma,2009 Pemanfaatan dan Validasi

Conformal-Cubic Atmospheric Model (CCAM) untuk prakiraan cuaca di Jakarta,

Pusat Penelitian dan Pengembangan Badan Meteorologi Klimatologi dan Geofisi-

ka (BMKG), Jurnal Meteorologi dan Geofisika Volume. 10 Nomor 2

[4] Morgan , Hilary A.,2012, , Lava Discharge Rate Estimates From Thermal Infrared

Satellite Data At Pacaya Volcano Guatemala, Geology Department, Michigan

Technological University, .

19