Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan...

6
1 Identifikasi suara ucap berbasis fitur non-akustik dengan menggunakan jaringan syaraf tiruan Muhammad Ambarjati (1) , Bambang L Widjiantoro (2) , Andi Rahmadiasah (3) (1)(2)(3) Jurusan Teknik Fisika Fakultas Teknologi Industri Institut Teknologi Sepuluh Nopember Surabaya [email protected], [email protected] AbstrakTelah dilakukan studi mengenai pengenalan suara ucap berbasis fitur non-akustik dengan menggunakan jaringan syaraf tiruan back propagation. Data yang digunakan berupa sinyal yang dihasilkan oleh perbedaan kapasitansi organ artikulator dibawah rahang bawah ketika berbicara tanpa suara. Data yang didapat kemudian diolah dengan menggunakan transformasi wavelet diskrit (DWT) yang menghasilkan delapan sinyal dekomposisi. Sinyal hasil dekomposisi kemudian diekstrasi fitur untuk mendapatkan input jaringan syaraf tiruan. Hasil identifikasi dengan jaringan syaraf tiruan mampu mengenali 14 kata dari 19 kata maju yang diidentifikasi atau sebesar 73,68%, dan mampu mengenali 13 kata dari 20 kata mundur yang diidentifikasi atau sebesar 65 %. KeywordsJST, Suara ucap, artikulatori, wavelet. PENDAHULUAN Komunikasi di antara manusia dengan manusia dan manusia dengan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak digunakan. Usaha untuk melakukan automasi kamunikasi diantara manusia dengan manusia dilakukan dengan alat komunikasi berdasarkan suara. Bagaimanapun, strategi komunikasi dengan suara memiliki ketidak-leluasaan dalam berkomunikasi. Ketidak-leluasaan itu seperti sangat sensitif pada ambient noise, syarat yang layak untuk pembentukan dan pengucapan kata, dan kesamaan bahasa. Keterbatasan fisik dalam menghasilkan suara juga akan menjadi kendala, seperti dilingkungan yang tidak memungkinkan misalnya didalam air ataupun lingkungan yang padat dan bising. Disamping itu komunikasi dengan suara tidak memungkinkan untuk digunakan dalam komunikasi yang bersifat privat dan memiliki kebisingan latar yang sangat keras seperti dalam situasi operasi militer atau perang yang memang sangat membutuhkan kerahasiaan informasi [1] Sistem produksi suara ucap pada manusia berawal dari udara yang dikompresi oleh paru-paru yang kemudian melewati vocal cord. Untuk menghasilkan bunyi sesuai dengan bentuk vocal cord. Setelah melewati vocal cord udara melewati vocal track hingga bagian bibir. Bagian vocal track inilah yang menentukan perbedaan suara antara manusia. Sistem produksi suara ucap semacam ini disebut sebagai sistem sistem produksi suara ucap akustik. Alternatif komunikasi yang bisa dilakukan untuk menjaga kerahaisan diantara dua orang dan tidak bergantung pada penggunaan sinyal suara adalah dengan menggunakan suara ucap yang dapat dilakukan dengan mengukur perubahan kapasitansi otot akibat pergerakan organ artikulatori . Metode pengenalan suara semacam ini memanfaatkan fitur non akustik. Berdasarkan latar Belakang yang telah dijelaskan diatas, maka pada tugas akhir ini difokuskan pada dua hal yaitu kerahasiaan dan metode alternatif komunikasi non akustik. Metode yang akan digunakan pada tugas akhir ini akan diujicoba terhadap aktivitas organ artikulatori khususnya rahang. STUDI LITERATUR A. PROSES PRODUKSI SUARA Suara adalah sebuah sinyal yang merambat melalui media perantara. Suara dapat dihantarkan dengan media air, udara, maupun benda padat. Dengan kata lain Suara adalah gelombang yang merambat dengan dengan frekuensi dan amplitudo tertentu. Suara yang dapat didengar oleh manusia berkisar antara 20 Hz sampai dengan 20 KHz, dimana Hz adalah satuan frekuensi yang artinya banyaknya getaran per detik. Perlengkapan produksi suara terdapat pada gambar 2.1 yang secara garis besar terdiri dari jalur suara (vocal track), dan jalur hidung (nasal track). Jalur suara dimulai dari pita suara (vocal cords), celah suara (glottis), dan berakhir pada bibir. Jalur hidung dimulai dari belakang langit langit (velum) dan berakhir pada cuping hidung (nostrils). Proses menghasilkan suara dimulai dari udara masuk ke paru paru melalui pernapasan, kemudian melalui trakea, udara masuk ke batang tenggorokan dimana didalam batang tenggorokan ini terdapat pita suara. Pita suara ini kemudian bergetar dengan frekuensi tertentu karena adanya aliran udara tersebut sehingga dihasilkan suara. Suara yang dihasilkan ini berbeda beda bergantung pada posisi lidah, bibir, mulut, langit- langit pada saat itu.

Transcript of Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan...

Page 1: Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak digunakan. Usaha

1

Identifikasi suara ucap berbasis fitur non-akustik dengan menggunakan

jaringan syaraf tiruan

Muhammad Ambarjati(1), Bambang L Widjiantoro(2), Andi Rahmadiasah(3)

(1)(2)(3)Jurusan Teknik Fisika – Fakultas Teknologi Industri

Institut Teknologi Sepuluh Nopember Surabaya

[email protected], [email protected]

Abstrak— Telah dilakukan studi mengenai pengenalan suara

ucap berbasis fitur non-akustik dengan menggunakan

jaringan syaraf tiruan back propagation. Data yang

digunakan berupa sinyal yang dihasilkan oleh perbedaan

kapasitansi organ artikulator dibawah rahang bawah ketika

berbicara tanpa suara. Data yang didapat kemudian diolah

dengan menggunakan transformasi wavelet diskrit (DWT)

yang menghasilkan delapan sinyal dekomposisi. Sinyal hasil

dekomposisi kemudian diekstrasi fitur untuk mendapatkan

input jaringan syaraf tiruan. Hasil identifikasi dengan

jaringan syaraf tiruan mampu mengenali 14 kata dari 19 kata

maju yang diidentifikasi atau sebesar 73,68%, dan mampu

mengenali 13 kata dari 20 kata mundur yang diidentifikasi

atau sebesar 65 %. Keywords— JST, Suara ucap, artikulatori, wavelet.

PENDAHULUAN

Komunikasi di antara manusia dengan manusia dan

manusia dengan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak

digunakan. Usaha untuk melakukan automasi kamunikasi

diantara manusia dengan manusia dilakukan dengan alat

komunikasi berdasarkan suara. Bagaimanapun, strategi

komunikasi dengan suara memiliki ketidak-leluasaan dalam

berkomunikasi. Ketidak-leluasaan itu seperti sangat sensitif

pada ambient noise, syarat yang layak untuk pembentukan dan

pengucapan kata, dan kesamaan bahasa. Keterbatasan fisik

dalam menghasilkan suara juga akan menjadi kendala, seperti

dilingkungan yang tidak memungkinkan misalnya didalam air

ataupun lingkungan yang padat dan bising. Disamping itu

komunikasi dengan suara tidak memungkinkan untuk digunakan

dalam komunikasi yang bersifat privat dan memiliki kebisingan

latar yang sangat keras seperti dalam situasi operasi militer atau

perang yang memang sangat membutuhkan kerahasiaan

informasi[1]

Sistem produksi suara ucap pada manusia berawal dari udara yang dikompresi oleh paru-paru yang kemudian melewati

vocal cord. Untuk menghasilkan bunyi sesuai dengan bentuk

vocal cord. Setelah melewati vocal cord udara melewati vocal

track hingga bagian bibir. Bagian vocal track inilah yang

menentukan perbedaan suara antara manusia. Sistem produksi

suara ucap semacam ini disebut sebagai sistem sistem produksi

suara ucap akustik.

Alternatif komunikasi yang bisa dilakukan untuk

menjaga kerahaisan diantara dua orang dan tidak bergantung

pada penggunaan sinyal suara adalah dengan menggunakan

suara ucap yang dapat dilakukan dengan mengukur perubahan

kapasitansi otot akibat pergerakan organ artikulatori . Metode

pengenalan suara semacam ini memanfaatkan fitur non akustik.

Berdasarkan latar Belakang yang telah dijelaskan

diatas, maka pada tugas akhir ini difokuskan pada dua hal yaitu kerahasiaan dan metode alternatif komunikasi non akustik.

Metode yang akan digunakan pada tugas akhir ini akan

diujicoba terhadap aktivitas organ artikulatori khususnya

rahang.

STUDI LITERATUR

A. PROSES PRODUKSI SUARA

Suara adalah sebuah sinyal yang merambat melalui media

perantara. Suara dapat dihantarkan dengan media air, udara,

maupun benda padat. Dengan kata lain Suara adalah gelombang

yang merambat dengan dengan frekuensi dan amplitudo

tertentu. Suara yang dapat didengar oleh manusia berkisar antara

20 Hz sampai dengan 20 KHz, dimana Hz adalah satuan

frekuensi yang artinya banyaknya getaran per detik.

Perlengkapan produksi suara terdapat pada gambar 2.1

yang secara garis besar terdiri dari jalur suara (vocal track), dan

jalur hidung (nasal track). Jalur suara dimulai dari pita suara

(vocal cords), celah suara (glottis), dan berakhir pada bibir. Jalur

hidung dimulai dari belakang langit – langit (velum) dan berakhir pada cuping hidung (nostrils).

Proses menghasilkan suara dimulai dari udara masuk

ke paru – paru melalui pernapasan, kemudian melalui trakea,

udara masuk ke batang tenggorokan dimana didalam batang

tenggorokan ini terdapat pita suara. Pita suara ini kemudian

bergetar dengan frekuensi tertentu karena adanya aliran udara

tersebut sehingga dihasilkan suara. Suara yang dihasilkan ini

berbeda – beda bergantung pada posisi lidah, bibir, mulut,

langit- langit pada saat itu.

Page 2: Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak digunakan. Usaha

2

Gambar 1 Organ pembentuk suara manusia

B. DISCRETE WAVELETE TR ANSFORM (DWT)

Kata wavelet berarti sebuah gelombang kecil. Kecil

merujuk kepada kondisi jika fungsi jendela merupakan panjang

terbatas (compactly supported). Gelombang merujuk pada

kondisi bahwa fungsi ini oscillatory. Sedangkan kata mother

merujuk pada fungsi dengan daerah berbeda yang digunakan

pada proses transformasi yang diturunkan dari sebuah dungsi

utama, atau mother wavelet. Dengan kata lain, mother wavelet

ialah prototipe untuk membangkitkan fungsi jendela lainnya.

Contoh mother wavelet dapat dilihat pada gambar berikut.

Gambar 2. Beberapa keluarga wavelet

Proses perhitungan koefisien-koefisien wavelet pada

setiap skala yang memungkinkan merupakan sebuah pekerjaan

yang berat dan hal ini menghasilkan data yang terlalu banyak.

Dari hal ini, dimunculkan sebuah metode untuk memilih skala

dan posisi berdasarkan powers of two yang juga disebut skala

dan posisi dyadic, maka analisis yang dihasilkan akan lebih

efisien dan akurat.

Diketahui sebuah fungsi f(n) dan definisi DWT dapat

dipenuhi dengan,

(1)

Dimana ialah wavelet diskrit sebagaimana,

(2)

Parameter a dan b didefinisikan sebagai a = 2jቧ

,b= 2-jk.

Persamaan invers dapat dituliskan sebagai,

(3)

Jika framebound persamaan A=B=1, maka transformasi ini

adalah ortogonal. Wavelet dapat dikontruksi dari analisis

multiresolusi yang akan didiskusikan selanjutnya.

WT dapat diasumsikan sebagai bagian dari FT klasik,

akan tetapi analisa yang dilakukan tidak dalam satu dimensi saja

(frekuensi atau waktu). Analisa dengan WT dilakukan dalam

basis multi dimensi. Sehingga dapat dilakukan suatu

dekomposisi pada suatu sinyal dalam beberapa tahap/level, yang

mana tiap tahap merepresentasikan suatu informasi yang

terkandung dalam suatu sinyal. Secara skematis tahapan untuk

melakukan multiresolution decomposition dapat dilihat melalui

Gambar 3

.

Gambar 3. Penerapan dekomposisi pada DWT; g[n] merupakan HPF; h[n] merupakan LPF

Proses dekomposisi dapat berulang dengan koefisien-

koefisien aproksimasi terbaru yang terus di-dekomposisi

sehingga satu sinyal dapat didekomposisi hingga banyak

komponen resolusi. Secara teori, pengulangan ini dapat diteruskan tanpa

batas. Namun dalam kenyataannya, proses dekomposisi hanya

dapat berlangsung hingga masing-masing detail mengandung sebuah sampel dari sinyal terdekomposisi saja. Pada prakteknya,

penentuan level dekomposisi dapat didasarkan pada kebutuhan

dan sifat-sifat alami sinyal.

Gambar 4. Filtering pada dekomposisi wavelet

Seluruh hasil dari WT dapat didefinisikan sebagai keluaran dari

low pass filter (LPF), h.

Page 3: Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak digunakan. Usaha

3

C. JARINGAN SYARAF TIRUAN

Seperti halnya model Jaringan Saraf Tiruan yang lain, Backpropagation melatih jaringan untuk mendapatkan

keseimbangan antara kemampuan jaringan untuk mengenali

pola yang digunakan selama pelatihan serta kemampuan

jaringan untuk memberikan respon yang benar terhadap pola

masukkan

yang serupa (tapi tidak sama) dengan pola yang dipakai

selama pelatihan.(Laurene Fausett, 1994)

Pelatihan backpropagation meliputi tiga fase. Fase

pertama adalah fase maju. Pola masukkan dihitung maju mulai

dari layer masukkan hingga layer keluaran menggunakan fungsi

aktifasi yang ditentukan. Fase kedua adalah fase mundur. Selisih

antara keluaran jaringan dengan target yang diinginkan

merupakan kesalahan yang terjadi. Kesalahan tersebut

dipropagasi mundur, dimulai dari garis yang berhubungan

langsung dengan unit – unit dilayer keluaran. Fase ketiga adalah

modifikasi bobot untuk menurunkan kesalahan yang terjadi.

Fase 1 : Propagasi maju Selama propagasi maju, sinyal masukkan

(xi)dipropagasikan ke layer tersembunyi menggunakan fungsi

aktifasi yang ditentukan. Keluaran dari setiap unit layer

tersembunyi (zj) tersebut selanjutnya dipropagasikan maju lagi

ke layer tersembunyi diatasnya menggunakan fungsi aktifasi

yang ditentukan. Demikian seterusnya hingga menghasilkan

keluaran jaringan (yk).

Berikutnya, keluaran jaringan (yk) dibandingkan dengan

terget yang harus dicapai (tk). Selisih tk-yk adalah kesalahan

yang terjadi. Jika kesalahan ini lebih kecil dari batas toleransi

yang ditentukan, maka iterasi dihentikan. Akan tetapi apabila

kesalahan masih lebih besar dari batas toleransinya, maka bobot

setiap garis dalam jaringan akan dimodifikasi untuk mengurangi

kesalahan yang terjadi.

Fase 2 : Propagasi mundur

Berdasarkan kesalahan tk-yk, dihitung faktor k (k =

1,2,...,m) yang dipakai untuk mendistribusikan kesalahan diunit

yk kesemua unit tersembunyi yang terhubung langsung dengan yk .

k juga dipakai untuk mengubah bobot garis yang

berhubungan langsung dengan unit keluaran.

Dengan cara yang sama, dihitung faktor j disetiap unit

dilayer tersembunyi sebagai dasar perubahan bobot semua garis

yang berasal dari unit tersembunyi dilayer bawahnya. Demikian

seterusnya hingga semua faktor diunit tersembunyi yang

berhubungan langsung dengan unit masukan dihitung.

Fase 3 : Perubahan bobot

Setelah semua faktor dihitung, bobot semua garis

dimodifikasi bersamaan. Perubahan bobot suatu garis

didasarkan atas faktor neuron dilayer atasnya. Sebagai

contoh, perubahan bobot garis yang menuju ke layer keluaran

didasarkan atas k yang ada di unit keluaran.

Ketiga fase tersebut diulang – ulang terus hingga kondisi penghentian dipenuhi. Umumnya kondisi penghentian

yang sering dipakai adalah jumlah iterasi atau kesalahan. Iterasi

akan dihentikan jika jumlah iterasi yang dilakukan sudah

melebihi jumlah maksimum iterasi yang ditetapkan, atau jika

kesalahan yang terjadi sudah lebih kecil dari batas toleransi

yang diijinkan. (J.J. Siang, 2005)

METODOLOGI PENELITIAN

Tahapan-tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut :

Gambar 5. Skema metodologi perancangan

A. PEMBANGKITAN DATA INPUT

Tahapan-tahapan dalam pembangkitan data input adalah sebagai berikut a. Pengambilan dan perekaman data

Data rekaman EEG yang digunakan dalam penelitian

tugas akhir ini diperoleh dari perekaman yang dilakukan di

Klinik Parahita. Data dalam tugas akhir ini dilakukan di Klinik

Parahita dengan menggunakan alat EEG. Dimana spesifikasi

EEG yang digunakan untuk pengukuran adalah sebagai berikut :

Page 4: Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak digunakan. Usaha

4

Merk : Compu Medic

Frekuensi sampling 512 Hz

32 Channel

Dalam eksperimen ini dilakukan perekaman sinyal

yang dihasilkan karena perbedaan kapasitansi aktifitas organ

artikulatori dibawah rahang bawah dari satu orang naracoba

dengan jenis kelamin laki-laki dan umur 19 tahun. Aturan dalam

melakukan perekaman adalah sebagai berikut :

Dilakukan di tempat yang sepi dan tenang.

Sensor pada elektrode EEG diletakkan didaerah

bawah rahang depan dan sebuah channel referensi

diletakkan pada daun telinga bagian bawah.

Sebelum melakukan pengambilan data, naracoba

diminta untuk menelan ludah sebanyak lima kali.

Kemudian diminta untuk tenang selama 10 detik.

Naracoba diminta untuk mengucapkan kata maju

tanpa mengeluarkan suara sebanyak sepuluh kali,

dimana untuk pengucapan antara kata maju yang satu dengan kata maju setelahnya ada jeda 0,5 detik.

Naracoba diminta untuk mengucapkan kata mundur

tanpa mengeluarkan suara sebanyak sepuluh kali,

dimana untuk pengucapan antara kata mundur yang

satu dengan kata mundur setelahnya ada jeda 0,5

detik.

Naracoba diminta mengucapkan kata maju dan

mundur secara bergantian masing – masing

sebanyak sepuluh kali.

Dengan menggunakan data video yang direkam

secara bersamaan dengan pengambilan data EEG,

didapatkan sinkronisasi event pengucapan naracoba

dengan data EEG

b. Konversi data perekaman EEG Data perekaman yang diperoleh masih berbentuk data .raw

yang belum bisa dibaca oleh matlab dan belum terpisahkan

setiap datanya. Sehingga diperlukan sebuah tahapan untuk

mengkonversi dan melakukan segmentasi data menjadi ”.mat”.

Pada awalnya data hasil rekaman dibuka dengan

menggunakan software Persys. Berikut ini tampilan dari sinyal

kata maju dalam software persys seperti pada gambar 6

dibawah.

Gambar 6. Sinyal EEG untuk pengucapan kata maju

Data hasil rekaman kemudian dengan menggunakan software

itu data dipotong berdasarkan suku kata yang diucapkan dalam perekaman yaitu kata maju dan mundur. Pemotongan

dilakukan berdasarkan panjangnya waktu perekaman untuk

perkata.Dalam waktu pemotongan sinyal digunakan data video

yang direkam secara bersamaan dengan pengambilan data

EEG untuk mendapatkan sinkronisasi event pengucapan

naracoba dengan data EEG.

Data dengan format ”.xls” inilah yang kemudian dipanggil

dengan meggunakan matlab dengan dan disimpan sesuai

dengan nama kata yang direkam oleh data tersebut, dengan

format ”.mat”.

.

Gambar 7. Sinyal EEG untuk pengucapan kata mundur

c. Normalisasi Data

Sebuah cara normalisasi yang paling umum adalah

dengan memposisikan data tepat berada ditengah rataan nolnya

dan menskalanya berdasarkan standar deviasinya[9]

. Persamaan

normalisasi dapat dituliskan :

(10)

Dengan a adalah sinyal asli dan b adalah sinyal normalisasi.

B. TAHAP PRA PROSES

Tahapan-tahapan dalam pra proses ini ada dua yaitu :

dekomposisi dengan menggunakan DWT dan ekstraksi fitur

a. Dekomposisi Wavelet

Dalam proses DWT ini sinyal hasil normalisasi kemudian

didekomposisi dengan menggunakan dekomposisi tujuh level.

Dengan dilakukan proses dekomposisi ini diharapkan akan

didapat koefisiean aproksimasi dan koefisien detail.

Kedelapan komponen tersebut yaitu koefisien detail 1

(cD1), koefisien detail 2 (cD2), koefisien detail 3 (cD3),

koefisien detail 4 (cD4), koefisien detail 5 (cD5), koefisien

detail 6 (cD6), koefisien detail 7 (cD7), dan koefisien

aproksimasi 7 (cA7).

b. Ekstraksi Fitur Ekstraksi fitur ini diterapkan pada delapan koefisien

hasil dekomposisi. Fitur yang akan diekstrak adalah mean,

standar deviasi, nilai maksimum, dan nilai minimum. Sehingga

( ( ))

( )

a mean ab

std a

Page 5: Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak digunakan. Usaha

5

dari hasil ekstraksi fitur ini didapatkan matrik yang berukuran

sama yaitu [4x8]. Dari hasil ekstraksi fitur inilah yang kemudian akan dijadikan sebagai inputan untuk jaringan syaraf tiruan.

Untuk menghitung ekstrasi fitur dapat dilakukan dengan

menggunakan persamaan dibawah ini :

C. TAHAP PROSES

a. Membangun Arsitek Jaringan Syaraf Tiruan.

Arsitektur jaringan syaraf tiruan yang digunakan dalam

tugas akhir ini adalah dengan menggunakan algoritma

pembelajaran back propagation. Arsitekturnya adalah dengan

menggunakan 4 layer, yaitu 1 layer input yang terdiri dari 4

node, 2 hidden layer yang masing – masing terdiri dari 5 dan 6

node, dan 1 layer output yang terdiri dari 1 node.

Gambar 7. Arsitektur Jaringan Syaraf Tiruan

b. Melakukan training jaringan syaraf tiruan

Setelah arsitektur jaringan syaraf tiruan terbentuk,

langkah selanjutnya adalah melakukan training pada jaringan

syaraf tiruan untuk masing-masing sinyal kata yang akan diuji

yaitu kata maju dan mundur. Dari training ini kemudian

mendapatkan bobot akhir yang akan dijadikan sebagai bobot

untuk proses identifikasi. c. Melakukan Identifikasi

Identifikasi kata maju dan mundur dilakukan dengan

menggunakan jaringan syaraf tiruan yang sama dengan jaringan

syaraf tiruan buat training dengan bobot yang digunakan adalah

bobot akhir hasil dari training.

ANALIS A DAN PEMBAHASAN

A. EKSTRAKSI FITUR

Hasil ekstraksi fitur memiliki dimensi matriks [8 x 4].

Berikut akan dipaparkan contoh proses ekstraksi fitur pada sinyal kata maju1 dan mundur5 yang masing-masing mewakili

kata maju dan kata mundur.

Tabel 1. Ekstraksi fitur koefisien dekomposisi kata maju1

Maksimum Minimum Mean Standar Deviasi

cD1 0.21021624 -0.17252384 -4.854E-05 0.0594999

cD2 0.55350518 -0.56737123 0.00225952 0.202629354

cD3 0.71954324 -0.84290012 -0.01760071 0.372108694

cD4 2.05780331 -1.22830465 0.04548863 0.744264195

cD5 2.06562379 -1.04386836 0.12796956 0.687346429

cD6 3.01217373 -3.17631837 -0.00437565 1.599509928

cD7 2.04951467 -3.03092948 0.09068084 1.489353387

cA7 11.1375246 -23.5119797 -3.54558138 9.566686954

Tabel 2. Ekstraksi fitur koefisien dekomposisi kata mundur5

Maksimum Minimum Mean Standar Deviasi

cD1 0.15515738 -0.12869807 -0.00022119 0.049385398

cD2 0.63886218 -0.45552684 0.00088456 0.199680326

cD3 0.82268469 -0.75916742 -0.004138 0.316264682

cD4 1.15197198 -1.05039305 -0.09581535 0.456839895

cD5 2.27396885 -1.31225957 0.06663922 0.729753774

cD6 2.83180426 -2.84294767 0.08650715 1.464354014

cD7 6.27951506 -5.34700339 0.19125193 3.514597507

cA7 13.4047692 -14.8319774 2.12470432 7.21841113

B. TRAINING JST

Karena bobot awal training adalah random maka saat

dilakukan training lagi (tanpa adanya perubahan konstruksi

JST) akan didapat bobot training yang berbeda, sehingga hasil

yang didapat pun akan berbeda pula. Dalam training untuk kata

maju ini ditentukan targetnya adalah matrik T=[1 1 1 1 1 1 1 0].

Dalam training untuk kata maju ini ditentukan targetnya adalah

matrik T=[0 0 0 0 0 0 0 1].

C. HASIL IDENTIFIKASI

Tabel 3 Hasil Identifikasi Kata Maju

No Input Error Keputusan

1 Maju12 0.0137 Dikenali

2 Maju13 0.0373 Dikenali

3 Maju14 0.0167 Dikenali

4 Maju15 0.0242 Dikenali

5 Maju16 0.0157 Dikenali

6 Maju17 0.3116 Tidak Dikenali

7 Maju18 0.3116 Tidak Dikenali

Page 6: Identifikasi suara ucap berbasis fitur non-akustik dengan ... · ngan mesin dapat dilakukan dengan banyak cara. Pada faktanya informasi visual dan verbal lebih banyak digunakan. Usaha

6

No Input Error Keputusan

8 Maju19 0.3505 Tidak Dikenali

9 Maju21 0.0139 Dikenali

10 Maju22 0.0108 Dikenali

11 Maju23 0.0629 Dikenali

12 Maju24 0.0546 Dikenali

13 Maju25 0.0396 Dikenali

14 Maju26 0.0470 Dikenali

15 Maju27 0.1811 Dikenali

16 Maju28 0.3372 Tidak Dikenali

17 Maju29 0.3546 Tidak Dikenali

18 Maju30 0.0137 Dikenali

19 Maju31 0.0167 Dikenali

Dari hasil identifikasi terhadap kata maju didapatkan

hasil bahwa sistem hanya mampu mengenali kata maju sebesar

14 kata dari 19 kata maju yang diidentifikasi. Presentase tingkat

keberhasilan sistem dalam mengenali kata maju sebesar 73,68%.

Sedangkan Dari hasil identifikasi terhadap kata

mundur didapatkan hasil bahwa sistem hanya mampu mengenali

kata mundur sebesar 13 kata dari 20 kata mundur yang

diidentifikasi. Presentase tingkat keberhasilan sistem dalam

mengenali kata mundur sebesar 65%. Adapun tabelnya adalah

sebagai berikut.

Tabel 4 Hasil Identifikasi Kata Mundur

No Input Error Keputusan

1 Mundur11 0.0371 Dikenali

2 Mundur12 0.0394 Dikenali

3 Mundur13 0.3652 Tidak Dikenali

4 Mundur14 0.0202 Dikenali

5 Mundur15 0.0111 Dikenali

6 Mundur16 0.2403 Tidak Dikenali

7 Mundur17 0.0651 Dikenali

8 Mundur18 0.3513 Tidak Dikenali

9 Mundur19 0.3360 Tidak Dikenali

10 Mundur20 0.0190 Dikenali

11 Mundur21 0.7000 Tidak Dikenali

12 Mundur22 0.0400 Dikenali

13 Mundur23 0.0812 Dikenali

14 Mundur24 0.0165 Dikenali

15 Mundur25 0.0165 Dikenali

16 Mundur26 0.3340 Tidak Dikenali

17 Mundur27 0.0654 Dikenali

18 Mundur28 0.0111 Dikenali

19 Mundur29 0.340 Tidak Dikenali

20 Mundur30 0.0163 Dikenali

DAFTAR PUSTAKA

1. Jorgensen, Chuck; Binstek, Kim : Web Browser Control

Using EMG Based Sub Vocal Speech Recognition

2. Gordan, Cornelia : EEG Signal Processing Using

Wavelet: Rumania : University of Oradea

3. Arman, Akhmad, : Proses Pembentukan Dan KarakteristikSinyal Ucapan. Bandung : Teknik Elektro

ITB

4. Gunawan, Adi : Mekanisme dan Mekanika Pergerakan

Otot.

5. Qureshi, Shehrzad. 2005. Embedded Image Processing

on the TMS320C6000tm DSP. California: Springer Science

and Business Media

6. Adiputra, Andrew. 2008. Identifikasi Kelainan Otak Jenis

Epilepsi melalui Sinyal Electroencephalogram (EEG)

dengan Metode Neuro Fuzzy. Surabaya: Jurusan Teknik

Fisika ITS

7. Roddlin Billah, Muhammaad. 2009. Identifikasi

Perubahan Segmen ST Sinyal keluaran ECG

Menggunakan Transformasi Wavelet . Surabaya: Jurusan

Teknik Fisika ITS

8. Novak, Daniel et.al. 2008. Denoising Electrocardiogram

Signal Using Adaptive Wavelets (extended abstract). Czech: Czech Technical University

9. Oppenheim G. et.al. 2001. Wavelet Toolbox User’s

Guide. Massachusetts: The MathWorks, Inc.

BIO DATA PENULIS: Nama : Mochamad Ambarjati

NRP : 2403100019

TTL : Ponorogo, 10 Maret 1985

Alamat : Gebang Roda Sekolah No. 6

Riwayat Pendidikan :

SDN Simo I

SLTPN 1 Slahung

SMAN 2 Ponorogo

Teknik Físika ITS