Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam...

22
Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi Sepuluh Nopember (ITS) E-mail: [email protected]

Transcript of Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam...

Page 1: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

Oleh:Ahmad Irfan

Abdul RahmanTri Budi Santoso

Titon Dutono

Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi Sepuluh Nopember (ITS)

E-mail: [email protected]

Page 2: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

1. Pendahuluan:

Aplikasi Speech Recognitionvoice dialingbanking by telephonetelephone shoppingdata base access servicesecurity control

Speech Recognition ?Merupakan salah satu dari aplikasi proses digital signal processing (pengolahan sinyal digital)

Page 3: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Penelitian …

Oleh Min Do [1] telah dikembangkan sebuah mini project Automatic Speaker Recognition System, simulaioff-line menggunakan perangkat lunak Matlab. Darren Ellis [2], sebuah rancangan speaker recognition. Disini simulasi pengkondisian lingkungandisajikan dalam bentuk munculnya noise gaussian. Maria Ulfa [3] telah berhasil membangun sebuah aplikasi sederhana pada layanan perbankan berbasis voice recognition. Paper [4] dan [5] disajikan bentuk aplikasi teknologi digital signal processing secara real time.

Page 4: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Pada paper ini ...membangun sebuah voice dial telephonemenggunakan perintah sinyal wicara. sistem yang dibangun masih pada tingkatan independet speaker

Tujuan:Secara keseluruhan tujuan penelitian ini adalah untuk membangun sebuah Modul Praktikum Speech Processing di Laboratorium Sinyal, PENS-ITS.

Page 5: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

2. Prinsip Pengenal Wicara

Perancangan sistem pengolah wicara:

1. Fase pertama adalah pada pembuatan sebuah sistem pengenal wicara adalah enrollment session (fase pembelajaran) atau yang dikenal juga sebagai training phase.

2. Sedangkan fase kedua adalah operating session atau testing phase (fase pengujian).

Page 6: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Fase Pembelajaran

SinyalSuara Sampling Frame

Blocking Windowing

DFT

Code Book

Setiap perintah yang masuk dilakukan ekstraksi ciri (feature extraction) suaranya.

Page 7: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Fase Pengujian

SinyalSuara

Sampling Frame Blocking

Windowing

DFT

Code Book

Maximum likelihood

Decision

Threshold

Perintah

Page 8: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Fase pengujian diawali dengan ekstraksi ciri suara (perintah) yang masuk. Ciri dari suara yang masuk selajutnya di cocokkan dengan yang ada pada code book. Ini juga dikenal sebagai proses feature matching (pencocokan ciri). Proses matching menggunakan algoritma maximum likelihood, yaitu ciri perintah yang masuk dicari yang paling mirip dengan ciri perintah yang ada pada code book

Page 9: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Teori Pendukung…

Proses SamplingNyquist mempersyaratan frekuensi sampling minimal dua kali frekuensi sinyal.

fs ≥ 2 x fmax

dimana:fs : frekuensi samplingfmax: frekuensi tertinggi sinyal yang disampel

Page 10: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

•Pre EmphassisSpectrum sinyal wicara akan diperhalus dengan filter pre-empahsis 1-az-1, dengan nilai a=0,95

Page 11: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

•Frame Blocking dan Windowing

Page 12: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

•Discrete Fourier Transform (DFT)Untuk mendapatkan ciri sinyal dalam domain frekuensi

10)()(1

0

0 −≤≤=∑−

=

− NkenxkXN

n

njkω

dimana:ω0 = frekuensi fundamental

= 2π/sampling rate= 2π/N

• Maximum Likelihood

Maximum likelihood atau maximum of posteriormerupakan prosedur untuk mendapatkan nilai atau parameter yang memiliki bentuk terdekat dengan cara membandingkansuatu parameter masukan dengan parameter pilihan tersedia.

Page 13: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

3. Perancangan SistemVoice Dial Telephone Sinyalsuara Microphone

Sound card

Telephone

CPU(PC)

PBX

Untuk fase pembelajaran dan pengujian

Page 14: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

•Kerja Sistem Fase Pembelajaran

•Suara dari pembicara akan ditangkap microphone

•Sinyal elektrik disampling dan dikonversi ke dalam bentuk sinyal digital oleh sound card.

•Dilanjutkan dengan Pre-emphasis, frame blocking, dan windowing untuk menghaluskan spektral sinyal.

•Setiap sinyal dicirikan oleh bentuk spektral frekuensinya dan disipan sebagai code book untuk masing-masing jenis perintah.

Page 15: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

•Kerja Sistem Fase Pembelajaran

fase pengujian proses dari sampling sampai ekstraksi ciri sama dengan yang terjadi pada fase pembelajaran. Setelah ciri sebuah sinyal uji didapatkan dilanjutkan dengan proses matching dengan ciri-ciri sinyal perintah yang tersipan dalam code book. Dengan menggunakan algorithma maximum likelihood bentuk perintah yang masuk akan dapat diterjemahkan.

Page 16: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

4. Analisa Hasil Pengujian

Page 17: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Hasil DFT Sinyal Input

DFT

0

20

40

60

80

100

0 422

844

1266

1688

2109

2531

2953

3375

3797

4219

4641

5063

5484

5906

Frekuensi (Hz)

Series1

Page 18: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Pentuan Jenis Perintah dengan Maximum Likelihood

Konsep ini dapat direalisasikan dalam bentuk persamaan dasar sederhana yang kita kenal sebagai least squares error (LSE).

Secara formal LSE dapat dibentuk dengan mencari nilai sum squares error (SSE) dari dua nilai masukan terhadap nilai standar yang digunakan untuk menguji.

Page 19: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Formulasinya:

( )∑=

−=m

kk XcXXSSE

1

2)()(

Dimana:Xk = nilai ciri kata yang masuk dalam domain frekuensic(X) = nilai ciri dari kata standar dalam code book

contoh pengujian kata ‘optik’yang masuk didapatkan hasil seperti berikut: - Optik : 0.220744- Multimedia : 1.076151- Telkom : 0.710211- Jarkom : 0.850238- Digital : 1.049321

kata “optik” , karena memiliki nilai error

terkecil yaitu 0.220744.

Page 20: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Hasil Pengujian Sistem3 pengujian,

pertama diambil sampel data dari orang pria yang sama kedua orang pria yang berbeda ketiga adalah wanita.

0

20

40

60

80

100

120

Optik Multimedia Telkom Jarkom Digital

Page 21: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

5. Kesimpulan

sistem yang telah dirancang denganmenggunakan sistem pengucap bebas inimemiliki prosentase keberhasilan yang tinggiDiharapkan untuk melakukan penelitian lanjutdengan menggunakan sistem pengucap takbebas

Page 22: Aplikasi Teknik Speech Recognition pada Voice Dial … · Untuk mendapatkan ciri sinyal dalam domain frekuensi ( ) ( ) 0 1 1 0 = ... dalam bentuk sinyal digital oleh sound card. ...

Referensi:[1] Min N. Do, “An Automatic Speaker Recognition System”,

Audio Visual Communication Laboratory, Swiss Federal Institute of Technology, Lausanne, Switzerland, 2001.

[2] Darren Ellis, “Design of a Speaker Recognition Code using Matlab”, Department of Computer and Elektrical Engineering, University of Tennesse, 2001.

[3] Maria Ulfa, Prima K, Titon Dutono, “Aplikasi Speech Recognition sebagai Fungsi Layanan pada Sistem Perbankan”, Seminar SNTE, Jogjakarta 2003.

[4] Bima Sena, Linda Indra, Titon Dutono, “Aplikasi Pengenalan Wicara untuk Perintah pada Micromouse Robot Nirkabel”, Seminar IES 2004.

[5] Anas, Wahyudin, Tri Budi, Titon Dutono, “Pengenalan Nada-Nada Tunggal pada Gitar dengan Menggunakan Teknik Pengolahan Sinyal Digital”, EEPIS Journal, Volume 10, Juli 2005.

[6] Titon Dutono, Moh Nuh, “Dasar-Dasar Pengolahan Sinyal”, EEPIS Press 2000.

[7] Rabiner, Juang, “An Introduction to Speech Recognition”, Prentice Hall, USA, 1993.