崑山科技大學 -...

63
崑山科技大學 資訊工程系 專題製作報告 英文拼字自我檢測系統 SELF-TESTING SYSTEM IN ENGLISH SPELLING 生:4960E069 陳毅書 生:4960E007 李昭翰 生:4960E059 蔡秉軒 指導老師:黃志賢 博士 中華民國1006

Transcript of 崑山科技大學 -...

Page 1: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

崑 山 科 技 大 學

資訊工程系

專題製作報告

英文拼字自我檢測系統

SELF-TESTING SYSTEM IN ENGLISH

SPELLING

學 生:4960E069 陳毅書

學 生:4960E007 李昭翰

學 生:4960E059 蔡秉軒

指導老師:黃志賢 博士

中華民國100年6月

Page 2: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

2

英文拼字自我檢測系統

SELF-TESTING SYSTEM IN ENGLISH

SPELLING

學 生:陳毅書 Student: Chen Yi-Shu

學 生:李昭翰 Student: Li Chao-Han

學 生:蔡秉軒 Student:Tsai Bing-Hsuan

指導老師:黃志賢 Advisor: Huang Chih-Hsien

崑山科技大學

資訊工程系

專題報告

A Report

Submitted to Department of Information Engineering

Kun Shan University

in Partial Fulfillment of the Requirements

for the Degree of Bachelor

in

Information Engineering

June 2011

Tainan, Taiwan, Republic of China

中華民國 100 年 6 月

Page 3: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

3

授權單

Page 4: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

4

中文摘要

英文拼字自我檢測系統

學生:陳毅書 指導老師:黃志賢

學生:李昭翰

學生:蔡秉軒

崑山科技大學資訊工程系

摘 要

本專題目的在於訓練英文能力,藉由聽力與發音來幫助學習,專題分成三種

難度,簡單、普通、困難,三種的區別在於字數的長短來定義,專題分為介面與

辨識兩大區塊。介面部分使用 Microsoft Visual C++6.0(Microsoft Foundation Class)

來撰寫介面程式,並且連接語音辨識的部分,語音辨識部分使用隱藏式馬可夫語

音辨識工具-HTK 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

可以擷取出每個單字的發音特徵,依照指定的參數來擷取,將結果儲存在指定的

資料夾內。專題在實作方面,受限於環境因素,每個人的發音方式與說話速度也

都會有些微的不同,這些差異導致系統在辨識上可能會產生錯誤的結果,同時發

音的長短也會造成辨識的錯誤,所以對發音有很高的要求才能夠正確辨識。系統

辨識結果根據使用者說出來的答案且同時錄音,之後在播放的同時辨識錄音的結

果顯示在介面上,也顯示正確的單字,由使用者自行確認答案。

Page 5: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

5

英文摘要

SELF-TESTING SYSTEM IN ENGLISH

SPELLING

Student: Chen Yi-Shu Advisor: Huang Chih-Hsien

Student: Li Chao-Han

Student: Tsai Bing-Hsuan

Submitted to Department of Information Engineering

Kun Shan University

Abstract

The project aimed to improve the user’s English ability by listening and spelling.

The fundamental English words were divided into three groups according to the

length of each word, i.e. easy, normal, and hard. The demonstration program was

composed by two parts. The interface was programmed using Microsoft Visual

C++6.0 (Microsoft Foundation Class) and was connected the speech recognition

provided by HTK. The capability of speech recognition was accomplished by HTK

toolbox. It is responsible for training an acoustic model set and the word spelling

recognition. The system recognized each character spelled out by the user and output

the corresponding characters to the screen. The variations from different environment

and the different speaker caused some mistakes of recognition in the system. Besides,

the number of the spelled characters also introduced recognition errors, so we have to

consider the issue about appropriate speed of spelling words. The identification results

calculated according to the standard spelling of a word and the recognized character

sequence. Finally, the system showed the correct word on the interface and the

recorded sound could be played to let the user confirm the answer manually.

Page 6: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

6

誌 謝

哪時還在擔心專題是否做不做的出來然後還在寫程式上跌跌撞撞的,日子一

天一天逼近專題展這也告訴我們專題也要進入尾聲告一段落並完成,在這段日子

裡老師其實很擔心我們因為我們前半段專題的進度遠遠落後別的組別可是老師

也叮嚀我們這是對自己負責,所以要認真的去看待這件事情,我們知道我們自己

的程式底子沒別人來的穩可是老師也一直激勵我們,我們可以做到的,只要肯做

沒甚麼事是辦不到的,所以非常感謝我們的指導老師-黃志賢導師,給予我們非

常多的意見指導以及幫助,在專題製作的過程中,我們遇到了非常多的瓶頸以及

意見不同的地方,每到碰壁時老師都會適時的給予我們意見及討論,給予我們一

個方向,讓我們一步一步的完成每個部分直到專題完成,此外也很謝謝老師教導

我們做人做事的態度因為學校與社會真的遇到的事情複雜很多所以老師要考慮

到的事情很多我們也知道老師把疲累的一面壓下來然而在我們面前還是很和

藹,我們要向您說一聲:「老師,您辛苦了!」。

Page 7: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

7

目 錄

授 權 單........................................................................................................................ 3

中文摘要........................................................................................................................ 4

英文摘要........................................................................................................................ 5

誌 謝........................................................................................................................ 6

圖 目 錄........................................................................................................................ 8

第一章 初步專題構思................................................................................................ 10

1.1 何謂語音辨識............................................................................................... 10

1.2 目標................................................................................................................ 12

1.3 研究動機....................................................................................................... 12

1.4 英語分段能力指標與十大基本能力關係.................................................... 13

1.5 系統功能........................................................................................................ 15

第二章 專題語音錄製與錄製軟體............................................................................ 16

2.1 單字來源........................................................................................................ 16

2.2 軟體 GoldWave 錄製英文單字..................................................................... 16

2.3 系統架構....................................................................................................... 17

第三章 介面製作與程式撰寫.................................................................................... 18

3.1 使用專題製作軟體........................................................................................ 18

3.2 開啟專案選取 MFC AppWizard [exe](顯示 List Box 中內容 1/4) ........... 19

3.3 基本介面控制項(按鈕與視窗的連動 1/6) ................................................. 22

3.4 程式修改(.txt 內容要顯示 ListBox 裡 1/3) ............................................... 28

3.5 難度分類與選擇............................................................................................ 32

3.6 ListBox 裡內容傳至 EditBox ...................................................................... 36

3.7 隨機選擇---程式撰寫及執行...................................................................... 37

3.8 錄音---加入檔案與程式撰寫...................................................................... 40

3.9 更改介面顏色與字體顏色............................................................................ 44

第四章 HTK 隱藏式馬可夫語音辨識工具 ............................................................ 46

4.1 由 SAMPA 比對英文字母音標 .................................................................... 46

4.2 HParse、HCopy、HVite 說明與產生結果 .................................................. 51

第五章 系統操作流程與結果.................................................................................... 53

5.1 系統操作流程與結果.................................................................................... 53

第六章 結論................................................................................................................ 62

參考文獻...................................................................................................................... 63

Page 8: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

8

圖目錄

【圖 1-1】語音辨識流程圖 ....................................................................................... 11

【圖 2-1】朗文當代英英辭典 第五版 ..................................................................... 16

【圖 2-2】GoldWave 軟體錄製英文單字發音 ......................................................... 16

【圖 2-3】系統架構圖 ............................................................................................... 17

【圖 3-1】Microsoft Visual C++6.0 (Microsoft Foundation Class) ........................... 18

【圖 3-2】開啟 MFC AppWizard [exe]專案 ............................................................. 19

【圖 3-3】在介面中設計 ListBox 與 Button ............................................................ 20

【圖 3-4】此段程式是要在 ListBox 顯示 txt 內容 .................................................. 21

【圖 3-5】顯示結果 ................................................................................................... 21

【圖 3-6】另創新的按鈕 ........................................................................................... 22

【圖 3-7】插入新視窗 ............................................................................................... 23

【圖 3-8】選取 Dialog ............................................................................................... 24

【圖 3-9】左邊出現新增視窗的名字 ....................................................................... 25

【圖 3-10】程式呼叫 ................................................................................................. 26

【圖 3-11】在 Button2 的加入程式 .......................................................................... 26

【圖 3-12】執行成功 ................................................................................................. 27

【圖 3-13】在第 2 個視窗加入程式 ......................................................................... 28

【圖 3-14】在主視窗加入程式 ................................................................................. 29

【圖 3-15】執行程式 ................................................................................................. 30

【圖 3-16】ListBox .................................................................................................... 31

【圖 3-17】區別三個難度之程式 ............................................................................. 32

【圖 3-18】區別三個難度之程式 ............................................................................. 33

【圖 3-19】區別三個難度之程式 ............................................................................. 33

【圖 3-20】選取簡單難度 ......................................................................................... 34

【圖 3-21】選取普通難度 ......................................................................................... 34

【圖 3-22】選取困難難度 ......................................................................................... 35

【圖 3-23】點擊或選取之動作會把單字傳至 EditBox .......................................... 36

【圖 3-24】按下 Button3 出現隨機動作 ................................................................. 37

【圖 3-25】撰寫程式與執行結果 ............................................................................. 38

【圖 3-26】加入 ActiveMovie Control Object 物件 ................................................. 39

【圖 3-27】錄音程式撰寫 ......................................................................................... 40

【圖 3-28】錄音程式撰寫 ......................................................................................... 41

【圖 3-29】按下按鈕上面的字會變動 ..................................................................... 41

【圖 3-30】關閉錄音程式撰寫 ................................................................................. 42

【圖 3-31】按下錄音鈕 ............................................................................................. 43

Page 9: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

9

【圖 3-32】按下停止錄音鈕 ..................................................................................... 43

【圖 3-33】更改介面與字體顏色程式 ..................................................................... 44

【圖 3-34】多加一個 EditBox ................................................................................... 45

【圖 5-1】按下難度選擇鈕 ....................................................................................... 53

【圖 5-2】選取三難度任意一個難度 ....................................................................... 54

【圖 5-3】顯示出該難度之單字表 ........................................................................... 55

【圖 5-4】系統操作流程 ........................................................................................... 56

【圖 5-5】此段程式不顯示”.wav”字樣................................................................ 57

【圖 5-6】停止錄音的動作 ....................................................................................... 58

【圖 5-7】在資料夾裡產生音檔 ............................................................................... 59

【圖 5-8】撰寫產生音檔檔名、辨識結果程式 ....................................................... 59

【圖 5-9】按播放錄音鈕同時辨識與顯示結果 ....................................................... 60

【圖 5-10】上框正確答案、下框為使用者答案 ..................................................... 61

Page 10: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

10

第一章 初步專題構思

1.1 何謂語音辨識

語音辨識最主要的目的是希望電腦聽懂人類說話的聲音,進而命令電腦執行

相對應的工作。當聲音藉由類比到數位的轉換裝置輸入電腦內部,並以數值方式

儲存後,語音辨識程式便開始已事先儲存好的聲音樣本與輸入的測詴聲音樣本進

行比對工作。比對完成後點擊輸入一個它認為最“像”的聲音樣本序號,我們尌可

以知道使用者剛剛唸進去的聲音代表何意,進而命令電腦做事。

※設計一個語音辨識程式,至少要有兩方面的知識:

【1】 瞭解如何把外界的聲音訊號抓到電腦內部處理:

這一部份和語音使用者的聲音輸入/輸出(I/O)硬體裝置有關,不同的裝置會

使這部分的處理程式也不相同,然而處理聲音(I/O)的基本原理卻差不多。

【2】 瞭解聲音比對原理:

聲音比對原理一直是研究語音辨識的專家學者們急於尋求突破的地方,截至

目前為止,已有不下上千篇的相關論文在尋找這方面的解答。

所謂語音辨識(Speech Recognition)有別於語者辨識(Speaker Identification),

語音辨識著重的是聲音代表的意義,而語者辨識是要辨識說話者的身份,兩者各

有不同的應用範圍,前者可應用於將聲音轉成文字的場合,而後者可用在門禁系

統等。

Page 11: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

11

※語音辨識的困難

語音訊號的差異性大(說話速度、習慣、生理狀況、性別、年齡、地域等)

語音訊號分段的困難

辨識率易受背景雜訊的影響

辨識模型複雜度高

※語音辨識系統基本方塊圖

【圖 1-1】 語音辨識流程圖

Page 12: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

12

1.2 目標

此系統是為了給想自我練習與測詴常用英文單字拼字的人所設計的系統。在

日常生活中最常用到的英文單字大約有 3000 字,為了讓使用者清楚了解到自己

到底對於英文發音和矯正單字拼字是否正確以達到學習效果,我們設計了簡易使

用的介面,讓孩童、青少年、老年人或者障礙人士都可以輕鬆操作。

1.3 研究動機

現在要測詴單字尌是透過筆詴(紙上測驗),再加上人工批改才能得知自己分

數的方式之下是很麻煩的,也可能發生人工批改上的錯誤等情況發生,另一方面

是為「方便」節省批改時間已達到測驗效果,有要考英檢或其他國際英語證照的

都需要考聽力,多多少少人都會想說測驗一下自己英文單字懂了多少會念的又是

哪些字,所以我們才從這些問題當中來做出此英文單字測驗系統,系統裡也會隨

時依照使用者的需要加入更多的單字不單單局限於常用字。

Page 13: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

13

1.4 英語分段能力指標與十大基本能力關係

基本能力 英語課程透過主題、溝通能力、教學活動可培養能力與態度

(一)了解自我 了解身體部位之說法

發展潛能 了解如何以簡易英語表達個人興趣或嗜好

了解如何以簡易英語描述個人外表或個性

了解如何以簡易英語描述日常生活作息

了解如何以簡易英語描述個人專長

描述不同職業類別

(二)欣賞、表現 欣賞英語之音韻節奏

與創新 吟唱和朗讀簡易歌謠及韻文

欣賞簡易兒童故事

欣賞簡易文學作品

欣賞簡易卡通影片

欣賞簡易廣播、電視電影等節目

(三)生涯規劃 培養英語之基本能力,奠定終生學習基礎

(四)表達、溝通 使用簡易教室用語

與分享 參與課堂口語練習

使用簡易英語參與課堂討論活動

使用簡易英語從事日常生活對話

使用簡易英語介紹自己、家人與朋友

使用簡易英語表達個人需求與感受

使用簡易英語表達個人意見

使用簡易英語分享個人經驗

使用簡易英語描述生活中相關人、事、物

使用簡易英語進行提問、回答與敘述

使用簡易英語回應或解釋別人所說的話

使用基本的社交禮儀用語

了解英美人士之溝通方式

(五)尊重、關懷 透過英語學習,培養對人權、兩性、及弱勢族群之尊重

與團隊合作 透過英語學習,培養對家人、朋友及社區之關懷

透過英語學習,培養環保觀念

(六)文化學習 認識中外節慶習俗

與國際了解 了解中外風土民情

欣賞簡易兒童文學作品,藉以了解他國文化

了解國際社會禮儀

欣賞、接納不同之文化習俗

Page 14: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

14

培養國際觀

(七)規劃、組織 利用有效之外語學習方法安排規畫英語之學習

(八)運用科技 認識一些生活常見的科技、資訊用語

與資訊 利用科技提昇英語學習興趣

利用網路查詢資料

(九)探索、研究 使用字典及其他工具書查詢資料

(十)獨立思考 培養利用英語解決問題之能力

Page 15: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

15

1.5 系統功能

I. 常用英文單字(約 3000 字)

以隨機方式出現該測驗之單字。

II. 可設定單字難度

根據所收集之 3000 英文單字之單字中字母數量,區分為三種難度等

級;可設定三種難度「Easy 簡單」、「Normal 中等」、「Hard 困難」;之

後會以使用者所設定之難度亂數從中選取單字準備測驗。

III. 由使用者逐一發出每一字母輸入

按下播放按鈕,由系統播放當前選定單字之發音;給定單字後按下錄

音鈕錄製使用者所念之單字字母拼字序列語音。

IV. 檢測單字是否正確

由所錄製的拼字語音,系統辨識出對應之字母序列,並顯示正確率

與答案於系統介面上。

Page 16: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

16

第二章 專題語音錄製與錄製軟體

2.1 單字來源

【圖 2-1】 朗文當代英英辭典 第五版

2.2 軟體 GoldWave 錄製英文單字

【圖 2-2】 GoldWave 軟體錄製英文單字發音

Page 17: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

17

2.3 系統架構

【圖 2-3】系統架構圖

說明 1: 當讀取音檔時,會根據所設定的格是去擷取所要的語音部分,同時將

語音的格式轉換成 MFC 格式,做為後續分析檔案的前置工作,詳細

介紹會在第四章做介紹。

說明 2: 分析結果、常用 3000 單字庫、語者因素、使用者設定會與語音處理

搭配然而顯示辨識結果,詳細設計介面部分會在第三章介紹。

Page 18: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

18

第三章 介面製作與程式撰寫

3.1 使用專題製作軟體

【圖 3-1】 Microsoft Visual C++6.0 (Microsoft Foundation Class)

Page 19: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

19

3.2 開啟專案選取 MFC AppWizard [exe](顯示 List Box 中內

容 1/4)

【圖 3-2】 開啟 MFC AppWizard [exe]專案

說明: 在上面目錄選取 Projects 之後選取 MFC AppWizard [exe]專案,在

Projects name 下框裡打入自己需要的檔名,設好之後按”OK”鈕。

Page 20: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

20

在 List Box 理顯示字體(顯示 ListBox 中內容 2/3)

【圖 3-3】 在介面中設計 ListBox 與 Button

說明: 在基本介面裡從工具箱中找 ListBox 與 Button 物件,然後如上圖擺放

上去。

Page 21: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

21

經過修改過後程式(顯示 ListBox 中內容 3/3)

【圖 3-4】 此段程式是要在 ListBox 顯示 txt 內容

【圖 3-5】 顯示結果

說明: 在主程式裡加入【圖表 3-3】程式,然後執行成功後會顯示【圖表 3-4】。

Page 22: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

22

3.3 基本介面控制項(按鈕與視窗的連動 1/6)

【圖 3-6】 另創新的按鈕

說明: 在工具箱裡在另外拉取 2 個 Button 鈕,”確定”、”取消”目前都只是關

掉視窗的動作。

Page 23: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

23

新增/插入新 Dialg(按鈕與視窗的連動 2/6)

【圖 3-7】 插入新視窗

說明: 把游標移到主要專案上,之後按右鍵出現表單選取”Insert…”新增/插

入。

Page 24: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

24

【圖 3-8】 選取 Dialog

說明: 按下”Insert..”後出現【圖表 4-3】,選取 Dialog 看到右邊選取”New”。

Page 25: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

25

新增新 Dialog (按鈕與視窗的連動 3/6)

【圖 3-9】 左邊出現新增視窗的名字

說明: 新增新視窗”TwoDlg.cpp”,在新增的介面上加上”easy”、”normal”、

”Hard”,在工具箱 Radio Button1、Radio Button2 、Radio Button3。

Page 26: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

26

在 HeroDlg 加這行→#include “TwoDlg.h”(按鈕與視窗的連

動 4/6)

【圖 3-10】 程式呼叫

說明: 選取 HeroDlg.cpp 會出現右邊撰寫程式,加入”#include TwoDlg.h。

在 Button2 這控制項裡增加此段程式碼(按鈕與視窗的連

動 5/6)

【圖 3-11】 在 Button2 的加入程式

說明: 在基本介面往 Button2 點兩下可跳至 void CHeroDlg::OnBuuton2()加

入【圖表 4-5】紅框中的程式,呼叫第 2個視窗。

Page 27: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

27

執行成功(按鈕與視窗的連動 6/6)

【圖 3-12】 執行成功

說明: 執行成功,按下難度選擇鈕成功跳出新的視窗。

Page 28: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

28

3.4 程式修改(.txt 內容要顯示 ListBox 裡 1/3)

【圖 3-13】 在第 2個視窗加入程式

說明: 在第 2 個視窗往”OK”按兩下會跳至 void CTwoDlg::OnOK()撰寫【圖

表 4-7】程式。

Page 29: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

29

程式修改(.txt 內容要顯示 ListBox 裡 2/3)

【圖 3-14】在主視窗加入程式

說明: 在主視窗往 Button2 按兩下跳至 void CHeroDlg::OnButton2()加入【圖

表 4-8】紅框中的程式。

Page 30: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

30

執行程式(.txt 內容要顯示 ListBox 裡程式成功 3/3)

【圖 3-15】 執行程式

說明: 成功執行程式視窗,按下難度選擇跳出第 2 個視窗按下”OK”鈕。

Page 31: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

31

【圖 3-16】ListBox

說明: 按下”OK”鈕後會出現 txt 裡的單字顯示在 ListBox 中。

Page 32: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

32

3.5 難度分類與選擇

【圖 3-17】區別三個難度之程式

說明: 在主視窗介面程式 void CHeroDlg OnButton2()中撰寫程式,上塗”刷

新” 是為了每切換一次難度都能把之前的單字刷掉,尌不會單字重疊。

Page 33: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

33

【圖 3-18】區別三個難度之程式

說明: 在第 2 個視窗介面程式撰寫,分別在三個 Radio Button 加上旗標。

【圖 3-19】區別三個難度之程式

說明: 主程式 HeroDlg.cpp 如上圖加入此全域變數。

Page 34: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

34

【圖 3-20】 選取簡單難度

【圖 3-21】 選取普通難度

Page 35: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

35

【圖 3-22】 選取困難難度

Page 36: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

36

3.6 ListBox 裡內容傳至 EditBox

【圖 3-23】點擊或選取之動作會把單字傳至 EditBox

說明: 如上圖把程式加在主程式 void CHeroDlg::OnSelchangeList1()中。

Page 37: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

37

3.7 隨機選擇---程式撰寫及執行

【圖 3-24】按下 Button3 出現隨機動作

說明: 另創按鈕 Button3,在主程式 void CHeroDlg::OnButton3()中撰寫紅框

中的程式碼,其中「//m_ctlMplay.SetFileName(strbuf)」這一行要註解

掉。

Page 38: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

38

【圖 3-25】撰寫程式與執行結果

說明: 在 Hero.cpp 中撰寫程式,不是在 HeroDlg.cpp 要注意!成功執行按下難

度。

Page 39: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

39

播放.wav 音檔

【圖 3-26】加入 ActiveMovie Control Object 物件

說明: 在主介面上從工具箱拉取 ActiveMovie Control Object,此物件為播放

器。

Page 40: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

40

3.8 錄音---加入檔案與程式撰寫

【圖 3-27】 錄音程式撰寫

說明: 在撰寫錄音程式前要先加入 PlayMMSound.cpp、PlaySound.cpp、

RecordSound.cpp、WriteSoundFile.cpp、PlayMMSound.h、PlaySound.h

RecordSound.h、WriteSoundFile.h 這八個檔。

Page 41: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

41

【圖 3-28】 錄音程式撰寫

說明: 如上圖程式放在 HeroDlg.cpp 檔裡。

【圖 3-29】 按下按鈕上面的字會變動

說明: 如上圖程式放在 HeroDlg.cpp 檔裡,此段程式為按下”錄音”鈕後上面

「錄音」字體會變成「停止錄音」,等按下「停止錄音」時又變成「錄

音」。

Page 42: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

42

【圖 3-30】關閉錄音程式撰寫

說明: 如上圖程式放在 HeroDlg.cpp 檔裡。

Page 43: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

43

【圖 3-31】按下錄音鈕

【圖 3-32】按下停止錄音鈕

Page 44: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

44

3.9 更改介面顏色與字體顏色

【圖 3-33】 更改介面與字體顏色程式

說明: 如上圖程式加在 Hero.cpp 中,RGB 三原色如不知數值該怎麼設定的可

開起小畫家→色彩→編輯色彩→定義自定色彩→紅(R) 綠(G) 藍

(U/B)。

Page 45: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

45

多加一個 EditBox

【圖 3-34】多加一個 EditBox

說明: 在主介面上工具箱拉取 EditBox,此框是要來顯示使用者念的結果。

Page 46: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

46

第四章. HTK 隱藏式馬可夫語音辨識工具

4.1 由 SAMPA 比對英文字母音標

SAMPA(子

音) 範例 SAMPA(子音) 範例

p pen, spin, tip z zoo, rose

b but, web S she, sure,

emotion, leash

t two, sting, bet Z pleasure, beige

d do, odd h ham

tS chair, nature, teach m man, ham

dZ gin, joy, edge n no, tin

k cat, kill, skin, queen, thick N singer, ring

g go, get, beg l left, bell

f fool, enough, leaf r run, very

v voice, have w we

T thing, breath j yes

D this, breathe W wh

s see, city, pass x loch (Scottish)

SAMPA(母音) 範例

RP GenAm AuE

A: A a: father

i: i i: see

I I I city

E E e bed

_3: 3` 3: bird

{ { {[1] lad, cat, ran(蝴蝶音)

A: Ar a: arm

Page 47: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

47

V V a run, enough

Q A O not, wasp

O: O or A[2] o: law, caught

U U U put

u: u }: soon, through

@ @ @ about

@ @` @ Winner

SAMPA(雙母音) 範例

RP GenAm AuE

eI eI or e {I day

aI aI Ae my

OI OI oI boy

@U oU or o @} no

aU aU {O now

I@ ir I@ near,here

E@ Er e: hair,there

U@ Ur U@ tour

ju: ju j}: pupil

比對完上列三表之結果,製作成音標發音表

a eI n E n

b b i o @ U

C s i p p i

d d i q k j u:

e i r A r

f E f s E s

g dZ i t t i

h E i tS u j u:

i aI v v i

j dZ E I w d V b @ l j u:

k k E I x E k s

l E l y w aI

m E m z z i

Page 48: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

48

A~Z 變化規律統計

Page 49: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

49

演算法 檔名命名為 gram.txt

$A = B | C | D | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z;

$B = A | B | E | I | J | L | M | O | R | S | T | U | V | Y;

$C = A | C | E | Q | R | S | T | U | Y;

$D = A | B | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | U | V | W | Y;

$E = A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X |

Y | Z;

$F = A | E | F | I | L | O | R | T | U | W | X | Y;

$G = A | E | G | H | I | L | M | N | O | R | S | T | U | Y ;

$H = A | B | D | E | I | L | M | N | O | R | S | T | U | W | Y ;

$I = A | B | C | D | E | F | G | K | L | M | N | O | P | Q | R | S | T | U | V | X | Z ;

$J = A | E | O | U ;

$K = A | E | F | G | I | L | N | O | S | W | Y ;

$L = A | B | C | D | E | F | I | J | K | M | N | O | P | R | S | T | U | V | W | Y ;

$M = A | B | E | F | I | M | N | O | P | S | U | Y ;

$N = A | B | C | D | E | F | G | H | I | J | K | L | M | N | P | S | T | U | V | W | X | Y ;

$O = A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X |

Y | Z ;

$P = A | B | E | F | H | I | L | M | O | P | R | S | T | U | V | W | X | Y | Z ;

$Q = U ;

$R = A | B | C | D | E | F | G | H | I | K | L | M | N | O | P | R | S | T | U | V | W | Y ;

$S = A | B | C | E | F | G | H | I | K | L | M | N | O | P | Q | R | S | T | U | W | X | Y ;

$T = A | B | C | E | F | G | H | I | L | M | N | O | P | R | S | T | U | W | Y ;

$U = A | B | C | D | E | F | G | I | L | M | N | O | P | R | S | T | Y ;

Page 50: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

50

$V = A | E | I | O | U | Y ;

$W = A | B | D | E | F | H | I | K | L | N | O | R | S | T | Y ;

$X = A | C | E | H | I | P | T | V ;

$Y = A | B | C | E | F | H | I | L | M | O | P | R | S | T | W ;

$Z = A | E | I | O | Y ;

(SENT-START <(A $A)|(B $B)|(C $C)|(D $D)|(E $E)|(F $F)|(G $G)|(H $H)|(I $I)|(J

$J)|(K $K)|(L $L)|(M $M)|(N $N)|(O $O)|(P $P)|(Q $Q)|(R $R)|(S $S)|(T $T)|(U

$U)|(V $V)|(W $W)|(X $X)|(Y $Y)|(Z $Z)> SENT-END)

Page 51: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

51

4.2 HParse、HCopy、HVite 說明與產生結果

HParse

從一個以純文字格式描述文法的檔案,HPARSE 工具據以生成字詞層次的網

格檔案(提供給如:HVITE 之用),其中的文法描述是包含了一群運用 EBNF 格式

而重新改寫的規則。EBNF 規則是用於生成一組有限狀態網路的內部表現型式,

此一有限狀態網路是由 HPARSE 網路節點表示網路中的字詞與相應的節點間鏈結

集合所連結而成。這樣的 HPARSE 網路之後便可轉換為 HTK V2 字詞層次的網

格。這個工具提供了一種定義此類字詞層次網頁的便利途徑。

用法: HParse gram.txt wdnet

將 gram.txt 生成 wdnet

HCopy

這個程式會複製一個或多個音檔至指定的輸出檔案中,而且可以選擇性地將

資料轉成某一種參數格式。無論來源檔案是以何種可支援的格式存在,輸出的檔

案格式一定都是 HTK 格式。此程式的預設動作是將整份來源檔案複製到目的地

檔案中,但是是有選項可以設定只複製所指定的段落。於是,此程式的用途在於

轉換其他格式的資料檔案為 HTK 格式、串接或是分割資料檔案內容,以及轉換

出某一種參數型式的輸出。如果有任何關於擷取來源檔特定段落而不是要輸出整

份資料的選項設定好的話,這些段落尌會由所有的資料來源檔案擷取出來並串接

成為一個輸出的結果檔案中。

用法: HCopy -C config.8K_hcopy_mfcc26 clock.wav clock.mfc 將音源檔

轉換成 Mfc 格式。

Page 52: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

52

HVite

HVITE 是一個通用的 Viterbi 字詞辨識器。它將語音文件與 HMM 網路進行

匹配,並輸出對應的辨識結果。當辨識器執行 N-best 辨識時,所輸出的是在字

詞層次上含有多種候選字詞的網格。無論是讀入一個字詞層次的網格或是標記

檔,之後都可以透過所使用的字典去建立一個以模型為主的辨識網路。這樣的作

法可以指定任一種有限狀態字詞網路與簡單的強制匹配得以進行辨識工作。

用法: HVite -C config.txt -H macros -H hmmdefs -o ST -S test.scp -l '*' -i

clock.mlf -w wdnet -p 0.0 dict.txt tiedlist.txt

把所產生的 mfc 檔案與 hmmdefs 與 macros 進行比對。

結果

進行比對之後,將生成的結果到指定檔案,在檔案內部同時把不要的資訊依

照 CONFIG.TXT、-o、ST 的設定剔除,同時再比對 dict.txt,並比對 HMM 模型,

將最符合的字選擇出來再顯示到檔案,而下列文字則是檔案的內容。

產生的結果: #!MLF!#

"'*'/clock.rec"

c l o c k

Page 53: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

53

第五章 系統操作流程與結果

5.1 系統操作流程與結果

【圖 5-1】按下難度選擇鈕

步驟 1: 按下”難度選擇 ”的按鈕。

Page 54: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

54

【圖 5-2】選取三難度任意一個難度

步驟 2: 出現難度選擇框中有”Easy 簡單”、”Normal 普通”、”Hard 困難”,

難度分別是以單字字母長度而分。

步驟 3: 按下”OK ”按鈕。

Page 55: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

55

【圖 5-3】 顯示出該難度之單字表

i: 出現使用者所選的難度之單字列表。

Page 56: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

56

【圖 5-4】 系統操作流程

步驟 4: 按下”隨機選擇”鈕,會在使用者所選之難度列表中隨機選取 1 個

單字。

步驟 5: 按下播放鈕,聆聽此系統隨機選取的單字音檔,可重複播放。

步驟 6: 按下”錄音”鈕。

ii: 在測驗時測驗框 EditBox 中會出現”ans ”時代表可以開始作答。

Page 57: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

57

【圖 5-5】 此段程式不顯示”.wav”字樣

說明: 尋找.txt 裡單字,但在 ListBox 裡不顯示”.wav”的字樣,程式 str=”ans”

這行是表示難度選擇之後隨機會在 EditBox1 框裡出現”ans”表示可以

開始按下“錄音”鈕開始錄音。

Page 58: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

58

【圖 5-6】 停止錄音的動作

步驟 7: 看到按鈕上由”錄音”→”停止錄音”這時使用者可以開始逐一念

出字母,如果念完時按下”停止錄音”停止錄音動作,錄失敗可以

再重複錄音

iii: 代表可以開始錄音。

Page 59: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

59

【圖 5-7】 在資料夾裡產生音檔

說明: 程式錄音完會在這個主資料夾裡產生”a~z.wav”錄音檔。

【圖 5-8】撰寫產生音檔檔名、辨識結果程式

Page 60: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

60

【圖 5-9】 按播放錄音鈕同時辨識與顯示結果

步驟 8: 先按下”播放錄音”鈕時,開始辨識錄音檔,在辨識時可能需要 5~7

秒才會顯示結果。

Page 61: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

61

【圖 5-10】 上框正確答案、下框為使用者答案

iiii: 顯示出隨機鈕所選到的正確單字。

iiiii: 顯示出使用者逐一念出的單字,我們設定是大寫。

Page 62: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

62

第六章 結論

以往學習英文的方法大多為背誦單字與眼睛看過,但是這樣的效率其實是不

好的,而專題製作出一個會發出英文單字聲音,然後要求使用者念出單字再去辨

識所念的單字是否正確藉由這種方法來提升效率,但是語音的辨識容易受到外在

環境的影響,常常會因為一點小小的聲音尌會導致結果的偏差,同時,辨識的精

確度也是一個很大的課題,因為語音包含了特定語者系統、不特定語者系統,若

是系統需要使用者加以訓練,而只能供該訓練者使用稱為特定語者,特定語者系

統是針對特定使用者所設計的系統,設計的要求只是提高對這些使用者的語音辨

識率,對其他使用者而言,系統不保證能夠提供可接受程度的辨識率,不特定語

者語音辨識器則是針對一般使用者所設計的,由於不特定語者語音辨識器的訓練

語音收集較為困難,其辨識率一般都不如特定語者語音辨識器這也是需要克服的

問題,當這些問題都克服,有講師建議能夠再增加整句的英文會話,並要求使用

者,將整句念過一遍,再拼湊出單字,藉此達到雙重複習發音語拼字記憶,或者

是增加小考模式,可以選擇考題數量,借由不同的題目,來刺激記憶,提升英文

能力,同時可以結合,補教界的英文教材,利用這套系統,幫助學生。

Page 63: 崑山科技大學 - ir.lib.ksu.edu.twir.lib.ksu.edu.tw/bitstream/987654321/14212/2/專題製作.pdf · 音辨識工具-htk 負責訓練語音模型及之後的辨識,當使用者念出單字時,系統

63

參考文獻

1.Stanley B.Lippman 譯者:侯捷、王建興”Essential C++ 中文版”

2001-08

2.工業技術研究院“The HTK Book(for HTK Version 3.2.1)” Revised

for HTK Version 3.2 December 2002

3.普塞斯/集思廣譯工作室/Prosise Jeff ”Windows 程式設計:使用

MFC”2004.08.30

4.LONGMAN “Dictionary of Contemporary English ”2007.01.01