Amazon Transcribe - 開發人員指南• 使用 Amazon Transcribe...

193
Amazon Transcribe 開發人員指南

Transcript of Amazon Transcribe - 開發人員指南• 使用 Amazon Transcribe...

  • Amazon Transcribe開發人員指南

  • Amazon Transcribe 開發人員指南

    Amazon Transcribe: 開發人員指南Copyright © 2020 Amazon Web Services, Inc. and/or its affiliates. All rights reserved.

    Amazon's trademarks and trade dress may not be used in connection with any product or service that is not Amazon's,in any manner that is likely to cause confusion among customers, or in any manner that disparages or discreditsAmazon. All other trademarks not owned by Amazon are the property of their respective owners, who may or may notbe affiliated with, connected to, or sponsored by Amazon.

  • Amazon Transcribe 開發人員指南

    Table of Contents什麼是 Amazon Transcribe? ............................................................................................................... 1

    辨識語音 .................................................................................................................................... 2轉錄個別音訊聲道 ....................................................................................................................... 2轉錄串流音訊 ............................................................................................................................. 2自訂詞彙 .................................................................................................................................... 3您第一次使用 Amazon Transcribe 嗎? .......................................................................................... 3

    運作方式 ............................................................................................................................................ 4語音輸入 .................................................................................................................................... 5轉錄數字 .................................................................................................................................... 6替代轉錄 .................................................................................................................................... 7識別講者 .................................................................................................................................... 9轉錄串流音訊 ............................................................................................................................ 10聲道識別 .................................................................................................................................. 11自訂詞彙 .................................................................................................................................. 12

    使用清單建立自訂詞彙 ....................................................................................................... 13使用資料表建立自訂詞彙 .................................................................................................... 14自訂詞彙的字元集 .............................................................................................................. 15

    入門 ................................................................................................................................................ 43步驟 1. 設定帳戶 ....................................................................................................................... 43

    註冊 AWS 帳號 ................................................................................................................ 43建立 IAM 使用者 ............................................................................................................... 43下一個步驟 ....................................................................................................................... 44

    步驟 2:設定 AWS CLI .............................................................................................................. 44下一個步驟 ....................................................................................................................... 44

    步驟 3:開始使用主控台 ............................................................................................................. 45建立轉錄工作 .................................................................................................................... 45檢視轉錄工作 .................................................................................................................... 46

    步驟 4:開始使用 API ................................................................................................................ 49入門 (AWS CLI) ................................................................................................................ 49入門 (SDK for Python) ....................................................................................................... 51

    步驟 5:串流音訊入門 ................................................................................................................ 53串流轉錄 .......................................................................................................................................... 57

    事件串流編碼 ............................................................................................................................ 59使用 WebSocket 串流 ................................................................................................................ 60

    將 WebSocket 請求的原則新增到您的 IAM 角色 ..................................................................... 60建立預先簽章 URL ............................................................................................................ 60處理 WebSocket 升級回應 .................................................................................................. 64提出 WebSocket 串流請求 .................................................................................................. 65處理 WebSocket 串流回應 .................................................................................................. 65處理 WebSocket 串流錯誤 .................................................................................................. 65

    使用 HTTP/2 串流 ..................................................................................................................... 66串流請求 .......................................................................................................................... 66串流回應 .......................................................................................................................... 69範例請求和回應 ................................................................................................................. 70HTTP/2 重試用戶端 ........................................................................................................... 71使用 HTTP/2 重試用戶端 .................................................................................................... 78

    Transcribe-Medical ............................................................................................................................ 80什麼是 Amazon Transcribe Medical? .......................................................................................... 80

    重要說明 .......................................................................................................................... 80轉錄串流音訊 .................................................................................................................... 80支援的專科 ....................................................................................................................... 80您是第一次使用 Amazon Transcribe Medical 嗎? .................................................................. 81

    運作方式 .................................................................................................................................. 81轉錄數字 .......................................................................................................................... 81

    iii

  • Amazon Transcribe 開發人員指南

    轉錄串流音訊 .................................................................................................................... 82入門 ........................................................................................................................................ 82

    設定 帳戶 ......................................................................................................................... 82Amazon Transcribe Medical 串流轉錄 .......................................................................................... 83

    事件串流編碼 .................................................................................................................... 84使用 WebSocket 串流 ........................................................................................................ 85

    安全性 ............................................................................................................................................. 92資料保護 .................................................................................................................................. 92

    靜態加密 .......................................................................................................................... 93傳輸中加密 ....................................................................................................................... 93金鑰管理 .......................................................................................................................... 93

    Identity and Access Management ................................................................................................ 94對象 ................................................................................................................................ 94使用身分來驗證 ................................................................................................................. 95使用政策管理存取權 .......................................................................................................... 96Amazon Transcribe 如何搭配 IAM 運作 ................................................................................ 98身分型政策範例 ................................................................................................................. 99故障診斷 ........................................................................................................................ 103

    監控 Amazon Transcribe .......................................................................................................... 104使用 CloudTrail 監控 Amazon Transcribe ............................................................................ 105CloudWatch Events ......................................................................................................... 107

    合規驗證 ................................................................................................................................ 109彈性 ...................................................................................................................................... 109基礎設施安全 .......................................................................................................................... 109

    指導方針和限制 ............................................................................................................................... 110支援的區域 ............................................................................................................................. 110調節 ...................................................................................................................................... 110指導方針 ................................................................................................................................ 110限制 ...................................................................................................................................... 110

    文件歷史記錄 .................................................................................................................................. 111API 參考 ........................................................................................................................................ 114

    Actions .................................................................................................................................. 114Amazon Transcribe Service .............................................................................................. 114Amazon Transcribe Streaming Service ............................................................................... 158

    Data Types ............................................................................................................................ 162Amazon Transcribe Service .............................................................................................. 163Amazon Transcribe Streaming Service ............................................................................... 176

    Common Errors ...................................................................................................................... 185Common Parameters ............................................................................................................... 186

    AWS Glossary ................................................................................................................................ 189

    iv

  • Amazon Transcribe 開發人員指南

    什麼是 Amazon Transcribe?Amazon Transcribe 使用進階機器學習技術以辨識音訊檔案中的語音,然後轉錄為文字。您可以使用Amazon Transcribe 將音訊轉換為文字,並建立併入音訊檔案內容的應用程式。例如,您可以轉錄影片的音軌以建立影片的字幕。

    您可以使用 Amazon Transcribe 來轉錄以下語言的文字:

    • 海灣阿拉伯文 (ar-AE)• 現代標準阿拉伯文 (ar-SA)• 中國華語 - 大陸 (zh-CN)• 荷蘭文 (nl-NL)• 澳洲英文 (en-AU)• 英式英文 (en-GB)• 印度英文 (en-IN)• 愛爾蘭英文 (en-IE)• 蘇格蘭英文 (en-AB)• 美式英文 (en-US)• 威爾斯英文 (en-WL)• 西班牙文 (es-ES)• 美國西班牙文 (es-US)• 法文 (fr-FR)• 加拿大法文 (fr-CA)• 波斯文 (fa-IR)• 德文 (de-DE)• 瑞士德文 (de-CH)• 希伯來文 (he-IL)• 印地語 (hi-IN)• 印尼文 (id-ID)• 義大利文 (it-IT)• 日文 (ja-JP)• 韓文 (ko-KR)• 馬來文 (ms-MY)• 葡萄牙文 (pt-PT)• 巴西葡萄牙文 (pt-BR)• 俄文 (ru-RU)• 坦米爾文 (ta-IN)• 特拉古文 (te-IN)• 土耳其文 (tr-TR)

    您可以使用下列語言轉錄串流音訊:

    • 澳洲英文 (en-AU)• 英式英文 (en-GB)

    1

  • Amazon Transcribe 開發人員指南辨識語音

    • 美式英文 (en-US)• 法文 (fr-FR)• 加拿大法文 (fr-CA)• 美國西班牙文 (es-US)

    您可以使用 Amazon Transcribe 與其他 AWS 服務來建立應用程式。例如,您可以:

    • 使用 Amazon Transcribe 將語音轉換為文字,將文字傳送到 Amazon Translate 並翻譯為另一種語言,然後將翻譯的文字傳送至 Amazon Polly 以說出翻譯的文字。

    • 使用 Amazon Transcribe 轉錄客戶服務通話的錄音記錄,以進行分析。轉錄錄音記錄後,請傳送到Amazon Comprehend 來識別關鍵字、主題或情緒。

    • 使用 Amazon Transcribe 來轉錄電視之類的即時廣播,以提供即時字幕。

    若要使用 Amazon Transcribe,您需要將音訊檔案存放在 Amazon S3 儲存貯體中。轉錄工作的輸出也會存放在 S3 儲存貯體中。Content delivered to Amazon S3 buckets might contain customer content. For moreinformation about removing sensitive data, see How Do I Empty an S3 Bucket? or How Do I Delete an S3Bucket?.

    辨識語音Amazon Transcribe 可以識別音訊剪輯中的個別講者,此項技術稱為自動分段標記或講者識別。啟動講者識別時,Amazon Transcribe 即包含識別音訊剪輯內各講者的屬性。您可以使用講者識別功能來:

    • 在錄音的客戶支援通話中,識別客戶和支援代表• 識別隱藏式輔助字幕的字元• 在錄音的記者會或課堂中,識別講者和提問者

    您可以指定您要 Amazon Transcribe 在音訊剪輯中辨識的語音數。

    轉錄個別音訊聲道若要建立每個聲道的轉錄,或者已錄製音效的單一串流,請在音訊檔案中使用聲道識別。透過聲道識別,Amazon Transcribe 會傳回兩個或多個轉錄:所有音訊聲道的合併轉錄,以及每個音訊聲道的轉錄。

    當您的音訊為多聲道時,請使用聲道識別。例如,使用聲道識別的時機:

    • 當您錄音的一個聲道為客戶服務代表,另一個聲道為客戶時• 當您轉錄的播客將主持人錄製在一個聲道,而訪客則在另一個聲道時

    如需聲道識別的詳細資訊,請參閱聲道識別 (p. 11)。

    轉錄串流音訊您可以使用 Amazon Transcribe 來即時轉錄串流音訊。您會向 Amazon Transcribe 傳送音訊串流,而Amazon Transcribe 會傳回包含該音訊轉錄的 JSON 物件串流。

    如需處理音訊串流的詳細資訊,請參閱串流轉錄 (p. 57)。

    2

    https://docs.aws.amazon.com/AmazonS3/latest/user-guide/empty-bucket.htmlhttps://docs.aws.amazon.com/AmazonS3/latest/user-guide/delete-bucket.htmlhttps://docs.aws.amazon.com/AmazonS3/latest/user-guide/delete-bucket.html

  • Amazon Transcribe 開發人員指南自訂詞彙

    自訂詞彙建立自訂詞彙,以協助 Amazon Transcribe 辨識您的使用案例的專屬文字,並提升語音轉文字的準確性。例如,您可能會建立包含產業專屬文字和片語的自訂詞彙。

    使用自訂詞彙協助 Amazon Transcribe 辨識:

    • 未被辨識的文字• 您領域專屬的不常見文字

    如需建立自訂詞彙的詳細資訊,請參閱「自訂詞彙 (p. 12)」。

    您第一次使用 Amazon Transcribe 嗎?如果您是第一次使用,我們建議您依序閱讀以下章節:

    1. Amazon Transcribe 運作方式 (p. 4):簡介 Amazon Transcribe。2. Amazon Transcribe 入門 (p. 43):說明如何設定您的 AWS 帳戶和使用 Amazon Transcribe。3. API 參考 (p. 114):包含 Amazon Transcribe 操作的參考文件。

    3

  • Amazon Transcribe 開發人員指南

    Amazon Transcribe 運作方式Amazon Transcribe 分析內含語音的音訊檔案,然後利用進階機器學習技術,將語音資料轉錄為文字。然後,您就可以像使用任何文字文件一樣,使用轉錄的文字。

    若要轉錄語音檔案,Amazon Transcribe 運用三種操作:

    • StartTranscriptionJob (p. 147) – 開始非同步工作,將音訊檔案中的語音轉錄為文字。• ListTranscriptionJobs (p. 138) – 傳回已開始的轉錄工作的清單。您可以指定您希望操作傳回的工作的狀

    態。例如,您可以取得所有待處理的工作列表,或已完成的工作列表。• GetTranscriptionJob (p. 129) – 傳回轉錄工作結果。回應包括內含結果的 JSON 檔案的連結。

    若要將串流音訊轉錄為文字,Amazon Transcribe 提供一個操作:

    • StartStreamTranscription (p. 159) – 在音訊串流到 Amazon Transcribe 時開始雙向 HTTP/2 串流,而轉錄結果會串流到您的應用程式。

    您也可以開始進行 WebSocket 協定串流,將音訊傳送到 Amazon Transcribe。如需詳細資訊,請參閱 使用Amazon Transcribe 串流與 WebSocket (p. 60)。

    您也可以使用 Amazon Transcribe 建立並管理您解決方案的自訂詞彙。自訂詞彙提供 Amazon Transcribe 更多關於如何處理音訊剪輯中語音的資訊。

    • CreateVocabulary (p. 116) – 建立您可以在自己的轉錄工作中使用的自訂詞彙。• DeleteVocabulary (p. 125) – 從您的帳戶刪除自訂詞彙。• GetVocabulary (p. 132) – 取得自訂詞彙資訊,以及您可以用於下載詞彙內容的 URL。• ListVocabularies (p. 141) – 取得您帳戶中的自訂詞彙清單。• UpdateVocabulary (p. 152) – 更新現有詞彙。

    您可以使用下列任意語言轉錄語音:

    • 海灣阿拉伯文 (ar-AE)• 現代標準阿拉伯文 (ar-SA)• 中國華語 (zh-CN)• 荷蘭文 (nl-NL)• 澳洲英文 (en-AU)• 英式英文 (en-GB)• 印度英文 (en-IN)• 愛爾蘭英文 (en-IE)• 蘇格蘭英文 (en-AB)• 美式英文 (en-US)• 威爾斯英文 (en-WL)• 法文 (fr-FR)• 加拿大法文 (fr-CA)

    4

  • Amazon Transcribe 開發人員指南語音輸入

    • 波斯文 (fa-IR)• 德文 (de-DE)• 瑞士德文 (de-CH)• 希伯來文 (he-IL)• 印地語 (hi-IN)• 印尼文 (id-ID)• 義大利文 (it-IT)• 日文 (ja-JP)• 韓文 (ko-KR)• 馬來文 (ms-MY)• 葡萄牙文 (pt-PT)• 巴西葡萄牙文 (pt-BR)• 俄文 (ru-RU)• 西班牙文 (es-ES)• 美國西班牙文 (es-US)• 坦米爾文 (ta-IN)• 特拉古文 (te-IN)• 土耳其文 (tr-TR)

    您可以使用以下語言的串流轉錄:

    • 澳洲英文 (en-AU)• 英式英文 (en-GB)• 美式英文 (en-US)• 法文 (fr-FR)• 加拿大法文 (fr-CA)• 美國西班牙文 (es-US)

    主題• 語音輸入 (p. 5)• 轉錄數字 (p. 6)• 替代轉錄 (p. 7)• 識別講者 (p. 9)• 轉錄串流音訊 (p. 10)• 聲道識別 (p. 11)• 自訂詞彙 (p. 12)

    語音輸入若要轉錄音訊檔案,您可以使用轉錄工作。您將檔案另存為 Amazon S3 儲存貯體中的物件。輸入檔案必須是:

    • FLAC、MP3、MP4 或 WAV 檔案格式• 長度低於 4 小時或小於 2 Gb 的音訊資料

    5

  • Amazon Transcribe 開發人員指南轉錄數字

    您必須指定輸入檔案的語言和格式。

    為了獲得最佳結果:

    • 使用無失真格式,例如 FLAC 或以 PCM 16 位元編碼的 WAV。• 使用 8000 Hz 取樣率的電話音訊。

    轉錄數字當您使用此 StartTranscriptionJob (p. 147) 操作轉錄美式英文、澳洲英文、英式英文或印度英文音訊時,數值會轉錄為數字而非單詞。對於串流轉錄,數值只會轉錄為美式英文和英式英文的數字。例如,口述「一千兩百四十二」將轉錄為「1242」。

    用於所有其他語言時,數字會轉錄為該語言的字詞形式。

    數字轉錄將依下列規則進行:

    規則 描述

    將大於十的基數轉換成數字 • 「五十五」> 55• 「一百」> 100• 「一千零三十一」> 1031• 「一億二千三百四十五萬六千七百八十九」>

    123,456,789

    當「百萬」或「億」後面沒有數字時,將基數後面接著「百萬」或「億」的數字轉換為數字後接著字詞。

    • 「一億」> 1 億• 「十億」> 10 億• 「二點三百萬」> 230 萬

    將大於十的序數轉換成數字 • 「四十三」> 43rd• 「二十六街」> 26th avenue

    將分數轉換成數字形式。 • 「四分之一」> 1/4• 「十六分之三」> 3/16• 「一半」> 1/2• 「一百」> 1/100

    將一行中超過一位但不到十位的數值轉換成數字。 • 「三四五」> 345• 「我的電話號碼是四二五五五五一二一二」>

    4255551212

    小數點以「點」表示。 • 「三百零三點五」> 303.5• 「三點二十三」 > 3.23• 「零點四」> 0.4• 「點三」 > 0.3

    將數字後的「百分比」轉換成百分比符號 (%)。 • 「百分之二十三」> 23%• 「百分之二十三點四五」> 23.45%

    將數字後的字詞「元」、「美元」、「澳幣」、「AUD」或「USD」轉換成數字前的美元符號 ($)。

    • 「一元又十五分」> $1.15• 「23 USD」> $23• 「二十三澳幣」> $23

    6

  • Amazon Transcribe 開發人員指南替代轉錄

    規則 描述

    將數字後面的字詞「鎊」、「英鎊」或「GDB」轉換為數字前的英鎊符號(£)。

    • 「二十三鎊」> £23• 「我有兩千鎊」> 我有 £2,000• 「五鎊三十三便士」> £5.33

    將數字後的字詞「盧比」、「印度盧比」或「INR」轉換為數字前的盧比符號 (#)。

    • 「二十三盧比」> #23• 「五十盧比三十派士」> #50.30

    將時間轉換成數字。 • 「早上七點東部標準時間」> 7 a.m. easternstandard time

    • 「下午一二點三十」> 12:30 p.m.

    將兩位數表示的年份合併為四位數。

    僅適用於 20、21 和 22 世紀。

    • 「一九六二」> 1962• 「二零一二年」> the year is 2012• 「二零一九」> 2019• 「二一三零」> 2130

    轉換日期成為數字。 • 「五月五日二零一二」> May 5th 2012• 「五月五日二零一二」> May 5 2012• 「二零一二年五月五日」> 5 May 2012

    使用「到」表達連續範圍數字。 • 「二十三到三十七」> 23 to 37

    替代轉錄當 Amazon Transcribe 轉錄音訊檔案時,它會傳回可信度最高的轉錄。您可以指定 Amazon Transcribe 傳回可信度較低的其他轉錄。使用替代轉錄來查看所轉錄音訊的不同解釋。例如,在使用人員能夠審核轉錄的應用程式中,您可以提供可供人員選擇的替代轉錄。替代轉錄僅適用於 StartTranscriptionJob (p. 147) 操作。

    您可以使用主控台或使用 Amazon Transcribe API,將 Amazon Transcribe 設定為傳回替代轉錄。若要使用API 取得替代轉錄,請將 ShowAlternatives 欄位設定為 true,並將 MaxAlternatives 欄位設定為當您呼叫 StartTranscriptionJob (p. 147) 作業時要傳回的替代項目個數。您可以指定 Amazon Transcribe 傳回最多不超過 10 個的替代轉錄。

    替代轉錄可以組合喇叭識別碼和聲道識別碼。替代轉錄可供所有支援語言使用。

    替代項目會顯示在轉錄的區段層級上。區段會依語音中的自然停頓而決定,例如,喇叭變更或音訊暫停。例如,「今天在西雅圖下雨,但波特蘭沒下雨」這個口說片語分為兩部分:「今天在西雅圖下雨」和「但波特蘭沒下雨」。

    Amazon Transcribe 會在回應中傳回您的音訊檔案的整體轉錄。當 Amazon Transcribe 已設成要傳回替代項目時,整體轉錄就會從可信度最高的區段替代項目開始建立。替代轉錄已透過輸出 JSON,以 segments 結構傳回。如果找 Amazon Transcribe 不到替代項目,則其傳回的項目數目會少於 MaxAlternatives 欄位中所指定的替代項目數目。

    以下是來自 Amazon Transcribe 的 JSON 輸出。這是此輸入的轉錄輸出:"呃,如果我沒接到電話,你可以打這個號碼,然後留言,我就會回覆你。好的。這就是號碼。你是說 1166 號碼?"

    以下是 ShowAlternatives 設為 false 的 JSON 輸出。

    { "results": { "transcripts": [

    7

  • Amazon Transcribe 開發人員指南替代轉錄

    "Uh, you can just call this number if I don't pick up and leave a voicemail and I'll get back to you. Okay. And that's the number. The 1166 number, you mean" ], "items": [ { "start_time": 12.35, "end_time": 12.57, "alternatives": [ { "confidence": 0.9989, "content": "Uh" } ], "type": "pronunciation" }, Items removed for brevity. ] }}

    以下是輸入相同,但 ShowAlternatives 設為 true、而 MaxAlternatives 設為 2 的 JSON 輸出 。

    { "results": { "transcripts": [ "Uh, you can just call this number if I don't pick up and leave a voicemail and I'll get back to you. Okay. And that's the number. The 1166 number, you mean" ], "items": [ { "start_time": 12.35, "end_time": 12.57, "alternatives": [ { "confidence": 0.9989, "content": "Uh" } ], "type": "pronunciation" }, Items removed for brevity.. ], "segments": [ { "start_time": 11.84, "end_time": 19.665, "alternatives": [ { "transcript": "Uh, you can just call this number if I don't pick up and leave a voicemail and I'll get back to you.", "items": [ { "start_time": 12.35, "end_time": 12.57, "confidence": 0.9989, "content": "Uh", "type": "pronunciation" }, Items removed for brevity. { "start_time": 16.42, "end_time": 16.52, "confidence": 0.7572, "content": "and", "type": "pronunciation"

    8

  • Amazon Transcribe 開發人員指南識別講者

    }, Items removed for brevity. ] }, { "transcript": "Uh, you can just call this number if I don't pick up, just leave a voicemail and I'll get back to you.", "items": [ { "start_time": 12.35, "end_time": 12.57, "confidence": 0.9989, "content": "Uh", "type": "pronunciation" }, Items removed for brevity.. { "start_time": 16.42, "end_time": 16.52, "content": ",", "type": "punctuation" }, { "start_time": 16.42, "end_time": 16.52, "confidence": 0.8934, "content": "just", "type": "punctuation" }, Items removed for brevity.. ] }, Alternatives removed for brevity. ] }, Segments removed for brevity.. ] }}

    識別講者您可以讓 Amazon Transcribe 識別音訊剪輯中的不同講者,此項程序稱為自動分段標記或講者識別。當您啟用講者識別功能時,Amazon Transcribe 會以其識別出的講者標示每個片段。

    您可以指定 Amazon Transcribe 要在音訊剪輯中識別 2 到 10 位講者。您要求識別的講者人數符合輸入音訊中的講者人數時,即可獲得最佳效能。

    若要開啟講者識別功能,請在呼叫 MaxSpeakerLabels 操作時,設定 ShowSpeakerLabels 欄位的Settings 和 StartTranscriptionJob (p. 147) 欄位。您必須設定這兩個欄位,否則 Amazon Transcribe 將傳回例外狀況。

    當 Amazon Transcribe 完成轉錄工作,它會建立包含結果的 JSON 檔案,並將檔案儲存於 S3 儲存貯體。檔案以使用者特定 URI 識別。請使用此 URI 取得結果。

    以下是一段簡短音訊檔案的 JSON 檔案:

    { "jobName": "job ID", "accountId": "account ID",

    9

  • Amazon Transcribe 開發人員指南轉錄串流音訊

    "results": { "transcripts": [{ "transcript": "Professional answer." }], "speaker_labels": { "speakers": 1, "segments": [{ "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [{ "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" }] }] }, "items": [{ "start_time": "0.100", "end_time": "0.690", "alternatives": [{ "confidence": "0.8162", "content": "Professional" }], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [{ "confidence": "0.9939", "content": "answer" }], "type": "pronunciation" }, { "alternatives": [{ "content": "." }], "type": "punctuation" }] }, "status": "COMPLETED"}

    轉錄串流音訊串流轉錄會為您的音訊資料截取串流並進行即時轉錄。它使用 HTTP/2 或 WebSocket 串流,因此在您將更多音訊傳送到 Amazon Transcribe 時,轉錄結果將會傳回到您的應用程式。當您想要讓即時音訊轉錄結果立即可用,又或者您擁有的音訊檔案需要在處理同時進行轉錄,您可以使用串流轉錄。

    您可以使用串流轉錄與以下語言搭配:

    • 澳洲英文 (en-AU)• 英式英文 (en-GB)• 美式英文 (en-US)• 法文 (fr-FR)• 加拿大法文 (fr-CA)

    10

  • Amazon Transcribe 開發人員指南聲道識別

    • 美國西班牙文 (es-US)

    如需進一步了解,請參閱串流轉錄 (p. 57)。

    聲道識別當您想要轉錄的音訊檔案具有多個聲道,並且想要個別轉錄所識別的語音聲道時,請使用聲道識別。例如,如果您有客戶支援代表在一個聲道且客戶在另一個聲道,您可以使用聲道識別建立由每個聲道識別的轉錄,以及合併聲道的單一轉錄。

    Amazon Transcribe 將您的音訊檔案分割成多個聲道,並且個別轉錄聲道。在轉錄所有聲道後,AmazonTranscribe 也會合併轉錄以建立單一轉錄。其會以單一結果檔案傳回所有的轉錄。

    講者的表達用語是依開始時間排序。表達用語是音訊聲道的語音單位,通常會以靜音區分其他表達用語。如果在某個聲道的表達用語與另一個聲道的表達用語重疊,Amazon Transcribe 會在轉錄中以開始時間排序。輸入音訊中重疊的表達用語在轉錄輸出中不會重疊。

    您可以在 Amazon Transcribe 主控台或 API 中啟用聲道識別。在主控台中,當您建立轉錄工作時,請選擇Channel identification (聲道識別)。若您使用的是 API,請於呼叫 StartTranscriptionJob (p. 147) 操作時設定 ChannelIdentification 旗標。

    以下是雙聲道交談的簡要輸出:

    { "jobName": "job id", "accountId": "account id", "results": { "transcripts": [ { "transcript": "When you try ... It seems to ..." } ], "channel_labels": { "channels": [ { "channel_label": "ch_0", "items": [ { "start_time": "12.282", "end_time": "12.592", "alternatives": [ { "confidence": "1.0000", "content": "When" } ], "type": "pronunciation" }, { "start_time": "12.592", "end_time": "12.692", "alternatives": [ { "confidence": "0.8787", "content": "you" } ], "type": "pronunciation" },

    11

  • Amazon Transcribe 開發人員指南自訂詞彙

    { "start_time": "12.702", "end_time": "13.252", "alternatives": [ { "confidence": "0.8318", "content": "try" } ], "type": "pronunciation" }, Transcription abbreviated ] }, { "channel_label": "ch_1", "items": [ { "start_time": "12.379", "end_time": "12.589", "alternatives": [ { "confidence": "0.5645", "content": "It" } ], "type": "pronunciation" }, { "start_time": "12.599", "end_time": "12.659", "alternatives": [ { "confidence": "0.2907", "content": "seems" } ], "type": "pronunciation" }, { "start_time": "12.669", "end_time": "13.029", "alternatives": [ { "confidence": "0.2497", "content": "to" } ], "type": "pronunciation" }, Transcription abbreviated ] }}

    自訂詞彙主題

    • 使用清單建立自訂詞彙 (p. 13)• 使用資料表建立自訂詞彙 (p. 14)• 自訂詞彙的字元集 (p. 15)

    12

  • Amazon Transcribe 開發人員指南使用清單建立自訂詞彙

    您可以建立自訂詞彙,提供 Amazon Transcribe 更多關於如何處理您輸入檔案內語音的資訊。自訂詞彙是您想要 Amazon Transcribe 在您的音訊輸入中辨識的專屬文字清單。這些通常是特定領域的字組和詞組、Amazon Transcribe 未辨識出的字組,或適當的名詞。

    自訂詞彙最適合用來將特定字組或詞組設成目標。我們建議您建立個別且針對特定音訊錄製量身打造的小型詞彙,而不是建立單一詞彙,其中具有許多要用於所有錄製的術語。您的帳戶最多可有 100 個詞彙。自訂詞彙的大小限制為 50 Kb。

    您可以在文字檔中指定自訂詞彙。您可以指定詞彙中的字組清單,或指定四欄資料表,讓您可以進一步控制自訂詞彙中字組的輸入和輸出。

    如需建立自訂詞彙的詳細資訊,請參閱使用清單建立自訂詞彙 (p. 13)和使用資料表建立自訂詞彙 (p. 14)。

    若要建立自訂詞彙,請使用 CreateVocabulary (p. 116) 操作或 Amazon Transcribe 主控台。提交CreateVocabulary 請求後,Amazon Transcribe 即會處理詞彙。若要查看詞彙的處理狀態,請使用主控台或 GetVocabulary (p. 132) 操作。

    Note

    如果您是使用 Amazon Transcribe 主控台來上傳自訂詞彙,則必須使用語彙清單,而非詞彙表。若要使用主控台,以利用詞彙表來建立自訂詞彙,則來源檔案必須在 Amazon S3 儲存貯體中。

    若要使用自訂詞彙,請在呼叫 StartTranscriptionJob (p. 147) 操作時,設定 Settings 欄位的VocabularyName 欄位,或在建立轉錄工作時,於主控台中選擇詞彙。

    使用清單建立自訂詞彙您可以在文字檔中使用字組或詞組清單來建立自訂詞彙。您可以將每個字組放在其專屬行上,或者可以將多個字組放在單一行上,然後以逗號區隔字組或詞組。

    每個項目必須包含:

    • 少於 256 個字元,連字號包括在內• 僅限來自於允許字元集的字元

    如需有效字元集,請參閱 自訂詞彙的字元集 (p. 15)。

    如果項目是詞組清單,請使用連字號區隔詞組的字組。例如,如果詞組是 Los Angeles,您將在檔案中將其輸入為 Los-Angeles。

    字首語或其他字組的字母如應單獨發音,請在單一字母後面輸入點,例如 A.B.C. 或 F.B.I.。若要輸入字首語的複數形式,例如 "ABCs",請以連字號區隔字首語中的 "s":A.B.C.-s。您可以擇一使用大寫或小寫字母來輸入字首語。以下語言支援縮寫:

    • 荷蘭文• 所有英文變體• 所有法文變體• 所有德文變體• 北印度文• 印尼文• 義大利文• 馬來文• 所有葡萄牙文變體• 所有西班牙文變體• 土耳其文

    13

    https://console.aws.amazon.com/transcribe/

  • Amazon Transcribe 開發人員指南使用資料表建立自訂詞彙

    以下範例顯示一個輸入檔案,其中詞彙字組及詞組位於個別行上:

    Los-AngelesF.B.I.Etienne

    以下範例顯示一個輸入檔案,其中詞彙字組及詞組位於單一行上,以逗號區隔:

    Los-Angeles,F.B.I.,Etienne

    使用資料表建立自訂詞彙您可以在文字檔中建立資料表來建立自訂詞彙。資料表中的每個資料列不是字組就是詞組,其後接著選用的IPA、SoundsLike 和 DisplayAs 欄位。每個欄位必須包含:

    • 少於 256 個字元,連字號包括在內• 僅限來自於允許字元集的字元

    如需有效字元集,請參閱自訂詞彙的字元集 (p. 15)。

    將每個字組或詞組放在文字檔的個別行上。以 TAB 字元分隔欄位。將這個檔案 (副檔名為 .txt) 儲存在Amazon S3 儲存貯體中,而此儲存貯體所在區域即是您呼叫 API 之處。

    以下範例是文字格式的輸入檔案。這些範例會使用空格來對齊欄。您的輸入檔案應使用 TAB 字元來分隔欄。僅在 IPA 和 DisplayAs 欄中包含空格。如果您複製這些範例,請移除欄之間的多餘空格,並以 TAB 字元取代 "[TAB]"。

    Phrase [TAB]IPA [TAB]SoundsLike[TAB]DisplayAsLos-Angeles[TAB] [TAB] [TAB]Los AngelesF.B.I. [TAB]ɛ f b i aɛ[TAB] [TAB]FBIEtienne [TAB] [TAB]eh-tee-en [TAB]

    輸入資料欄的順序不拘。以下亦是對自訂詞彙輸入檔案有效的結構。

    Phrase [TAB]SoundsLike[TAB]IPA [TAB]DisplayAsLos-Angeles[TAB] [TAB] [TAB]Los AngelesF.B.I [TAB] [TAB]ɛ f b i aɛ[TAB]FBIEtienne [TAB]eh-tee-en [TAB] [TAB]

    DisplayAs [TAB]SoundsLike[TAB]IPA [TAB]PhraseLos Angeles[TAB] [TAB] [TAB]Los-AngelesFBI [TAB] [TAB]ɛ f b i aɛ[TAB]F.B.I. [TAB]eh-tee-en [TAB] [TAB]Etienne

    • 詞組 – 應可辨識的字組或詞組。

    如果項目是詞組,請以連字號 (-) 區隔字組。例如,您可以將 Los Angeles 以 Los-Angeles 的形式輸入。

    字首語或其他單字的字母如應單獨發音,請在單一字母後面接著輸入點,例如 A.B.C. 或 F.B.I.。若要輸入字首語的複數形式,例如 "ABCs",請以連字號區隔字首語中的 "s":"A.B.C.-s。"您可以擇一使用大寫或小寫字母來輸入縮寫。如需支援縮寫的語言清單,請參閱使用清單建立自訂詞彙 (p. 13)。

    14

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    Phrase 欄位是必要的。您可對輸入語言使用任何允許的字元。如需允許的字元清單,請參閱個別語言。如果您未指定 DisplayAs 欄位,則 Amazon Transcribe 會在輸出檔案中使用 Phrase 欄位的內容。

    • IPA – 若要指定字組或詞組的發音,您可以將國際音標 (IPA) 中的字元併入這個欄位中。IPA 欄位不能包含前導或尾端空格,而且您必須使用單一空格來區隔輸入中的每個音素。例如,在英文中您可將詞組 Los-Angeles 輸入為 l ɔ s æ n ɔ ɔ l ɔ s。亦可將詞組 F.B.I. 輸入為 ɔ f b i aɔ。

    如果未指定 IPA 欄位的內容,則必須包括空白 IPA 欄位。如果指定 IPA 欄位,則無法指定 SoundsLike欄位。

    如需特定語言允許的 IPA 字元清單,請參閱個別語言的資料表。• SoundsLike – 您可以將字組或詞組分成較小的片段,並使用語言的標準正寫法來提供每個片段的發音,

    以模擬字組發聲的方式。例如,在英文中您可以提供詞組 Los-Angeles 的發音提示,如下所示:loss-ann-gel-es。字組 Etienne 的提示如下所示:eh-tee-en。您可以使用連字號 (-) 區隔提示的每個部分。

    如果未指定 SoundsLike 欄位,則必須包括空白 SoundsLike 欄位。如果指定 SoundsLike 欄位,則無法指定 IPA 欄位。

    您可對輸入語言使用任何允許的字元。如需允許的字元清單,請參閱個別語言。• DisplayAs – 定義字組或詞組為輸出時的樣子。例如,如果字組或詞組為 Los-Angeles,則您可以將顯示

    形式指定為 "Los Angeles",以便連字號不會出現在輸出中。

    如果您未指定 DisplayAs 欄位,則 Amazon Transcribe 會在輸出中使用來自輸入檔案的 Phrase 欄位。

    您可以在 DisplayAs 欄位中使用任何 UTF-8 字元。

    自訂詞彙的字元集Amazon Transcribe 限制您可以用來建立自訂詞彙的字元。您可以針對每個語言使用以下字元集。

    主題• 阿拉伯文字元集 (p. 16)• 中文字元集 (p. 17)• 荷蘭文字元集 (p. 18)• 英文字元集 (p. 19)• 波斯文字元集 (p. 20)• 法文字元集 (p. 22)• 德文字元集 (p. 23)• 希伯來文字元集 (p. 24)• 印地語字元集 (p. 25)• 印尼文字元集 (p. 27)• 義大利文字元集 (p. 28)• 日文字元集 (p. 30)• 韓文字元集 (p. 31)• 馬來文字元集 (p. 32)• 葡萄牙文字元集 (p. 32)• 俄文字元集 (p. 34)• 西班牙文字元集 (p. 36)• 坦米爾文字元集 (p. 37)• 特拉古文字元集 (p. 39)

    15

    https://en.wikipedia.org/wiki/International_Phonetic_Alphabet

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    • 土耳其文字元集 (p. 41)

    阿拉伯文字元集若是阿拉伯文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元。您也可以使用連字號 (-)字元來分隔單字。

    字元 程式碼 字元 程式碼

    ء 0621 س 0633

    آ 0622 ش 0634

    أ 0623 ص 0635

    ؤ 0624 ض 0636

    إ 0625 ط 0637

    ئ 0626 ظ 0638

    ا 0627 ع 0639

    ب 0628 غ 063A

    ة 0629 ف 0641

    ت 062A ق 0642

    ث 062B ك 0643

    ج 062C ل 0644

    ح 062D م 0645

    خ 062E ن 0646

    د 062F ه 0647

    ذ 0630 و 0648

    ر 0631 ى 0649

    ز 0632 ي 064A

    您可以在詞彙輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 tˤ 0074 02E4

    aː 0061 02D0 u 0075

    b 0062 uː 0075 02D0

    d 0064 v 0076

    dˤ 0064 02E4 w 0077

    16

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    f 0066 x 0078

    h 0068 z 007A

    i 0069 zˤ 007A 02E4

    iː 0069 02D0 ð 00F0

    j 006A ðˤ 00F0 02E4

    k 006B ħ 0127

    l 006C ɣ 0263

    m 006D ɪ 026A

    n 006E ɫ 026B

    p 0070 ʃ 0283

    q 0071 ʒ 0292

    r 0072 ʔ 0294

    s 0073 ʕ 0295

    sˤ 0073 02E4 θ 03B8

    t 0074 χ 03C7

    中文字元集對於中文自訂字彙,Phrase 使用下面由 GitHub 檔案列出的任何字元。

    • chinese-character-set.txt

    SoundsLike 欄位可以包含下列 GitHub 檔案中列出的拼音音節。

    • pinyin-set.txt

    當您在 SoundsLike 欄位中使用拼音音節時,請使用連字號 (-) 分隔音節。

    Amazon Transcribe 使用數字表示國語的四個音調。下表顯示如何為字詞 "ma" 顯示音調標記。

    音調 音調標記 音調數字

    音調 1 mā ma1

    音調 2 má ma2

    音調 3 mǎ ma3

    音調 4 mà ma4

    中文自訂詞彙不會使用此 IPA 欄位,但您仍必須在詞彙表中加入 IPA 標頭。

    17

    https://github.com/awsdocs/amazon-transcribe-developer-guide/blob/master/doc_source/chinese-character-set.txthttps://github.com/awsdocs/amazon-transcribe-developer-guide/blob/master/doc_source/pinyin-set.txt

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    以下範例是文字格式的輸入檔案。此範例會使用空格來對齊欄。您的輸入檔案應使用 TAB 字元來分隔欄。僅在 DisplayAs 欄中包含空格。

    Phrase SoundsLike IPA DisplayAsɛɛ kang1-jian4ɛɛ qian3-ze2ɛɛɛɛ guo2-fang2-da4-chen2ɛɛɛɛɛ shi4-jie4-bo4-lan3-hui4 ɛɛɛ

    荷蘭文字元集若是荷蘭文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元。

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    您也可以在 Phrase 和 SoundsLike 欄位中使用下列 Unicode 字元:

    字元 程式碼 字元 程式碼

    à 00E0 î 00EE

    á 00E1 ï 00EF

    â 00E2 ñ 00F1

    ä 00E4 ò 00F2

    ç 00E7 ó 00F3

    è 00E8 ô 00F4

    é 00E9 ö 00F6

    ê 00EA ù 00F9

    ë 00EB ú 00FA

    ì 00EC û 00FB

    í 00ED ü 00FC

    您可以在詞彙輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a: 0061 003A z 007A

    bː 0062 02D0 ø: 00F8 003A

    b 0062 ŋ 014B

    18

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    d 0064 œy 0153 0079

    eː 0065 02D0 œː 0153 02D0

    f 0066 ɑ 0251

    g 0067 ɔ 0254

    i 0069 ɔu 0254 0075

    j 006A ɔː 0254 02D0

    k 006B ə 0259

    l 006C ɛ 025B

    m 006D ɛ: 025B 003A

    n 006E ɛi 025B 0069

    oː 006F 02D0 ɦ 0266

    p 0070 ɪ 026A

    s 0073 ɲ 0272

    t 0074 ɾ 027E

    u 0075 ʃ 0283

    v 0076 ʏ 028F

    w 0077 ʒ 0292

    y 0079 χ 03C7

    英文字元集若是英文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    您可以在詞彙輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    aʊ 0061 028A w 0077

    aɪ 0061 026A z 007A

    b 0062 æ 00E6

    19

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    d 0064 ð 00F0

    eɪ 0065 026A ŋ 014B

    f 0066 ɑ 0251

    g 0067 ɔ 0254

    h 0068 ɔɪ 0254 026A

    i 0069 ə 0259

    j 006A ɛ 025B

    k 006B ɝ 025D

    l 006C ɡ 0261

    l̩ 006C 0329 ɪ 026A

    m 006D ɹ 0279

    n 006E ʃ 0283

    n̩ 006E 0329 ʊ 028A

    oʊ 006F 028A ʌ 028C

    p 0070 ʍ 028D

    s 0073 ʒ 0292

    t 0074 ʤ 02A4

    u 0075 ʧ 02A7

    v 0076 θ 03B8

    波斯文字元集若是波斯文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元。

    字元 程式碼 字元 程式碼

    ء 0621 ظ 0638

    آ 0622 ع 0639

    أ 0623 غ 063A

    ؤ 0624 ف 0641

    ئ 0626 ق 0642

    ا 0627 ل 0644

    ب 0628 م 0645

    ت 062A ن 0646

    20

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    ث 062B ه 0647

    ج 062C و 0648

    ح 062D َ 064E

    خ 062E ُ 064F

    د 062F ِ 0650

    ذ 0630 ّ 0651

    ر 0631 پ 067E

    ز 0632 چ 0686

    س 0633 ژ 0698

    ش 0634 ک 06A9

    ص 0635 گ 06AF

    ض 0636 ی 06CC

    ط 0637    

    您可以在詞彙檔案的 IPA 欄位中使用下列國際音標:

    字元 程式碼 字元 程式碼

    b 0062 u 0075

    d 0064 v 0076

    f 0066 z 007A

    g 0067 æ 00E6

    h 0068 ɒ 0252

    i 0069 ɛ 025B

    j 006A ɾ 027E

    k 006B ʁ 0281

    l 006C ʃ 0283

    m 006D ʒ 0292

    n 006E ʔ 0294

    o 006F ʔ 0294

    p 0070 ʤ 02A4

    s 0073 ʧ 02A7

    t 0074 χ 03C7

    21

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    法文字元集若是法文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    您也可以在 Phrase 和 SoundsLike 欄位中使用下列 Unicode 字元:

    字元 程式碼 字元 程式碼

    À 00C0 à 00E0

    Â 00C2 â 00E2

    Ç 00C7 ç 00E7

    È 00C8 è 00E8

    É 00C9 é 00E9

    Ê 00CA ê 00EA

    Ë 00CB ë 00EB

    Î 00CE î 00EE

    Ï 00CF ï 00EF

    Ô 00D4 ô 00F4

    Ö 00D6 ö 00F6

    Ù 00D9 ù 00F9

    Û 00DB û 00FB

    Ü 00DC ü 00FC

    您可以在詞彙檔案的 IPA 欄位中使用下列國際音標:

    字元 程式碼 字元 程式碼

    a 0061 z 007A

    b 0062 ã 00E3

    d 0064 õ 00F5

    e 0065 ø 00F8

    f 0066 ŋ 014B

    i 0069 œ 0153

    22

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    j 006A œ̃ 0153 0303

    k 006B ɐ 0250

    l 006C ɔ 0254

    m 006D ə 0259

    n 006E ɛ 025B

    o 006F ɡ 0261

    p 0070 ɥ 0265

    s 0073 ɲ 0272

    t 0074 ʁ 0281

    u 0075 ʃ 0283

    v 0076 ʒ 0292

    w 0077 ẽ 1EBD

    y 0079    

    德文字元集若是德文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    您也可以在 Phrase 和 SoundsLike 欄位中使用下列 Unicode 字元:

    字元 程式碼 字元 程式碼

    ä 00E4 Ä 00C4

    ö 00F6 Ö 00D6

    ü 00FC Ü 00DC

    ß 00DF    

    您可以在詞彙輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 ts 0074 0073

    23

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    aɪ 0061 026A uː 0075 02D0

    aʊ 0061 028A v 0076

    aː 0061 02D0 x 0078

    b 0062 z 007A

    d 0064 yː 0079 02D0

    eː 0065 02D0 ã 00E3

    f 0066 ç 00E7

    g 0067 øː 00F8 02D0

    h 0068 ŋ 014B

    iː 0069 02D0 œ 0153

    j 006A ɐ̯ 0250 032F

    k 006B ɔ 0254

    l 006C ɔʏ 0254 028F

    l̩ 006C 0329 ə 0259

    m 006D ɛ 025B

    m̩ 006D 0329 ɛː 025B 02D0

    n 006E ɪ 026A

    n̩ 006E 0329 ʁ 0281

    oː 006F 02D0 ʃ 0283

    p 0070 ʊ 028A

    pf 0070 0066 ʏ 028F

    s 0073 ʧ 02A7

    t 0074    

    希伯來文字元集若是希伯來文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    字元 程式碼 字元 程式碼

    - 002D ם 05DD

    א 05D0 מ 05DE

    ב 05D1 ן 05DF

    ג 05D2 נ 05E0

    24

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    ד 05D3 ס 05E1

    ה 05D4 ע 05E2

    ו 05D5 ף 05E3

    ז 05D6 פ 05E4

    ח 05D7 ץ 05E5

    ט 05D8 צ 05E6

    י 05D9 ק 05E7

    ך 05DA ר 05E8

    כ 05DB ש 05E9

    ל 05DC ת 05EA

    您可以在詞彙輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 p 0070

    b 0062 s 0073

    d 0064 t 0074

    e 0065 u 0075

    f 0066 v 0076

    g 0067 w 0077

    h 0068 z 007A

    i 0069 ŋ 014B

    j 006A ɣ 0263

    k 006B ʃ 0283

    l 006C ʒ 0292

    m 006D ʔ 0294

    n 006E χ 03C7

    o 006F    

    印地語字元集若是印地語自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    25

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    - 002D थ 0925

    . 002E द 0926

    ँ 0901 ध 0927

    ं 0902 न 0928

    ः 0903 प 092A

    अ 0905 फ 092B

    आ 0906 ब 092C

    इ 0907 भ 092D

    ई 0908 म 092E

    उ 0909 य 092F

    ऊ 090A र 0930

    ऋ 090B ल 0932

    ए 090F व 0935

    ऐ 0910 श 0936

    ओ 0913 ष 0937

    औ 0914 स 0938

    क 0915 ह 0939

    ख 0916 ा 093E

    ग 0917 ि 093F

    घ 0918 ी 0940

    ङ 0919 ु 0941

    च 091A ू 0942

    छ 091B ृ 0943

    ज 091C ॅ 0945

    झ 091D े 0947

    ञ 091E ै 0948

    ट 091F ॉ 0949

    ठ 0920 ो 094B

    ड 0921 ौ 094C

    ढ 0922 ् 094D

    ण 0923 ज़ 095B

    26

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    त 0924    

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    aː 0097 0720 ŋ 0331

    b 0098 ɖ 0598

    bʱ 0098 0689 ɔː 0596 0720

    d 0100 ɖʱ 0598 0689

    dʱ 0100 0689 ə 0601

    eː 0101 0720 ɛː 0603 0720

    f 0102 ɡ 0609

    iː 0105 0720 ɡʱ 0609 0689

    j 0106 ɦ 0614

    k 0107 ɪ 0618

    kʰ 0107 0688 ɲ 0626

    l 0108 ɳ 0627

    m 0109 ɾ 0638

    n 0110 ʂ 0642

    oː 0111 0720 ʃ 0643

    p 0112 ʈ 0648

    pʰ 0112 0688 ʈʰ 0648 0688

    r 0114 ʊ 0650

    s 0115 ʋ 0651

    t 0116 ʤ 0676

    tʰ 0116 0688 ʤʱ 0676 0689

    uː 0117 0720 ʧ 0679

    z 0122 ʧʰ 0679 0688

    印尼文字元集若是印尼文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z

    27

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    • A - Z• ' (單引號)• - (連字號)• . (句點)

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 r 0072

    ai 0061 0069 s 0073

    au 0061 0075 t 0074

    b 0062 tʃ 0074 0283

    d 0064 u 0075

    d 0064 v 0076

    e 0065 w 0077

    f 0066 x 0078

    h 0068 y 0079

    i 0069 ŋ 014B

    j 006A ɔ 0254

    k 006B ə 0259

    l 006C ɛ 025B

    m 006D ɡ 0261

    n 006E ɣ 0263

    o 006F ɪ 026A

    oi̯ 006F 0069 032F ɲ 0272

    p 0070 ʃ 0283

    q 0071 ʊ 028A

    義大利文字元集若是義大利文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    28

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    您也可以在 Phrase 和 SoundsLike 欄位中使用下列 Unicode 字元:

    字元 程式碼 字元 程式碼

    À 00C0 à 00E0

    Ä 00C4 ä 00E4

    Ç 00C7 ç 00E7

    È 00C8 è 00E8

    É 00C9 é 00E9

    Ê 00CA ê 00EA

    Ë 00CB ë 00EB

    Ì 00CC ì 00EC

    Ò 00D2 ò 00F2

    Ù 00D9 ù 00F9

    Ü 00DC ü 00FC

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 ss 0073 0073

    b 0062 t 0074

    bb 0062 0062 tt 0074 0074

    d 0064 u 0075

    dd 0064 0064 v 0076

    e 0065 vv 0076 0076

    f 0066 w 0077

    ff 0066 0066 z 007A

    gg 0067 0067 ɔ 0254

    i 0069 ɛ 025B

    j 006A ɡ 0261

    k 006B ɲ 0272

    kk 006B 006B ɲɲ 0272 0272

    l 006C ʃ 0283

    ll 006C 006C ʃʃ 0283 0283

    m 006D ʎ 028E

    29

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    mm 006D 006D ʎʎ 028e 028e

    n 006E ʣ 02A3

    nn 006E 06E ʣʣ 02A3 02A3

    o 006F ʤ 02A4

    p 0070 ʤʤ 02A4 02A4

    pp 0070 0070 ʦ 02A6

    r 0072 ʦʦ 02A6 02A6

    rr 0072 0072 ʧ 02A7

    s 0073 ʧʧ 02A7 02A7

    日文字元集對於日文自訂字彙,Phrase 欄位可使用下面由 GitHub 檔案列出的任何字元。

    • japanese-character-set.txt

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 p 0070

    aː 0061 02D0 s 0073

    b 0062 t 0074

    d 0064 ts 0074 0073

    dz 0064 007A tɕ 0074 0255

    dʑ 0064 0291 w 0077

    e 0065 z 007A

    eː 0065 02D0 ç 00E7

    g 0067 ŋ 014B

    h 0068 ɕ 0255

    i 0069 ɯ 026F

    iː 0069 02D0 ɯː 026F 02D0

    j 006A ɴ 0274

    k 006B ɸ 0278

    m 006D ɾ 027E

    30

    https://github.com/awsdocs/amazon-transcribe-developer-guide/blob/master/doc_source/japanese-character-set.txt

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    n 006E ʑ 0291

    o 006F ʔ 0294

    oː 006F 02D0    

    韓文字元集若是韓文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用諺文音節。如需詳細資訊,請參閱維基百科上的諺文音節。

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 00061 s# 0073 0348

    e 00065 t 0074

    h 00068 tɕ 0074 0255

    i 00069 tɕʰ 0074 0255 02B0

    je 006A 0065 tʰ 0074 02B0

    jo 006A 006F t# 0074 0348

    ju 006A 0075 t#ɕ 0074 0348 0255

    jɛ 006A 025B u 0075

    jʌ 006A 028C we 0077 0065

    ja 006A 0061 wi 0077 0069

    k 006B wɛ 0077 025B

    kʰ 006B 02B0 wʌ 0077 028C

    k# 006B 0348 wa 0077 0061

    l 006C ø 00F8

    m 006D ŋ 0014B

    n 006E ɛ 0025B

    o 006F ɯ 026F

    p 0070 ɯi 006F 0069

    pʰ 0070 02B0 ɾ 027E

    p# 0070 0348 ʌ 028C

    s 0073    

    31

    https://en.wikipedia.org/wiki/Hangul_Syllables

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    馬來文字元集若是馬來文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    F 0046 r 0072

    a 0061 s 0073

    ai 0061 0069 t 0074

    au 0061 0075 tʃ 0074 0283

    b 0062 v 0076

    d 0064 w 0077

    dʒ 0064 0292 x 0078

    e 0065 y 0079

    h 0068 ŋ 014B

    i 0069 ɔ 0254

    j 006A ə 0259

    k 006B ɛ 025B

    l 006C ɡ 0261

    m 006D ɣ 0263

    n 006E ɪ 026A

    o 006F ɲ 0272

    oi̯ 006F 0069 32F ʃ 0283

    p 0070 ʊ 028A

    q 0071 ʊi 028A 0069

    葡萄牙文字元集若是葡萄牙文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z

    32

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    • A - Z• ' (單引號)• - (連字號)• . (句點)

    您也可以在 Phrase 和 SoundsLike 欄位中使用下列 Unicode 字元:

    字元 程式碼 字元 程式碼

    À 00C0 à 00E0

    Á 00C1 á 00E1

    Â 00C2 â 00E2

    Ã 00C3 ã 00E3

    Ä 00C4 ä 00E4

    Ç 00C7 ç 00E7

    È 00C8 è 00E8

    É 00C9 é 00E9

    Ê 00CA ê 00EA

    Ë 00CB ë 00EB

    Í 00CD í 00ED

    Ñ 00D1 ñ 00F1

    Ó 00D3 ó 00F3

    Ô 00D4 ô 00F4

    Õ 00D5 õ 00F5

    Ö 00D6 ö 00F6

    Ú 00DA ú 00FA

    Ü 00DC ü 00FC

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 v 0076

    b 0062 w 0077

    d 0064 w̃ 0077 0303

    e 0065 z 007A

    f 0066 õ 00F5

    33

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    g 0067 ĩ 00129

    i 0069 ũ 00169

    j 006A ɐ̃ 0250 0303

    k 006B ɔ 0254

    l 006C ɛ 025B

    m 006D ɲ 0272

    n 006E ɾ 027E

    o 006F ʁ 0281

    p 0070 ʃ 0283

    s 0073 ʎ 028E

    t 0074 ʒ 0292

    tʃ 0074 0283 ʤ 02A4

    u 0075 ẽ 1EBD

    俄文字元集若是俄文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    字元 程式碼 字元 程式碼

    ' 0027 п 043F

    - 002D р 0440

    . 002E с 0441

    а 0430 т 0442

    б 0431 у 0443

    в 0432 ф 0444

    г 0433 х 0445

    д 0434 ц 0446

    е 0435 ч 0447

    ж 0436 ш 0448

    з 0437 щ 0449

    и 0438 ъ 044A

    й 0439 ы 044B

    к 043A ь 044C

    34

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    л 043B э 044D

    м 043C ю 044E

    н 043D я 044F

    о 043E ё 0451

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    b 0062 t 0074

    bʲ 0062 02B2 tʃ 0074 0283

    d 0064 tʲ 0074 02B2

    dʲ 0064 02B2 u 0075

    f 0066 v 0076

    fʲ 0066 02B2 vʲ 0076 02B2

    g 0067 x 0078

    gʲ 067 02B2 xʲ 0078 02B2

    i 0069 z 007A

    j 006A zʲ 007A 02B2

    k 006B æ 00E6

    kʲ 006B 02B2 ə 0259

    l 006C ɛ 025B

    lʲ 006C 02B2 ɨ 0268

    m 006D ʃ 0283

    mʲ 006D 02B2 ʃʲ 0283 02B2

    n 006E ʊ 028A

    nʲ 006E 02B2 ʌ 028C

    p 0070 ʒ 0292

    pʲ 0070 02B2 ˈi 02C8 0069

    r 0072 ˈo 02C8 006F

    rʲ 0072 02B2 ˈv 02C8 0075

    s 0073 ˈɛ 02C8 025B

    sʲ 0073 02B2 ˈɨ 02C8 0268

    35

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    ts 0074 0073 ˈa 02C8 0061

    西班牙文字元集若是西班牙文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    您也可以在 Phrase 和 SoundsLike 欄位中使用下列 Unicode 字元:

    字元 程式碼 字元 程式碼

    Á 00C1 á 00E1

    É 00C9 é 00E9

    Í 00CD ë 00ED

    Ó 00D3 ó 0XF3

    Ú 00DA ú 00FA

    Ñ 00D1 ñ 0XF1

    ü 00FC    

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 r 0072

    b 0062 s 0073

    d 0064 t 0074

    e 0065 u 0075

    f 0066 v 0076

    g 0067 w 0077

    h 0068 x 0078

    i 0069 z 007A

    j 006A ŋ 014B

    k 006B ɲ 0272

    36

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    l 006C ɾ 027E

    m 006D ʃ 0283

    n 006E ʝ 029D

    o 006F ʧ 02A7

    p 0070 θ 03B8

    坦米爾文字元集若是坦米爾文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    字元 程式碼 字元 程式碼

    அ 0B85 ர 0BB0

    ஆ 0B86 ல 0BB2

    இ 0B87 வ 0BB5

    ஈ 0B88 ழ 0BB4

    உ 0B89 ள 0BB3

    ஊ 0B8A ற 0BB1

    எ 0B8E ன 0BA9

    ஏ 0B8F ஜ 0B9C

    ஐ 0B90 # 0BB6

    ஒ 0B92 ஷ 0BB7

    ஓ 0B93 ஸ 0BB8

    ஔ 0B94 ஹ 0BB9

    ஃ 0B83 ் 0BCD

    க 0B95 ா 0BBB

    ங 0B99 ி 0BBF

    ச 0B9A ீ 0BC0

    ஞ 0B9E ு 0BC1

    ட 0B9F ூ 0BC2

    ண 0BA3 ெ 0BC6

    த 0BA4 ே 0BC7

    ந 0BA8 ை 0BC8

    ப 0BAA ொ 0BCA

    37

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    ம 0BAE ோ 0BCB

    ய 0BAF ௌ 0BCC

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    a 0061 v 0076

    aː 0061 02D0 w 0077

    b 0062 z 007A

    d 0064 æ 00E6

    dʒ 0064 0292 ð 00F0

    e 0065 ŋ 014B

    f 0066 ɑ 0251

    g 0067 ɔ 0254

    h 0068 ə 0259

    i 0069 ɛ 025B

    iː 0069 02D0 ɡ 0261

    j 006A ɪ 026A

    k 006B ɭ 026D

    l 006C ɲ 0272

    m 006D ɳ 0273

    n 006E ɹ 0279

    n̪ 006E 032A ɹ 0279

    o 006F ɹ̩ 0279 0329

    oː 006F 02D0 ɾ 027E

    p 0070 ʂ 0282

    r 0072 ʃ 0283

    s 0073 ʈ 0288

    t 0074 ʊ 028A

    t̪ 0074 032A ʋ 028B

    tʃ 0074 0283 ʌ 028C

    u 0075 ʒ 0292

    38

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    uː 0075 02D0 θ 03B8

    特拉古文字元集若是特拉古文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    字元 程式碼 字元 程式碼

    - 002D త 0C24

    ఁ 0C01 థ 0C25

    ం 0C02 ద 0C26

    ః 0C03 ధ 0C27

    అ 0C05 న 0C28

    ఆ 0C06 ప 0C2A

    ఇ 0C07 ఫ 0C2B

    ఈ 0C08 బ 0C2C

    ఉ 0C09 భ 0C2D

    ఊ 0C0A మ 0C2E

    ఋ 0C0B య 0C2F

    ఌ 0C0C ర 0C30

    ఎ 0C0E ఱ 0C31

    ఏ 0C0F ల 0C32

    ఐ 0C10 ళ 0C33

    ఒ 0C12 వ 0C35

    ఓ 0C13 శ 0C36

    ఔ 0C14 ష 0C37

    క 0C15 స 0C38

    ఖ 0C16 హ 0C39

    గ 0C17 ా 0C3E

    ఘ 0C18 ి 0C3F

    ఙ 0C19 ీ 0C40

    చ 0C1A ు 0C41

    ఛ 0C1B ూ 0C42

    జ 0C1C ృ 0C43

    39

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    ఝ 0C1D ౄ 0C44

    ఞ 0C1E ే 0C47

    ట 0C1F ై 0C48

    ఠ 0C20 ొ 0C4A

    డ 0C21 ో 0C4B

    ఢ 0C22 ౌ 0C4C

    ణ 0C23 ్ 0C4D

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    字元 程式碼 字元 程式碼

    d̪ 0064 032A ð 00F0

    d̪̤ 0064 032A 0324 ŋ 014B

    dʒ 0064 0292 ɑ 0251

    dʒ̤ 0064 0292 0324 ɔ 0254

    e 0065 ɖ 0256

    eː 0065 02D0 ɖ̤ 0256 0324

    f 0066 ə 0259

    h 0068 ɛ 025B

    i 0069 ɡ 0261

    iʐ 0069 0290 ɡ̤ 0261 0324

    j 006A ɪ 026A

    k 006B ɭ 026D

    kʰ 006B 02B0 ɲ 0272

    l 006C ɳ 0273

    m 006D ɹ 0279

    n 006E ɹ̩ 0279 0329

    o 006F ɽ 027D

    oː 006F 02D0 ʂ 0282

    p 0070 ʃ 0283

    pʰ 0070 02B0 ʈ 0288

    r 0072 ʈʰ 0288 02B0

    40

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    s 0073 ʊ 028A

    t 0074 ʋ 028B

    t̪ 0074 032A ʌ 028C

    t̪ʰ 0074 032A 02B0 ʒ 0292

    t 0074 θ 03B8

    tʃʰ 0074 0283 02B0    

    土耳其文字元集若是土耳其文自訂詞彙,您可以在 Phrase 和 SoundsLike 欄位中使用下列字元:

    • a - z• A - Z• ' (單引號)• - (連字號)• . (句點)

    您也可以在 Phrase 和 SoundsLike 欄位中使用下列 Unicode 字元:

    字元 程式碼 字元 程式碼

    Ç 00C7 ö 00F6

    Ö 00D6 û 00FB

    Ü 00DC ü 00FC

    â 00E2 Ğ 011E

    ä 00E4 ğ 011F

    ç 00E7 İ 0130

    è 00E8 ı 0131

    é 00E9 Ş 015E

    ê 00EA ş 015F

    í 00ED š 0161

    î 00EE ž 017E

    ó 00F3    

    您可以在輸入檔案的 IPA 欄位中使用下列國際音標字元:

    41

  • Amazon Transcribe 開發人員指南自訂詞彙的字元集

    字元 程式碼 字元 程式碼

    a 0061 u 0075

    aː 0061 02D0 uː 0075 02D0

    b 0062 v 0076

    c 0063 w 0077

    d 0064 y 0079

    e 0065 yː 0079 02D0

    eː 0065 02D0 z 007A

    f 0066 ø 00F8

    g 0067 øː 00F8 02D0

    h 0068 ŋ 014B

    i 0069 ɟ 025F

    iː 0069 02D0 ɣ 0263

    j 006A ɫ 026B

    k 006B ɯ 026F

    l 006C ɯː 026F 02D0

    m 006D ɾ 027E

    n 006E ʃ 0283

    o 006F ʒ 0292

    oː 006F 02D0 ʔ 0294

    p 0070 ʤ 02A4

    s 0073 ʧ 02A7

    t 0074    

    42

  • Amazon Transcribe 開發人員指南步驟 1. 設定帳戶

    Amazon Transcribe 入門若要開始使用 Amazon Transcribe,請設定 AWS 帳戶並建立 AWS Identity and Access Management (IAM)使用者。若要使用 AWS Command Line Interface (AWS CLI),請下載它並進行設定。

    主題• 步驟 1:設定 AWS 帳戶,建立一個管理員使用者 (p. 43)• 步驟 2:設定 AWS Command Line Interface (AWS CLI) (p. 44)• 步驟 3:開始使用主控台 (p. 45)• 步驟 4:開始使用 API (p. 49)• 步驟 5:串流音訊入門 (p. 53)

    步驟 1:設定 AWS 帳戶,建立一個管理員使用者初次使用 Amazon Transcribe 之前,請先完成以下任務:

    1. 註冊 AWS 帳號 (p. 43)2. 建立 IAM 使用者 (p. 43)

    註冊 AWS 帳號註冊 Amazon Web Services (AWS) 時,您的 AWS 帳戶會自動註冊所有 AWS 服務,包括 AmazonTranscribe。您只需針對所使用的服務付費。

    使用 Amazon Transcribe 時,您僅需按使用的資源量付費。如果您是 AWS 新客戶,可免費開始使用Amazon Transcribe。如需詳細資訊,請參閱 AWS 免費用量方案。

    若您已經擁有 AWS 帳戶,請跳至下一節。

    建立 AWS 帳戶

    1. Open https://portal.aws.amazon.com/billing/signup.2. Follow the online instructions.

    Part of the sign-up procedure involves receiving a phone call and entering a verification code on thephone keypad.

    記錄您的 AWS 帳戶 ID,因為您需要它進行下一個任務。

    建立 IAM 使用者AWS 服務,例如 Amazon Transcribe,會在您進行存取時,要求您提供登入資料。這可讓服務判斷您是否擁有存取該服務資源的許可。

    我們強烈建議您使用 AWS Identity and Access Management (IAM) 存取 AWS,而非使用您 AWS 帳戶的登入資料。若要使用 IAM 來存取 AWS,請建立 IAM 使用者、將使用者新增到擁有管理許可的 IAM 群組,然後將管理許可授予 IAM 使用者。您可以使用特殊 URL 和 IAM 使用者的登入資料存取 AWS。

    43

    https://aws.amazon.com/free/https://portal.aws.amazon.com/billing/signup

  • Amazon Transcribe 開發人員指南下一個步驟

    本指南中的入門練習假設您有一個具備管理員權限的使用者 adminuser。

    建立管理員使用者並登入主控台

    1. 在您的 AWS 帳戶中建立一個名為 adminuser 的管理員使用者。如需說明,請參閱 IAM User Guide 中的建立您的第一個 IAM 使用者和管理員群組。

    2. 使用特殊 URL 登入 AWS Management Console。如需詳細資訊,請參閱《IAM User Guide》中的使用者如何登入您的帳戶。

    For more information about IAM, see the following:

    • AWS Identity and Access Management (IAM)• Getting Started• IAM User Guide

    下一個步驟步驟 2:設定 AWS Command Line Interface (AWS CLI) (p. 44)

    步驟 2:設定 AWS Command Line Interface (AWSCLI)

    您不需要 AWS CLI 執行入門練習中的步驟。不過,本指南中的一些其他練習則需要它。如果您願意,可略過此步驟,並在稍後設定 AWS CLI。

    設定 AWS CLI

    1. 下載和設定 AWS CLI。如需說明,請參閱 AWS Command Line Interface User Guide 中的下列主題。

    • 設定 AWS Command Line Interface• 設定 AWS Command Line Interface

    2. 在 AWS CLI config 檔案中,為管理員使用者新增命名設定檔:

    [profile adminuser]aws_access_key_id = adminuser access key IDaws_secret_access_key = adminuser secret access keyregion = aws-region

    當您執行 AWS CLI 命令時,使用此設定檔。如需命名設定檔的詳細資訊,請參閱《AWS CommandLine Interface User Guide》中的命名設定檔。如需 AWS 區域的清單,請參閱 Amazon Web ServicesGeneral Reference中的區域與端點。

    3. 在命令提示字元中輸入以下說明命令以驗證設定:

    aws help

    下一個步驟步驟 3:開始使用主控台 (p. 45)

    44

    https://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started_create-admin-group.htmlhttps://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started_how-users-sign-in.htmlhttps://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started_how-users-sign-in.htmlhttps://aws.amazon.com/iam/https://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started.htmlhttps://docs.aws.amazon.com/IAM/latest/UserGuide/https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-set-up.htmlhttps://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-started.htmlhttps://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-started.html#cli-multiple-profileshttps://docs.aws.amazon.com/general/latest/gr/rande.html

  • Amazon Transcribe 開發人員指南步驟 3:開始使用主控台

    步驟 3:開始使用主控台開始使用 Amazon Transcribe 的最簡單方法是,使用主控台提交一個轉錄音訊檔案的工作。如果您還沒有檢閱 Amazon Transcribe 運作方式 (p. 4) 中的概念和術語,我們建議您檢閱之後再繼續。

    主題• 建立轉錄工作 (p. 45)• 檢視轉錄工作 (p. 46)

    建立轉錄工作使用 Amazon Transcribe 主控台為您的音訊檔案建立轉錄工作。

    1. 請提供下列資訊:

    • Transcription job name (轉錄工作名稱) — 工作的名稱。此名稱在您的 AWS 帳戶中必須是獨一無二的。

    • Amazon S3 input URL (Amazon S3 輸入 URL) — 輸入音訊檔案所在的 Amazon S3 位置。此位置必須與您呼叫的端點位於同一個區域。

    • Language (語言) — 選擇您的輸入檔案的語言。• Format (格式) — 音訊檔案的格式。為了獲得最佳結果,您應該使用不失真的格式,例如 FLAC 或以

    PCM 16 位元編碼的 WAV。• Media sampling rate (Hz) (媒體取樣速率 (Hz)) — 選用。音訊檔案的位元取樣速率。Amazon

    Transcribe 接受 8000 Hz 至 48000 Hz 的取樣速率。為了獲得最佳結果,低傳真度音訊的取樣率應使用 8000 Hz,高傳真度音訊的取樣率應使用 16000 Hz。

    以下顯示為範例工作所填寫的 Create Transcription Job (建立轉錄工作)。

    45

  • Amazon Transcribe 開發人員指南檢視轉錄工作

    2. 選擇 Create (建立) 以提交工作進行處理。

    檢視轉錄工作完成的轉錄工作會顯示在清單中,其中包含該工作的簡短說明。Availability (可用性) 欄位顯示工作結果保存在伺服器上的剩餘時間。工作會保留 90 天,然後從系統中刪除。

    46

  • Amazon Transcribe 開發人員指南檢視轉錄工作

    在列表中選擇一個工作,查看有關該工作的資訊。

    有關轉錄工作的資訊頁面有三個部分。Detail (詳細資訊) 部分提供轉錄工作的詳細資訊,包括名稱、工作何時從伺服器刪除的相關資訊,以及輸入和輸出 URL。使用輸出 URL 從轉錄工作下載輸出。

    Output (輸出) 部分包含提交至 Amazon Transcribe 之音訊的轉錄。您可以選擇 Download transcription (下載轉錄) 按鈕來下載轉錄。

    Code samples (程式碼範例) 部分包含 StartTranscriptionJob (p. 147) 操作的 JSON 輸入,以及來自GetTranscriptionJob (p. 129) 操作的輸出。

    47

  • Amazon Transcribe 開發人員指南檢視轉錄工作

    下一個步驟

    步驟 4:開始使用 API (p. 49)

    48

  • Amazon Transcribe 開發人員指南步驟 4:開始使用 API

    步驟 4:開始使用 API本節包含示範使用 Amazon Transcribe API 的範例。您可以使用這些範例以了解 API 或做為自己應用程式的建構區塊。

    主題• 入門 (AWS Command Line Interface) (p. 49)• 入門 (AWS SDK for Python (Boto)) (p. 51)

    入門 (AWS Command Line Interface)在以下練習中,您會使用 AWS Command Line Interface (AWS CLI) 將語音轉錄為文字。若要完成本練習,您需要:

    • 具備文字編輯器。• 熟悉 AWS CLI。如需更多詳細資訊,請參閱 步驟 2:設定 AWS Command Line Interface (AWS

    CLI) (p. 44)。• 準備 .WAV 或 .MP4 格式的語音檔案,並儲存於具有適當許可的 S3 儲存貯體。如需 Amazon Transcribe

    所需許可的詳細資訊,請參閱IAM 使用者角色所需的許可 (p. 101)。

    若要轉錄文字,您必須在 JSON 檔案中提供輸入參數。

    轉錄文字

    1. 將您的輸入語音複製到 S3 儲存貯體。此位置必須與您呼叫的端點位於同一個區域。此範例假設此檔案位於名為 test-transcribe 的 S3 儲存貯體,檔案名稱為 answer2.wav。

    2. 建立名為 test-start-command.json 的 JSON 檔案,其中包含 StartTranscriptionJob (p. 147) 操作的輸入參數。

    { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "MediaFormat": "wav", "Media": { "MediaFileUri": "https://S3 endpoint/test-transcribe/answer2.wav" }}

    3. 在 AWS CLI 中執行以下命令。此範例格式適用於 Unix、Linux 和 macOS。用於 Windows 時,請以插入號 (^) 取代每一行結尾處的 Unix 接續字元斜線 (\)。

    aws transcribe start-transcription-job \ --region region \ --cli-input-json file://test-start-command.json

    Amazon Transcribe 回應下列項目:

    { "TranscriptionJob": { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "https://S3 endpoint/test-transcribe/answer2.wav"

    49

  • Amazon Transcribe 開發人員指南入門 (AWS CLI)

    }, "CreationTime": timestamp, "MediaFormat": "wav" }}

    列出轉錄工作

    • 執行以下命令:

    aws transcribe list-transcription-jobs \ --region region \ --status IN_PROGRESS

    Amazon Transcribe 回應下列項目:

    { "Status": "IN_PROGRESS", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "CreationTime": timestamp, "TranscriptionJobStatus": "IN_PROGRESS" } ]}

    取得轉錄工作結果

    1. 當工作狀態為 COMPLETED 時,即可取得工作的結果。輸入以下命令:

    aws transcribe get-transcription-job \ --region region \ --transcription-job-name "request ID"

    Amazon Transcribe 回應下列項目:

    { "TranscriptionJob": { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "Media": { "MediaFileUri": "input URI" }, "CreationTime": timestamp, "CompletionTime": timestamp, "Transcript": { "TranscriptFileUri": "output URI" } }}

    2. 使用輸出 URI 以取得從音訊檔案轉錄的文字。以下是轉錄簡短音訊檔的輸出結果:

    {

    50

  • Amazon Transcribe 開發人員指南入門 (SDK for Python)

    "jobName":"job ID", "accountId":"account ID", "results": { "transcripts":[ { "transcript":" that's no answer" } ], "items":[ { "start_time":"0.180", "end_time":"0.470", "alternatives":[ { "confidence":0.84, "content":"that's" } ], "type": "pronunciation" }, { "start_time":"0.470", "end_time":"0.710", "alternatives":[ { "confidence":0.99, "content":"no" } ], "type": "pronunciation" }, { "start_time":"0.710", "end_time":"1.080", "alternatives":[ { "confidence":0.874, "content":"answer" } ], "type": "pronunciation" } ] }, "status":"COMPLETED" }

    入門 (AWS SDK for Python (Boto))在本練習中,您建立指令碼以利用 SDK for Python 將語音轉錄為文字。若要完成本練習,您需要:

    • 安裝 AWS CLI。如需更多詳細資訊,請參閱 步驟 2:設定 AWS Command Line Interface (AWSCLI) (p. 44)。這會安裝 AWS SDK for Python (Boto)。

    • 準備 .WAV 或 .MP4 格式的語音檔案,並儲存於具有適當許可的 S3 儲存貯體。如需 Amazon Transcribe所需許可的詳細資訊,請參閱IAM 使用者角色所需的許可 (p. 101)。此位置必須與您呼叫的端點位於同一個區域。此範例假設此檔案位於名為 test-transcribe 的 Amazon S3 儲存貯體,檔案名稱為answer2.wav。

    from __future__ import print_functionimport time

    51

  • Amazon Transcribe 開發人員指南入門 (SDK for Python)

    import boto3transcribe = boto3.client('transcribe')job_name = "job name"job_uri = "https://S3 endpoint/test-transcribe/answer2.wav"transcribe.start_transcription_job( TranscriptionJobName=job_name, Media={'MediaFileUri': job_uri}, MediaFormat='wav', LanguageCode='en-US')while True: status = transcribe.get_transcription_job(TranscriptionJobName=job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5)print(status)

    當轉錄工作完成時,結果會連結到 Amazon S3 預先簽章的 URL,其中包含 JSON 格式的轉錄:

    { "jobName":"job ID", "accountId":"account ID", "results": { "transcripts":[ { "transcript":" that's no answer", "confidence":1.0 } ], "items":[ { "start_time":"0.180", "end_time":"0.470", "alternatives":[ { "confidence":0.84, "word":"that's" } ] }, { "start_time":"0.470", "end_time":"0.710", "alternatives":[ { "confidence":0.99, "word":"no" } ] }, { "start_time":"0.710", "end_time":"1.080", "alternatives":[ { "confidence":0.87, "word":"answer" } ] } ] }, "status":"COMPLETED"

    52

  • Amazon Transcribe 開發人員指南步驟 5:串流音訊入門

    }

    步驟 5:串流音訊入門以下範例是轉錄串流音訊的 Java 程式。輸入來自您電腦的麥克風或上傳的檔案,而輸出會使用您電腦的標準輸出。

    若要執行此範例,您需要以下項目:

    • 您必須使用 AWS SDK for Java 2.x• 用戶端必須使用 Java 1.8,以與 AWS SDK for Java 2.x 相容。

    /** * COPYRIGHT: *

    * Copyright 2018-2019 Amazon.com, Inc. or its affiliates. All Rights Reserved. *

    * Licensed under the Apache License, Version 2.0 (the "License"). * You may not use this file except in compliance with the License. * A copy of the License is located at *

    * http://www.apache.org/licenses/LICENSE-2.0 *

    * or in the "license" file accompanying this file. This file is distributed * on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either * express or implied. See the License for the specific language governing * permissions and limitations under the License. */package com.amazonaws.transcribestreaming;

    import org.reactivestreams.Publisher;import org.reactivestreams.Subscriber;import org.reactivestreams.Subscription;import software.amazon.awssdk.auth.credentials.AwsCredentialsProvider;import software.amazon.awssdk.auth.credentials.DefaultCredentialsProvider;import software.amazon.awssdk.core.SdkBytes;import software.amazon.awssdk.regions.Region;import software.amazon.awssdk.services.transcribestreaming.TranscribeStreamingAsyncClient;import software.amazon.awssdk.services.transcribestreaming.model.*;

    import javax.sound.sampled.*;import java.io.*;import java.net.URISyntaxException;import java.nio.ByteBuffer;import java.util.List;import java.util.concurrent.CompletableFuture;import jav