ベイズ基準による HSMM 音声合成の評価

◎橋本佳，南角吉彦，徳田恵一（名工大）

はじめに HMM に基づく音声合成

ML 基準によるモデル学習 MDL 基準によるモデル構造選択

ベイズ基準による HMM 音声合成（橋本ら ; ’08 ）

モデルパラメータの周辺化データ量を考慮したモデル構造選択学習・合成間におけるモデルの不一致

ベイズ基準による HSMM 音声合成（橋本ら ; ’09 ）

学習・合成において同一のモデルを使用ベイズ基準による HSMM 音声合成の詳細な評価

隠れマルコフモデル（ HMM ）

1 1 1 1 2 2 3 3

観測系列

状態系列

隠れセミマルコフモデル（ HSMM ）

状態継続長を考慮したモデル

1 1 1 1 2 2 3 3

:観測系列

継続長分布

状態系列 :

尤度関数

尤度関数の比較

: 状態系列: 観測系列

HSMM では状態遷移確率が継続長分布によって算出

: モデルパラメータ

モデル学習基準・音声合成基準

ベイズ基準による音声合成（ 1/2）

ML 基準

ベイズ基準

: モデルパラメータ

: 合成文のラベル列: 学習文のラベル列: 学習データ

: 合成音声パラメータ系列

ベイズ基準による音声合成（ 2/2）ベイズ基準における予測分布（周辺尤度関数）

: 合成データの状態遷移を表す隠れ変数

変分ベイズ法による近似（ Attias; ’99 ）

: 学習データの状態遷移を表す隠れ変数: 合成データの尤度関数: 学習データの尤度関数

: モデルパラメータの事前分布

対数周辺尤度の下限を定義

変分ベイズ法（ 1/2 ）

：に関する期待値

下限の最大化による対数周辺尤度の近似⇒ を最大化する近似事後分布を推定

（ Jensen の不等式）

: 近似事後分布

近似事後分布の独立性を仮定

変分法による事後分布推定

変分ベイズ法（ 2/2 ）

: 正規化項

交互に更新することでを最大化

音声パラメータ生成音声パラメータ

静的特徴量と動的特徴量によって表現

⇒ 合成部では静的特徴量のみ推定ベイズ基準による合成音声パラメータ生成

下限は対数周辺尤度を近似 ⇒ を最大化する音声パラメータを推定

実験条件

データベース ATR 日本語音声データベース b-set

話者 MHT

学習データ 450 文テストデータ 53 文サンプリング周波数 16 kHz

窓関数 Blackman 窓フレームサイズ / シフト 25 ms / 5 ms

特徴量

24 次メルケプストラム + Δ + ΔΔ

対数基本周波数 + Δ + ΔΔ

(78 次元 )

ML 基準・ HMM との比較 ML 基準とベイズ基準の比較 HMM と HSMM の比較

学習・合成基準

モデル構造選択モデル

ML-HMMML 基準 MDL 基準

ML-HSMM HSMM

Bayes-HMMベイズ基準ベイズ基準

Bayes-HSMM HSMM※ クロスバリデーションを用いたベイズ基準によるモデル構造選択（橋本ら ; ’08 ）

ML 基準・ HMM との比較

主観評価実験

1387,267 88,287 745,969 744,955分布数

改善の要因の調査ベイズ基準による改善の要因

パラメータの周辺化モデル構造選択

学習・合成基準

モデル構造選択モデル

ML-MDL ML 基準MDL 基準

HSMMBayes-MDL ベイズ基準ML-Bayes ML 基準

ベイズ基準Bayes-Bayes ベイズ基準

モデル構造の比較

主観評価実験

1588,28788,287 744,955744,955分布数

むすびベイズ基準による HSMM 音声合成の評価

HSMM による品質改善ベイズ基準の有効性パラメータの周辺化とモデル構造の両方が必

今後の課題小規模な学習データでの音声合成実験モデル構造と音質の調査

ベイズ基準による HSMM 音声合成の評価

Documents

Transcript of ベイズ基準による HSMM 音声合成の評価

ベイズ統計学のMCMCとの出会い ご紹介内容 →1．ベイズ統計のMCMCとの出会い 2．ベイズ統計で最尤推定 3．ベイズ統計と混合効果モデルの関係

Guia de Informação para o Utenteportaishospitais.azurewebsites.net/hbarcelos/wp-content/uploads/... · Objetivos No desenvolvimento da sua atividade, o HSMM assume os seguintes

I. ベイズ推定 ベイズ統計入門 モンテカルロ法と逆問題iba/kougi_2006_ism/c20062.pdf · ベイズ統計入門 ＆ ... マルコフ場による画像復元 共役事前分布（～

Jap2017 ss65 優しいベイズ統計への導入法

―ベイズ推定とパーティクルフィルタ―swk/lecture/ic2010/kagami_ic...知能制御システム学 画像追跡(3) ―ベイズ推定とパーティクルフィルタ―

ATR 音声言語コミュニケーション研究所音声言語 …chasen.org/~daiti-m/paper/nl165pf-slides.pdfToday’s Topic • 適切な文脈長を自動的に選択することのできるベイズ言語

OnYiyangDisyllabicToneSandhiinHunanProvince调。在重轻式下，阴平和去声仍然不发生变调，阳平在阴平、阳平、上声、去声和入声后发生 了变调，由13变成了33，上声在5种声调后发生了变调，由41变成了11，入声在5种声调

AEON MOBILE - イオンモバイル音声通話サービスを ご契約の …...p. 1 AM20210115V 音声・シェア音声プラン イオンモバイル音声通話サービスを

HSMM Overview Rel 2 0

ベイズ的アプローチに基づく音声認識 における事前分布の検討bonanza/Paper/bonanza_B4paper.pdf · 隠れマルコフモデル No. 3 第2章 隠れマルコフモデル

ベイズ Chow-Liu アルゴリズム

6 Prinsip Hsmm

ベイズ学習勉強会 EMアルゴリズム (作成途中)

一种对于单声道声源定位的 3D 声音定位算法 DSP 执行器

音声対話サンプルアプリ作成 ...€¦ · 音声認識(ASR) 自然言語処理(NLU) 音声合成(TTS) 音声 / テキスト / ... エンドユーザー AgentCraft™ 開発者

2．ビリーフとベイズの定理 ... 4月15日ベイズの定理とは？4月22日ベイズはどのようにして世に出たのか？5月6日【休日出勤】ベイズはコンピュータの父

PRML 10.1節 ~ 10.3節 - 変分ベイズ法

Sequence Pattern Extraction by Segmenting Time Series Data Using GP-HSMM …chasen.org/~daiti-m/paper/nagano18hdp-gphsmm.pdf · 2018-09-21 · based hidden semi-Markov model (GP-HSMM).

seminar 130306 v2 public - Nagoya Institute of Technologymatsuzoe.web.nitech.ac.jp/infogeo/seminar_130306_v2_public.pdf · ベイズ統計による推定の例(2/2) 答え方(ベイズ統計)

ベイズ統計学のMCMCとの出会いご紹介内容 →1．ベイズ統計のMCMCとの出会い 2．ベイズ統計で最尤推定 3．ベイズ統計と混合効果モデルの関係

I. ベイズ推定ベイズ統計入門モンテカルロ法と逆問題iba/kougi_2006_ism/c20062.pdf · ベイズ統計入門＆ ... マルコフ場による画像復元共役事前分布（～

―ベイズ推定とパーティクルフィルタ―swk/lecture/ic2010/kagami_ic...知能制御システム学画像追跡(3) ―ベイズ推定とパーティクルフィルタ―

OnYiyangDisyllabicToneSandhiinHunanProvince调。在重轻式下，阴平和去声仍然不发生变调，阳平在阴平、阳平、上声、去声和入声后发生了变调，由13变成了33，上声在5种声调后发生了变调，由41变成了11，入声在5种声调

AEON MOBILE - イオンモバイル音声通話サービスをご契約の …...p. 1 AM20210115V 音声・シェア音声プランイオンモバイル音声通話サービスを

ベイズ的アプローチに基づく音声認識における事前分布の検討bonanza/Paper/bonanza_B4paper.pdf · 隠れマルコフモデル No. 3 第2章隠れマルコフモデル