ICASSP2017読み会 (Deep Learning III) [電通大中鹿先生]

MLSP-L6Deep Learning III

中鹿亘（電通大）

2017.6.24 ICASSP2017読み会

※スライド中の図表はオリジナルの論文から引用しています

自己紹介• 中鹿　亘

• 出身大学

• 神戸大学大学院システム情報学研究科博士（工学）

• 職歴

• 神戸大学助教（2014～2015）

• 電気通信大学助教（2015～）

• 研究分野

• ディープラーニング、ボルツマン分布、音声・画像認識、声質変換

紹介する論文

1. Reconstruction-Error-Based Learning for Continuous Emotion Recognition in Speech J. Han, Z. Zhang, F. Ringeval, and B. Schuller

2. Disjunctive Normal Shape Boltzmann Machine E. Erdil, F. Mesadi, T. Tasdizen, and M. Cetin

3. Inferring Latent States in a Network Influenced by Neighbor Activities: an Undirected Generative Approach B. L. Samarakoon, M. N. Murthi, and K. Premaratne

MLSP-L6　Deep Learning III

1. Reconstruction-Error-Based Learning for Continuous Emotion Recognition in Speech J. Han, Z. Zhang, F. Ringeval, and B. Schuller

概要

• タスクは？連続感情認識

• どうやる？２つのRNNをくっつける

• 結果は？従来（１つのRNN）よりも良くなった

連続感情：arousal（興奮）とvalence（感情の度合い）

提案フレームワーク

• Model1とModel2は、同じ構造のBLSTM

• Model1を学習した後、Model2を学習する

MFCCなど連続感情

提案フレームワーク

• Model1とModel2は、同じ構造のBLSTM

• Model1を学習した後、Model2を学習する

MFCCなど連続感情

著者たちの主張：Model1でモデルの”弱点”（再構築エラー）を学習し、弱点を知っているModel2では予測精度が上がるであろう

実験結果

提案手法（MFCC+powerの13次元のフレーム特徴量）

提案手法（MFCC+powerの8秒セグメントの26次元の統計量）

従来手法（１つのBLSTM、MFCC+powerの13次元のフレーム特徴量？）

Pearson’s Correlation Coefficient

実験結果

再構築エラーとarousal改善との相関はほとんどない再構築エラーとvalence改善

との相関はある

2. Disjunctive Normal Shape Boltzmann Machine E. Erdil, F. Mesadi, T. Tasdizen, and M. Cetin

概要

• 何をしようとしている？RBMを拡張（DNSBM）してシルエット画像をうまく表現

• どうやる？SBMとDNSMを組み合わせる

• 結果は？従来（SBM）よりも実データに近いサンプルが生成できた

Restricted Boltzmann Machine

Disjunctive Normal Shape Boltzmann Machine

Shape Boltzmann Machine

Disjunctive Normal Shape Model

従来手法１：SBM

RBM SBM

Shape Boltzmann Machine

従来手法１：SBM

RBM SBM

SBMの問題点• それぞれのパッチが、必ずしも正しいパーツと対応付いていない

変なものがサンプリングされてしまう可能性がある！

• そこで、正しい（正しそうな）パーツと対応付けて学習させる

提案手法の流れ

DNSMでセグメンテーション

DNSBMを学習 DNSBM

（従来手法）（提案手法） ≒ SBM

従来手法２：DNSM• どんな形状（シルエット）でも、convex polytope（凸多面体）の集合で近似できる

Disjunctive Normal Shape Model

convex polytopeの例

≒ { }convex polytopeの集合ある形状

従来手法２：DNSMDisjunctive Normal

Shape Model

• ある形状 Ω+ の定式化：

• あるconvex polytope: Pi の定式化：

Shape Model

• ある形状 Ω+ の定式化：

• ある点 x が前景であるかどうかを返す関数 f(x) は

ド・モルガンより

微分できるように

Shape Model

• ある点 x が前景であるかどうかを返す関数 f(x) は

• 最小化したい評価関数はt個目の学習データ

データとモデルの近さ多面体が互いに異なるように

実験結果

- Walking silhouette data set of 150 binary images, each of which has 170x170 pixels.- 1000 units for h1, and 50 units for h2.- DNSM was processed using 6 polytopes.

実験結果

3. Inferring Latent States in a Network Influenced by Neighbor Activities: an Undirected Generative Approach B. L. Samarakoon, M. N. Murthi, and K. Premaratne

概要• 何をしようとしている？動的に変化するneighbors（近接ノード）と隠れ状態の関係性をよく表現する新しいグラフィカルモデルを提案

• どうやる？Energy-basedモデルで、隠れ状態とneighborsの関係性を記述

• 結果は？人工データを用いた実験で、SVMよりも隠れ状態の推定精度が高かった

ちょっと疑問

To the best of our knowledge, no undirected models have been applied to modeling neighbor influence and hidden variables in networks.

定式化• あるノード i のneighborsの定義：

全ノード（ユーザ）集合隣接行列

• 表現したい確率分布：隠れ状態（世論）系列

観測されるユーザカウント系列e.g., the number of postings of a certain category or number of infected people in a contact network

users may change their political biases depending on their neighbors’ postings but they may not wish to express these changes explicitly

定式化

• この確率分布を、２つのファクターで定義したい：

1.隠れ状態と近接ノードから受けるファクター ψA

2.隠れ状態とユーザアクティビティによるファクター ψB

定式化• 隠れ状態と近接ノードから受けるファクター ψA の定義：

定式化• 隠れ状態とユーザアクティビティによるファクターψBの定義：

定式化• 二つ合わせて確率分布を定義：

定式化• 式を変形：

隠れ状態の推測• 観測データから隠れ状態を推測したい：

計算困難！ → 変分近似法を用いる

変分近似• 近似分布を定義：

多項分布と仮定

多項分布のパラメータ

• 近似分布と目標分布とのKL距離：

変分近似

• 式を変形：

変分近似• 式をさらに変形：

変分近似• 式をさらに変形： q と f のKL距離になってる！

変分近似• 結局、KL(Q||F)を最小とするFは、KL(Q||P)も最小とするので、

を用いてP(X|Z)を近似する

パラメータ推定• 対数尤度を最小化するように、SGDでパラメータを推定：

評価実験

1. 隠れ状態と観測データを人工的に生成して、学習

2. 観測データから推測した隠れ状態と、正解の隠れ状態がどれほど一致するかを見る

3. 従来手法（SVMとCox）による推測結果と比較

評価実験

• SVMはすべてのサンプルが独立であると仮定しているため、精度が微妙

• Coxは時間変動を考慮している分SVMよりは良いが、ユーザ間の関係性は考慮していないため提案法に負ける

紹介した論文

1. Reconstruction-Error-Based Learning for Continuous Emotion Recognition in Speech エラー抽出器と識別器の２つのRNNを直列につないで連続感情認識

2. Disjunctive Normal Shape Boltzmann Machine セグメンテーションとSBMを組み合わせてシルエット画像モデリング

3. Inferring Latent States in a Network Influenced by Neighbor Activities: an Undirected Generative Approach ダイナミックに変化する隠れ状態とユーザ嗜好をモデリング

ICASSP2017読み会 (Deep Learning III) [電通大 中鹿先生]

Science

Transcript of ICASSP2017読み会 (Deep Learning III) [電通大 中鹿先生]

DEEP FOUNDATIONS – Pile Foundations - جامعة تكريتced.ceng.tu.edu.iq/images/lectures/dr.farouq/ch7-Deep-Foundation... · DEEP FOUNDATIONS – Pile Foundations ... Qs =

Deep Freeze MDM – Baixar Apresentação em PDF · Deep Freeze Enterprise User Guide 4 | Contents Configuração do Deep Freeze 58 Aplicando a Configuração do Deep Freeze ...

DEEP/DEEP JEWELS Mixed Martial Artsルール · 2020-02-07 · DEEP/DEEP JEWELS Mixed Martial Artsルール 監修：一般社団法人日本MMA審判機構 ※DEEP競技運営機構が管轄するDEEP/DEEP

NIPS2013読み会 DeViSE: A Deep Visual-Semantic Embedding Model

マイネノーブレス2018 牡・鹿 3／291 マイネノーブレス2018 牡・鹿 3／29 リオンディーズ 黒鹿 2013 マイネノーブレス 栗 2007 キングカメハメハ

[DL輪読会]Continuous Deep Q-Learning with Model-based Acceleration

[DL輪読会]Imagination-Augmented Agents for Deep Reinforcement Learning / Learning model-based planning from scratch

Deep River

鈴鹿鈴鹿サーキットクイーンサーキットクイーン ...鈴鹿サーキットでは、2月24日（日）に30回目を迎えた「鈴鹿サーキットクイーン選考会」を開催し、新しい鈴鹿サーキット

CVPR 2015 読み会 "Understanding Deep Image Representations by Inverting Them"

[DL輪読会]Beyond Shared Hierarchies: Deep Multitask Learning through Soft Layer Ordering

[DL輪読会]Understanding deep learning requires rethinking generalization

イーストスタッド | 株式会社ジャパンレースホース ... - Deep SkyChris Evert Sw on's Miss Carmie カーミライズド Carmelized 鹿毛1 90 キートゥザミント

Hangzhou Deep Learning Meetup-Deep Reinforcement Learning

(研究会輪読) Facial Landmark Detection by Deep Multi-task Learning

TO THE WORLD28 トゥザワールド TO THE WORLD 鹿毛 201年生 安平産 キングカメハメハ 鹿毛 2001 キングマンボ Kingmambo 鹿毛 1990 ミスタープロスペクター

Deep Learningの前提知識 - rhuang.cis.k.hosei.ac.jp · •Deep Learningについての前提知識の紹介。 •細かい部分は、プロジェクトのページの輪読の資料を参考

論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」

スマナサーラ長老と読む - サンガ-samgha-スマナサーラ長老と読む がたり お釈迦様の物語「ジャータカ」 目次 第だい 1話 わ ルル鹿 しか

.@F 6G - aba.main.jpaba.main.jp/pdf/h28_joujouyoteiba_data_2.pdf27 エムケイミラクル2015 ・黒鹿 3／31 ショウナンカンプ 鹿1998 エムケイミラクル 鹿2001 サクラバクシンオー

ICASSP2017読み会 (Deep Learning III) [電通大中鹿先生]

Transcript of ICASSP2017読み会 (Deep Learning III) [電通大中鹿先生]

DEEP/DEEP JEWELS Mixed Martial Artsルール · 2020-02-07 · DEEP/DEEP JEWELS Mixed Martial Artsルール監修：一般社団法人日本MMA審判機構 ※DEEP競技運営機構が管轄するDEEP/DEEP

マイネノーブレス2018 牡・鹿 3／291 マイネノーブレス2018 牡・鹿 3／29 リオンディーズ黒鹿 2013 マイネノーブレス栗 2007 キングカメハメハ

TO THE WORLD28 トゥザワールド TO THE WORLD 鹿毛 201年生安平産キングカメハメハ鹿毛 2001 キングマンボ Kingmambo 鹿毛 1990 ミスタープロスペクター

スマナサーラ長老と読む - サンガ-samgha-スマナサーラ長老と読むがたりお釈迦様の物語「ジャータカ」目次第だい 1話わルル鹿しか

.@F 6G - aba.main.jpaba.main.jp/pdf/h28_joujouyoteiba_data_2.pdf27 エムケイミラクル2015 ・黒鹿 3／31 ショウナンカンプ鹿1998 エムケイミラクル鹿2001 サクラバクシンオー