Download - 第1回NIPS読み会・関西発表資料篠崎

Transcript

Page 1: 第1回NIPS読み会・関西発表資料篠崎

Synthesizing the preferred inputs for neurons in neural networks via deep generator networks

Takashi ShinozakiCiNet, NICTNov 12, [email protected]

Page 2: 第1回NIPS読み会・関西発表資料篠崎

紹介論文

• A. Nguyen, A. Dosovitskiy, J. Yosinski, T. Brox, J. Clune• “Synthesizing the preferred inputs for neurons in

neural networks via deep generator networks”

• メインはワイオミング大学

• フライブルク大学の可視化技術がベース

• Dosovitskiy & Brox 2016 arXiv• “Generating images with

perceptual similarity metrics based on deep networks”

Page 3: 第1回NIPS読み会・関西発表資料篠崎

ワイオミング？

• アメリカの真ん中あたり

• イエローストーン国立公園があるところ

• ソルトレイクシティやデンバーが近い

Page 4: 第1回NIPS読み会・関西発表資料篠崎

ざっくり

• DCGAN的な手法で

DNNの内部状態を表現する

解釈可能な画像を生成する

DGN-AMを提案

Page 5: 第1回NIPS読み会・関西発表資料篠崎

はじめに

• Deep Neural Network (DNN)の可視化は重要

• 基礎科学として

• DNNの改良のため

• 可視化の基本

• Activation Maximization (AM) [Erhan+2009]• 反応を最大化する入力を探す

• 可視化する先を制限するpriorが必要

• 自然画像なら自然画像のprior

Page 6: 第1回NIPS読み会・関西発表資料篠崎

様々なprior

• Hand-designed priors• Gaussian blur [Yosinski+2015]• α-norm [Simonyan+2014]• Total variation [Mahendran+2016]• Jitter [Mordvintsev+2015]• Data-driven patch [Wei+2015]• Center-bias regularization [Nguyen+2016]• Mean images [Nguyen+2016]

• 本研究ではImageNetを学習したCNNをpriorに!!

Page 7: 第1回NIPS読み会・関西発表資料篠崎

可視化の為の生成モデル

• これまでの生成モデル

• Probabilistic model [Lee+2009]• Auto-encoder [Alain+2014]• Stochastic model [Kingma+2014]• Recurrent networks [Theis+2015]

• Generative Adversarial Network (GAN)• [Goodefellow+2014]• 最近の流行、特にDCGAN

• Deep Convolutional GAN [Radford+2015]

Page 8: 第1回NIPS読み会・関西発表資料篠崎

Ex. Arithmetics over semantic space

• Radford et al., 2016• “Unsupervised Representation Learning with Deep

Convolutional Generative Adversarial Networks”

Page 9: 第1回NIPS読み会・関西発表資料篠崎

Ex. mini-Video generation

• Vondrick et al., 2016• “Generating Videos with Scene Dynamics”

Page 10: 第1回NIPS読み会・関西発表資料篠崎

DCGANとは、、、

•Autoencoderの新しい形• 逆向き結合のAutoencoder

Realor

Fake

Randominput

DCGAN

Image output

Autoencoder

Imageoutput

Imageinput

Page 11: 第1回NIPS読み会・関西発表資料篠崎

本研究の目的

• ImageNetで学習したCNNをpriorとして

• GANのような生成モデルである

Deep Generative Network (DGN)を使って

• Activation Maximization (AM)な画像を生成する

• DGN-AMを開発して、その性能を検証

Page 12: 第1回NIPS読み会・関西発表資料篠崎

Fig.1: 画像生成の概要

• CaffeNetを用いた場合の生成画像の例

Page 13: 第1回NIPS読み会・関西発表資料篠崎

Fig.2: ネットワーク構造

• 基本的なDCGANの構造

• ネットワークは学習しない?• 赤い部分の分布を学習する?

G Φ

h

Page 14: 第1回NIPS読み会・関西発表資料篠崎

ネットワーク詳細 (1/2)

• 前段階でGenerator Gを学習

• VAEGAN的学習？

Realor

Fake

圧縮表現

yi=E(xi)生成画像

G(yi)元画像

xi

DiscriminatorD

ComparatorC

EncoderE

GeneratorG

生成画像

C(G(yi))C(xi)

判別結果

D(G(yi))D(xi)

比較

比較

比較

Page 15: 第1回NIPS読み会・関西発表資料篠崎

ネットワーク詳細 (2/2)

• ネットワークは固定して最適な圧縮表現を探索

• yiは [0,3σ]でクリッピング

• あらかじめEncoder Eの出力分布を取っておく

圧縮表現

yi=E(xi)生成画像

G(yi)

target DNNΦ

=可視化するCNNGenerator

G

featureh

ここを最適化

Page 16: 第1回NIPS読み会・関西発表資料篠崎

Fig.3: Priorの汎用性 (1/3)

• MIT Places datasetで学習したDNN[Zhou+2014]• Priorは普通のCaffeNet• いずれもいい感じに可視化できた

• ネットの基本構造が同じなため？

Page 17: 第1回NIPS読み会・関西発表資料篠崎

Fig.4: Priorの汎用性 (2/3)

• 全く異なるDNN [Donahue+2015]• 動画像(UCF101)で学習

• 先のものと比べると性能が悪い？

• ネットのせい？データのせい？

Page 18: 第1回NIPS読み会・関西発表資料篠崎

Fig.5: Priorの汎用性 (3/3)

• もっと根本から異なるネットワークでも検証

• 学習データは同一(ImageNet)• GoogLeNet [Szegedy+2015], ResNet [Zhang+2016]• 構造が違うほど性能は低下

Page 19: 第1回NIPS読み会・関西発表資料篠崎

Fig.6: 中間層(5層目)の可視化

Page 20: 第1回NIPS読み会・関西発表資料篠崎

その他の応用の可能性

• ネットワークの学習過程の可視化

• 動画の可視化

• 意味レベルでの合成

Page 21: 第1回NIPS読み会・関西発表資料篠崎

Fig.S12: 画像の合成 (1/2)

Page 22: 第1回NIPS読み会・関西発表資料篠崎

Fig.S12: 画像の合成 (2/2)

• 様々なものに「火」を灯す

• 意味的な合成が適切に行われている

• 新規画像を生成するための新しい手法？

Page 23: 第1回NIPS読み会・関西発表資料篠崎

まとめ

• DGN-AMを提案

• Priorを使って可視化

• 解釈しやすいリアルな画像を生成

• DNNの研究に有効

• テキストからの可視化も促進？

• ネットワークを超えた一般性も持つ？

Page 24: 第1回NIPS読み会・関西発表資料篠崎

学習過程での生成画像の変化

• 動画

• https://goo.gl/p9P2zE

Page 25: 第1回NIPS読み会・関西発表資料篠崎

Fig.S7: canonical imagesについて

• よくわからないです

Page 26: 第1回NIPS読み会・関西発表資料篠崎

Fig.S8: 訓練データの多様性の影響

• 訓練データが単調だと生成画像も単調

Page 27: 第1回NIPS読み会・関西発表資料篠崎

Fig.S9: priorのデータ量の影響

• 少データだと正答率もクオリティも低下

Page 28: 第1回NIPS読み会・関西発表資料篠崎

Fig.S10: 正答率とクオリティ(1/2)

• 正答率が高いとクオリティも高い

Page 29: 第1回NIPS読み会・関西発表資料篠崎

Fig.S10: 正答率とクオリティ(1/2)

• 正答率が低くてもそこまで悪くない

Page 30: 第1回NIPS読み会・関西発表資料篠崎

動画の生成

• LRCN DNN[Donahue+2015]で生成モデル

• LSTMでUCF-101を判定するDNN• 動画

• https://goo.gl/pCPIHA

Page 31: 第1回NIPS読み会・関西発表資料篠崎

Fig.S11: 画像の合成 (1/2)

Page 32: 第1回NIPS読み会・関西発表資料篠崎

Fig.S11: 画像の合成 (2/2)

• 特徴ベクトルのL2の差を損失に追加

• 様々なレベル(画像、意味)での合成

• 科学的にも芸術的にも面白い？

Page 33: 第1回NIPS読み会・関西発表資料篠崎

Fig.S12: 画像の合成 (1/2)

Page 34: 第1回NIPS読み会・関西発表資料篠崎

Fig.S12: 画像の合成 (2/2)

• 様々なものに「火」を灯す

• 意味的な合成が適切に行われている

• 新規画像を生成するための新しい手法？

Page 35: 第1回NIPS読み会・関西発表資料篠崎

Fig.S13: 様々な層での表現 (1/2)

• 上段：conv3、下段：conv5

Page 36: 第1回NIPS読み会・関西発表資料篠崎

Fig.S13: 様々な層での表現 (2/2)

• 上段：fc6、下段：fc7

Page 37: 第1回NIPS読み会・関西発表資料篠崎

Fig.S14: 各層での表現の詳細 (1/2)

Page 38: 第1回NIPS読み会・関西発表資料篠崎

Fig.S14: 各層での表現の詳細 (2/2)

• 上段は従来のhand-designed priorによるもの

• 下段が提案手法

• よりリアルな色とテクスチャを実現

Page 39: 第1回NIPS読み会・関西発表資料篠崎

Fig.S15: 場所CNNでの各層 (1/2)

Page 40: 第1回NIPS読み会・関西発表資料篠崎

Fig.S15: 場所CNNでの各層 (2/2)

• 場所判定CNN[Zhou+2015]の学習表現

• 3-5層は物体検出に対応？

• fc6,fc7層では複数の表現が混ざり合う？

Page 41: 第1回NIPS読み会・関西発表資料篠崎

学習過程での各層の表現の変化

• 動画

• https://goo.gl/p9P2zE

Page 42: 第1回NIPS読み会・関西発表資料篠崎

Fig.S17: 従来手法との比較

Page 43: 第1回NIPS読み会・関西発表資料篠崎

Fig.S18: 様々な生成結果 (1/2)

Page 44: 第1回NIPS読み会・関西発表資料篠崎

Fig.S18: 様々な生成結果 (2/2)

Page 45: 第1回NIPS読み会・関西発表資料篠崎

変形への対応

• (1) ベースライン (2) cut-upの影響

• (3) 色変換の影響 (4) blurの影響

Page 46: 第1回NIPS読み会・関西発表資料篠崎

Fig.S19: cut-upの影響 (1/2)

• 上段：元画像、下段：cut-up画像

Page 47: 第1回NIPS読み会・関西発表資料篠崎

Fig.S19: cut-upの影響 (2/2)

• 上段：元画像での生成、下段：cut-upでの生成

Page 48: 第1回NIPS読み会・関西発表資料篠崎

Fig.S20: 色変換の影響 (1/2)

• 上段：元画像、下段：色変換画像

Page 49: 第1回NIPS読み会・関西発表資料篠崎

Fig.S20: 色変換の影響 (2/2)

• 上段：元画像での生成、下段：色変換での生成

Page 50: 第1回NIPS読み会・関西発表資料篠崎

Fig.S21: blurの影響 (1/2)

• 上段：元画像、下段：blur画像

Page 51: 第1回NIPS読み会・関西発表資料篠崎

Fig.S21: blurの影響 (2/2)

• 上段：元画像での生成、下段：blurでの生成

Page 52: 第1回NIPS読み会・関西発表資料篠崎

Fig.S22: 画像の記憶かの検証

• 単なる記憶であるという明瞭な証拠はない？

Top Related

篠崎連携研究グループ（機能開発研究チーム） - …...篠崎連携研究グループ（機能開発研究チーム） Shinozaki Research Collaborative Group RIKEN

篠崎連携研究グループ（機能開発研究チーム） - …...篠崎連携研究グループ（機能開発研究チーム） Shinozaki Research Collaborative Group RIKEN

PENG-00016 BEI-PP3 SPT NIPS 10-2019...NIPS CKRA perusahaan Tercatat PT Golden Plantation T bk PT Sigmagold Inti Perkasa Tbk. PT Sugih Energy T bk. PT Evergreen Invesco Tbk. PT Nipress

PENG-00016 BEI-PP3 SPT NIPS 10-2019...NIPS CKRA perusahaan Tercatat PT Golden Plantation T bk PT Sigmagold Inti Perkasa Tbk. PT Sugih Energy T bk. PT Evergreen Invesco Tbk. PT Nipress

Nips yomikai 1226

Nips yomikai 1226

-142200.000 3 - 2 2 5 42 - 3 4 - 4 -1 2 6 - 6 - 4 2 7 1 -1 …事務所灘区将軍通3丁目篠原南町5丁目将軍通2丁目篠原中町6丁目篠原中町4丁目篠原中町2丁目

-142200.000 3 - 2 2 5 42 - 3 4 - 4 -1 2 6 - 6 - 4 2 7 1 -1 …事務所灘区将軍通3丁目篠原南町5丁目将軍通2丁目篠原中町6丁目篠原中町4丁目篠原中町2丁目

小松川警察署速度取締指針 · 10 篠崎街道 ☆ 30km （40km）篠崎駅入口交差点（ポニーランド前交差点）江戸川区江戸川4－20先（江戸川区江戸川3－12先交差点）

小松川警察署速度取締指針 · 10 篠崎街道 ☆ 30km （40km）篠崎駅入口交差点（ポニーランド前交差点）江戸川区江戸川4－20先（江戸川区江戸川3－12先交差点）

岡崎ビジネスサポートセンターOKa-Biz 活動報告書活動報告書岡崎ビジネスサポートセンターOKa-Biz 岡崎市岡崎商工会議所（運営：岡崎市、岡崎商工会議所／協力：岡崎市六ツ美商工会、岡崎市ぬかた商工会）

岡崎ビジネスサポートセンターOKa-Biz 活動報告書活動報告書岡崎ビジネスサポートセンターOKa-Biz 岡崎市岡崎商工会議所（運営：岡崎市、岡崎商工会議所／協力：岡崎市六ツ美商工会、岡崎市ぬかた商工会）

Dual Learning for Machine Translation (NIPS 2016)

Dual Learning for Machine Translation (NIPS 2016)

三つ折りパンフ修正0715 - mech.co.jp · PDF fileTitle: 三つ折りパンフ修正0715 Author: 篠崎 S 忠宏

三つ折りパンフ修正0715 - mech.co.jp · PDF fileTitle: 三つ折りパンフ修正0715 Author: 篠崎 S 忠宏

Languages

Pages

Legal

Copyright © 2022 FDOCUMENT