私情協・分野連携(アクティブ・ラーニング)対話集会 ー数学分 … · ディープラーニング(深層学習) 参考 ニューラルネットワークと深
AI学会講演 · 深層学習 Deep learning...
Transcript of AI学会講演 · 深層学習 Deep learning...
宇宙誌と脳 ー 脳ができるまで
ビッグバン (138億年前) 物理学・化学
生命 (36億年前) 生命科学
脳・神経系 (5億年前) 神経科学・情報科学
文明・社会 (20万年前?)脳科学・情報科学・人間科学
⼈⼯知能と脳のモデル:ー歴史の要約第⼀次ブーム: 記号と論理 VS パターンと学習
1956~ AI 脳モデルDartmous 会議 Perceptron記号と論理 学習する普遍計算機構
知的推論、ゲーム
実⽤的でない!! 暗⿊期 (1965後半~1970ʼs)
第2次ブーム
1970~ AI 1980~ BT (神経回路) エキスパートシステム MLP (backprop)
(MYCIN, DENDRAL) 連想記憶モデル、ダイナミックス
⼀兆円産業か?
沈静化 確率Bayes推論chess (1997)
第3次ブーム 2010~ 脳型の⼈⼯知能(融合)深層学習 Deep learning(畳み込み多層回路(福島)+確率勾配降下:
⽇本でなぜ実現しな かったか?)確率推論
深層学習の勝利 ーー⼈間以上の識別能⼒パターン認識: vision, auditory, sentence analysis
囲碁:強化学習時系列とダイナミックス、動的パターン;⾔語処理
記号と論理 VS パターンとダイナミックス、学習−融合
層状学習回路網multilayer perceptron
x z
パーセプトロン Perceptronバックプロパゲーション Backpropagation
2, ,
,,
L W y W
L Wc
W
x g x
xw w w w
Information Theory II--Geometrical Theory of Information
Shun-ichi AmariUniversity of Tokyo
Kyouritu Press, Tokyo, 1968
最初のMLPの確率勾配降下学習法 (1967;1968)
数理脳科学は脳の基本原理を探求する単純な基本モデル⽤いる:数理的探索(現実とは違う) 計算論的神経科学
(脳はいかにこの原理を実現したか)
AI : 技術による原理の実現 (脳とは違う) 神経科学(ありのままの脳)
究極のゲーム(ultimatum game)
10万円A B
A: 配分を決定する---- 7万円–3万円B: 同意または拒否
この時の脳の働き、各領野の確執利益、公正、その後のこと、評判二人か社会ゲームか
葛藤する⼼
統計神経⼒学Rozonoer (1969)Amari (1971; 1974)Amari et al (2013)Toyoizumi et al (2015)Poole, …, Ganguli (2016)Schoenholz et al (2017) ~ (0 , 1)ijw N
巨視的振舞いほとんどすべての(典型的)回路に共通
深層回路
01
2
1
( )
1
( )
i ij i il l
il ll
l l
x w x w
A xn
A F A
2
20
~ (0, / )
~ (0, ) ij
i b
w N n
w b N
活動度の⼒学
2 2 2 2
22 2 1
0 21
20
( ) ( )
~ (0, );
1 1( ) [ ( ) ] ( ) = cos ( )2 1
( ) ( ) ~ (0,1)
k k
A A b
A
l A
y w y b u
u N A
A y E u An
A Av Dv v N
Basis vectors
1 1 1 1
1 1
1 1
1 1
( ... )
...
l l
l
l l
l l l
l l l l l
i ii i i i i i
l l l l m m
l l l
i ii
l m m
a
i i
a a
dx u W dx B dx
d B d B Bd
B B B
B u W
x x x
e e e
Mectric
1 1 1 1
1
2
2 2 2
221
,
l l
l l l l l
l
l
l l l l
a bab ab
l l l
a bab
i ii i i l i i
i
l i
g BB g
ds g d x d x
BB W W u E
E u
e e
リーマン計量の⼒学
2
2 2
2 22 2
1 2
( ) ( )
,
( ) ( '( ) )
, ,
E[ '( )) ] E[ '( )) ]E[ ]
1( ) { '( )}2 1 2(
k k
k k a a
i jij
k k
a b ab k j k j
k j k j
b
b
y w y b u
dy B dy B
ds g dy dy d d
B B u w
g B B
u w w u w w
AA Av DvA
e e
y y
e e e e
2 )
平均場近似
1 1 1 1
1 1
1 1 1 1
2 2
1 12
2' '
2'
2' '
( )
[ '( ) ]
= E[ '( ) ] O (1/ )
=E[ '( ) ]E[ ] O (1/ )
l l l l
l l l l l
l l
l l l
l l
l l l l l
i
l l l
i i i ii i i i i
i ii i i p
i ii i i i i p
d s dx
d s BBd xd x
B B u W W
n u W W n
u W W n
2 2 '( )li
u Dv
law of large numbers
1
1 1
1
( )conformal transformation!
( ) 1:
( )
ab ab
l sab ab
g A g
A
g A
拡大(カオス、Lyapnov指数)
rotation, expansion
曲率の⼒学
2 2
''( )( )( ) '( )
| |
lab a b a b
a b a b
ab ab ab
ab ab
H y
u
H
e
w e w e w e
H H H
H
Euler-Schouten曲率Affine connection
Backward path; error back-propagationFisher information matrix
221( , ) ( ; ) ( , )2
l x W y x W e x y
Stochastic model : 深層回路の多様体
2
2
( ) ; ~ (0,1)1( , : ) exp{ ( ( ; )) } ( )2
[ log ( , : ) log ( , : )]x W W
y u N
p y x W c y x W q x
G E p y x W p y x W
ds dWGdW
Fisher information
1 1 1
2 1 1
1
' ...
, (1/ )
, 0 ~ (1/ ),
, 0 ~ (1/ ),
m ll l l m
m m m m
l l l
il m x p
l m pl l
i j p
G EW W
W B BB BW W W W
G W W E O n
G W W O n l m
G O n i j
x
w x x
w w
1
1 2 1
' '
1.... ( )
1.. ( )
l l l m
m l m
l l
m m m m
i i i ii i i i p
i ii i pi i
B B B On
On
B
B B
1 1
'
' '
, E [ ' ' ]
+o (1/ );
, E [ ' ' ]
E [ ' ' ]
L L
l m
L L
l m
l l l l
i il m x i i
p
i il l x i i
i i x i i
G W W
n l m
G W W
B B xx
B B xx
xx
Domino Theorem
1 1 1 1
1 1 1 1
1 2
2
1
1
1
1 1 1
L L
L L L L L L
L L
L L L L L L
i ii i i i i i
i ii i i i i
l l l
m m m
l l l
m m m
i
B BB BBB
B BB BB
B B
B B BBBB
BW W W
x x x
x x x
x x x
Fisher information of unit
0
2
1 2 1 2
E E [( ') ]
{ , ,... } { * , *,... , *}: ortho-normal basis
* ,
x
n n
n
y w
G
w
xx
e e e e e e
we
x w w
w x
2
1
0 0 0 1
simila: r o f rm
B CG A
G
I
ww wb + bww w
b
Input x: independent and identically distributed, 0-mean