自己組織化マップを利用したロボットにおける知的情報処理...

5
マップを したロボットにおける システム けて [email protected]‡{tokunaga, furukawa}@brain.kyutech.ac.jp †‡ 大学大学院 2009 3 10 1 はじめに 々( 大学大学院 (以 ))が いる「 アルゴリズムを いた ロボットにおける 」について する. マップを拡 したモジュラー ネットワーク SOMmnSOM)および マップ(SOM 2 )を 案し,これま ・アルゴリズム ,および した みを ってきた. mnSOM SOM におけるベクトルユニットをニュー ラルネットワーク モジュールに えた格 モジュラーネットワーク つ.またモジュ ラーネットワークにおけるゲーティングネットワーク わりに SOM アルゴリズムを るこ ネットワーク うモジュールが した )を獲 するように学 われる. ため mnSOM された SOM いって いだろう [1].これにより SOM ベクトル におけ るマップを するが,mnSOM における マップを する.mnSOM (1)一つ モジュー ルが つ,(2)モジュール わせて にデザイン きる, いった つため,多 った SOM いえる.mnSOM ,パターン パターン ,移 ロボット, ロボット され ている [2, 3, 4, 5]SOM 2 mnSOM モジュールを SOM モジュー ルにした つが, SOM が多 する わりに SOM 2 ファイバー する いう [7, 8].ファイバー パターン されているため [6]SOM 2 パターン きる 待される. SOM 2 いて ,移 ボットにおける モデル している [9, 10]mnSOM SOM 2 えられたデータ (エピ ソード)から あり (モデル)を する にモデル くマップ われる.つまり し学 あり学 された学 メカニズムを [11].さ らにネットワークに データ えられた ,各モジュール により ましいモデ ルを するこ る.mnSOM SOM 2 おけるこ よう ロボット における シーンおよび きる いか えている. これより mnSOM SOM 2 いた ロボットにおける システム みている. ,あるい )において れるロボット ている.こ よう ロボット センサを りに がら, する, する, する, コミュニケーションを る, イン タラクションを じて学 タスクを うこ ましい.これら タスクを する モデル かつ いテーマ ために多く している ある. に対し, に以 3テーマについ て,mnSOM および SOM 2 によるアプローチを みている. 1. ロボットにおける モデル 2. える システム 1 - 33 -

Transcript of 自己組織化マップを利用したロボットにおける知的情報処理...

Page 1: 自己組織化マップを利用したロボットにおける知的情報処理 …app6.ele.tottori-u.ac.jp/SOM-Meeting/2009/web-PDF/som2009-07-web.pdf自己組織化マップを利用したロボットにおける知的情報処理

自己組織化マップを利用したロボットにおける知的情報処理システムの実現に向けて

†○秋吉祐紀,†岩男誠二,†川畑宣之,‡徳永憲洋,‡古川徹生†[email protected],‡{tokunaga, furukawa}@brain.kyutech.ac.jp

†‡九州工業大学大学院 生命体工学研究科

2009年 3月 10日

1 はじめに

本稿では我々(九州工業大学大学院生命体工学研究

科脳情報専攻古川研究室(以下、古川研))が現在取

り組んでいる「自己組織化アルゴリズムを用いた自律

移動ロボットにおける脳型知性の開発」について紹介

する.

古川研では自己組織化マップを拡張したモジュラー

ネットワーク SOM(mnSOM)および高階型自己組織化マップ(SOM2)を数年前に提案し,これまでに理

論・アルゴリズムの確立,および様々な分野への応用

を目指した取り組みを行ってきた.

mnSOMはSOMにおけるベクトルユニットをニューラルネットワークなどのモジュールに置き換えた格子

状のモジュラーネットワークの構造をもつ.またモジュ

ラーネットワークにおけるゲーティングネットワーク

の代わりに SOMの競合・協調アルゴリズムを導入することでネットワーク上で隣り合うモジュールが類似

した機能(関数)を獲得するように学習が行われる.

そのためmnSOMは一般化された SOMといってもいいだろう [1].これにより SOMはベクトル空間におけるマップを作成するが,mnSOMは関数空間におけるマップを作成する.mnSOMは(1)一つのモジュールが高次情報処理機能を持つ,(2)モジュールは課題

に合わせて自由にデザインできる,といった特徴を持

つため,多様性を持った SOMといえる.mnSOMは現在,パターン認識,信号パターン認識,適応制御,移

動ロボット,水中ロボットの制御などに応用がなされ

ている [2, 3, 4, 5].SOM2は単にmnSOMのモジュールをSOMモジュー

ルにした構造を持つが,幾何学的には SOMが多様体を近似する代わりに SOM2はファイバー束を近似する

という特徴をもつ [7, 8].ファイバー束はパターン認識に応用されているため [6],SOM2もパターン認識や

物体の構造認識などに応用ができると期待される.実

際に我々は,SOM2を用いて手書き文字認識,移動ロ

ボットにおける外界環境のモデル構築,物体形状認識

などに応用している [9, 10].mnSOM と SOM2 は与えられたデータ集合(エピ

ソード)から教師ありで関数(モデル)を推定すると

同時に教師なしで自己組織的にモデルの類似度に基づ

くマップ生成が行われる.つまり教師なし学習と教師

あり学習が融合された学習メカニズムを持つ [11].さらにネットワークに疎のデータ集合が与えられたとし

ても,各モジュール間の協調作用により望ましいモデ

ルを推定することが可能となる.mnSOMと SOM2に

おけるこのような自己組織的学習能力は移動ロボット

における行動の自己創発やシーンおよび環境認識に利

用できるのではないかと我々は考えている.

これより我々は mnSOMと SOM2 を用いた自律移

動ロボットにおける知的情報処理システムの実現を試

みている.具体的には,作業空間(部屋の中や建物の

中,あるいは公園や都市などの野外)において環境を

認識し自律的に動き回れるロボットの実現を目標とし

ている.このようなロボットは自らのセンサを頼りに

外界環境を認識しながら,自己位置を推定する,目的

地まで到達する,未知環境を探索する,最適行動の発

見,人間とコミュニケーションをとる,人間とのイン

タラクションを通じて学ぶ,などのタスクを自律的に

行うことが望ましい.これらのタスクを実現する知的

な情報処理モデルの構築は非常に困難かつ実に興味深

いテーマのために多くの研究者が挑戦している分野で

もある.

この目標に対し,我々は特に以下の3テーマについ

て,mnSOMおよび SOM2の応用によるアプローチを

試みている.

1. ロボットにおける自己組織的環境モデル構築

2. 物体認識を実時間で行える視覚情報処理システムの開発

1

- 33 -

fujimura
長方形
Page 2: 自己組織化マップを利用したロボットにおける知的情報処理 …app6.ele.tottori-u.ac.jp/SOM-Meeting/2009/web-PDF/som2009-07-web.pdf自己組織化マップを利用したロボットにおける知的情報処理

3. 外界とのインタラクションから自律的に環境モデルと行動制御器を学習させるシステム

本稿では上記3テーマについての説明と結果を示す.

2 ロボットにおける自己組織的環境

モデル構築

ロボットが自律的に移動するためには,ロボット自

身が,作業環境内における位置や姿勢を推定し,かつ

目的地までの行動を計画する必要がある.これらのタ

スクを実行するためには移動ロボット自身が有するセ

ンサ情報を用いて,外界との相互作用を繰り返すこと

で作業空間の環境内部モデルを自己組織的に構築する

ことが望ましい.我々は自己組織的環境モデルの構築

法として,SOM2とmnSOMを拡張した進化型モジュラーネットワーク(SElf Evolving Modular network:SEEM)の二つの手法からアプローチを試みてきた.以下にそれぞれのアプローチの説明と実験結果につい

て簡単に説明する.

2.1 SOM2を用いた自己組織的環境モデル構築

我々はSOM2を利用することで、視覚情報からロボッ

トの位置と向き(姿勢)を推定できる環境モデルを教

師なしで自己組織的に構築する方法を提案した [10].これは連続多様体集合の自己組織化マップを作成する

ことで実現が可能となる.以下に枠組みについて説明

する.

今,視覚センサを搭載した移動ロボットが見通しの

良い広場にいるとしよう.ここで移動ロボットが作業

環境上のある地点A(図 1左)で周囲を見回したとき,その一連の視覚センサ情報系列は多次元ベクトル空間

上にて一元のひも状に分布する.仮に移動ロボットが

地点Aにおいて 360◦ 回転しながら視覚センサ情報を観測したならば,その一連の視覚センサ情報系列は多

次元空間上にて1次元の環状多様体を形成する(図 1右).さらに地点Aの近辺にある地点Bや地点Cで観測

したセンサ情報系列は,多次元空間上にて地点Aにお

ける多様体の近辺に分布する.もし地点Aから地点D

まで移動ロボットが動きながら視覚センサ情報系列を

観測したとすると一元環状多様体は図 1右に示すようにチューブ状に連続的に分布する.このように地点ご

とのセンサ情報を環状多様体に分布させることで,多

次元空間上に分布する環状多様体集合のトポロジーと

広場の地理のトポロジーは一致することが期待できる.

図 1: 多次元ベクトル空間における視覚センサ情報系列. 

また移動ロボットの姿勢(向き)がどんなに変わった

としても視覚情報の対応点は滑らかかつ連続的に変化

するために対応点さえ既知であれば方位の推定も可能

となる.このことから多様体集合の写像(ファイバー

束)を実現する SOM2を利用することで,視覚センサ

情報だけからロボットの位置と向きを推定できる自己

組織的に環境モデルを構築できると考えられる.

我々は一モジュールを1次元環状多様体を近似でき

る環状 SOMとした SOM2を用いて移動ロボットにお

ける環境モデル構築のシミュレーションを行った.シ

ミュレーションはロボットシミュレータWebots(Cy-berbotics社)を用いた.図 2はWebots上で作成した仮想の広場である.広場の周りにはビルや木など様々

な物体を配置してある.移動ロボットはこの広場の格

子領域(図 2内に描いた格子内)を自由に動き回れる.また移動ロボットには全方位視覚センサを搭載してお

り,全方位視覚センサ情報を図 3のように細分化することで多次元空間上にて1次元環状多様体が形成され

る(単眼の視覚センサによる環境モデル構築について

は現在研究段階のため掲載を省略する).

図 4に実験結果を示す.図 4(a)の矢印及び数字はロボットの軌跡を表わしており,“●”は視覚センサ情報を観測した場所を表わす.観測された視覚センサ情

報を基に SOM2を学習させた.SOM2のマップのトポ

ロジーと広場のトポロジーが一致しているかどうかを

確かめるために,図 4(b)のように渦巻き状にロボットを動かし,“●”の地点で視覚センサ情報を SOM2に

与え,勝者モジュールを確認した.その結果が図 4(c)である.結果よりマップのトポロジーと広場のトポロ

ジーが一致していることが確認できる.

2.2 SEEMを用いた自己組織的環境モデル構築

これまでに述べたmnSOMや SOM2は追加学習が必

要な用途を想定したアルゴリズムではなく,モジュール

の数や配置は課題に応じて固定して用いていた.これに

2

- 34 -

fujimura
長方形
Page 3: 自己組織化マップを利用したロボットにおける知的情報処理 …app6.ele.tottori-u.ac.jp/SOM-Meeting/2009/web-PDF/som2009-07-web.pdf自己組織化マップを利用したロボットにおける知的情報処理

図 2: Webotsで作成した仮想広場.

図 3: 全方位視覚センサ情報の細分化.

(a) (b)

(c)

Learn Test

Map

図 4: SOM2 が獲得した環境モデル.

より学習が安定する反面,学習する環境の形状など学習

データにあわせたパラメータを人間が試行錯誤的に調

図 5: SEEMにより学習する環境.

整しなければならない.実環境で移動ロボットを用いる

場合,環境の事前情報は不完全であることが多く全ての

可能性を考慮したパラメータ調整を行うことは現実的で

はない.例えば格子状にモジュールを配置したmnSOMや SOM2では,2.1節で述べたような格子状の広場のような環境でなければ望ましい学習を行うことは困難で

ある.さらにロボットを行動させながら学習する必要が

ある場合,バッチ学習であるmnSOM,SOM2では対

応が難しい.そこで我々はmnSOMを拡張した自己進化型モジュラーネットワーク(SElf Evolving Modularnetwork: SEEM)を提案し,自己組織的環境モデル構築への応用を試みている.SEEMは mnSOMのベースとなる学習アルゴリズムを SOM から Kasabov らが提案した進化型 SOM(Evolving SOM: ESOM)に拡張したグラフ構造のモジュラーネットワークであり,

ノードはモジュール,ノード間のパスはモジュール間

の類似性を表現する.これらのノードとパスは学習に

よって自己組織的に増加するため,最適なモジュール

の数や配置をあらかじめ設定する必要がない.さらに

これらの学習は全てオンラインで行うことができるた

め,SEEMでは未知の環境のモデルを探索しながらその場で作るなどということが可能になる.

我々は 2.1節の SOM2と同様な環状SOMをモジュールとした SEEMによって環境モデル構築のシミュレーションを行った.学習を行った環境が図 5,その学習結果が図 6である.実験の条件は 2.1節の実験とほぼ同様であるが,学習する環境が未知であり,全ての学

習をロボットが移動しながらオンラインで行っている

点で異なる.

3

- 35 -

fujimura
長方形
Page 4: 自己組織化マップを利用したロボットにおける知的情報処理 …app6.ele.tottori-u.ac.jp/SOM-Meeting/2009/web-PDF/som2009-07-web.pdf自己組織化マップを利用したロボットにおける知的情報処理

図 6: SEEMの学習により得られたグラフ状の環境モデル.

3 物体認識を実時間で行える視覚情

報処理システムの開発

ロボットは移動しながら物体認識や環境の構造を認

識しなければならない.そのため実時間で視覚情報か

ら特徴を抽出し,かつ,物体認識を行えるシステムを開

発しなければならない.視覚情報から特徴抽出した後

に物体認識(あるいは環境認識)までを一度に行う工学

的モデルとしてはネオコグニトロンや ConvolutionalNeural Networkに代表されるような階層型のニューラルネットワークが挙げられる [12, 13].つまり初期の層で視覚情報から局所領域における特徴を抽出し,後ろ

に続く層でそれらを統合し,最終層で認識を行う,と

いったモデルである.これは人間における視覚情報処

理のメカニズムに類似している.加藤らは SOMを階層構造にすることでパターン認識に応用している [14].我々は SOM2を階層構造にした視覚情報処理モデルを

提案し物体認識への応用を試みている.SOMの階層化と違う点は横ずれや回転にロバストなパターン認識

ができることである.次に簡単な説明をするが,まだ

実験段階のため結果は省略する.

我々が提案する階層型 SOM2のネットワークアーキ

テクチャを図 7に示す.まず,与えられた画像からガボールフィルタの周波数および角度毎に特徴を抽出す

る.抽出された情報をベクトルデータの集合として第

一層目の SOM2に入力し学習を行う.学習によって第

一層目の SOM2は,輪郭形状の特徴を獲得する.つま

り各モジュール毎に異なった輪郭形状の特徴を表現す

る.さらに第一層目で反応した SOM2のモジュール情

図 7: 階層型 SOM2を用いた視覚情報処理システム.

報を第二層目 SOM2に入力する.これにより第二層目

SOM2は,輪郭ではなく口や目といった形状の特徴を

表現することになる.第二層目以降も SOM2を階層化

することでさらに高次のパターン認識が可能となるだ

ろう.

さて,実際にこの階層型 SOM2を利用した場合,大

規模なネットワークであるために認識までにかなりの

時間を要すると考えられる.しかしアーキテクチャ的

には並列処理による処理速度の向上が期待できる.ま

たさらなる処理速度の向上にはハードウェア化も期待

できる.

4 外界とのインタラクションから自

律的に環境モデルと行動制御器を

学習させるシステム

自律的に行動するエージェントにとって,多様な外

界(環境)のモデル表現を獲得することは,自己の状

況認識や行動決定のために必要である.環境は常に変

化するものなので,ロボットは自らセンサ情報を頼り

に外界とのインタラクションを繰り返すことで環境の

モデルを獲得する必要がある.また環境のモデルを獲

得するだけでなく,同時にモデルに合わせて最適な行

動制御も行う必要がある.そこで我々は,図 8に示すような,外界とのインタラクションから自律的に環境

モデルと行動制御器を学習させるシステムを提案する.

環境モデルの獲得には mnSOMあるいは SOM2 を用

いる.mnSOM を環境モデルの獲得に用いる理由は,mnSOMはモジュール間の近傍学習によって学習が安定するだけでなく,学習していない環境のモデルも近

傍学習による内挿によって自己組織的に発現すること

が可能だからである.これより mnSOM は自律エージェントが環境モデルを獲得する基盤的アルゴリズム

としても適すると期待される.一方,行動制御器とし

ては強化学習を用いる.強化学習は外界とのインタラ

クションを通じて環境から与えられる報酬を元にして,

4

- 36 -

fujimura
長方形
Page 5: 自己組織化マップを利用したロボットにおける知的情報処理 …app6.ele.tottori-u.ac.jp/SOM-Meeting/2009/web-PDF/som2009-07-web.pdf自己組織化マップを利用したロボットにおける知的情報処理

mnSOM

図 8: 外界とのインタラクションから自律的に環境モデルと行動制御器を学習させるシステム.

図 9: mnSOMのマップ上に表現された環境のサブモデル.

最も報酬が多く得られるような行動を教師なしで獲得

する学習アルゴリズムである.つまり現在の環境の状

態を観測(認識)し,報酬が最大となる行動を決定す

るように学習を行う.mnSOMの各モジュールは環境の局所環境モデル(サブモデル)を獲得するので,サ

ブモデルを強化学習における状態として利用すること

が可能となる.これよりmnSOMの各モジュールを離散状態として用いて強化学習と組み合わせることで,

より高度な行動の創発が期待され,自律エージェント

の実現が期待される.

本研究では,図 8 に示すシステム開発の第一歩として,まずmnSOMの前身である SOMと強化学習によるリアクティブコントローラを実現した.さらに,

mnSOMが環境をサブモデル毎に表現するように設計し検証を行った.図 9にmnSOMの各モジュールが環境のサブモデルを表現したことを示す.

参考文献[1] K. Tokunaga, and T. Furukawa, “Modular Network

SOM,” Neural networks, Vol.22, pp.82–90, 2009.

[2] T. Furukawa, K. Tokunaga, S. Kaneko, K. Ki-motsuki, and S. Yasui, “Generalized self-organizingmaps(mnSOM) for dealing with dynamical sys-tems ,” Proceedings of   International Symposiumon Nonliner Theory and its Applications(NOLTA),pp.231-234, 2004.

[3] 湊原哲也,古川徹生, “適応性と汎化性を考慮した自己組織化適応制御器”, 電子情報通信学会論文誌, vol.J91-D-II, no.4, pp.1142–1149, 2008.

[4] M. Aziz Muslim, M. Ishikawa, and T. Furukawa,“Task segmentation in a mobile robot by mnSOM:a new approach to training expert modules,” Neu-ral Computing and Applications, Vol.16, Issue 6,pp.571–580, 2007.

[5] 西田周平, 石井和男, 古川徹生, “水中ロボットにおける自己組織的行動獲得システム -第一報:自己組織化マップを用いた運動制御システムの提案-”, 日本船舶海洋工学会論文集 第 3号, pp.205–213, 2006.

[6] C. Min, and, G. Medioni, “Inferring SegmentedDense Motion Layers Using 5D Tensor Voting,”IEEE Transactions on Pattern Analysis and MachineIntelligence, Vol.30, No.9, 2008.

[7] T. Furukawa, “SOM of SOMs,” Neural networks, inpress, 2009.

[8] 古川徹生, “SOM の SOM: SOM 集合をマップするSOM”, 知能と情報(日本知能情報ファジィ学会誌),Vol.19, No.6, pp.618–626, 2007.

[9] 郡谷宏市, 大谷誠, 古川徹生, “NG× SOMによる手書き文字認識”, 電子情報通信学会技術報告,NC2008-84,pp.13–18, 2009

[10] 増岡孝紀, 徳永憲洋, 古川徹生, “SOM2 による移動ロボットのための環境内部モデル獲得”, 電子情報通信学会技術報告,NC2007-102,pp.91–96,2008.

[11] 徳永憲洋, 古川徹生, “一般化自己組織化マップ ~ 教師あり学習と教師なし学習の融合 ~”, 電子情報通信学会技術報告, NC2006-35, pp.75–80, 2006.

[12] K. Fukushima, “Interpolating vectors for robust pat-tern recognition,” Neural Networks, Vol.20, No.8,pp.904–916, 2007.

[13] S. Lawrence, A. C. Tsoi, and A. D. Back, “Facerecognition: A convolutional neural network ap-proach ,” IEEE Transactions on Neural Networks,Vol.8, pp.98–113, 1997.

[14] 加藤聡, 下平博, 堀口進, “大脳視覚野におけるV1野-IT

野を模した階層型 SOMのパターン分類能力”, 情報処

理学会研究報告, 2002-MPS-42-7, pp.25–28, 2002.

5

- 37 -

fujimura
長方形