トーラス型自己組織化マップのための 追加学習法の...

4
トーラス型自己組織化マップのための 追加学習法の提案および検討 A Proposal and Examination of Additional Learning Method For a Torus Typed Self-Organizing Map ○ 島崎 尚史 Naohumi SHIMASAKI,鳥取大学工学部電気電子工学科, 瀬木 寛人 Hiroto SEGI,鳥取大学工学部電気電子工学科, 松浦 弥三郎 Yasaburo MATUURA,鳥取大学大学院工学研究科, 大木 誠 Makoto OHKI 鳥取大学工学部電気電子工学科, 大北 正昭 Masaaki OHKITA,鳥取大学工学部電気電子工学科([email protected] 1.はじめに 自己組織化マップ(Self-Organizing Map,以 SOM)は,多次元データの分類に効果的な技術 として知られている.汎用性に優れており,認識, 予測,分類などさまざまな分野への応用が可能で あることから,今後ますます注目されるであろう [1],[2]しかし,SOM には問題点があり,今回はその 中でも一度学習を終えると新しいデータを追加 する場合にはじめから学習しなおさなければな らない(以下,再学習)という点に着目した.これ では,出力からのフィードバックで学習して再度 出力するような処理を行いたい場合,フィードバ ックが入力されるたびに再学習する必要があり, あまり効率のよい処理ではない.また学習データ が増加することにしたがってメモリを圧迫した り,学習量が不足したりするため,学習回数を増 やすか,学習できる量に上限を設けるなどの制限 が必要となってくる.これでは,SOM の柔軟な 情報処理を十分に生かしきれているとは言えな い. そこで本論文では,入力データを減らして学習 量を削減する追加学習法を 2 種類提案する.これ により入力データの増加に伴う学習時間の増加 を押さえ,気象などの時間とともに新しいデータ が観測されるような場合にも対応できるように なると考えられる.また,実際に追加学習法を利 用した場合と利用しない場合の比較を行うため, 上下水道の配水量を予測するシミュレーション を行った.その結果,追加学習法を利用しなかっ た場合と比べて予測精度と学習時間の改善の見 通しを得たので報告する. 2.トーラス型自己組織化マップ 基本的な SOM Basic SOM, BSOM)では,学 習後のマップに偏りが生じるという問題があっ た.これは,どのユニットを勝者ユニットに選ぶ かによって入力ベクトルの学習量が変化するた めと考えられる.そこで,本論文ではマップの上 下左右が結合したトーラス型自己組織化マップ Torus SOM)を用いる.Torus SOM を用いる ことにより学習量の差が発生することを防ぐこ とができる.次の図 1,図 2 Basic SOM Torus SOM の違いを示す. 図 1 Basic SOM 図 2 Torus SOM

Transcript of トーラス型自己組織化マップのための 追加学習法の...

トーラス型自己組織化マップのための

追加学習法の提案および検討

A Proposal and Examination of Additional Learning Method

For a Torus Typed Self-Organizing Map ○ 島崎 尚史 Naohumi SHIMASAKI,鳥取大学工学部電気電子工学科,

瀬木 寛人 Hiroto SEGI,鳥取大学工学部電気電子工学科, 松浦 弥三郎 Yasaburo MATUURA,鳥取大学大学院工学研究科,

大木 誠 Makoto OHKI 鳥取大学工学部電気電子工学科, 大北 正昭 Masaaki OHKITA,鳥取大学工学部電気電子工学科([email protected]

1.はじめに 自己組織化マップ(Self-Organizing Map,以

下 SOM)は,多次元データの分類に効果的な技術

として知られている.汎用性に優れており,認識,

予測,分類などさまざまな分野への応用が可能で

あることから,今後ますます注目されるであろう [1],[2].

しかし,SOM には問題点があり,今回はその

中でも一度学習を終えると新しいデータを追加

する場合にはじめから学習しなおさなければな

らない(以下,再学習)という点に着目した.これ

では,出力からのフィードバックで学習して再度

出力するような処理を行いたい場合,フィードバ

ックが入力されるたびに再学習する必要があり,

あまり効率のよい処理ではない.また学習データ

が増加することにしたがってメモリを圧迫した

り,学習量が不足したりするため,学習回数を増

やすか,学習できる量に上限を設けるなどの制限

が必要となってくる.これでは,SOM の柔軟な

情報処理を十分に生かしきれているとは言えな

い. そこで本論文では,入力データを減らして学習

量を削減する追加学習法を 2 種類提案する.これ

により入力データの増加に伴う学習時間の増加

を押さえ,気象などの時間とともに新しいデータ

が観測されるような場合にも対応できるように

なると考えられる.また,実際に追加学習法を利

用した場合と利用しない場合の比較を行うため,

上下水道の配水量を予測するシミュレーション

を行った.その結果,追加学習法を利用しなかっ

た場合と比べて予測精度と学習時間の改善の見

通しを得たので報告する.

2.トーラス型自己組織化マップ 基本的な SOM(Basic SOM, BSOM)では,学

習後のマップに偏りが生じるという問題があっ

た.これは,どのユニットを勝者ユニットに選ぶ

かによって入力ベクトルの学習量が変化するた

めと考えられる.そこで,本論文ではマップの上

下左右が結合したトーラス型自己組織化マップ

(Torus SOM)を用いる.Torus SOM を用いる

ことにより学習量の差が発生することを防ぐこ

とができる.次の図 1,図 2にBasic SOMとTorus SOM の違いを示す.

図 1 Basic SOM

図 2 Torus SOM

3.追加学習法

3.1 入力ベクトルの重み 本論文で用いる Torus SOM では,追加学習を

行うために次の学習式を用いる.

)]()([)()()1( ttwthtt ijiciii mxmm (1)

ここで, は入力ベクトル, は参照ベ

クトル, は更新された後の参照ベクト

ル, は学習係数を示す. 改良した Torus SOM では,入力ベクトルごと

に重みパラメータ を設け,これを学習係数 に掛ける.これにより入力ベクトルごとに,

マップへどれだけ学習させるかを指定できる.

3.2 読み取り型追加学習法 読み取り型追加学習法とは,一度学習を終えた

マップの参照ベクトルのうちラベルのついたも

のを全て取り出して,新たに追加学習したいデー

タとともにマップへ学習する手法である.読み取

り型追加学習法の概要を図 3 に示す.図中の a~cはラベル, は新たに追加学習する入力ベクト

ル, はラベルの添付されたユニットの持

つ参照ベクトルを示す. 読み取り型追加学習法による学習は以下の流

れで行う. 1. 追加学習する入力ベクトルと,追加学習さ

れるマップを準備する. 2. 追加学習されるマップの勝者ユニット(図

3 a,b,c)が持つ参照ベクトルを取り出して,

入力データとする.ここで,一つ勝者ユニ

ットに 1 つの入力ベクトルが参照していた

場合は重みを 1 とし,複数の入力ベクトル

が参照していた場合は,重みを参照してい

た数とする. 3. 取り出した入力データに,新たに追加学習

する入力ベクトルを加える. 4. 出来上がった入力データを新たなマップに

学習させる. 追加学習時に利用する入力データの数は,再

学習に利用する入力データの数より少ないの

で,その分だけ学習回数を減らす必要がある.

学習回数は式(2)を用いて求める.

0TDRT (2)

ここで, は初期の学習回数,T は使用する

学習回数,R は追加学習時の入力データ数,D は

再学習時の入力データ数を示す.

図 3 読み取り型追加学習法

本手法を用いることにより学習回数を減らすこ

とができ,学習時間を削減することができる.し

かし,参照ベクトルと入力ベクトルは完全に等し

くはないため,そのときの誤差が追加学習のたび

に蓄積するという問題が生じる.

3.3 入力ベクトル保存型追加学習法 入力ベクトル保存型追加学習法とは,学習を終

えたマップのユニットにラベルをつけると同時

に,そのユニットを参照した入力ベクトルの平均

値を保存しておき,保存された入力ベクトルの平

均値を使って追加学習を行う手法である.これに

より入力ベクトルと参照ベクトルの間の誤差の

発生を防ぐことができる.読み取り型追加学習法

の概要を図 4 に示す.図中の はユニット

に保存された入力ベクトルの平均値を表す. 入力ベクトル保存型追加学習法による学習は

以下の流れで行う. 1. 追加学習する入力ベクトルと,追加学習さ

れるマップを準備する. 2. 追加学習されるマップの勝者ユニット(図

3 a,b,c)が持つ前回の学習で利用した入

力ベクトルの平均値を取り出して,入力デ

ータとする.重みは読み取り型追加学習法

と同様に設定する. 3. 取り出した入力データに,新たに追加学習

する入力ベクトルを加える. 4. 出来上がった入力データを新たなマップ

に学習させる. この手法は,1 つのユニットを 1 つの入力ベク

トルが参照した場合は誤差が生じず有効である.

)(thcijw

)(tjx

)(thci

)(tim)1( tim

)(tx

ca x'x' ~

0T

ca mm ~

しかし,複数の入力ベクトルが参照された場合そ

れらの平均値をとることで平均値と入力ベクト

ルの間に誤差が生じる問題がある.

図 4 入力ベクトル保存型追加学習法

4. 配水量予測

4.1 上水道設備 上水道設備は,河川,ダムなどから取り入れら

れた原水は水の製造工場である浄水場へ送られ,

種々の設備や薬品で安全な飲み水に浄化される.

浄化された水は浄水場から複数台の送水ポンプ

で配水タンクへ送水されいったん蓄えられる.蓄

えられた水は配水タンクから地中に網目のよう

に張り巡らされている水道管を通り,自然流下に

よって各家庭へ届けられる. 浄化された水は複数台の送水ポンプにより配

水タンクへ1日中送り続けられ,配水タンクの水

位は地震や火事のような急な水の需要に対応で

きるように適当な水位が保たれている. このような上水道設備の運用を効率的かつ安

定して行うためには,配水タンクの容量に制限が

ある場合を考えると配水量の変化をあらかじめ

予測し,その予測値に基づいて送水ポンプを制御

することが有効となる.この配水量の予測は,広

域にわたる規模の大きな問題になると演算時間

が大きくなるという課題があったが,SOM を適

用することで高速に演算できるようになる[3].

4.2. 配水量予測 本研究では,奈良県桜井市水道局の上水道の配

水量予測を行う.SOM には演算制御工学研究室

で開発中の Mr. Torus に追加学習用の改良を施し

て使用する.SOM に学習させる入力ベクトルは

24 次元で,各次元の要素は,毎時間の配水量を計

測したものである.1999 年と 2000 年,2002 年

のうち 7 月から 9 月まで一ヶ月 30 日として合計

270 日分の実測データから 2002 年 9月の 30日分

を評価データとして除いたものを 0~1 に正規化

して用いる. 配水量予測の概要を図 6 に示す.

図 5 配水量予測の概要

5. シミュレーション 配水量予測を用いない従来法と 2種類の追加学

習法を比較するためにシミュレーションを行う.

5.1 実験方法

シミュレーションは以下の流れで行う. 1.マップを初期化する. 2.1999 年 7 月 1 日~15 日までを入力データと

してマップに学習させる. 3.2002 年 9 月~9 月 30 日までの評価データを

予測させ,予測したデータと本来のデータと

の誤差と学習に要した時間を算出する. 4.マップを初期化する. 5.1 日分追加学習する.ただし従来法では今ま

での入力データに 1日分を加えて学習させる. 6.3 と同様に誤差と学習に要した時間を算出す

る.

7.1999 年 7 月 16 日~2002 年 8 月 31 日までの

225 日分追加学習して誤差と時間を算出する

まで 4~6 を繰り返す. シミュレーションは以下の表 1に示す学習パラ

メータを用いる. 表 1 学習パラメータ

従来法 読取型 保存型 学習回数 10000 学習係数 0.01 0.05 0.01 近傍半径 18 14 18 マップサイズ 14×14 5.2 シミュレーション結果 1 日ずつ追加学習したさいの予測誤差と追加学

習に要した時間を,それぞれ図 6~8 に示した.

また,225 回追加学習した SOM のマップを図 9~11 に示す.

シミュレーションでは,入力ベクトル保存型よ

りも読み取り型追加学習法で良好な精度が得ら

れた.さらに,従来法と同等の予測精度を保った

まま,学習時間を約 11%程度まで削減することが

できた. 一方,入力ベクトル保存型では,学習時間は減

少したものの予測精度が安定せず従来法と同程

度の予測精度は得られなかった.このことから,

同じユニットを参照した入力ベクトルであって

も,平均値をとってはいけないということがわか

った.

(a)予測誤差の推移 (b)学習に要した時間の推移

図 6 従来法によるシミュレーション

(a)予測誤差の推移 (b)学習に要した時間の推移

図 7 読取型によるシミュレーション

(a)予測誤差の推移 (b)学習に要した時間の推移

図 8 読取型によるシミュレーション

図 9 従来法 図 10 読取型

図 11 保存型

6. 終わりに 本論文では,SOM に追加学習する手法とし

て読み取り型追加学習法と入力ベクトル保存

型追加学習法を提案し,上水道設備の配水量デ

ータを予測させて比較を行い,読み取り型追加

学習法にて良好な結果が得られ,追加学習法の

有効性が確認できた. 今後は,配水量予測だけではなくほかの分野

に対する予測を行い,更なる予測精度の向上と

学習時間の削減手法の提案及び検討を行う.

7. 参考文献 [1] T.Kohonen,”Self-Organizing Maps” (2nd

ed) Springer Ver-lag, 1997. [2] 徳高平蔵・岸田聡・藤村喜久朗, ”自己組織

化マップの応用 ” 海文堂出版株式会

社,1999. [3] 松浦 弥三郎, 大北 正昭, 大木 誠, ”自

己組織化マップを用いた配水量予測によ

る上水道設備のポンプ運転経費の軽減”, 2004.

連絡先 〒680-8552 鳥取市湖山町南 4-101 鳥取大学 工学部 電気電子工学科 大北正昭 電話:0857-31-5699, FAX:0857-31-0880 e-mail:[email protected]