対話型遺伝的アルゴリズムにおける ユーザ負担軽減と多様性維持の検討

94
対対対対対対対対対対対対対対対対 対対対対対対対対対対対対対対対対 対対対対対 対対対対対対 対対対対対対対対対対対対対 2006 対対 745 対 対対 対

description

対話型遺伝的アルゴリズムにおける ユーザ負担軽減と多様性維持の検討. 工学研究科 知識工学専攻 知的システムデザイン研究室 2006 年度 745 番 山川 望. 研究背景. 多くの人がインターネットショッピングを利用 商品提供者は数多くの商品を販売 ユーザは自由に商品を検索,購入. 研究背景. 多くの人がインターネットショッピングを利用 商品提供者は数多くの商品を販売 ユーザは自由に商品を検索,購入 ショッピングサイトにおける商品の提示方法 - PowerPoint PPT Presentation

Transcript of 対話型遺伝的アルゴリズムにおける ユーザ負担軽減と多様性維持の検討

対話型遺伝的アルゴリズムにおけるユーザ負担軽減と多様性維持の検討

工学研究科 知識工学専攻知的システムデザイン研究室

2006年度 745番山川 望

研究背景

多くの人がインターネットショッピングを利用商品提供者は数多くの商品を販売ユーザは自由に商品を検索,購入

研究背景

多くの人がインターネットショッピングを利用商品提供者は数多くの商品を販売ユーザは自由に商品を検索,購入

ショッピングサイトにおける商品の提示方法商品提供者 → 提示できる商品の数の制限たくさんの商品を販売することができるが,ユーザに対してすべての商品を提示することは困難ユーザ → 比較操作による疲労ページ遷移を繰り返すことにより,商品を比較,購入するかを検討する

商品のリコメンデーション

検索・購入履歴や商品の関連性を用いて商品を提示

商品のリコメンデーション

検索・購入履歴や商品の関連性を用いて商品を提示

  ユーザ:検索することなく関連商品を発見商品提供者:ユーザが購入しそうな商品を効率的に提示

商品のリコメンデーション方法の問題点

商品選択時のユーザの嗜好を商品提示に反映できていない主にユーザの検索・購入履歴を用いて商品を提示商品選択時のユーザの選択操作により,ユーザの嗜好を学習するしくみを利用していない

研究目的商品選択時のユーザの嗜好を商品提示に反映できていない

ユーザの選択操作から商品選択時のユーザの嗜好を学習し,ユーザの嗜好に合った商品提示を行うシステムの構築

選択を繰り返す

ユーザの嗜好を反映した提示

ユーザの嗜好を判断・学習

ユーザの嗜好を判断・学習

対話型遺伝的アルゴリズム (iGA)

遺伝的アルゴリズム (GA) の評価部分を人間の主観的評価によって行う人間の好みや印象といった数式化できないものの解析に利用様々な分野へ適用されている

CGグラフィックス音楽服飾デザイン補聴器フィッティング

iGA を用いる際に検討すべきこと

ユーザ負担の軽減入力インタフェースの改善収束の高速化評価値予測

iGA を用いる際に検討すべきこと

ユーザ負担の軽減入力インタフェースの改善収束の高速化評価値予測

提示個体 1つ 1つに点数付けを行うのではなく,嗜好に合った個体を選ぶ

iGA を用いる際に検討すべきこと

多様性の維持

提示個体 1つ 1つに点数付けを行うのではなく,嗜好に合った個体を選ぶ

ユーザ負担の軽減入力インタフェースの改善収束の高速化評価値予測

iGA を用いる際に検討すべきこと

多様性の維持iGA は単一目的のための最適化手法であるため,探索終盤では収束する可能性がある

提示個体 1つ 1つに点数付けを行うのではなく,嗜好に合った個体を選ぶ

ユーザ負担の軽減入力インタフェースの改善収束の高速化評価値予測

iGA を用いた補聴器フィッティングユーザが最も聴こえやすいと感じる補聴器パラメータを求めることが目的

iGA を用いた補聴器フィッティング

提示個体を少しずつ最適解に近づいていくため類似した個体や同じ個体が提示される

ユーザが最も聴こえやすいと感じる補聴器パラメータを求めることが目的

多様性維持の必要性

商品を探す際に同じ商品を複数提示してもユーザには不要な情報となるユーザの嗜好が複数ある場合には複数の嗜好に対応した提示を行う必要がある

商品選択時のユーザの嗜好ユーザの嗜好が 1つの場合

商品選択時のユーザの嗜好ユーザの嗜好が 1つの場合

iGA は 1つの解を求めることが目的

商品選択時のユーザの嗜好ユーザの嗜好が 1つの場合 ユーザの嗜好が複数の場合

iGA は 1つの解を求めることが目的

商品選択時のユーザの嗜好ユーザの嗜好が 1つの場合 ユーザの嗜好が複数の場合

赤色,あるいは青色どちらかの Tシャツに収束し, 同じ Tシャツを複数提示する可能性がある

iGA は 1つの解を求めることが目的

商品選択時のユーザの嗜好ユーザの嗜好が 1つの場合 ユーザの嗜好が複数の場合

iGA は 1つの解を求めることが目的

ユーザの嗜好の多峰性に対応した個体を生成し,提示する必要がある

構築したシステムの概要

T シャツを対象とした商品選択支援システム

色: HSB 表色系 形:袖の長さ,襟の形 模様:種類,色

設計変数

HSB 表色系

色相 (Hue)色合いを細分化した色相環彩度 (Saturation)色の鮮やかさの度合い明度 (Brightness)色の明暗の度合い

人間の色彩感覚に似た色の表現

袖の長さと襟の形

襟の形袖の長さ

模様

色:白,黄緑,水色,青,紫,ピンク,赤,黄,黒

ユーザによる評価

提示された Tシャツからユーザは好きな Tシャツを10 枚以下の任意の数選ぶ

システムによる評価・選択

提示した個体の中からユーザが選択した個体と類似した個体を親個体として選択する

親個体

交叉親個体 2個体から形質を引き継いだ子個体 2個体を生成

親個体 子個体子個体 親個体

交叉親個体 2個体から形質を引き継いだ子個体 2個体を生成

親個体 子個体子個体 親個体

突然変異

突然変異率に基づき,設計変数値をランダムに変化

突然変異前 突然変異後

ショッピングサイトにおける商品提示

iGA を用いた場合ユーザの嗜好に合うものは提示できるが収束する

初期個体 6 世代目

ショッピングサイトにおける商品提示

iGA を用いた場合ユーザの嗜好に合うものは提示できるが収束する

初期個体 6 世代目

ランダムに個体を生成し,提示する突然変異率を高くする

ショッピングサイトにおける商品提示

iGA を用いた場合ユーザの嗜好に合うものは提示できるが収束する

初期個体 6 世代目

ランダムに個体を生成し,提示する突然変異率を高くする

多様性は維持できるが嗜好に合った提示は困難

ショッピングサイトにおける商品提示

iGA を用いた場合ユーザの嗜好に合うものは提示できるが収束する

初期個体 6 世代目

ユーザの嗜好を考慮した提示個体の多様性維持の方法が必要

商品選択時のユーザの嗜好ユーザの嗜好が 1つの場合 ユーザの嗜好が複数の場合

iGA は 1つの解を求めることが目的

ユーザの嗜好の多峰性に対応した個体を生成し,提示する必要がある

人の嗜好の多峰性に対応した個体生成(1/2)ユーザの選択した個体の色相と襟の形の分布に着目

人の嗜好の多峰性に対応した個体生成(1/2)

ユーザが選択した個体の分布範囲で個体を生成

個体生成範囲

ユーザの選択した個体の色相と襟の形の分布に着目

人の嗜好の多峰性に対応した個体生成(2/2)ユーザの選択した個体の分布が複数に分かれる場合

人の嗜好の多峰性に対応した個体生成(2/2)

個体生成範囲

ユーザの選択した個体の分布範囲から個体を生成

人の嗜好の多峰性に対応した個体生成(2/2)ユーザの選択した個体の分布範囲から個体を生成

個体生成範囲

ユーザの嗜好に合っていない範囲

人の嗜好の多峰性に対応した個体生成(2/2)ユーザの選択した個体の分布範囲から個体を生成

個体生成範囲

ユーザの嗜好に合っていない範囲

人の嗜好の多峰性に対応した個体生成(2/2)

適切にグループ化する必要がある

ユーザの選択した個体をグループ化する

個体生成範囲

クラスタリング

データマイニングの手法の 1つ

類似したデータをグループ化し,データ中の価値ある情報を抽出する方法

K-means法クラスタ数の決定に多目的クラスタリング (MOCK) の最適クラスタ数自動決定アルゴリズムを利用

クラスタリングを用いた個体生成方法(1/2)ユーザの選択した個体をクラスタリングによりグループ化

クラスタリングを用いた個体生成方法(1/2)生成されたクラスタの範囲からランダムに個体を生成

ランダムに個体を生成

評価実験

目的クラスタリングを用いた個体生成を行うことにより人の嗜好の多峰性に対応した個体を提示できているかを検証する被験者

20歳代の男女 20名教示

ショッピングサイトで好きな Tシャツを探す実験に用いるシステム

クラスタリングを行うシステム (提案システム )クラスタリングを行わないシステム (従来システム )

20世代の評価を行い,アンケートを実施

実験に用いたシステム

提案システムユーザは提示された 20 枚の Tシャツから嗜好に合った Tシャツを 10 以下の任意の数選択する10 世代目にクラスタリングを行い,個体を生成し,提示する

従来システムユーザが行う操作は提案システムと同様クラスタリングは行わず,遺伝的操作のみを行う

検討項目

アンケートによる検討多様性嗜好性

データによる検討多様性人の嗜好の多峰性に対応した個体生成

多様性に関するアンケート結果

どちらのシステムを利用したときの方がいろいろな Tシャツが提示されていると感じたか

多様性に関するアンケート結果

どちらのシステムを利用したときの方がいろいろな Tシャツが提示されていると感じたか

クラスタリングを用いて個体を生成することにより,多様性を維持した個体を提示できている

嗜好性に関するアンケート結果

どちらのシステムを利用したときの方が好きな Tシャツが提示されたか

嗜好性に関するアンケート結果

どちらのシステムを利用したときの方が好きな Tシャツが提示されたか

iGA の嗜好を提示に反映するメカニズムに悪影響を与えず,嗜好に合った個体を生成し,提示できている

多様性に関する考察

提案システムの方が多様性を維持した個体を提示したと回答した被験者のクラスタリング後の提示個体の分布

多様性に関する考察

提案システムの方が多様性を維持した個体を提示したと回答した被験者のクラスタリング後の提示個体従来システム 提案システム

多様性に関する考察

提案システムの方が多様性を維持した個体を提示したと回答した被験者のクラスタリング後の提示個体

多様性を維持し,ユーザの嗜好に合った個体を提示することができている

従来システム 提案システム

人の嗜好の多峰性に関する考察クラスタリング結果が複数に分かれていたユーザの

個体生成範囲とクラスタリング後の提示個体

人の嗜好の多峰性に関する考察クラスタリング結果が複数に分かれていたユーザの

個体生成範囲とクラスタリング後の提示個体

人の嗜好の多峰性に関する考察クラスタリング結果が複数に分かれていたユーザの

個体生成範囲とクラスタリング後の提示個体

ユーザの嗜好の多峰性に対応した個体を生成し,提示できている

まとめ

iGA において多様性を維持する方法→ クラスタリングを用いた個体生成

クラスタリングを用いた個体生成が多様性維持に有効であるかを検証する評価実験→提示個体の多様性を維持し,人の嗜好の多峰性に 対応した個体を生成し,提示することができた

発表論文一覧山川望,廣安知之,三木光範「 Web上での商品選択のインタフェースの検討 〜対話型遺伝的アルゴリズムを用いたデザイン支援システムの構築〜」人工知能学会 第 20回人工知能学会全国大会,タワーホール船堀 (2006.6)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムを用いたデザイン支援システムの構築」日本機械学会 第 19回計算力学講演会,名古屋大学 (2006.11)山川望,廣安知之,三木光範「 Web上での商品選択のインタフェースの検討」情報処理学会 インタラクション 2007,学術総合センター (2007.3)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムを用いたデザイン支援システムにおける ユーザの嗜好情報の抽出と利用」人工知能学会 第 21回人工知能学会全国大会,ワールドコンベンションセンターサミット(2007.6)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムの評価操作におけるユーザの負担軽減の検討」日本機械学会 第 20回計算力学講演会,同志社大学 (2007.11)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムにおける多様性維持の検討」情報処理学会 第 67回数理モデル化と問題解決研究会, 産業総合技術研究所 (2007.12)廣安知之,山川望,伊藤冬子,三木光範,佐々木康成「対話型遺伝的アルゴリズムにおける評価方法と個体生成方法の検討」情報処理学会 第 68回数理モデル化と問題解決研究会, 道後温泉(2008.3,発表・論文投稿予定 )

ユーザの嗜好が複数ある場合

人の嗜好は多峰性であるため,人の嗜好の多峰性に対応した提示が重要

ex.) ユーザが赤色と青色が好きな場合iGAは単一目的のための最適化手法→ 赤色、あるいは青色どちらかの Tシャツに収束し,  同じものばかりを提示する可能性がある

システムによる評価・選択 (1/2)

提示した個体の中からユーザが選択した個体と類似した個体を親個体として選択する

親個体

システムによる評価・選択 (2/2)

距離による評価ユーザが選択した個体と提示されている個体とユークリッド距離を求め,距離の小さい個体から親個体として選択する

xi :ユーザが選択した個体 (i = 0, 1, ・・・, 10)yj: 提示されている個体 (j = 0, 1, ・・・ ,20)xh,yh,:色相の値 xs,ys,:彩度の値xb,yb,: 明度の値 xsl,ysl: 袖の長さの値xc,yc,:襟の形の値 ( それぞれの値は正規化した値 )

色相の交叉色相は HSB表色系において円形で表現されている

距離の小さい方から

ランダムに 2個体生成

彩度,明度の交叉

彩度,明度は 0 〜 100で表現している

親個体の間からランダムに

2個体生成

袖の長さと襟の形,模様の交叉

袖の長さ親個体の袖の長さをそのまま子個体の袖の長さとする

襟の形色相と同様の交叉方法を用いる

模様,模様の色親個体の模様,模様の色をそのまま子個体が引き継ぐ

ユーザの選択個体の履歴

類似した個体を選択しても分布が 0と 1に偏ってしまう場合が生じる

類似した形を選択した場合 類似した色を選択した場合

ユーザの選択個体の履歴

クラスタリングを行うと類似したものであっても異なるクラスタに分類される

ユーザが評価する際の設計変数の表現と分布をとる際の表現方法が異なるため

データに加える処理データの最大値と最小値の差が 0.5以上の場合のみ処理を加える隣り合うデータの差が最大となるとき,小さい値に差の 1/2を加えた値をデータをシフトする基準値とする

データに加える処理データの最大値と最小値の差が 0.5以上の場合のみ処理を加える隣り合うデータの差が最大となるとき,小さい値に差の 1/2を加えた値をデータをシフトする基準値とする

差の 1/2

差が最大

基準値

データに加える処理データの最大値と最小値の差が 0.5以上の場合のみ処理を加える隣り合うデータの差が最大となるとき,小さい値に差の 1/2を加えた値をデータをシフトする基準値とする

差の 1/2

差が最大

基準値

多目的クラスタリングアルゴリズム

MOCK: Multiobjective clustering with automatic k-determination

J.Handl, J.Knowlesが 2004 年に提唱多くのテストデータおよび実データを用いた実験により他手法と比較して高いクラスタリング性能が示されている

特徴多目的最適化の概念を用いる接続性: Connectivityコンパクト性: Overall Deviation

幅広いクラスタ数を持つ複数の解(解集合)を導出最適クラスタ数自動決定メカニズムを持つ他の多くのクラスタリングアルゴリズムはクラスタ数決定機能を持たない

2つの目的関数

Connectivity (最小化)接続性を評価する目的関数近傍のデータ同士が異なるクラスタに属する場合ペナルティを与えるペナルティ関数

Overall Deviation (最小化)コンパクト性を評価する目的関数クラスタ中心と各データの間の距離の総和

MOCKで得られる解集合解集合の特徴幅広いクラスタ数を持つ解を含むそれぞれのクラスタ数では高精度のクラスタ境界が得られている

クラスタ数に着目して最終解を決定→ 最適なクラスタ数を決定できる→ 最適な分割方法も既に決定している

クラスタ数少

クラスタ数多

GAP 統計を用いてクラスタ数を自動決定

コンパクト性

接続性

GAP 統計ベースのクラスタ数自動決定

クラスタが存在しないという帰無仮説に基づいたクラスタリング結果と,実際のクラスタリング結果との差異を計測することにより,最適クラスタ数を持つクラスタソリューションが存在する場合に両者の差異が最大となるという予測を用いて最適クラスタ数を決定する.

GAP 統計:クラスタ数を決定するための統計手法

GAP 統計ベースのクラスタ数自動決定の流れ

1st 2nd

クラスタリングにより幅広いクラスタ数の解を得る

GAP 統計ベースのクラスタ数自動決定の流れ

2つのパレートの誤差が最大となる点を最終解として選択誤差が最大 = 与えられたデータの特性を

最も顕著に示す

MOCKの利点

高いクラスタリング性能を持つ実験により K-means法や凝集法など多くのクラスタリングアルゴリズムと比較して高いクラスタリング性能が示されている

最適クラスタ数自動決定メカニズムを持つ他の多くのクラスタリングアルゴリズムは最適クラスタ数の決定機能を持たない(ex. K-means法,群平均法,最短距離法)

適切なクラスタ数・クラスタ境界の双方を一度の探索で発見可能

提示への反映 (1/4)

ユーザが評価した個体

提示への反映 (2/4)

ユーザが評価した個体 クラスタリングを行う

提示への反映 (3/4)

ユーザが評価した個体 ランダムに個体生成

提示への反映 (4/4)従来システムiGA のみを用いた場合

クラスタリングを用いた場合

ユーザが評価した個体

今後の課題クラスタリングに関する検討

クラスタリングを行う世代数,回数クラスタリングの対象とする設計変数

多様性を維持した提示によるユーザ負担への影響提示個体が収束し,ユーザが選択できる個体が類似した個体ばかりになるとユーザ負担につながる

多様性に関する考察 (3/3)

従来システムと回答した被験者の結果 提案システムと回答した被験者の結果

多様性に関する考察 (3/3)

人が見たときの多様性とデータの多様性を考慮した指標

従来システムと回答した被験者の結果 提案システムと回答した被験者の結果