商品レビューコメント文からの 商品評価レーダーチャート 自動 … ·...

22
1 商品レビューコメント文からの 商品評価レーダーチャート 自動生成システム 電気通信大学大学院 情報理工学研究科 情報・ネットワーク工学専攻 教授 沼尾 雅之

Transcript of 商品レビューコメント文からの 商品評価レーダーチャート 自動 … ·...

Page 1: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

1

商品レビューコメント文からの商品評価レーダーチャート自動生成システム

電気通信大学大学院 情報理工学研究科

情報・ネットワーク工学専攻

教授 沼尾 雅之

Page 2: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

2

従来技術とその問題点

ネットショッピングサイトの商品レビュー

• ユーザの自由なコメント• 商品購入を決定する際の助けとなるしかし,

• 大量のレビューを全て読むのは困難• ユーザーごとの主観評価• 複数商品で比較できない

Page 3: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

3

従来技術とその問題点:AMAZON.COMの例

• 商品ごとのユーザーコメント• ユーザーの主観評価• 総合評価のみ

Page 4: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

4

従来技術とその問題点:価格.COMの例

• 商品ごとのユーザーコメント

• ユーザーの主観評価

• 評価軸はサイトが設定

• 商品間の比較

Page 5: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

5

既存のレビュー分析手法の課題

評価表現辞書:肯定語と否定語を登録した語彙集

レビューの肯定・否定しか評価することができない.

実際には商品には複数の評価指標が存在する.

安いか?

音は静か?

吸引力は十分か?

例(掃除機)

肯定・否定の情報だけでは不十分

Page 6: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

6

新技術の特徴

1. コメント文からのテキストマイニング技術2. ジャンル毎の評価語と評価軸の自動生成3. 商品ごとのレーダーチャート自動生成

Page 7: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

7

• コメント文を構文解析– 文章の主節の極性から評価を推定

• 最終的な評価を下している可能性が高いため.

7

新技術の特徴1:コメント文からのテキストマイニング技術

文章全体は肯定的であると推定できる.

音は

うるさいけど

吸引力は

強いし

満足です

主節

Page 8: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

8

• 評価軸ごとの評価– 特徴語と評価表現の係り受け関係から推定

• 特徴語が属する評価軸ごとに計算する.

8

新技術の特徴1:コメント文からのテキストマイニング技術

音は

うるさいけど

吸引力は

強いし

満足です

音:否定吸引力:肯定

これらを集計し,レーダーチャートの評価値を算出

Page 9: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

9

• 評価表現辞書– 肯定・否定の情報を連続値の評価極性値で表現する

• [-1, 1] で,正ならば肯定,負ならば否定

新技術の特徴2:ジャンル毎の評価語と評価軸の自動生成

9連続値により表現力が上がり,精度向上を期待連続値により表現力が上がり,精度向上を期待!

Page 10: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

10

新技術の特徴2:ジャンル毎の評価語と評価軸の自動生成

• 評価軸:商品の複数の評価指標を表したもの– 特徴語の集合として表現– 例:掃除機のジャンル

評価軸1

価格

・・・

値段

吸引力

・・・

パワー

・・・

動作音

評価軸2 評価軸3

商品ジャンル毎に評価軸と評価表現辞書を学習

Page 11: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

11

新技術の特徴3:商品ごとのレーダーチャート自動生成

• 2種類の評価を分析可能– 総合評価

• ユーザが商品を肯定的に評価しているかどうか

– 評価軸ごとの評価• 商品ジャンルに対応したレーダーチャート

11

Page 12: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

12

システム構成

商品レビューから商品ジャンルに特化した語彙情報を学習する

1. 語彙情報の学習

2. 評判分析

学習した情報を用いた評判分析・可視化

• システムの全体像

Page 13: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

13

システム構成1-1:評価表現辞書の構築

• 構築結果(一部抜粋)– 商品ジャンルに応じた評価表現が幾つか確認できた

• 掃除機

• スーツ

• 和菓子

13

肯定表現 強い,静か,コンパクト,高性能,・・・

否定表現 うるさい,大きい,重たい,しんどい,・・・

肯定表現 お洒落,かっこいい,丈夫,快適,・・・

否定表現 派手,地味,薄い,重い,雑,・・・

肯定表現 美味しい,程よい,大きい,ヘルシー,・・・

否定表現 物足りない,しつこい,小さい,割高,・・・

Page 14: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

14

• 掃除機の構築結果 (各4個まで特徴語を表示)– 「音」,「吸引力」,「価格」 等に関する軸が構築された

• 下線部はk-medoids法の代表点

14

軸 特徴語群

1 モーター音,音,おと,排気音

2 使い勝手,評判,調子

3 吸引力,吸塵力,吸収力,威力

4 形,色,見た目,ピンク

5 価格,値段,お値段,金額

6 ヘッド,ヘッド部分,サイズ,本体

7 ごみ捨て,お手入れ,ごみ処理,取り出し

8 使い心地,滑り,性能,コードレス

レーダーチャートのラベルも自動生成

システム構成1-2:評価軸の構築

Page 15: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

15

システム構成1-2:評価軸の構築

• スーツの構築結果– 「生地」,「着心地」,「丈」 等

• 掃除機と同様,扱いやすい商品ジャンルだと考えられる

15

軸 特徴語群

1 生地,布地,記事,生地自体

2 質感,肌触り,着心地

3 お値段,価格,値段,金額

4 サイズ展開,品数,バリエーション,種類

5 シルエット,ライン,形,状態

6 質,品質,見た目,物

7 丈,袖,手,袖丈

Page 16: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

16

システム構成1-2:評価軸の構築

• 和菓子の構築結果– 「餡」,「甘さ」,「生地」,「見た目」 等

• 商品の多様性のため,他ジャンルに比べ困難

16

軸 特徴語群

1 餡,あんこ,あん,大福

2 縁起,使い勝手,腹持ち,ウケ

3 甘さ,甘み,甘さ加減,塩加減

4 見た目,包装紙,形,箱

5 お値段,値段,価格,金額

6 いちご,イチゴ,苺,栗

7 生地,餅,お餅,おもち

Page 17: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

17

システム構成2:レーダーチャートの生成

• 掃除機– 2つの製品の比較

17

product1(青)

・ 「使い心地」や「ヘッド」等の使用感で高い評価

・総合評価で優位

product2(赤)

・ 「価格」に対する評価が極めて高い

価値観に合ったものを選択できる

Page 18: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

18

システム構成2:レーダーチャートの生成

• スーツ

18

•和菓子

Page 19: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

19

企業への期待

• コメント文のみからレーダーチャート生成システムを開発済み.実用的なシステムとして稼働させたい.

• 様々なユーザーコメントなどの実データを持っている企業でのシステム化を希望.

Page 20: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

20

本技術に関する知的財産権

• 発明の名称 :情報処理装置,情報処理システム,情報処理方法およびプログラム

• 出願番号 :特願0000-0000• 出願人 :電気通信大学

• 発明者 :金兵裕太,沼尾雅之

Page 21: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

21

産学連携の経歴

• 2009年-2010年 東洋ガラス社と共同研究実施

• 2011年-2012年 ユビキタス社と共同研究実施

• 2012年-2013年 JST ASTEP事業に採択• 2015年-2017年 ニフティ社と共同研究実施

Page 22: 商品レビューコメント文からの 商品評価レーダーチャート 自動 … · ジャンル毎の評価語と評価軸の自動生成 • 評価軸:商品の複数の評価指標を表したもの

22

お問い合わせ先(必須)

電気通信大学

産学官連携センター 今田 智勝

TEL 042-443-5871

FAX 042-443-5726

e-mail [email protected]