A survey of automated text simplification

8
A Survey of Automated Text Simplification (Abstruct, Introduction) Matthew Shardlow Text Mining Group, School of Computer Science University of Manchester, Manchester, United Kingdom International Journal of Advanced Computer Science and Applications, Special Issue on Natural Language Processing, pp.5870, 2014. プレゼンテーション:小平 知範 1

Transcript of A survey of automated text simplification

Page 1: A survey of automated text simplification

A Survey of Automated Text Simplification

(Abstruct, Introduction)Matthew Shardlow

Text Mining Group, School of Computer Science University of Manchester, Manchester, United Kingdom

International Journal of Advanced Computer Science and Applications, Special Issue on Natural Language Processing,

pp.58–70, 2014.

プレゼンテーション:小平 知範1

Page 2: A survey of automated text simplification

Text Simplification• テキスト平易化は、複雑さを減らし、可読性と理解しやすさをあげる自然言語処理(文法、語彙の修正を含む)

• テキスト平易化の近年の成長は明らかなものである。

2

Page 3: A survey of automated text simplification

Text Simplification• テキスト平易化は自然言語処理である

• 類似技術として、機械翻訳、テキスト生成、テキスト要約、言い換え生成などがある。

• テキスト平易化は、一般的に文長が短くなるが、テキスト要約とは違い、説明などを加えるときは長くなる * 要約は、重要でないもの、不必要なものを削る

• テキスト平易化は、可読性を向上させるために使われる

3

Page 4: A survey of automated text simplification

Simplicity

• 平易さは直感的で明らかだが、定義するのは難しい

• 一般的に、文長、文節数、などがある

• 平易化したものは、文長が長くても、説明を生成した場合、長くなることもある。

4

Page 5: A survey of automated text simplification

readability, understandability• 可読性:どのくらいテキストを簡単に読めるか → 文法の複雑さ、文長、語彙との親密度など

• 理解性:テキストから得られる情報量  →重要な概念の理解、テキストを読む時間など

5

Page 6: A survey of automated text simplification

Explanation Generation• Explanation Generation: 説明生成  理解性を上げるために難しい語に追加情報を与える

• 明確な例として、健康科学の病名、解剖学的構造、装置などの意味を表す単語に説明を加える。 例:Pulmonary atresia ( a type of birth defect ) シソーラスから簡単な単語(birth defect)を探し、それをつなげるために( a type of)をつなげる。

6

Page 7: A survey of automated text simplification

• 固有表現に対する説明生成は、関連したWikiの記事から短い説明を抽出する

• Educational FACILITA:Webブラウザのプラグイン ユーザーが希望すれば、別のテキストボックスにその説明が示される

• 最近の研究は、第二言語学習者を対象としている 語義曖昧性を解消すれば、確実に正しい単語の意味を読者に示すことができる

7

Explanation Generation 固有表現

Page 8: A survey of automated text simplification

• 最近では、ユーザーがテキストをわかりやすくしたいと望めば、説明を難語と並べる こうすることで、概念をよく理解でき、次にこの単語を見る時には説明が必要なくなる

• 生成された説明は可読性を減らすかもしれない

• 説明生成した後に、可読性を増やすステップをすれば、読者の理解をより助けられる

8

Explanation Generation 固有表現