A survey of automated text simplification
-
Upload
kodaira-tomonori -
Category
Science
-
view
255 -
download
5
Transcript of A survey of automated text simplification
A Survey of Automated Text Simplification
(Abstruct, Introduction)Matthew Shardlow
Text Mining Group, School of Computer Science University of Manchester, Manchester, United Kingdom
International Journal of Advanced Computer Science and Applications, Special Issue on Natural Language Processing,
pp.58–70, 2014.
プレゼンテーション:小平 知範1
Text Simplification• テキスト平易化は、複雑さを減らし、可読性と理解しやすさをあげる自然言語処理(文法、語彙の修正を含む)
• テキスト平易化の近年の成長は明らかなものである。
2
Text Simplification• テキスト平易化は自然言語処理である
• 類似技術として、機械翻訳、テキスト生成、テキスト要約、言い換え生成などがある。
• テキスト平易化は、一般的に文長が短くなるが、テキスト要約とは違い、説明などを加えるときは長くなる * 要約は、重要でないもの、不必要なものを削る
• テキスト平易化は、可読性を向上させるために使われる
3
Simplicity
• 平易さは直感的で明らかだが、定義するのは難しい
• 一般的に、文長、文節数、などがある
• 平易化したものは、文長が長くても、説明を生成した場合、長くなることもある。
4
readability, understandability• 可読性:どのくらいテキストを簡単に読めるか → 文法の複雑さ、文長、語彙との親密度など
• 理解性:テキストから得られる情報量 →重要な概念の理解、テキストを読む時間など
5
Explanation Generation• Explanation Generation: 説明生成 理解性を上げるために難しい語に追加情報を与える
• 明確な例として、健康科学の病名、解剖学的構造、装置などの意味を表す単語に説明を加える。 例:Pulmonary atresia ( a type of birth defect ) シソーラスから簡単な単語(birth defect)を探し、それをつなげるために( a type of)をつなげる。
6
• 固有表現に対する説明生成は、関連したWikiの記事から短い説明を抽出する
• Educational FACILITA:Webブラウザのプラグイン ユーザーが希望すれば、別のテキストボックスにその説明が示される
• 最近の研究は、第二言語学習者を対象としている 語義曖昧性を解消すれば、確実に正しい単語の意味を読者に示すことができる
7
Explanation Generation 固有表現
• 最近では、ユーザーがテキストをわかりやすくしたいと望めば、説明を難語と並べる こうすることで、概念をよく理解でき、次にこの単語を見る時には説明が必要なくなる
• 生成された説明は可読性を減らすかもしれない
• 説明生成した後に、可読性を増やすステップをすれば、読者の理解をより助けられる
8
Explanation Generation 固有表現