9. cgc parser with_norml_std

12
「正規化制約を用いた 構文解析とその実 装」について 松本 松本 「正規化制約を用いた 構文解析とその実装」について

Transcript of 9. cgc parser with_norml_std

Page 1: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

.

.

. ..

.

.

「正規化制約を用いた CCG 構文解析とその実装」について

松本 宏

2013年 2月 20日

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 2: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

About this paper

.正規化制約を用いた CCG 構文解析とその実装..

.

. ..

.

.

著者: 尾崎 博子, 戸次大介 (お茶大)

出典: 言語処理学会第 19回年次大会

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 3: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

Introduction

.形式文法..

.

. ..

.

.

文字群上の文字列の集合を数学的に詳述する規則の集まり

生成文法:言語の文字列を生成することができる規則

分析的文法:文字列が言語の文法に含まれるか判断するための規則

.よく使われる形式文法として:..

.

. ..

.

.

文脈自由文法 (CFG): Context Free Grammar

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 4: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

About CCG

.組み合わせ範疇文法 CCG [Steedman 2000]..

.

. ..

.

.

Combinatory Categorial Grammar: CCG

辞書:記号列, 統語範疇, 意味表示

統語範疇: loves: S\NP/NP : (後ろに NP, 前に NP をとってSentenceを成すことをあらわす)意味表示: x|λx.M|MN|pred(x1, · · · , xn)

規則:

関数合成規則型繰り上げ規則

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 5: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

規則

.関数合成規則..

.

. ..

.

.

X/Y Y/Z => X/Z

.型繰り上げ規則..

.

. ..

.

.本来の統語範疇を変数 Tを含む別の統語範疇の形にできる

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 6: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

関数合成規則において:

.利点..

.

. ..

.

.

関数合成規則によって Extractionが移動なしで可能である(Extraction: 名詞句、wh-句の前方移動を表す)

.問題点..

.

. ..

.

.

解析結果で1つの意味に対して複数の異なる結果が指数的に出力される。

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 7: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

正規化解析

.正規化解析..

.

. ..

.

.

全て計算するのは処理効率に問題があるので、正規化制約を決めて正規形 (1つの意味に対しての唯一の解析結果)を見つける。正規化解析の関連研究:[Eisner 1996]において完全性、安全性を検証しかし、型繰り上げ規則の適用は辞書内に限定[Hockernmaier 2010]では一般合成規則と型繰り上げ規則についても対処された。

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 8: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

提案

今回型繰り上げ規則の設定をしない固有名詞等は繰り上げられた型を持つものとする

これは、型繰り上げ規則の採用には以下のような問題があるからである。.型繰り上げ規則をつかわなかった理由..

.

. ..

.

.

...1 同一の構成素に対して繰り返し適用可能な規則のため、ナイーブな実装では構文解析が停止しない。

...2 型変数を使用するためトップダウンの解析が難しい。

...3 Extraction のような言語現象では型繰り上げ規則があると問題が発生する

正規形を決定することができない問題がある[Hockernmaier 2010]の制約を意味表示に言及する形式の制約に変更

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 9: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

提案

今回型繰り上げ規則の設定をしない固有名詞等は繰り上げられた型を持つものとする

これは、型繰り上げ規則の採用には以下のような問題があるからである。.型繰り上げ規則をつかわなかった理由..

.

. ..

.

.

...1 同一の構成素に対して繰り返し適用可能な規則のため、ナイーブな実装では構文解析が停止しない。

...2 型変数を使用するためトップダウンの解析が難しい。

...3 Extraction のような言語現象では型繰り上げ規則があると問題が発生する

正規形を決定することができない問題がある[Hockernmaier 2010]の制約を意味表示に言及する形式の制約に変更

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 10: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

検証

上述の制約によって唯一の導出となるかの検証.安全性..

.

. ..

.

.

全ての構文木 α について、 αと意味的に同値な正規形構文木NF(α)が存在する

.完全性..

.

. ..

.

.

葉が同じである正規形構文木 α ̸= α ` が与えられたとき、α と α`は意味的には同値ではない

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 11: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

実装

.実行例..

.

. ..

.

.

1: > ?-test("John sees vincent", C,R,S).

2: |~r_mp ~|

3: | C1:lex_ |

4: R: | |-l_mp -| |

5: | C2:| C1:lex_| |

6: |_ | C1:lex_|_|

7: C: s

8: S: "\lambda e.(see(e,j,v))"

9: Enter ';' for more choices, otherwise press ENTER --> ;

10: no

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について

Page 12: 9. cgc parser with_norml_std

. . . . . .

About this paper Introduction Propose Veri�cation Implementation Q&A

..

質疑

.型繰り上げ規則のないCGCとすると機能として半減するのでは?..

.

. ..

.

.

固有名詞については辞書の定義で型繰り上げされた形として構文解析の途中でつかわないということ

.ある名詞が固有名詞と一般名詞として存在する場合はどうなるのか?..

.

. ..

.

.

現段階では固有名詞しか設定されていないが、辞書の定義としては複数の定義が可能 なので 可能なのではないか?解析結果が爆発することはないのか?

松本 宏 「正規化制約を用いた CCG 構文解析とその実装」について