Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est...

39
Traitement Automatique du Langage Cours 4 - Modèle syntaxique : Lexical Functional Grammar Antoine Rozenknop [email protected] 18 novembre 2010 A. Rozenknop Traitement Automatique du Langage

Transcript of Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est...

Page 1: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Traitement Automatique du Langage

Cours 4 - Modèle syntaxique : Lexical Functional Grammar

Antoine [email protected]

18 novembre 2010

A. Rozenknop Traitement Automatique du Langage

Page 2: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 3: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 4: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Exemple de structure-c

Structure-C : S

SN

N

Tarzan

SV

V

mange

SN

Dét

une

N

banane

A. Rozenknop Traitement Automatique du Langage

Page 5: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Exemple de structure-f

Structure − F : f1

PRED ’manger’<SUBJ, OBJ>

SUBJ

PRED ’Tarzan’NUM SgGEND MascPERS 3

TENSE PresMODE IndNUM sgGEND MascPERS 3

OBJ

PRED ’banane’NUM SgGEND FemDef -

A. Rozenknop Traitement Automatique du Langage

Page 6: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Structure-f du nœud SN

PRED ’Tarzan’NUM SgGEND MascPERS 3

A. Rozenknop Traitement Automatique du Langage

Page 7: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Structures-f

Définition

Une structure-f est un ensemble de traits.

A. Rozenknop Traitement Automatique du Langage

Page 8: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Structures-f

Définition

Une structure-f est un ensemble de traits.

Définition

Un trait est un couple (attribut, valeur).

A. Rozenknop Traitement Automatique du Langage

Page 9: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Structures-f

Définition

Une structure-f est un ensemble de traits.

Définition

Un trait est un couple (attribut, valeur).

Une valeur peut être :

◮ atomique ;Ex : Sg pour l’attribut NUM, Masc pour l’attribut GEND

A. Rozenknop Traitement Automatique du Langage

Page 10: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Structures-f

Définition

Une structure-f est un ensemble de traits.

Définition

Un trait est un couple (attribut, valeur).

Une valeur peut être :

◮ atomique ;Ex : Sg pour l’attribut NUM, Masc pour l’attribut GEND

◮ constituée d’une structure de traits enchâssée ;Ex : la valeur de l’attribut SUBJ

A. Rozenknop Traitement Automatique du Langage

Page 11: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Structures-f

Définition

Une structure-f est un ensemble de traits.

Définition

Un trait est un couple (attribut, valeur).

Une valeur peut être :

◮ atomique ;Ex : Sg pour l’attribut NUM, Masc pour l’attribut GEND

◮ constituée d’une structure de traits enchâssée ;Ex : la valeur de l’attribut SUBJ

◮ constituée d’une liste de valeurs, notée entre accolades.

A. Rozenknop Traitement Automatique du Langage

Page 12: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 13: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Lexique

Tarzan, N : PRED ’Tarzan’, NUM Sg, GEND Masc.banane, N : PRED ’banane’, NUM Sg, GEND Fem.une, Det : Def -, NUM Sg, GEND Fem.mange, V : PRED ’manger <SUBJ, OBJ>’, TENSEPres, NUM Sg, PERS 3.

A. Rozenknop Traitement Automatique du Langage

Page 14: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 15: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Grammaire

S → SN SV↑SUBJ=↓ ↑= ↓

↑MODE=ind↑SUBJ NUM=↓NUM↑SUBJ GEND=↓GEND↑SUBJ PERS=↓PERS

SN → N↑= ↓

SN → Det N↑= ↓ ↑= ↓

SV → V SN↑= ↓ ↑OBJ = ↓

A. Rozenknop Traitement Automatique du Langage

Page 16: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Extensions aux CFG

L’écriture des règles est un peu plus souple que pour unegrammaire hors-contexte. On peut en particulier utiliser :

◮ les parenthèses pour marquer un symbole optionnel

◮ * (étoile de Kleene) pour marquer un symbole pouvant serépéter un nombre indéfini de fois (y compris zéro fois).

A. Rozenknop Traitement Automatique du Langage

Page 17: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 18: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Equations fonctionnelles

◮ ↓ renvoie à l’ensemble des traits du groupe ou de la catégoriedésignée (le non-terminal associé à l’équation fonctionnelle) ;

◮ ↑ renvoie à l’ensemble des traits du groupe immédiatementdominant dans la structure-c (qui est aussi la tête de la règle).

A. Rozenknop Traitement Automatique du Langage

Page 19: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Analyse syntaxique

◮ création de la structure-c, à l’aide de la première partie desrègles grammaticales ; peut se faire à l’aide des algorithmes desgrammaires hors-contexte ;

A. Rozenknop Traitement Automatique du Langage

Page 20: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Analyse syntaxique

◮ création de la structure-c, à l’aide de la première partie desrègles grammaticales ; peut se faire à l’aide des algorithmes desgrammaires hors-contexte ;

◮ recherche des f-structures associées aux nœuds de lac-structure, de manière à ce que toutes les équationsfonctionnelles soient vérifiées.

A. Rozenknop Traitement Automatique du Langage

Page 21: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 22: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Unification

Définition

L’unification de deux structures de traits A et B est à la fois uneextension de A et de B.

A. Rozenknop Traitement Automatique du Langage

Page 23: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Unification

Définition

L’unification de deux structures de traits A et B est à la fois uneextension de A et de B.

La structure résultant de l’unification est la plus petite desextensions de A et de B : un trait qui n’apparaît ni dans A ni dansB ne peut pas se trouver dans l’unification de A et B.

A. Rozenknop Traitement Automatique du Langage

Page 24: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Unification

Définition

L’unification de deux structures de traits A et B est à la fois uneextension de A et de B.

La structure résultant de l’unification est la plus petite desextensions de A et de B : un trait qui n’apparaît ni dans A ni dansB ne peut pas se trouver dans l’unification de A et B.

L’opération d’unification est idempotente (A ∪ A = A)

A. Rozenknop Traitement Automatique du Langage

Page 25: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Unification

Définition

L’unification de deux structures de traits A et B est à la fois uneextension de A et de B.

La structure résultant de l’unification est la plus petite desextensions de A et de B : un trait qui n’apparaît ni dans A ni dansB ne peut pas se trouver dans l’unification de A et B.

L’opération d’unification est idempotente (A ∪ A = A),commutative (A ∪ B = B ∪ A)

A. Rozenknop Traitement Automatique du Langage

Page 26: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Unification

Définition

L’unification de deux structures de traits A et B est à la fois uneextension de A et de B.

La structure résultant de l’unification est la plus petite desextensions de A et de B : un trait qui n’apparaît ni dans A ni dansB ne peut pas se trouver dans l’unification de A et B.

L’opération d’unification est idempotente (A ∪ A = A),commutative (A ∪ B = B ∪ A)et associative ((A ∪ B) ∪ C = A ∪

(B ∪ C))

A. Rozenknop Traitement Automatique du Langage

Page 27: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 28: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Formation des structures-f

◮ en partant des feuilles (lexique)

A. Rozenknop Traitement Automatique du Langage

Page 29: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Formation des structures-f

◮ en partant des feuilles (lexique)

◮ en remontant le long des branches

A. Rozenknop Traitement Automatique du Langage

Page 30: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Formation des structures-f

◮ en partant des feuilles (lexique)

◮ en remontant le long des branches

◮ en appliquant les opérations d’unification pour chaque règle

A. Rozenknop Traitement Automatique du Langage

Page 31: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 32: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Schémas de sous-catégorisation

Le trait particulier PRED est composé :

◮ du prédicat du groupe ;

◮ du schéma de sous-catégorisation du groupe : une liste defonctions devant apparaître dans la structure-f. On dit que cesfonctions sont gouvernées par le prédicat du groupe.

Exemples :PRED ’manger’<SUBJ, OBJ>

◮ le prédicat est ’manger’

◮ la structure-f doit contenir les traits SUBJ et OBJ (sujet etobjet).

A. Rozenknop Traitement Automatique du Langage

Page 33: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Schémas de sous-catégorisation

Le trait particulier PRED est composé :

◮ du prédicat du groupe ;

◮ du schéma de sous-catégorisation du groupe : une liste defonctions devant apparaître dans la structure-f. On dit que cesfonctions sont gouvernées par le prédicat du groupe.

Exemples :PRED ’manger’<SUBJ, OBJ>PRED ’dormir’<SUBJ>

◮ le prédicat est ’dormir’

◮ la structure-f doit contenir le trait SUBJ.

A. Rozenknop Traitement Automatique du Langage

Page 34: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 35: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Principes de bonne formation des structures-f

◮ Unicité : un même attribut ne peut apparaître deux fois dansune même structure-f ;

◮ Cohérence : toutes les sous-structures doivent être localementcohérentes, ce qui signifie que les fonctions sous-catégorisablesqui y apparaissent doivent être gouvernées par le prédicat local.

◮ Complétude : toutes les sous-structures doivent êtrelocalement complètes, ce qui veut dire que toutes les fonctionsgouvernées par leur prédicat local doivent être présentes.

A. Rozenknop Traitement Automatique du Langage

Page 36: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Principes de bonne formation des structures-f

Tarzan dort la banane. (principe de cohérence violé)Tarzan mange. (principe de complétude violé)

A. Rozenknop Traitement Automatique du Langage

Page 37: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Plan

A. Rozenknop Traitement Automatique du Langage

Page 38: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

Equations fonctionnelles spéciales

Contraintes

◮ le signe =c :équation contraintePar exemple : ↑ PERS =c 3 : vérifie que l’attribut PERS a lavaleur 3 dans la structure-f du nœud supérieur

◮ le signe ∼ : indique l’absence d’un trait.Par exemple : ∼ [↑PERS 3] : vérifie que le trait PERS 3 n’estpas dans la f-structure du nœud supérieur.

Remplissage de listes« A ∋ B » indique que la structure de trait B est un élément de laliste A.

A. Rozenknop Traitement Automatique du Langage

Page 39: Traitement Automatique du Langagerozenknop/Cours/ITCN_MLAS/...PRED ’dormir’ le prédicat est ’dormir’ la structure-f doit contenir le trait SUBJ. A. Rozenknop Traitement

SUBJ : sujet Max dortOBJ : objet Max mange une pommeA_OBJ : objet introduit par la

préposition « à »Max donne une pomme à Ma-rie

DE_OBJ : objet introduit par lapréposition « de »

Max rêve de Marie

COMP : complétive Max sait que Marie viendra de-main

VCOMP : infinitive Max veut devenir professeurACOMP : attribut adjectival Max trouve magnifique cet ou-

vrageNCOMP : attribut nominal Le peuple à élu Max présidentVajout : subordonnée circons-

tancielleVoulant partir tôt, Max se ré-veille à 5h

Aajout : adjectif apposé Max est parti heureux

A. Rozenknop Traitement Automatique du Langage