IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza...

17
IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département d’informatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/ cours/ift702

Transcript of IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza...

Page 1: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

IFT 702Planification en intelligence artificielle

Reconnaissance de plans

Froduald Kabanza

Département d’informatique

Université de Sherbrooke

planiart.usherbrooke.ca/kabanza/cours/ift702

Page 2: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

© Froduald Kabanza IFT702 2

Plan de l’exposé

Énoncé du problème Quelques approches

Page 3: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

3

Données:

Actions primitives

But» État à atteindre» Comportement (but temporellement

étendu) État initial

Sortie : plan d’actions

» Séquence» Politique

Rappel – Problème de planification

© Froduald Kabanza IFT702

Quelle prochaine action?

Page 4: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

4

Données : Séquence d’observations Actions primitives Pour certaines approches: librairie de plans

Sortie : But expliquant les observations Plan expliquant les observations

Problèmes reliés Complex event processing Pattern recognition Abductive reasoning Planning

Problème de reconnaissance de plans

© Froduald Kabanza IFT702

Quel est son but?Comment y arrivera-t-il?

Page 5: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

5

Jeux Sécurité Défense Interfaces humain-machines Domotique Compréhension du langage naturel

Facteurs de complexité

© Froduald Kabanza IFT702

Page 6: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

6

Facteurs de complexité

© Froduald Kabanza IFT702

Quel est son but?Comment y arrivera-t-il?

Environnement complétement observable vs partiellement observable

Interaction vs pas d’interaction entre l’agent observé et l’agent observateur

L’agent observé est hostile vs coopératif

Un seul agent observateur vs une équipe d’agents observateurs

Un seul agent observé vs des équipes d’agents observateurs

Contraintes de temps réel

Page 7: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

7

Planification comme outil de compréhension de la situation

© Froduald Kabanza IFT702

Architecture de contrôle inspirée de SAPHIRA

Page 8: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

8

Basé sur des librairies de plans On suppose que l’agent agit en suivant des

recettes

On peut modéliser ses recettes par une librairie de plans.

Le problème revient à reconnaître lequel des plans est suivi.

Problème: comment avoir les librairies de plans? Apprentissage Forage

Techniques: Inférence probabiliste Parsing probabiliste

(HTN/Grammaires)

Deux types d’approches vues dans ce cours

© Froduald Kabanza IFT702

Basé sur les actions primitives On suppose qu’un comportement rationnel

(optimal) est plus probable que celui qui l’est moins Subtilité: différent de dire que l’agent

agit de façon rationnel (optimale)

On n’a pas besoin des recettes

Le problème revient à inverser le processus de planification: Probabilité d’un but dépend de la

différence entre un comportement optimal vers le but et le comportement observé

Technique: Ramirez et Geffner (AAAI 2010).

Page 9: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

9

Rappel – inférence probabiliste• Contexte: Un gardien de sécurité passe un mois dans un édifice sous-terrain, sans

sortir. Il s’amuse à prévoir le temps en observant si le patron amène un parapluie.

• Variables: Xt = {Rt} (pour « Rain ») et Et={Ut} (pour « Umbrella »).

1tRaintRain1tRain

1tUmbrellatUmbrella1tUmbrella

Modèle des transitions: P(Rt | Rt-1). Modèle d’observation: P(Et | Rt).

© Froduald Kabanza IFT702

Page 10: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

10

D. Pynadath and M. Wellman. Accounting for Context in Plan Recognition, with Application to Traffic Monitoring. Proc. of Conference on Uncertainty in Artificial Intelligence, 1995.

Reconnaissance de planPar réseau bayésiens

© Froduald Kabanza IFT702

Page 11: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

11

Reconnaissance de planpar réseaux bayésiens dynamiques

Kautz et al.http://www.cs.rochester.edu/u/kautz/talks/converging-technology-kautz-v3.ppt

Page 12: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

12

Reconnaissance de planpar réseaux bayésiens dynamiques

Transportation mode

x=<Location, Velocity>

GPS reading

Goal

Trip segment

xk-1

zk-1 zk

xk

mk-1 mk

tk-1 tk

gk-1 gk

Kautz et al.http://www.cs.rochester.edu/u/kautz/talks/converging-technology-kautz-v3.ppt

© Froduald Kabanza IFT702

Page 13: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

13

A. Sadilek and H. Kautz, Location-Based Reasoning about Complex Multi-Agent Behavior, Journal of Artificial Intelligence Research 43 (2012) 87-133.

Reconnaissance de plans par une logique Markovienne (Markov logic)

© Froduald Kabanza IFT702

Application : jeu de capture du drapeau Markov Logic

Mariage de la logique du premier ordre avec les probabilités. Assigne des poids à des formules de logique du premier ordre Interprétation probabiliste

Approche: Utiliser la logique markovienne pour spécifier les règles du jeu Utiliser l’inférence de la logique markovienne pour prédire les buts des

joueurs étant donné les observations

Page 14: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

14

C. Geib and R. Goldman.  A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): 1101-1132 (2009)

Reconnaissance de plans par analyse (parsing) des grammaires

© Froduald Kabanza IFT702

Page 15: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

15

C. Geib and R. Goldman.  A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): 1101-1132 (2009)

Reconnaissance de plans par analyse (parsing) des grammaires

Implémenté par l’algorithme YAPPR. Pour avoir l’implémentation: contacter planiart.usherbrooke.ca/~julien

© Froduald Kabanza IFT702

Page 16: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

16

M. Ramirez and H. Geffner. Probabilistic Plan Recognition Using Off-the-Shelf Classical Planners. AAAI 2010.

Par définition

En supposant le principe de rationalité (un agent aura tendance à suivre les plans optimaux), on peut établir que

c(G,O) est le coût du meilleur plan respectant avec les observations c(G,) est le coût du plan optimal peu importe les observations

Chacun de ces coûts est calculé en lançant un planificateur classique

Accès au code: contacter planiart.usherbrooke.ca/~julien

Approche en inversant la planification

© Froduald Kabanza IFT702

)()|()|( GPGOPOGP

)),(),((_

)|( OGcOGceGOP

Page 17: IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département dinformatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702.

© Froduald Kabanza IFT702 17

Résumé

La reconnaissance de plan vise à comprendre les plans, les buts, les intentions d’autres agents à partir d’observations.

Problème plus compliqué que la planification.

Résolu en réduisant le problème à des algorithmes/théories d’inférences utilisées pour d’autres problèmes. Filtrage et prédiction probabiliste Inversion de la planification Etc.