IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza...

IFT 702Planification en intelligence artificielle

Reconnaissance de plans

Froduald Kabanza

Département d’informatique

Université de Sherbrooke

planiart.usherbrooke.ca/kabanza/cours/ift702

© Froduald Kabanza IFT702 2

Plan de l’exposé

Énoncé du problème Quelques approches

3

Données:

Actions primitives

But» État à atteindre» Comportement (but temporellement

étendu) État initial

Sortie : plan d’actions

» Séquence» Politique

Rappel – Problème de planification

© Froduald Kabanza IFT702

Quelle prochaine action?

4

Données : Séquence d’observations Actions primitives Pour certaines approches: librairie de plans

Sortie : But expliquant les observations Plan expliquant les observations

Problèmes reliés Complex event processing Pattern recognition Abductive reasoning Planning

Problème de reconnaissance de plans


Quel est son but?Comment y arrivera-t-il?

5

Jeux Sécurité Défense Interfaces humain-machines Domotique Compréhension du langage naturel

Facteurs de complexité


6

Facteurs de complexité


Quel est son but?Comment y arrivera-t-il?

Environnement complétement observable vs partiellement observable

Interaction vs pas d’interaction entre l’agent observé et l’agent observateur

L’agent observé est hostile vs coopératif

Un seul agent observateur vs une équipe d’agents observateurs

Un seul agent observé vs des équipes d’agents observateurs

Contraintes de temps réel

7

Planification comme outil de compréhension de la situation


Architecture de contrôle inspirée de SAPHIRA

http://www.cs.jhu.edu/~hager/Public/ICRAtutorial/Konolige-Salphira/saphira.pdf

8

Basé sur des librairies de plans On suppose que l’agent agit en suivant des

recettes

On peut modéliser ses recettes par une librairie de plans.

Le problème revient à reconnaître lequel des plans est suivi.

Problème: comment avoir les librairies de plans? Apprentissage Forage

Techniques: Inférence probabiliste Parsing probabiliste

(HTN/Grammaires)

Deux types d’approches vues dans ce cours


Basé sur les actions primitives On suppose qu’un comportement rationnel

(optimal) est plus probable que celui qui l’est moins Subtilité: différent de dire que l’agent

agit de façon rationnel (optimale)

On n’a pas besoin des recettes

Le problème revient à inverser le processus de planification: Probabilité d’un but dépend de la

différence entre un comportement optimal vers le but et le comportement observé

Technique: Ramirez et Geffner (AAAI 2010).

9

Rappel – inférence probabiliste• Contexte: Un gardien de sécurité passe un mois dans un édifice sous-terrain, sans

sortir. Il s’amuse à prévoir le temps en observant si le patron amène un parapluie.

• Variables: Xt = {Rt} (pour « Rain ») et Et={Ut} (pour « Umbrella »).

1tRaintRain1tRain

1tUmbrellatUmbrella1tUmbrella

Modèle des transitions: P(Rt | Rt-1). Modèle d’observation: P(Et | Rt).


10

D. Pynadath and M. Wellman. Accounting for Context in Plan Recognition, with Application to Traffic Monitoring. Proc. of Conference on Uncertainty in Artificial Intelligence, 1995.

Reconnaissance de planPar réseau bayésiens


http://arxiv.org/abs/1302.4980

http://arxiv.org/abs/1302.4980

11

Reconnaissance de planpar réseaux bayésiens dynamiques

Kautz et al.http://www.cs.rochester.edu/u/kautz/talks/converging-technology-kautz-v3.ppt

12

Reconnaissance de planpar réseaux bayésiens dynamiques

Transportation mode

x=<Location, Velocity>

GPS reading

Goal

Trip segment

xk-1

zk-1 zk

xk

mk-1 mk

tk-1 tk

gk-1 gk

Kautz et al.http://www.cs.rochester.edu/u/kautz/talks/converging-technology-kautz-v3.ppt


13

A. Sadilek and H. Kautz, Location-Based Reasoning about Complex Multi-Agent Behavior, Journal of Artificial Intelligence Research 43 (2012) 87-133.

Reconnaissance de plans par une logique Markovienne (Markov logic)


Application : jeu de capture du drapeau Markov Logic

Mariage de la logique du premier ordre avec les probabilités. Assigne des poids à des formules de logique du premier ordre Interprétation probabiliste

Approche: Utiliser la logique markovienne pour spécifier les règles du jeu Utiliser l’inférence de la logique markovienne pour prédire les buts des

joueurs étant donné les observations

http://www.cs.rochester.edu/~sadilek/publications/Sadilek-Kautz_Location-Based-Reasoning-about-Complex-Multi-Agent-Behavior_JAIR-12.pdf

14

C. Geib and R. Goldman. A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): 1101-1132 (2009)

Reconnaissance de plans par analyse (parsing) des grammaires


http://www.sciencedirect.com/science/article/pii/S0004370209000459

15

C. Geib and R. Goldman. A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): 1101-1132 (2009)

Reconnaissance de plans par analyse (parsing) des grammaires

Implémenté par l’algorithme YAPPR. Pour avoir l’implémentation: contacter planiart.usherbrooke.ca/~julien


http://planiart.usherbrooke.ca/~julien

16

M. Ramirez and H. Geffner. Probabilistic Plan Recognition Using Off-the-Shelf Classical Planners. AAAI 2010.

Par définition

En supposant le principe de rationalité (un agent aura tendance à suivre les plans optimaux), on peut établir que

c(G,O) est le coût du meilleur plan respectant avec les observations c(G,) est le coût du plan optimal peu importe les observations

Chacun de ces coûts est calculé en lançant un planificateur classique

Accès au code: contacter planiart.usherbrooke.ca/~julien

Approche en inversant la planification


)()|()|( GPGOPOGP

)),(),((_

)|( OGcOGceGOP

http://www.aaai.org/ocs/index.php/AAAI/AAAI10/paper/viewFile/1821/2160



http://planiart.usherbrooke.ca/~julien

© Froduald Kabanza IFT702 17

Résumé

La reconnaissance de plan vise à comprendre les plans, les buts, les intentions d’autres agents à partir d’observations.

Problème plus compliqué que la planification.

Résolu en réduisant le problème à des algorithmes/théories d’inférences utilisées pour d’autres problèmes. Filtrage et prédiction probabiliste Inversion de la planification Etc.

IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza...

Documents

Transcript of IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza...