Dialogsystem del 1 - Agenter och dialog
-
Upload
harding-sweeney -
Category
Documents
-
view
34 -
download
0
description
Transcript of Dialogsystem del 1 - Agenter och dialog
Dialogsystem del 1- Agenter och dialog
Staffan Larsson
Pragmatik VT04
Agenter(Wooldridge & Jennings)
Vad är en (artificiell) agent?• beteendebaserad defintion • autonomi:
– agenter handlar utan direkt inblandning av människor eller andra, och har kontroll över sina egna handlingar och sitt eget interna tillstånd
• social förmåga: – agenter interagerar med andra agenter (inkl. människor), bl a med hjälp
av språk• reaktivitet:
– agenter uppfattar sin omgivning (den fysiska världen, ett grafiskt användarinterface, internet...) och reagerar på förändringar i omgivningen
• proaktivitet: – aganter reagerar inte bara på omgivningen, utan är också kapabla till
målinriktat beteende och kan ta initiativ
Två huvudtyper av ramverk för artificiella agenter
• ”Deliberative”– en agent har en explicit representerad symbolisk modell av världen– beslut fattas genom logiskt slutledning (mönstermatchning,
symbolmanipulation)– teoribaserade– Exempel: General Problem Solver (Newell & Simon)
• Reaktiv– ingen symbolisk modell– ingen komplex symbolprocessning– Exempel: situerade finita automater (Rosenschein & Kaelbling)– tenderar att vara ad hoc
• det finns ocskå hybridteorier– ett reaktivt och ett deliberativt lager
• Är människor reaktiva eller deliberativa? Eller kanske hybrider...
Attityder för deliberativa agenter
• Privat
• Social
• Informationsattityd– kunskap / tro
• Proattityd– handling, mål
Reaktivitet
• Perception– agenter uppfattar världen genom sinnesorganen,
vilket ger upphov till kunskap / trosföreställningar om världen
• Privata informationsattityder– trosföreställningar (beliefs, B)– kunskap (sann berättigad tro)
• Reaktion– kräver förmåga att agera
Proaktivitet
• Initiativ– Agenter har behov, önskningar och avsikter
och försöker ofta ändra världen utgående från dessa
• Kräver– förmåga att planera– förmåga att bestämma sig
• Privat proattityd: intention
Autonomi
• agenter handlar utan direkt inblandning av människor eller andra, och har kontroll över sina egna handlingar och sitt eget interna tillstånd
• Privata attityder (info- och proattityder):– trosföreställningar (beliefs, B)– önskningar/vilja (desires, D)– intentioner (I)
Social förmåga
• Människor är också sociala varelser; de står i sociala relationer till varandra och agerar utifrån dessa
• Sociala informationsattityder:– delad tro/kunskap (shared belief),
• Sociala proattityder – skyldigheter (obligations) – åtaganden (committments), – rättigheter (rights) (?)
Dialog
•Kunskap för dialogagenter
•Informella approacher
•Formella ramverk
Typer av kunskap som behövs för att kunna delta i en dialog
• sociala informationsattityder (delad kunskap)• statisk
– generell världskunskap för att tolka yttranden– aktivitetsspecifik världskunskap– språklig kunskap; förmåga att tolka och konstruera
yttranden, inkl. kunskap om talakter och dialogspel
• dynamisk – privata och sociala attityder– dialogmodell; ``dialogprotokoll'’: håller reda på
gemensamma antaganden, aktuella frågor, skyldigheter, referenter mm.
Hur ska kunskap representeras?
• Kunskapsrepresentationsspråk, t ex FOL, semantiska nätverk, frames...
• Kunskapsbas = mängd av statser + inferensregler
• ontologier / typhierarkier (för begreppskunskap)
• Hur mycket och vilken typ av kunskap som behövs beror på dialogtyp
• enkel -> komplex– call routing– tidtabellsupplysning– databassökning– programmera video– instruktionsdialog (t ex ge vägbeskrivning)– förhandling– planera framtida aktivitet– vardagligt småprat (?)
Informal approaches to dialogue modelling
• speech act theory (Austin, Searle, ...)– utterances are actions
– illocutionary acts: ask, assert, instruct etc.
• implicature (Grice)– relating utterances to context, implicit information
• dialogue games (Sinclair & Coulthard,...)– structure of dialogue segments (rather than separate utterances)
– can e.g. be encoded as regular expressions or finite automata• qna-game -> question qna-game* answer
• discourse analysis (Schegloff, Sacks, ...)– turn-taking, pre-sequences etc.
Ramverk för dialogagenter• Logikbaserade
– Rationalitetsaxiom + inferens– axiomatiserad talaktsteori (i modallogik)– problem med komplexitet och avgörbarhet
• Planbaserade– Planering & planigenkänning– talakter som planer– problem med komplexitet
• Dialoggrammatik – dialogspel som finita automater genererade av grammatik– ingen information i tillstånd
• Informationstillstånd – dialogdrag, dialogspel, uppdateringsregler– variabel komplexitet deliberativ <-> reaktiv
• Dessa kan kombineras!
Agenter i dialog (Traum 1999)
Översikt över forskning
• En (artificiell) dialogagent kan– interagera och kommunicera med andra agenter på
ett koherent sätt– delta i dialoger (d v s kommunikativa utbyten med en
längre sekvens av yttranden) om ett givet ämne med avsikten att uppnå ett gemensamt övergripande mål
• Yttranden ändrar– mentala tillstånd– kontexten och dialogtillståndet
• Dialog är såpass komplicerat att det går utöver vad samtida agentteorier klarar
Agenter & talaktsteori
• TA gör det möjligt att betrakta kommunikation mellan agenter i ett generellt ramverk för agenters handlande
• MEN i relation till ”vanlig” agentteori skulle TA kräva en mer uttrycksfull logisk formalism för handlingar– flera agenter– samtidig och fallibel handling
Planbaserade approacher till talaktsteori
• Bruce (1975)– planering av yttranden– attityder: belief, want, intention
• Cohen & Perrault (1979)– planering av yttranden– attityder: belief, want
• Allen & Perrault (1980)– igenkänning av indirekta talakter
• Hinkelman (1990)– lingvistiska info + planer för att korrelera form och
funktion (d v s känna igen talakter)
Ickemonotona approacher(varianter av logikbaserade app.)
• Perrault (1990)– defaultlogik för talaktsteori– defaulteffekter av talaktsoperatorer följer om inget i
kontexten motsäger dem– ej direkt implementerbar; kräver komplett indutivt
inferenssystem• Appelt & Konolige (1988)
– omformulering av Perrault i ”autoepistemisk logik”– implementerbart
• McRoy & Hirst (1995)– abduktion för produktion och igenkänning av indirekta
talakter
Andra logikbaserade approacher till talakter
• problem med STRIPS:– tid & förändring representeras inte i tillräcklig
detalj; operatorernas semantik oklar– kraftfullare handlingslogik krävs, med tydlig
semantik
• BDI-baserade logiska ramverk:– Cohen & Levesque– Sadek
BDI-baserade logiska ramverk:Cohen & Levesque (1990)
• detaljerad dynamisk modallogik för att beskriva handlingar och mentala attityder
• semantik för logiken i termer av möjliga världar• attityder: beliefs, goals• effekter av illokuta akter härleds från generella
principer för rationell kompetens– formaliserade som axiom i logiken
• logiken används för att beskriva agenter och deras handlingar– ej som resurs för agenterna själva
BDI-baserade logiska ramverk: Sadek
• liksom Cohen & Levesque: logik för handlingar, möjliga världar-semantik
• logiken används som resurser av agenter
• implementerat i dialogsystem
Problem med Cohen & Levesque, Sadek (enligt Traum)
• logiskt allvetande agenter– om en sats p följer logiskt från vad A tror, så tror A på
p– om man tror på en tautologi så tror man t ex på alla
matematiska sanningar
• logiken för tid och handlingar fortfarande inte kraftfull nog för att modellera t ex överlappande tal
• privata attityder (belief, goal, intention) räcker inte för att modellera talakter
• vi behöver även sociala attityder!
Talakter och dialog
• Tidigare nämna teorier fokuserar på isolerade satser
• I dialog kombineras yttranden i en koherent interaktion för att uppnå icke-kommunikativa mål
• Utvidga tidigare approacher till dialog– planbaserade– logikbaserade
Planbaserad dialogteori:Litman & Allen (1985)
• utvidgning av Allen & Perrault• dialoger, ej bara enstaka yttranden• två typer av planer
– domänplaner för att samarbeta för att uppnå mål – diskursplaner för att hantera dialogen; oberoende av
domän
• metaplaner; har andra planer som argument• kan redogöra för längre yttrandesekvenser, t ex
klargörande subdialoger
Logikbaserad dialogteori:Cohen & Levesque (1991)
• axiom för rationellt beteende i dialog• bekräftelse som ”joint action”• sociala (gemensamma) handlingar
– saker man gör tillsammans
• social proattityd: joint intention (delad avsikt)
• Dock:– oklart hur logiken relaterar till faktiska
yttranden
Interaktion på flera nivåer
• Ide: modellera dialog som handlingar på flera nivåer – ej bara satsnivå (talakter)
• Föregångare: – Dialogspel, Sinclair & Coulthard (1975)– 4 ”ranks”
• act• move: användning av acts i vissa syften• exchange: sekvens av flera moves• transaction: flera exchanges
• Kombinera dialogspel och planer? – Mann, Kowtko, Isard mfl (HCRC, Edinburgh)– planering på spelnivå
• 4 talaktsnivåer (Traum & Hinkelmann 1992)– turtagning– ”grounding”
• bekräftelse att man förstår varandra
– ”core speech acts” (traditionella illokuta akter)• Exempel: Inform, YNQ, Check, Eval, ReqRepair, RecAck• en CSA involverar flera agenter, eftersom de måste
bekräftas
– argumentationshandlingar (retoriska handlingar)• Exempel: Elaborate, Summarize, Clarify, Q&A, Convince,
Find-Plan
Är talakter en användbar entitet i kopplingen mellan yttranden och effekter?
• mot:– svårt komma överens om en uppsättning talakter– yttranden är multifunktionella; ett yttrande kan
förändra kontexten på flera olika sätt samtidigt• kan lösas genom att ha flera nivåer av talakter
– är talakter objektiva eller subjektiva?
• för:– talakter förenklar planering; ”buntar ihop”
kontextuppdateringar till hanterliga entiteter– kan vara lättare att känna igen talakter än att
resonera direkt från yttrande till kontextuppdatering
Skiss till en teori för talakter för kollektiv av sociala agenter
• För att en talaktsteori ska kunna hantera dialog behöver den följande utvidgningar:– förmåga att resonera om tid
• inklusive överlapp och samtidig handling
– förmåga att resonera om osäkra handlingar• som kan misslyckas och ha oväntade resultat
– hantering av kollektiv av agenter• samarbete
– kunna fungera i realtid– koppla ihop planering och handling
• Kollektiv av agenter -> sociala attityder
• Kan sociala attityder defineras i termer av privata attityder?
• Delad tro (mututal belief)
• Skyldigheter (obligations)
• Delade planer (shared plans)
• Delade intentioner (joint intentions)
Formuleringar av mutual belief / knowledge
• Iterativ (Schiffer)– K*S Ap omm KSp & Kap & KSKAp & KAKSp & KAKSKAp & ...
• Fixpunkt (Harman)– En grupp agenter tror gemensamt p omm
• 1. varje agent tror p och • 2. alla tror att (1) och (2)
• Delad situation (Barwise)– En grupp G vet gemensamt X omm något ”state of affairs” A gäller, sådant att
• alla i G har skäl att tro att A gäller• A indikerar för alla i G att alla i G har skäl att tro att A gäller• A indikerar för alla i G att X
• Belief spaces (Cohen)– varje ”belief space” innehåller en mängd av propositioner som en agent tror på– nästade beliefs (A tror att B tror...) representeras av nästade belief spaces– det djupast inbäddade belief space inbäddar sig självt
• Mutual belief space (Bruce & Newman)– ett separat belief space representerar mutual beliefs; i detta finns inga nästningar
Hur kan mutual belief uppnås?
• Man kan inte generellt sett anta att alla handlingar lyckas• Innan man kan veta att MB uppnåts krävs någon form av
bekräftelse, tex ”mm”• Ändå har de flesta formaliseringar av talakter antagit att
mutual belief är en direkt effekt av enskilda talakter (jfr STRIPS)
• Detta får olyckliga konsekvenser:– agenter kan få felaktiga uppfattningar om en annan agents
tillstånd – agenten kan inte känna igen bekräftelsehandlingar (feedback)
eller ”förstå” varför bekräftelser behövs• Men om varje talhandling måste bekräftas av den
tilltalade så är talakter kollektiva handlingar; båda måste bidra för att handlingen ska kunna slutföras
Skyldigheter (obligations)
• Social proattityd (obligation to do A)– motsvarande informationsattityd: committment
• Krävs (enligt Traum) för att formalisera effekterna av vissa talakter
• Vad en agent borde göra, givet sociala normer• Dessa normer kan formaliseras i ”deontisk logik” (von
Wright); en typ av modallogik• Normerna är inlärda, kulturella, och delade av
medlemmarna i en social gemenskap• Agenter kan välja att ignorera skyldigheter om de
krockar med agentens mål• Kan ej reduceras till (definieras i termer av) privata
attityder!
• Igenkänning av intentioner behövs (enligt Traum) inte vanligtvis i vardaglig kommunikation
• Det räcker att man uppfyller sina skyldigheter!
TALAKT SKYLDIGHET
S lovar A S uppnår A
S ber om A H accepterar eller förkastar A
S frågar Q H svarar på Q
Delade planer och intentioner
• Modellerar ett kollektivs benägenhet att handla• Intuition: koordinerade handlingar kan inte
förklaras enbart utifrån individuella intentioner• Hur styrs individuella handlingar av kollektiva
attityder?• Konvention (Lewis)
– En regelbundenhet R i beteendet hos ett kollektiv sådan att
• alla följer R• alla förväntar sig att alla andra ska följa R• alla föredrar att följa R, givet att alla andra gör det
– Exempel: att köra på höger sida
• Delade planer (SharedPlans, Grosz&Sidner 1986)– en mängd mutual beliefs om intentioner hos inblandade
agenter, och exekverbarhet hos handlingar
• Joint intentions (Searle)– Searle menar att ”vi-intentioner” ej kan reduceras till individuella
intentioner
• Multi-agent plans (Traum 1994)– En grupp agenter A exekverar en multiagentplan MP omm
1. varje agent Ai A exekverar en en-agentsplan MPi som utgörs av Ai’s handlingar i MP plus att de andra agenterna exekverar sina delar
2. Varje agent Ai A är skyldig att utföra MPi som en del av MP
Att definiera talhandlingar
• Nödvändiga och tillräckliga villkor• Hur akten kan användas i planering
– Perlokuta effekter kan ej förutses och kan därmed inte ges en uttömmande definition
– Dialog är interaktiv -> ej meningsfullt planera långt framåt
• Hur akten kan kännas igen– Ska man försöka känna igen akten eller bara intentionerna /
planerna bakom yttrandet?– Handlingar är kanske inte alltid avsiktliga– Dialog är interaktiv -> om man är osäker kan man fråga!– Hur stor del av planen behöver man känna igen?
Dialogaktsigenkänning och intentionsdjup
• igenkända mål (intentioner) kan vara på olika plan:– aktivitetsnivå: planera resa, bestäm pris– spelnivå: få information om X– dragnivå (talaktsnivå): få svar på en fråga– grounding: fastställa om P nu är gemensam kunskap
• Hur ``djupgående'' intentioner behöver kännas igen? • ”Vad kostar en biljett till Paris?”
– A vill få mig att tro att A vill ställa en fråga– A vill ställa en fråga– A vill ha svar på sin fråga– A vill använda svaret för att kunna resa till Paris– A vill resa till Paris– A vill resa till Paris på en nöjesresa– A vill vara glad
Dialogspel för agenter:Conversational Game Theory
(Lewin 2000)
Informationstillstånd och dialogtillstånd
• Dialogtillstånd – ett tillstånd i en finit automat; ingen information lagrad
i tillståndet
• Informationstillstånd– ett ``dialogprotokoll'' som håller reda på
gemensamma antaganden, aktuella frågor, skyldigheter, referenter mm.
– kan även inkludera privata och sociala attityder– både privat och delad information– kan t o m inkludera dialogtillstånd (t ex ett heltal som
refererar till ett tillstånd i en automat)
CGT & dialogspelsbaserade agenter
• Teori som tillämpar dialoggrammatik i dialogsystem
• Använder också informationstillstånd• Spel representerade som RTNs (Recursive
Transition Networks)– d v s bågar i ett spel kan vara associerade med ett
annat spel• Kombineras med enkelt
informationstillstånd/kontext <Pd, Cm>:– Pd: Propositions under discussion
• < P, d(P) >, där d(P) är ett fokuserat element i P– Cm: Commitment slate
• Moves & games är funktioner som uppdaterar kontexten
• Moves uppdaterar Pd• Games uppdaterar Cm
– committments: ej mentala attityder utan ”publika objekt” som man kan bindas till
– social attityd
• Ej som i t ex Cohen & Perrault!– förvillkor och effekter i termer av mentala tillstånd,
privata attityder
Move types (urval)
• qw(p): wh-fråga– Pd := < p, 0 >
• rw(p): svar på wh-fråga– Pd := < p, 0 >
• ack: acknowledgement; Pd oförändrad• cnf(c): confirmation
– Pd före = < P, _ >– Pd := < P, c >
• Ryes: ja-svar ; Pd oförändrad• Rno: nej-svar ; Pd oförändrad
Games
• Att spela dialog involverar ”parsning” av spel m h a dialoggrammatiken– parallell, inkrementell parser– rankar möjliga parsningar m h a en preferensmekanism– detta sköts av en ”monitor”
• Men agenten måste också producera egna yttranden– sköts av dialogbidragsgenerator– genererar output om monitorn indikerar att det är systemets tur– vilken output som väljs beror dels av speltillstånd, dels av
informationstillstånd
0
4
1 2 3
qw
qw-r
rw
cnf
Ryes|Rno|Rmod
ack
QW(p)
QW(p) -> {qw | qw-r} rw (cnf {Ryes | Rno | Rmod}) ack...
Exempeldialog
game state
infostate
A: Where do you want to travel? 1 Pd = <{dest(X)}, 0>
Cm = {}
B: To Exeter 2 Pd = <{dest(exeter)}, 0>
A: Is your destination Exeter? 4 Pd = <{dest(exeter)}, dest(exeter)>
B: Yes 2
A: Okay 3 Pd =
Cm = {dest(exeter)}
Uppgifter (2-4 sidor)
• 10.1 Vilka egenskaper har en agent? Vilka attityder kan en agent ha, och hur hänger dessa samman med egenskaperna? (Wooldridge & Jennings)
• 10.2 Beskriv de olika approacherna till att bygga artificiella dialogagenter (Traum, Lewin)– planbaserad– logikbaserad– tillståndsbaserad
• 10.3 Vilken typ av information behöver en dialogagent hålla reda på i de olika approacherna? (Traum, Lewin)