Dinamičke Igre s Potpunom i Nesavršenom Informacijom

23
DINAMIČKE IGRE S POTPUNOM I NESAVRŠENOM INFORMACIJOM Dr. sc. Tunjo Perić

description

igg

Transcript of Dinamičke Igre s Potpunom i Nesavršenom Informacijom

  • DINAMIKE IGRE S POTPUNOM I NESAVRENOM INFORMACIJOM

    Dr. sc. Tunjo Peri

  • 1. Predstavljanje igara u ekstenzivonom obliku

    Analizirali smo statike igre predstavljene u normalnom obliku.Sad analiziramo dinamike igre predstavljene u ekstenzivom obliku.I statike i dinamike igre mogu se predstaviti ili u normalnom ili ekstenzivnom obliku.Za analizu dinamikih igara prikladniji je ekstenzivni oblik predstavljanja.Normalni oblik predstavljanja igre specificira: (1) igrae u igri, (2) raspoloive strategije svakog igraa, i (3) isplate svakom igrau za svaku kombinaciju strategija koju igrai mogu izabrati. **

  • Definicija: Ekstenzivni oblik predstavljanja igara specificira: (1) igrae u igri, (2a) kad svaki igra povlai potez, (2b) to svaki igra moe uiniti na svakoj od njegovih/njezinih mogunosti za povlaenje poteza, (2c) to svaki igra zna na svakoj od mogunosti za povlaenje poteza, i (3) isplate svakom igrau za svaku kombinaciju poteza koju bi mogli odabrati.Ekstenzivni oblik igre koristi stablo igre za predstavljanje igre.Kao primjer igre predstavljene u ekstenzivnom obliku, razmotrimo sljedeu igru:Igra 1 bira akciju a1 iz mogueg skupa A1 = {L, R}.Igra 2 promatra a1 i potom bira akciju a2 iz skupa A2 = {L, R}.Isplate su u1(a1, a2) i u2(a1, a2), kao to je prikazano u stablu igre na slici 1.**

  • Isplata igrau 1:Isplata igrau 2:31122100122LRLRLRSlika 1 Ovo stablo igre poinje s vorom odluivanja za igraa 1, gdje igra 1 bira izmeu L i R. Ako igra 1 bira L, onda dolazimo do vora odluivanja igraa 2, gdje igra 2 bira izmeu L i R. Meutim, ako igra 1 bira R, onda dolazimo do drugog vora za igraa 2, gdje igra 2 bira izmeu L i R.Slijedei svaki od izbora igraa 2, dolazimo do zavrnog vora i do kraja igre, gdje su indicirane isplate primljene.**

  • Nije teko proiriti stablo igre prikazano na slici 1 na bilo koju dinamiku igru s potpunom i savrenom informacijom, tj. na bilo koju igru u kojoj igrai povlae poteze u nizu, svi prethodni koraci su poznati prije odabira sljedeeg koraka, a isplate od svake kombinacije koraka su takoer poznate igraima.Sad emo izvesti normalni oblik predstavljanja dinamike igre na slici 1.Da bismo dinamiku igru predstavili u normalnom obliku, potrebno je prevesti informaciju u ekstenzivnom obliku u opis strategijskog prostora svakog igraa u normalnom obliku.Definicija: Strategija za igraa je potpuni plan akcije, koji specificira moguu akciju za igraa u svim okolnostima u kojima igra moe biti pozvan da djeluje. Mora postojati plan akcije za sve okolnosti koje se mogu pojaviti.**

  • Na slici 1, igra 2 ima dvije akcije i etiri strategije, poto postoje dva pravca akcije (nakon promatranja L i nakon promatranja R sa stane igraa 1) u kojima bi igra 2 mogao biti pozvan da djeluje.Strategija 1: Ako igra 1 igra L onda igrati L, ako igra 1 igra R onda igrati L, oznaeno sa (L, L).Strategija 2: Ako igra 1 igra L onda igrati L, ako igra 1 igra R onda igrati R, oznaeno sa (L, R).Strategija 3: Ako igra 1 igra L onda igrati R, ako igra 1 igra R igrati L, oznaeno sa (R, L).Stratedija 4: Ako igra 1 igra L onda igrati R, ako igra 1 igra R onda igrati R, oznaeno sa (R, R).Igra 1 ima dvije akcije i samo dvije strategije: igrati L i igrati R. Strategijski prostor igraa 1 je ekvivalentan prostoru akcije A1 = {L, R}.Sa danim strategijskim prostorima za dva igraa nije teko izvesti normalni oblik predstavljanja igre iz ekstenzivnog oblika.**

  • Tablica 1 Sada emo pokazati kako se statike igre mogu predstaviti u ekstenzivnom obliku. Poznato nam je da u statikim igrama nije nuno da igrai istovremeno povlae poteze. Doboljno je rei da svaki od igraa povlai potez bez znanja povuenog poteza od svog protivnika. Prema tome, simultanu igru izmeu igraa 1 i 2 moemo predstaviti na sljedei nain:Igra 1 bira akciju a1 iz mogueg skupa A1.Igra 2 ne promatra potez igraa 1, ve bira akciju a2 iz mogueg skupa A2.Isplate su u1(a1, a2) i u2(a1, a2).**

    Igra 2

    Igra 1(L, L)(L, R)(R, L)(R, R)L3, 13, 11, 21, 2R2, 10, 02, 10, 0

  • Alternativno, igra 2 moe prvi povui potez a da igra 1 povlai potez bez promatranja poteza igraa 2.Definicija: Informacijski skup za igraa je skup vorova odluivanja, koji zadovoljava:Igra ima potez na svakom voru informacijskog skupa, iKad igra doe u vor u informacijskom skupu, igra koji povlai potez ne zna koji je vor u informacijskom skupu dostignut, ili nije dostignut.Dio 2) ove definicije implicira da igra mora imati isti skup moguih akcija na svakom voru odluivanja u informacijskom skupu, inae bi igra mogao zakljuiti iz samog skupa akcija raspoloivih na nekom voru je li taj vor dostignut.U ekstenzivnom obliku igre, indicirat emo da skup vorova odluivanja sadri informacijski skup koji povezuje vorove isprekidanom linijom, kao u predstavljanju zatvorenikove dileme u ekstenzivnom obliku na slici 2.**

  • Zatvorenik 1Zatvorenik 2Zatvorenik 2NepriznatiPriznatiNepriznatiNepriznatiPriznatiPriznati44055011Slika 2Ponekad emo naznaiti koji igra ima potez na kojem voru u informacijskom skupu, kao na slici 2. Alternativno moemo povezati te vorove isprekidanom linijom. Interpretacija informacijskog skupa na slici 2: kad zatvorenik 2 ima potez on samo zna da je informacijski skup postignut (tj. da je igra 1 povukao potez)**

  • Kao drugi primjer upotrebe informacijskog skupa u predstavljanju ignoriranja prethodnog koraka, razmotrimo sljedeu igru s potpunom i nesavrenom informacijom:Igra 1 bira akciju a1 iz mogueg skupa A1 = {L, R}.Igra 2 promatra a1 i potom bira akciju a2 iz mogueg skupa A2 = {L, R}.Igra 3 promatra je li ili nije (a1, a2) = (R, R) i potom bira akciju a3 iz mogueg skupa A3 = {L, R}.Ekstenzivni oblik predstavljanja ove igre dan je na slici 3. U ovom ekstenzivnom skupu igra 3 ima dva informacijska skupa: jednolan informacijski skup koji slijedi R igraa 1 i R igraa 2, i nejednolan informacijski skup koji ukljuuje sve ostale vorove u kojima igra 3 ima potez. Prema tome, igra 3 promatra samo je li ili nije (a1, a2) = (R, R). **

  • 12233LRLLRRLLLLRRRRSlika 3Sad moemo ponuditi alternativnu definiciju razlika izmeu savrene i nesavrene informacije. Prethodno samo definirali da savrena informacija znai da kod svakog koraka igre igra zna svu prethodnu povijest igre do tada. Ekvivalentna definicija savrene informacije je da svaki informacijski skup je jednolan; nesavrena informacija, suprotno od toga, znai da postoji najmanje jedan nejednolan informacijski skup.**

  • 2. Nash-ova ravnotea savrene podigreRanije smo definirali podigru kao dio igre koja preostaje da se odigra, zapoinjui na bilo kojoj toki na kojoj zajedniko znanje igraa ini potpunu povijest igre.Sada emo dati formalnu definiciju za generalnu dinamiku igru s potpunom informacijom u uvjetima predstavljanja igre u ekstenzivnom obliku.Definicija: Podigra igre u ekstenzivnom oblikua) zapoinje na voru odluivanja n koji je jednolani informacijski skup (ali nije prvi vor odluivanja igre),b) ukljuuje sve vorove odluivanja i zavrne vorove koji slijede n u stablu igre (ali ne postoje vorovi koji ne slijede n), ic) ne eliminira niti jedan informacijski skup ( tj. ako vor odluivanja n slijedi n u stablu igre, onda svi ostali vorovi u informacijskom skupu koji sadre n moraju takoer slijediti n, i stoga moraju biti ukljueni u podigru).

    **

  • Na slici 1 postoje dvije podigre, koje zapoinju na svakom od vorova igraa 2. U zatvorenikovoj dilemi (odnosno u bilo kojoj simultanoj igri) ne postoje podigre. Na slici 3 postoji samo jedna podigra, koja zapoinje na voru odluivanja igraa 3 slijedei R od igraa 1 i R od igraa 2. Zbog dijela c) podigra ne zapoinje niti na jednom voru odluivanja igraa 2, ak iako su oba ta vora jednolani informacijski skupovi.Treba zabiljeiti da dio definicije pod a) samo garantira da igra koji povlai potez na voru n poznaje potpunu povijest igre do tada, a ne da ostali igrai takoer poznaju tu povijest. Dio definicije pod c) garantira da postoji zajedniko znanje izmeu svih o potpunoj povijesti igre do tada, i to u sljedeem smislu: na bilo kojem voru koji slijedi n, recimo n, igra s potezom na n zna da je igra dola do vora n. Prema tome, ak ako n pripada nejednolanom informacijskom skupu, svi vorovi u informacijskom skupu slijede n, tako da igra s potezom na informacijskom skupu zna da je igra dola na vor koji slijedi n. **

  • Uz danu definiciju podigre, primijenit emo definiciju Nash-ove ravnotee savrene podigre.Definicija (Selten 1965): Nash-ova ravnotea savrene podigre, ako strategije igraa ine Nash-ovu ravnoteu, je svaka podigra.Jednostavno je pokazati da bilo koja dinamika igra s potpunom informacijom ima Nash-ovu ravnoteu savrene podigre. Ovaj argument ukljuuje proceduru u duhu inverzne indukcije, a zasnovan je na dva zapaanja. Prvo, premda je Nash-ov teorem prezentiran u kontekstu statike igre s potpunom informacijom, on se primjenjuje na sve konane igre s potpunom informacijom, a takve igre mogu biti statike i dinamike. Drugo, konana dinamika igre s potpunom informacijom ima konaan broj podigara, od kojih svaka zadovoljava pretpostavke Nash-ovog teorema. **

  • Definicija: U dvoetapnoj igri s potpunom i savrenom informacijom definiranom ranije, rezultat inverzne indukcije je (a1*, R2(a1*)), a Nash-ova ravnotea savrene podigre je (a1*, R2(a1)).U ovoj igri akcija a1* je strategija za igraa 1, poto postoji samo jedna mogunost u kojoj igra 1 moe biti pozvan da igra na poetku igre. Za igraa 2, meutim, R2(a1*) je jedna akcija (najbolji odgovor igraa 2 na a1*), a nije strategija, budui da strategija za igraa 2 mora specificirati akciju igraa 2 koju e poduzeti slijedei svaku od moguih akcija igraa 1 u prvoj etapi. Funkcija najboljeg odgovora R2(a1), na drugoj strani, je strategija za igraa 2. U ovoj igri podigre poinju s potezom igraa 2 u drugoj etapi. Postoji jedna podigra za svaku od moguih akcija igraa 1, a1 u A1. Da bismo pokazali da je (a1*, R2(a1)) Nash-ova ravnotea savrene podigre, moramo pokazati da je (a1*, R2(a1)) Nash-ova ravnotea, i da strategije igraa ine Nash-ovu ravnoteu u svakoj od tih podigrara.**

  • Budui da su podigre jednostavni problemi odluivanja jedne osobe, posljednja definicija se reducira na zahtjev da akcija igraa 2 bude optimalna u svakoj podigri, koja je tono problem koji rjeava funkcija najboljeg odgovora R2(a1). Konano, (a1*, R2(a1*)) je Nash-ova ravnotea poto su strategije igraa najbolji odgovori: a1* je najbolji odgovor na R2(a1) tj. a1* maksimizira u1(a1, R2(a1)), a R2(a1) je najbolji odgovor na a1* - tj. R2(a1*) maksimizira u2(a1*, a2).Definicija: U dvoetapnoj igri s potpunom i nesavrenom informacijom definiranom ranije, rezultat savrene podigre je (a1*, a2*, a3*(a1*, a2*), a4*(a1*, a2*)), a Nash-ova ravnotea savrene podigre je (a1*, a2*, a3*(a1, a2), a4*(a1, a2)).U ovoj igri akcijski par (a3*(a1*, a2*), a4*(a1*, a2*)) je Nash-ova ravnotea jedne podigre izmeu igraa 3 i 4, gdje (a3*(a1, a2), a4*(a1, a2)) je strategija za igraa 3 i igraa 4 potpuni plan akcije koji opisuje odgovor na svaki mogui par poteza sa strane igraa 1 i 2. **

  • U ovoj igri podigre sadre interakciju izmeu igraa 3 i 4 u drugoj etapi, ako su dane akcije igraa 1 i 2 odigrane u prvoj etapi. Strategijski par (a3*(a1, a2), a4*(a1, a2)) specificira Nash-ovu ravnoteu u svakoj od tih podigara.Definicija: Perfekcija podigre eliminira Nash-ovu ravnoteu koja se zasniva na nevjerodostojnim prijetnjama ili obeanjima. Primjer ekstenzivni oblik igre na slici 1. Taj bismo primjer mogli rijeiti inverznom indukcijom, kao slijedi. Ako igra 2 doe do vora odluivanja koji slijedi L od igraa 1, onda je najbolji odgovor igraa 2 igrati R (to daje isplatu od 2) radije nego igrati L (to daje isplatu od 1). Ako 2 doe do vora odluivanja koji slijedi R od igraa 1, onda je najbolji odgovor igraa 2 igrati L (to daje plaanje od 1) radije nego R (to daje plaanje od 0). Budui da igra 1 moe rijeiti problem igraa 2 kao to to on moe uiniti, problem igraa 1 u prvoj etapi odnosi se na izbor izmeu L (to dovodi do isplate od 1 za igraa 1, nakon to ogra 2 igra R) i R (to dovodi do isplate od 2 nakon to igra 2 igra L). **

  • Prema tome, najbolji odgovor igraa 1 na anticipirano ponaanje igraa 2 je igrati R u prvoj etapi, tako da razultat inverzne indukcije ove igre je (R, L), to je prikazano podebljanom linijom na slici 4. Postoji i dodatna podebljana linija koja poinje u voru koji slijedi L igraa 1. Ova druga podebljana linija indicira da bi igra 1 mogao igrati R ako bi taj vor odluivanja bio dostignut.1LRLRLR3112210022Slika 4**

  • Prisjetimo se da je ova igra prikazana u normalnom obliku u tablici 2. Kad bismo traili Nash-ovu ravnoteu ove igre prikazane u normalnom obliku, dobili bismo 2 iste strategije: (R, (R, L)) i (L, (R, R)). Sad moemo usporediti te dvije Nash-ove ravnotee iz igre predstavljene u normalnom obliku s rezultatima procedure inverzne indukcije igre predstavljene u ekstenzivnom obliku.:Nash-ova ravnotea (R, (R, L)) korespondira svim podebljanim pravcima na slici 4. (R, L) smo nazvali rezultatom inverzne indukcije ove igre. Bilo bi prirodno nazvati (R, (R, L)) Nash-ovom ravnoteom inverzne indukcije ove igre, meutim, mi emo koristiti opu terminologiju i to nazvati Nash-ovom ravnoteom savrene podigre. Razlika izmeu rezultata i ravnotee je da rezultat specificira samo podebljani put koji poinje na poetnom voru, a zavrava na zavrnom voru, dok ravnotea takoer specificira dodatni podebljani put koji potie od vora odluivanja igraa 2 slijedei L od igraa 1. Prema tome, ravnotea specificira potpunu strategiju za igraa 2. **

  • Moemo se zapitati to je s drugom Nash-ovom ravnoteom? U ovoj ravnotei strategija igraa 2 je da igra R ne samo ako igra 1 bira L, ve takoer i kad igra 1 bira R. Poto R (slijedei R) vodi isplati 0 za igraa 1, najbolji odgovor igraa 1 na ovu strategiju igraa 2 je da igra L, pri emu oekuje isplatu od 1 za igraa 1 (nakon to igra 2 bira R), to je bolje od 0. Koristei slobodni i izazivaki jezik, moe se rei da igra 2 prijetei igra R ako igra 1 igra R. Ako je ta prijetnja uinkovita (to jest ako igra 1 bira igrati L), onda igrau 2 nije ostavljena mogunost da provede prijetnju. Meutim, prijetnja ne treba biti uinkovita poto nije vjerodostojna: ako je igrau 2 dana mogunost da provede prijetnju (ako je igra 1 igrao R), onda e igra 2 igrati L prije nego li R. Formalno, Nash-ova ravnotea (L, (R, R) nije savrena podigra, poto strategije igraa ne ine Nash-ovu ravnoteu u jednoj od podigara. Posebno, izbor igraa 2 od R nije optimalan u podigri poinjui na voru odluivanja igraa 2, a slijedei R igraa 1.**

  • U igri sa potpunom i savrenom informacijom, inverzna indukcija eliminira nevjerodostojne prijetnje.U igri s potpunom i nesavrenom informacijom, stvari nisu tako jednostavne, poto takva igra ukljuuje najmanje jedan nejednolani informacijski skup. Meutim, moemo pokuati sljedei prilaz: raditi inverzno kroz ekstenzivnu formu i eventualno dostii vor odluivanja koji je sadran u nejednolanom informacijskom skupu. Jedan od naina rada s nejednolanim informacijskim skupovima u inverznoj indukciji je raditi inverzno kroz ekstenzivni oblik sve dok se ne naie na nejednolani informacijski skup, takav skup preskoiti i nastaviti dalje sve dok se ne naie na jednolani inforamcijski skup. Onda razmotriti ne samo to bi igra s potezom na jednolanom informacijskom skupu uinio, ako ga dostigne, ve takoer koje bi akcije igra poduzeo s korakom na svim nejednolanim informacijskim skupovima koji su preskoeni. **

  • Pitanja:Koji je osnovni cilj teorije igara?Odgovor: Definirati najpovoljnije ponaanje sudionika u konfliku, pod pretpostavkom njihove racionalnosti.Zbog eka je teorija igara ostala u okvirima akademskih primjera?Odgovor: Zbog toga to konflikti u stvarnom ivotu obino nisu podloni jednostavnim pravilima.Definirajte Nash-ovu ravnoteu u statikim igrama s potpunom informacijom.Definirajte strategije i optimalne strategije u teoriji igara.U emu je razlika izmeu igra sa simultanim izborom i igara sa sekvencijalnim izborom.Definirajte razlike izmeu igara s potpunom informacijom i igara s nepotpunom informacijom.Definirajte razlike izmeu igara sa savrenom i igara s nesavrenom informacijom.

    **

  • Definirajte tablicu isplata u teoriji igara.Definirajte mjeovite strategije u teoriji igara.Definirajte sedlastu toku u statikim igrama s potpunom informacijom.Definirati dominirajuu i dominiranu strategiju.to je to oekivana vrijednost igre.to specificira normalni oblik igara.Na emu se zasniva iterativna eliminacija strogo dominiranih strategija?Iterativna eliminacija strogo dominiranih strategija ima dva nedostatka, navedite ih.Po emu je Nash-ova ravnotea jai koncept od iterativne eliminacije strogo dominiranih strategija.Kakav je odnos izmeu Nash-ove ravnotee i iterativne eliminacije strogo dominiranih strategija?

    **