1 Bolsistas do PET Matemática da UFU – SESu/MEC 2 Tutor do PET Matemática da UFU – SESU/MEC
A teoria da dualidade e o equilíbrio de Nash
Lara Martins Barbosa1, Marcos Antônio da Câmara
2, Letícia Ferreira Martins
1
UFU - Faculdade de Matemática – Campus Santa Mônica
38408-100, Uberlândia, Minas Gerais
E-mail: [email protected], [email protected], [email protected]
Palavras-chave: Painéis IC, dualidade, teoria dos jogos, equilíbrio de Nash
Resumo: Neste trabalho estudamos a teoria da dualidade da programação linear e sua
aplicação na demonstração da existência do equilíbrio de Nash em estratégias mistas para jogos de soma zero com dois jogadores.
1 Introdução
A teoria dos jogos é uma teoria matemática criada para se modelar fenômenos que podem ser
observados quando dois ou mais agentes de decisão interagem entre si. Ela fornece linguagem para a descrição de processos de decisões conscientes envolvendo mais do que um indivíduo.
Em seu início, a teoria dos jogos chamou pouca atenção. Em 1928, John Von Neumann mudou
essa situação ao demonstrar que todo jogo finito de soma zero possui uma solução em estratégias mistas. A demonstração original usava topologia e análise funcional e era difícil de
acompanhar. Em 1937, ele forneceu uma nova demonstração baseada no teorema do ponto fixo
de Brouwer. Neste trabalho apresentaremos uma demonstração que utiliza a Teoria da Dualidade da Programação Linear.
2 A teoria da dualidade
Os problemas duais da programação linear denominados, respectivamente, de PRIMAL e DUAL são:
minimizar 𝑄 𝑋 = 𝐶𝑇𝑋sujeito a 𝐴𝑋 ≥ 𝐵
𝑋 ≥ 0
(1)
maximizar 𝑄𝐷 𝑌 = 𝐵𝑇𝑌
sujeito a 𝐴𝑇𝑌 ≤ 𝐶
𝑌 ≥ 0
(2)
em que 𝐴 = 𝑎𝑖𝑗 𝑚𝑥𝑛, 𝐵 = 𝑏𝑖 𝑚𝑥 1, 𝐶 = 𝑐𝑗 𝑛𝑥1
, 𝑋 = 𝑥𝑗 𝑛𝑥1 e 𝑌 = 𝑦𝑖 𝑚𝑥 1.
De outra forma, podemos considerar (2) o PRIMAL e (1) o DUAL.
Teorema 1: Se 𝑋 e 𝑌 são soluções viáveis quaisquer, respectivamente, do primal e do dual,
então 𝑄 𝑋 ≥ 𝑄𝐷 𝑌 .
Corolário 1: Se 𝑋∗ e 𝑌∗ são soluções viáveis, respectivamente, do primal e do dual, tais que
𝑄 𝑋∗ = 𝑄𝐷 𝑌∗ , então 𝑋∗e 𝑌∗ são soluções ótimas dos seus respectivos problemas.
Corolário 2: Se a função objetivo é ilimitada no conjunto das soluções viáveis 𝑆𝑃 do primal,
então o conjunto das soluções viáveis 𝑆𝐷 do dual é vazio.
Resumindo todas as alternativas de soluções possíveis para o para primal-dual, teremos somente uma das seguintes alternativas:
591
ISSN 2317-3300
1 Bolsistas do PET Matemática da UFU – SESu/MEC 2 Tutor do PET Matemática da UFU – SESU/MEC
PRIMAL
Existe
solução
ótima 𝑋∗
𝑄 𝑋∗ = 𝑄𝐷 𝑌∗
𝑆𝑃 = ∅
𝑆𝑃 = ∅
𝑄 𝑋∗ → −∞
DUAL
Existe solução
ótima 𝑌∗
𝑆𝐷 = ∅
𝑄𝐷 𝑌∗ → +∞
𝑆𝐷 = ∅
3 Teoria dos jogos
A teoria dos jogos pode ser definida como a teoria dos modelos matemáticos que estuda a
escolha de decisões ótimas sob condições de conflito. Um jogo tem os seguintes elementos
básicos: existe um conjunto finito de jogadores, representado por 𝐺 = 𝑔1, 𝑔2 , … , 𝑔𝑛 . Cada
jogador possui um conjunto finito 𝑆𝑖 = 𝑠𝑖1, 𝑠𝑖2, … , 𝑠𝑖𝑚 𝑖 de opções, denominadas estratégias
puras do jogador 𝑔𝑖 , 𝑚𝑖 ≥ 2.
Definição 1: Um jogo de soma constante com dois jogadores é um jogo com dois jogadores,
comumente denominados jogador linha 𝑔𝑙 e jogador coluna 𝑔𝑐 , com estratégias
𝑆𝑙 = 1, 2, 3, … , 𝑚 e 𝑆𝑐 = 1, 2, 3, … , 𝑛
e matriz de payoff 𝑎𝑖𝑗 , 𝑏𝑖𝑗 , 𝑖 = 1, 2, ⋯ , 𝑚 e 𝑗 = 1, 2, … , 𝑛, em que 𝑎𝑖𝑗 e 𝑏𝑖𝑗 representam os
payoffs de cada jogador para as escolhas da estratégia 𝑖 de 𝑔𝑙 e estratégia 𝑗 de 𝑔𝑐 , satisfazendo
𝑎𝑖𝑗 + 𝑏𝑖𝑗 = 𝑐, 𝑐 ∈ ℝ. Vamos considerar o caso particular em que 𝑐 = 0, ou seja, jogos que tem
soma zero. Nesse caso, 𝑏𝑖𝑗 = −𝑎𝑖𝑗 .
Além disso, vamos considerar o jogo do ponto de vista probabilístico, ou seja, ao invés de
escolher um perfil de estratégia pura, o jogador deve escolher uma distribuição de probabilidade
sobre suas estratégias puras. Uma estratégia mista 𝒑 = 𝑝1, 𝑝2, 𝑝3, … , 𝑝𝑚 para 𝑔𝑙 é uma
distribuição de probabilidade para as estratégias puras desse jogador e uma estratégia mista
𝒒 = 𝑞1, 𝑞2, 𝑞3, … , 𝑞𝑛 é uma distribuição de probabilidade para as estratégias puras desse
jogador, em que 𝑝𝑖 = 1, 𝑝𝑖 ≥ 0𝑚𝑖=1 e 𝑞𝑗 = 1, 𝑞𝑗 ≥ 0𝑛
𝑗=1 . Nesse caso, o payoff esperado para
𝑔𝑙 é 𝑢𝑙 𝒑, 𝒒 = 𝒑𝑇𝐴𝒒, com 𝐴 = 𝑎𝑖𝑗 𝑚𝑥𝑛 e o payoff esperado para 𝑔𝑐 é 𝑢𝑐 𝒑, 𝒒 = 𝒑𝑇𝐵𝒒, com
𝐵 = 𝑏𝑖𝑗 𝑚𝑥𝑛.
Definição 2: (Equilíbrio de Nash) Dizemos que um perfil de estratégia mista 𝒑∗, 𝒒∗ é um
equilíbrio de Nash se 𝑢𝑙 𝒑∗, 𝒒∗ ≥ 𝑢𝑙 𝒑, 𝒒∗ 𝑒 𝑢𝑐 𝒑
∗, 𝒒∗ ≥ 𝑢𝑐 𝒑∗, 𝒒 , para quaisquer 𝒑 e 𝒒.
Isto significa que nenhum jogador sente motivação de trocar sua estratégia mista se o outro não
o fizer.
Ao utilizar a estratégia 𝒑, o ganho médio mínimo de 𝑔𝑙 é min𝒒 𝑢𝑙 𝒑, 𝒒 e 𝑔𝑙 tentará escolher 𝒑
de forma a maximizar esta quantia, isto é, tentará encontrar um número 𝑀𝑙 > 0 tal que
𝑀𝑙 = max𝒑 min𝒒 𝑢𝑙 𝒑, 𝒒 .
Ao utilizar a estratégia 𝒒, a perda média máxima de 𝑔𝑐 é max𝒑 𝑢𝑙 𝒑, 𝒒 e 𝑔𝑐 tentará escolher 𝒒
de forma a minimizar esta quantia, isto é, tentará encontrar um número 𝑀𝑐 > 0 tal que
𝑀𝑐 = min𝒒 max𝒑 𝑢𝑙 𝒑, 𝒒 .
Para otimizar ambas as estratégias espera-se que 𝑀𝑙 = 𝑀𝑐 . Mas, isto é possível.
Teorema 2 (Minimax de von Neumann)
592
ISSN 2317-3300
1 Bolsistas do PET Matemática da UFU – SESu/MEC 2 Tutor do PET Matemática da UFU – SESU/MEC
Para todo jogo de soma zero com dois jogadores, representado pela matriz de payoffs 𝐴 do
jogador linha, sempre existe um perfil de estratégia mista 𝒑∗, 𝒒∗ satisfazendo
max𝒑 min𝒒 𝑢𝑙 𝒑, 𝒒 = 𝑢𝑙 𝒑∗, 𝒒∗ = min𝒒 max𝒑 𝑢𝑙 𝒑, 𝒒 .
Demonstração: O problema de 𝑔𝑙 é encontrar um vetor 𝒑𝑻 = 𝑝1, 𝑝2, 𝑝3 , … , 𝑝𝑚 e um número
𝑀𝑙 tal que 𝐴𝑇𝒑 ≥ 𝑀𝒍 𝒏𝒙𝟏, 𝑝𝑖 = 1𝑚𝑖=1 e 𝑝𝑖 ≥ 0. Colocando 𝑥𝑖 =
𝑝 𝑖
𝑀𝑙, teremos 𝑥𝑖 =
1
𝑀𝑙
𝑚𝑖=1 ,
que queremos minimizar, pois queremos maximizar 𝑀𝑙 . Nesse caso, teremos o seguinte PPL:
minimizar 𝑥𝑖 =1
𝑀𝑙
𝑚𝑖=1
sujeito a 𝐴𝑇𝑋 ≥ 1
𝑋 ≥ 0
(1)
em que 𝑋𝑇 = 𝑥1, 𝑥2, … , 𝑥𝑚 e 1 𝑇 = 1, 1, … , 1 .
O problema de 𝑔𝑐 é encontrar um vetor 𝒒𝑻 = 𝑞1, 𝑞2, 𝑞3, ⋯ , 𝑞𝑛 e um número 𝑀𝑐 tal que
𝐴𝒒 ≤ 𝑀𝑐 𝒎𝒙𝟏, 𝑞𝑗 = 1𝑛𝑗=1 e 𝑞𝑗 ≥ 0. Colocando 𝑦𝑗 =
𝑞𝑗
𝑀𝑐, teremos 𝑦𝑗 =
1
𝑀𝑐
𝑛𝑖=1 , que
queremos maximizar, pois queremos minimizar 𝑀𝑐 . Nesse caso, teremos o seguinte PPL:
maximizar 𝑦𝑗 =1
𝑀𝑐
𝑛𝑖=1
sujeito a 𝐴𝑌 ≤ 1
𝑌 ≥ 0
(2)
em que 𝑌𝑇 = 𝑦1, 𝑦2, … , 𝑦𝑛 e 1 𝑇 = 1, 1, … , 1 .
Os problemas (1) e (2) são duais e, portanto, min 𝑥𝑖 =𝑚𝑖=1 max 𝑦𝑗
𝑛𝑖=1 , ou seja,
1
𝑀𝑙=
1
𝑀𝑐⇒
𝑀𝑙 = 𝑀𝑐 . ∎
Em particular, 𝒑∗, 𝒒∗ é um equilíbrio de Nash. Além de estabelecer a existência de equilíbrios de Nash, a demonstração sugere uma maneira de encontrá-los: resolvendo-se dois problemas
duais da programação linear.
Referências
[1] D. G. Luenberger, Linear and Nonlinear Programming, Second Edition. Addison-Wesley
Publishing Company, 1989.
[2] H. V. Machado, Programação Linear, IMPA, Rio de Janeiro, 1975.
[3] B. A. Sartini, G. Garbugio, H. J. Bortolossi, P. A. Santos, L. S. Barreto, Uma Introdução
à Teoria dos Jogos, II Bienal da SBM, 2004.
593
ISSN 2317-3300
Top Related