El Farol Bar Problem e Jogo Minoritário: uma introdução à...
Transcript of El Farol Bar Problem e Jogo Minoritário: uma introdução à...
1
El Farol Bar Problem e Jogo Minoritário: uma introdução à
econofísica
(El Farol Bar Problem and Minority Game: An introduction to econophysics)
Diogo de Toledo Bertulino1, Diego O. Nolasco1,2
1Curso de Física - Universidade Católica de Brasília 2Programa de Pós-Graduação em Ciências Genômicas e Biotecnologia – Universidade
Católica de Brasília
Propõe-se nesse trabalho um estudo do El Farol Bar Problem e do Jogo Minoritário, a partir dos conceitos de racionalidade limitada e raciocínio indutivo na tomada de decisões em situações cotidianas, quando o número de agentes é grande. Nesses casos, verifica-se a impraticabilidade da Teoria dos Jogos. As novas linhas de pensamento, principalmente as propostas pelo Jogo Minoritário, revelam grande importância para o estudo da Econofísica porque servem de instrumento para a análise de situações reais, como mercados financeiros. Palavras-chave: El Farol Bar Problem, Jogo Minoritário, Teoria dos Jogos, Econofísica, modelos mercadológicos. The purpose in this paper is to make a study about the El Farol Bar Problem and the Minority Game, based on the concepts of bounded rationality and inductive reasoning in everyday situation decision-making, when there is a large number of players. In such cases, Game Theory is impractical. Those new thoughts, especially the ones proposed by the Minority Game, reveal great importance for studies in the field of Econophysics, as they are an essential tool for real situations analysis, like financial markets. Keywords: El Farol Bar Problem, Minority Game, Game Theory, Econophysics, market models.
1. Introdução
Nos últimos anos, a Econofísica se tornou uma das áreas de grande
interesse de cientistas, principalmente físicos e economistas. Isso ocorreu
devido à possibilidade de modelagem de comportamentos econômicos por
meio de teorias físicas vastamente conhecidas.
A Teoria dos Jogos, um ramo da matemática aplicada, tem-se mostrado
de grande aplicação em várias áreas do conhecimento, mas principalmente em
Economia, devido ao estudo da tomada “racional” de decisões estratégicas.
Porém, em situações onde o número de agentes é grande, a análise das
possibilidades de estratégias à luz da Teoria dos Jogos torna-se extremamente
complexa.
2
Assim, novas linhas de pensamento com base no raciocínio indutivo
foram exploradas, nas quais os métodos utilizados incorporam a racionalidade
humana. No presente trabalho são analisados o El Farol Bar Problem (Arthur,
1994) e o Jogo Minoritário (Challet e Zhang, 1997). No El Farol Bar Problem,
discutem-se os conceitos de racionalidade limitada e raciocínio indutivo em
situações de tomada de decisão. No Jogo Minoritário, seguindo a mesma linha
de pensamento, são explorados experimentos computacionais com o objetivo
de analisar a dinâmica comportamental dos agentes.
Neste trabalho realizou-se uma análise dos estudos mencionados, com
o objetivo de verificar a importância dessas ideias no entendimento das
interações humanas, especialmente as de caráter econômico, como no
mercado financeiro.
2. Referencial Teórico
2.1 Teoria dos Jogos
A Teoria dos Jogos é um ramo da matemática aplicada que foi
originalmente utilizada em ciências humanas, principalmente em economia
ciências políticas e relações internacionais, e tem sido aplicada em uma vasta
área de assuntos como biologia, ciência da computação e filosofia.
Tem-se considerado que o campo da Teoria dos Jogos tornou-se
firmemente estabelecido em 1944 com o livro “Theory of Games and Economic
Behavior” de John Von Neumann e Oskar Morgenstern (Sinha et al., 2011).
Pode-se dizer que o termo “Jogo” é uma situação em que os jogadores,
também conhecidos como participantes, tomam decisões estratégicas, ou seja,
decisões que levam em consideração as atitudes e respostas de todos os
jogadores (Pindyck, 2010). Assim, a Teoria dos Jogos dedica-se à análise
dessas interações estratégicas (Varian, 2006).
Uma maneira de se representar um jogo é construir uma “Matriz de
Ganhos de um Jogo”, a qual contém as possíveis jogadas dos jogadores e os
“payoffs”, ou seja, os valores associados a um resultado possível (Varian,
2006). Um exemplo de jogo seria: um professor propõe para dois alunos
escolherem entre as letras e . Se ambos os alunos escolherem a letra ,
3
ambos terão nota 8 naquela matéria. Se ambos os alunos escolherem a letra ,
ambos terão nota 9. E se apenas um escolher a letra , este terá nota 10 e o
outro terá nota 7. A matriz de ganhos do jogo é a seguinte:
Figura 1: Jogo das Notas representado pela Matriz de Ganhos do jogo.
O primeiro número de cada célula é o payoff do Aluno , já o segundo
número corresponde ao payoff do Aluno . Define-se “estratégia” como um
plano de ação para o jogo. No jogo citado, as estratégias são escolher a letra
ou a . Analisando a matriz, qual seria a melhor estratégia para o Aluno ? Se
ele optar pela letra ele pode obter notas 8, se o Aluno optar pela letra ou
10, se o Aluno optar pela letra . Se o Aluno optar pela letra , ele pode
obter notas 7, se o Aluno optar pela letra ou 9, se o Aluno optar pela letra
. Assim, conclui-se que a opção pela letra é melhor do que a letra ,
independentemente da escolha do Aluno , pois suas notas podem ser
melhores. O mesmo ocorre para o Aluno , já que os payoffs são os mesmos.
Dessa forma, define-se que a opção pela letra é a “estratégia dominante”.
Assim, pode-se dizer que estratégia dominante é a estratégia ótima, ou seja,
que resulta em melhor payoff, independentemente, das escolhas de estratégias
dos outros jogadores (Pindyck, 2010).
Um problema muito semelhante a esse é o famoso “Dilema do
Prisioneiro”, um dos jogos mais conhecidos na área, tratando-se de uma
situação em que dois prisioneiros, comparsas num crime, eram interrogados
separadamente. Cada prisioneiro tinha uma escolha de confessar o crime ou
negá-lo. Se apenas um deles confessasse o crime, ele seria libertado e o outro
seria condenado a seis meses de prisão. Se ambos confessassem, ambos
passariam três meses na prisão. E se ambos prisioneiros negassem, ambos
4
passariam apenas um mês na prisão. A matriz de ganhos desse jogo está
representada abaixo:
Figura 2: Dilema do Prisioneiro.
Analisando a melhor estratégia para cada jogador, também conhecida
como estratégia ótima, pode-se dizer que se o jogador escolhe confessar,
então a melhor estratégia para o jogador também é confessar, pois ele ficaria
apenas três meses preso. Já se o jogador escolhe negar, então a melhor
estratégia para o jogador é confessar. Assim vemos que a opção confessar é
uma estratégia dominante. O mesmo acontece para o jogador com relação
ao jogador . Utilizando marcações circulares para o jogador e marcações
quadrangulares para o jogador , temos a matriz dos ganhos com as
estratégias ótimas para cada jogador.
Figura 3: Dilema do Prisioneiro e marcações das estratégias ótimas para cada jogador
dependendo da estratégia do oponente.
Assim, diz-se que o par de estratégias “confessa” é um equilíbrio de
estratégias dominantes, pois é a melhor combinação de respostas para ambos
os jogadores, independentemente da estratégia de cada jogador. Porém, existe
5
a possibilidade de jogos sem a existência de estratégias dominantes para todos
os jogadores, ou mesmo, sem a existência de quaisquer estratégias
dominantes. Analisemos a matriz de ganhos do Dilema do Prisioneiro
Modificado abaixo:
Figura 4: Dilema do Prisioneiro Modificado.
Percebe-se que o jogador A não possui mais uma estratégia dominante.
Dessa forma, qual seria a melhor estratégia para o jogador A? Para responder
tal questão, o jogador A deve posicionar-se frente às condições do jogador B.
Assim, analisando as estratégias do jogador B, percebe-se que ele ainda
detém a estratégia “confessa” como estratégia dominante. Logo, o jogador A
supõe que o jogador B escolherá a estratégia “confessa”, pois é sua estratégia
ótima. Assim, sua melhor estratégia para esse caso também é “confessa”, pois
é preferível uma pena de 3 meses ao invés de uma pena de 6 meses. Assim, o
equilíbrio do jogo ocorre devido ao jogador A escolher sua melhor estratégia,
dado a decisão do jogador B, e o jogador B escolhe sua melhor estratégia,
dado a decisão do Jogador A. Tal situação é dita como um equilíbrio de Nash.
Ou seja, um equilíbrio de Nash é um par de estratégias na qual cada jogador
escolhe uma estratégia ótima em função das ações dos outros jogadores
(Pindyck, 2010). Percebe-se que a definição de equilíbrio de Nash é mais geral
do que a de equilíbrio de estratégias dominantes, pois essa ocorre qualquer
que seja a estratégia dos oponentes. Assim, equilíbrio de estratégias
dominantes é um caso especial do Equilíbrio de Nash. Existem jogos onde há
mais de um Equilíbrio de Nash e podem existir casos sem a existência de tal
equilíbrio. No caso do Dilema do Prisioneiro Modificado, como nos anteriores,
vemos que o equilíbrio de Nash não coincide com a melhor combinação de
6
respostas para ambos jogadores. No caso do Jogo das Notas, a melhor
estratégia seria se ambos escolhessem a letra ficando ambos com nota 9.
Nos casos do Dilema do Prisioneiro e no Dilema do Prisioneiro Modificado, a
melhor estratégia seria se ambos negassem o crime, ficando presos apenas
um mês. No Dilema do Prisioneiro, mesmo que o jogador soubesse que o
jogador escolherá a opção negar, sua estratégia ótima para este caso é
confessar, pois não existe nenhuma obrigação para que ele não o faça. Ou
seja, escolhas racionais podem levar a resultados ruins. Nesse caso o
equilíbrio de Nash também é chamado de “Pareto ineficiente” (Polak, 2007).
Agora, e se esse jogo fosse repetido? Digamos que esse jogo seja
repetido um número finito de vezes. Por exemplo, três vezes. Suponha-se a
análise da terceira rodada. Nesse caso, pode-se dizer que é provável que os
jogadores escolham a estratégia dominante, pois jogar a última vez é como
jogar uma só vez. Se pensarmos na segunda jogada, como na terceira jogada
cada jogador escolherá a estratégia dominante, então se pode dizer que a
escolha da estratégia dominante neste caso também é provável, pois cada
jogador não quer ser “enganado”, e ser “passado para trás”. Assim, se não
existir um meio de impor a cooperação entre os jogadores, não haverá um
meio de impor cooperação nas outras jogadas (Varian, 2006). Porém, se o jogo
tiver um número ilimitado de repetições, pode-se tentar impor um meio de
cooperação dos outros jogadores, se ele não cooperar nessa jogada, você
pode se recusar a cooperar na próxima jogada.
2.2 Racionalidade Limitada e Raciocínio Indutivo
De acordo com Arthur (1994), o tipo de raciocínio utilizado para
encontrar soluções de problemas em economia é o raciocínio lógico, dedutivo.
Porém, muitos destes problemas a serem enfrentados são de alta
complexidade e de difícil, se não impossível, solução dedutiva. Como exemplo,
podemos citar o “Jogo da Velha”, onde se pode determinar uma solução
totalmente racional, ao contrário de jogos como “Xadrez” e “Go”, nos quais
soluções racionais não são encontradas. Dessa forma Arthur (1994) destaca
que existem dois motivos para que a racionalidade dedutiva perfeita deixe de
funcionar. Quando enfrentamos um problema com certa complexidade, nosso
7
raciocínio lógico deixa de responder, ou seja, nossa “racionalidade é limitada”.
Ou quando em situações interativas entre agentes, não é possível saber
exatamente qual será o comportamento dos outros agentes, assim, somos
levados a imaginar seus comportamentos. Tais subjetividades e indefinições
não estão de acordo com raciocínio lógico, dedutivo e objetivo. De acordo com
Challet et al. (2005), esse conceito de racionalidade limitada foi introduzido por
Simon (1981).
Em economia sabemos que há grande presença de problemas similares,
pois em muitos casos, um agente não tem conhecimento de quais serão as
estratégias utilizadas pelos outros agentes e, nesse caso, há necessidade de
supor ou imaginar seus comportamentos. Essa maneira de pensar, esse
raciocínio utilizado é chamado indutivo. Dessa forma mostra-se necessário um
tipo de modelo diferenciado, que leve em conta a racionalidade limitada e o
raciocínio indutivo.
Arthur (1994) destaca que, de acordo com a psicologia moderna, a
racionalidade de humanos frente a problemas complicados ou mal definidos
ocorre através de reconhecimento de padrões. Humanos são bons em dedução
lógica porém, têm excelente habilidade de reconhecimento e determinação de
padrões. Tenta-se elaborar um modelo mais simples que solucione o problema
encontrado a partir da análise de comportamento, na tentativa de reconhecer
um padrão para que o agente toma sua decisão. Assim, um agente prepara
sua estratégia de acordo com um histórico privado, podendo ele tomar sua
decisão a partir de uma só estratégia ou uma combinação delas.
À medida que decisões são tomadas, o agente enfraquece ou fortalece
suas crenças de acordo com a performance de seus resultados, fazendo com
que novas hipóteses sejam formadas e novas decisões sejam tomadas, torna-
se um jogo de eterno aprendizado.
Além disso, Arthur (1994) destaca que todo o processo é evolucionário,
ou mais especificamente, co-evolucionário. Isso por se tratar de um processo
onde cada agente toma sua decisão a partir de seu histórico de decisões, à
medida que essas decisões vão sendo tomadas, esse histórico muda, e tal
processo ocorre com um “aprendizado”. À medida que cada agente, através da
competição com outros agentes, deve provar-se e estar adaptado ao ambiente
8
criado pelas hipóteses dos outros agentes, este conjunto de ideias e hipóteses
co-evoluem.
2.3 O problema do Bar “El Farol”
De acordo com Arthur (1994), o “El Farol Bar Problem” consiste no
seguinte: Imagine que pessoas decidem independentemente toda semana
a ir ou não a um bar que oferece entretenimento determinada noite. Como o
espaço é restrito, então o ambiente é agradável se menos que das
pessoas estiverem presentes. Não existe possibilidade de saber o número de
pessoas que vão. Dessa maneira, um agente vai, se ele acredita que estarão
presentes menos de das pessoas, ou ele fica em casa se acredita que mais
de das pessoas irão ao bar. As escolhas não são afetadas pelas visitas
prévias e não existe comunicação entre os agentes, sendo que a única
informação disponível é o número de pessoas que foram ao bar nas semanas
anteriores. Dessa forma, o interesse no problema é a dinâmica do número de
pessoas frequentando o bar semana a semana.
Arthur (1994) destaca nesse problema duas características
interessantes. A primeira é que não existe um modelo para que os agentes
possam basear suas decisões, logo, não é possível uma solução dedutiva.
Cada agente não tem conhecimento da estratégia que será utilizada pelos
outros agentes, tornando-se um problema mal definido do ponto de vista dos
agentes, o que leva a um processo de indução. A segunda vem do seguinte
raciocínio: imaginemos que todos os agentes acreditam que poucas pessoas
irão, dessa forma todos tenderão a ir, invalidando a hipótese. Ou se todos
agentes acreditam que mais de irão, então ninguém vai, invalidando a
hipótese. Logo, todas as hipóteses são forçadas a divergir.
2.3.1 Testes Computacionais
Uma simulação computacional nesse caso mostra-se de grande
importância no intuito de analisar a dinâmica da frequência de pessoas. Dessa
forma, Arthur (1994) utiliza um método gerador de hipóteses a partir de
números aleatórios, ou como ele mesmo diz, “sopa de letras”. Reunindo-os em
9
diversas dúzias, aleatoriamente, escolhe hipóteses para cada um dos
agentes. Assim, cada agente tem hipóteses para que possa utilizar. Dessa
forma, obtém-se o gráfico da figura 5.
Figura 5: Gráfico da frequência de agentes simulado por Arthur (1994) para as
primeiras semanas.
Do gráfico, pode-se concluir que onde existe uma repetição cíclica de
frequência, ela rapidamente tende a não mais acontecer. Ou seja, uma vez que
muitos agentes imaginam que a maioria irá, pois foi o padrão de
comportamento de ou semanas atrás, logo eles tenderão a ficar em casa.
Porém o mais relevante é o fato de que a frequência converge para . Arthur
(1994) descreve tal comportamento como uma auto-organização para um
padrão de equilíbrio, como uma ecologia, explicado talvez por ser um jogo de
predição, no qual uma estratégia mista de predição para uma frequência acima
de seja de probabilidade e para uma frequência abaixo de com
probabilidade , na qual o equilíbrio é o Equilíbrio de Nash.
2.4 Jogo Minoritário
Inspirado pelo “El Farol Bar Problem” e pelas ideias de racionalidade
limitada, Challet e Zhang (1997) introduzem um novo jogo, chamado “Minority
Game”, que pode ser melhor explicado pelas próprias palavras dos autores:
“Vamos considerar uma população de (ímpar) jogadores, cada tem um
número finito de estratégias . A cada intervalo de tempo, todos tem que
escolher em estar do lado ou do lado . O payoff do jogo é declarar que,
10
depois de todos terem escolhido o lado independentemente, aqueles que estão
do lado minoritário vencem.”
Por questão de conveniência, é estipulado ponto aos jogadores
vencedores e ponto aos jogadores perdedores. É importante ressaltar que
todos os jogadores têm acesso à informação correspondente ao registro dos
resultados anteriores. Esse registro pode ser colocado como uma string de
memória, onde cada jogador tem acesso a resultados mais recentes. Assim,
pode-se definir as estratégias como e , de maneira que corresponde a
estar do lado , por exemplo, e corresponde a não estar do lado . Dessa
forma, imaginemos que exista uma grande limitação da capacidade de análise
dos agentes, uma racionalidade limitada, e que informação disponível para
todos os agentes seja das duas últimas jogadas, ou seja, . Na tabela 1
tem-se um exemplo da situação.
Na tabela, para cada bit de informação possível (sinal), existe uma
estratégia correspondente a qual o agente utilizará. Então, de acordo com a
informação dada, a estratégia a utilizar seria . Como , então o número
de possibilidades de bits de informação é , como mostrado. Então o
número total de estratégias possíveis é . A figura 6 ilustra a
situação.
11
Figura 6: Espaço de estratégias possíveis para , inspirado no modelo de Sinha et al.(2011).
Dessa forma, Challet e Zhang (1997) simularam a dinâmica do comportamento
do jogo para 1001 agentes com diversos tamanhos cerebrais, ou seja,
diferentes valores de . Inicialmente foi cedido um
sinal artificial como informação pública e cada agente utilizou uma de suas
estratégias aleatoriamente. Todas as estratégias de cada agente recebem
pontos de acordo com a informação cedida, possibilitando a formação de um
ranking dos pontos acumulados para cada estratégia. Assim, o jogador utilizará
a que tiver a melhor posição no ranking, ou seja, a que tem mais pontos
acumulados. Dessa forma, o agente só ganhará o ponto real se a estratégia
que ele utilizar resultar em vitória. Tais simulações estão ilustradas pelos
gráficos da Figura 7.
12
13
Figura 7: Simulações realizadas por Challet e Zhang (1997) da presença do lado
para uma população de agentes com diferentes tamanhos cerebrais a) ,
b) e c) .
Dos gráficos, percebe-se que em todas as situações há flutuação da
presença em torno dos , porém jogadores mais “inteligentes” (valores de
maiores) mostram menor flutuação em torno do equilíbrio se comparado aos
jogadores menos “inteligentes”. Mas o que isso significa? Imaginemos que,
numa jogada, apenas um agente escolha o lado e os outros o lado . Então,
apenas o jogador que optou pelo lado é o vencedor e recebe ponto. Agora,
se agentes escolhem o lado e escolhem o lado , todos os
agentes que escolheram o lado são os vencedores e cada um recebe
ponto. Do ponto de vista quantitativo, a segunda situação é mais interessante,
pois muito mais pessoas pontuam, otimizando a eficiência. Assim, os gráficos
mostram que populações mais “inteligentes” tendem a aumentar a eficiência de
seu comportamento. Challet e Zhang (1997) destacam que, por definição, cada
agente é egoísta por preocupar-se apenas com a suas estratégias e sua
jogada, mas de alguma forma conseguem compartilhar os limitados recursos
disponíveis.
Os autores também ressaltam que se algum agente adotasse a
estratégia de permanecer fixo a um só lado, isto não funcionaria, pois
rapidamente os outros agentes perceberiam que ganhariam menos
frequentemente se escolhessem o mesmo lado. Assim, os outros agentes
adotariam estratégias de acordo com a situação. A Figura 8 mostra a diferença
do ganho médio para agentes com diferentes tamanhos cerebrais.
14
Figura 8: Simulação realizada por Challet e Zhang (1997) mostrando a diferença da
taxa de sucesso de acordo com os tamanhos cerebrais.
Challet e Zhang (1997) discutem que a média de ganho entre
populações com tamanhos cerebrais menores é menor do que a de populações
com tamanhos cerebrais maiores. Porém, a partir de um determinado tamanho
cerebral ( ), o ganho médio parece saturar. Isso ocorre devido à estrutura
binária do jogo, ou seja, a única informação cedida é sim ou não. Informações
mais precisas como o número de frequência, mais poder de análise entre
outros podem ser implementados para gerar cérebros mais desenvolvidos.
Outra situação abordada por Challet e Zhang (1997) é a possibilidade de
aumentar o número de estratégias para cada agente. A Figura 9 exemplifica a
situação para varias populações de agentes, memória e número
de estratégias .
15
Figura 9: Simulação realizada por Challet e Zhang (1997) da taxa de sucesso para
várias populações de 1001 agentes, com memória e número de estratégias
.
Analisando o gráfico, percebe-se que quanto maior o número de
estratégias, menor é o rendimento dos agentes. De acordo com Challet e
Zhang (1997), isso ocorre devido aos agentes ficarem “confusos” com a
possibilidade de estratégias. Na Figura 10 os autores simulam um gráfico da
taxa de troca de possibilidades para diversas populações, pela taxa de
sucesso. Percebe-se que maior é o sucesso se apenas uma estratégia é
utilizada.
Figura 10: Simulação realizada por Challet e Zhang (1997) da taxa de troca de
estratégias pela taxa de sucesso para diversas populações.
16
Outra informação de grande relevância destacada por Challet e Zhang
(1997) é o conhecimento da performance dos agentes. Assim, os autores
selecionam, de uma população com agentes, e , os três
melhores jogadores, os três piores e mais três de forma aleatória. O gráfico da
Figura 11 mostra a simulação.
Figura 11: Simulação realizada por Challet e Zhang (1997) do ganho acumulado em
função do tempo para os três melhores jogadores, os três piores e três selecionados
aleatoriamente, para uma população de jogadores, memória e número
de estratégias .
Pelo gráfico, observa-se que tanto os jogadores melhores sucedidos
quanto os piores obedecem a um crescimento, ou decaimento, que parece ser
linear. Isso mostra que os jogadores bem sucedidos tendem a continuar seu
bom desempenho e os mal sucedidos, ficam cada vez mais “pobres”. Challet e
Zhang (1997) destacam que tal situação pode ser revertida pela definição do
jogo, porém não é o que acontece com o passar do tempo. Assim, uma
questão pode ser levantada. Será que o desempenho dos piores jogadores
acontece devido a suas estratégias equivocadas ou por outro motivo? Challet e
Zhang (1997) discutem tal desempenho a partir do gráfico do ganho virtual dos
jogadores pela taxa de sucesso, com diferentes números de
interações( ), conforme a Figura 12.
17
Figura 12: Simulação realizada por Challet e Zhang (1997) do ganho virtual dos
agentes pela taxa de sucesso para a) b) e c) interações.
Challet e Zhang (1997) ressaltam que tal comportamento mostra que
todas as estratégias são iguais quando o tempo tender ao infinito, mostrando
que o desempenho dos piores jogadores acontece simplesmente devido à falta
de sorte ou a jogadas inoportunas.
Outro experimento de grande relevância discutido por Challet e Zhang
(1997) é o caso da “evolução de espécie”. O pior jogador é substituído por um
novo jogador depois de um número finito de interações, o qual este é cópia do
melhor jogador, porém com capital virtual acumulado igual a . Outra
característica do experimento é a introdução da possibilidade de mutação.
Cada novo jogador tem possibilidade de uma de suas estratégias ser trocada
por outra. Assim, os resultados estão mostrados na Figura 13.
18
Figura 13: Simulações realizadas por Challet e Zhang (1997) da presença do lado A
para a situação de “evolução de espécie” com relação ao tempo, com possibilidade de
mutação.
É possível perceber que tal experimento reflete uma situação de
aprendizado, na qual as flutuações são reduzidas e saturadas e há aumento do
ganho médio. Já para o caso de não ocorrer mutação, ou seja, os novos
jogadores são cópias perfeitas dos melhores jogadores, Challet e Zhang (1997)
obtiveram o gráfico da Figura 14.
Figura 14: Simulações realizadas por Challet e Zhang (1997) da presença do lado A
para a situação de “evolução de espécie” com relação ao tempo, sem possibilidade de
mutação.
19
Tal experimento exibe um comportamento com grandes flutuações e
total falta de coordenação da população, gerando grande perda. Challet e
Zhang (1997) relatam que tal comportamento é resultado de endogamia e
incesto.
Outra situação abordada por Challet e Zhang (1997) ainda com relação
à evolução da espécie, durante o processo de clonagem, o novo jogador tem
probabilidade de ter maior ou menor memória. O interesse dos autores neste
experimento refere-se ao domínio dos agentes com maiores cérebros sobre os
de menores. Assim, para duas populações, uma com agentes e outra com
e memórias iniciais de , obtém-se o gráfico da Figura 15.
Figura 15: Simulações realizadas por Challet e Zhang (1997) da média de memória
para duas populações, (a) e (b), ambas com memória inicial
.
Observa-se que a população com maior número de agentes detém
maior média de memória quando o tempo é grande, porém, seu crescimento é
mais lento do que a população com menos agentes. Challet e Zhang (1997)
relatam que tal comportamento ocorre porque quanto maior o número de
agentes, a competição entre eles é mais acirrada, pois há maior número de
jogadores com tamanhos cerebrais maiores. Porém, em ambas populações, tal
desenvolvimento tende a saturar em valores que não são universais, pois
dependem do tempo de interação entre os agentes. Outra observação feita
pelos autores é que nas populações com maiores números de agentes, o
tempo necessário para tal equilíbrio deve ser maior do que para populações
20
menores, pois cérebros maiores levam mais tempo para “aprender” do que
cérebros menores.
3. Discussões
O “El Farol Bar Problem” colocado por Brian Artur trata-se de um
exemplo que se assemelha a situações que são enfrentadas no nosso
cotidiano quando decisões devem ser tomadas. Artur apontava que em
situações cotidianas, é irreal que pessoas utilizem raciocínio dedutivo conforme
a Teoria dos Jogos antes de tomar uma decisão. De acordo com Challet et al.
(2005), um dos aspectos centrais do trabalho de Arthur (1994) é sem dúvida
fazer a contraposição entre raciocínio indutivo e raciocínio dedutivo, mostrando
que agentes, utilizando as ideias de racionalidade limitada através de padrões,
conseguem reduzir bruscamente a complexidade de tais problemas,
sacrificando talvez certa eficiência. Um segundo aspecto de extrema relevância
é a não existência de uma “melhor estratégia”, pois se houvesse, todos os
agentes a utilizariam. Isso faz com que as estratégias sejam divergentes.
Então, a simulação de Brian Arthur para o “El Farol Bar Problem” foi
realizada de forma com que todos os agentes tivessem um conjunto de
estratégias diferentes uns dos outros. E o resultado de tal experimento foi
surpreendente, a frequência média dos agentes no bar correspondeu a um
resultado ótimo, alcançado a partir do pressuposto de que não havia
coordenação entre os agentes, ou seja, cada um agiu da melhor forma para si.
Conforme Challet et al. (2005), este comportamento está de acordo com a
teoria da seleção natural de Darwin, pois mostra que uma espécie, a partir de
mutações aleatórias, se desenvolve sem que aconteça uma intervenção
“divina”.
O “Jogo Minoritário”, elaborado a partir de fortes influências das ideias
de Brian Artur e o “El Farol Bar Problem”, tem objetivos diferenciados de seu
precessor. Challet et al. (2005) destacam que o El Farol Bar Problem discute a
ideia de raciocínio indutivo como caminho para o equilíbrio, já o Jogo
Minoritário discute principalmente as flutuações em torno do equilíbrio, que são
de grande relevância para o entendimento de comportamentos de mercados
financeiros, como por exemplo, o mercado de ações. Tal diferença ocorre, de
21
acordo com Challet et al. (2005), principalmente devido à definição das
estratégias dos agentes. Como visto anteriormente, no Jogo Minoritário, o
número de estratégias possíveis é .
Agora, analisando o El Farol Bar Problem, suponhamos que agentes
tomem suas decisões a partir dos últimos dados de frequência. Então,
existem ( ) possibilidades de valores de frequência, incluindo a
possibilidade de ninguém comparecer. Assim, existem possibilidades
de combinações de informações passadas. Porém, de acordo com Artur
(1994), as estratégias são baseadas nas predições de frequência passada.
Assim, existem ( ) predições para cada combinação possível, resultando
em possíveis estratégias de predição.
Isso faz com que o número de estratégias do El Farol Bar Problem
dependa do número de agentes, ao contrário do Jogo Minoritário, fazendo com
que o espaço de estratégias possíveis do El Farol Bar Problem seja muito
maior do que o do Jogo Minoritário, fazendo do El Farol Bar Problem um caso
muito mais complexo.
Challet et al. (2005) discutem tal caso, no qual , o
número de estratégias cresce dramaticamente com o aumento de , porém
uma situação com uma população de agentes e outra onde
agentes, não deve haver grandes diferenças entre os comportamento dos
agentes de ambas populações. Assim, para que seja possível a elaboração de
um modelo do “El Farol Bar Problem”, é necessário reduzir a complexidade do
problema a partir da simplificação das estratégias, para que o número total de
estratégias não dependa do número de agentes .
Challet et al. (2005) analisam o fato de que o objetivo de cada agente é
saber se ele deve ir ao bar ou não. Não há necessidade da predição da
frequência exata de comparecimento no bar. Assim, o número de estratégias
passa a ser . Porém, o número de estratégias ainda depende da
variável . O segundo passo para a redução de complexidade discutido por
Challet et al. (2005) é o fato de que os agentes agora, criam suas estratégias
de decisão a partir de uma situação binária, então ter informação passada da
frequência exata de comparecimento ao bar parece um tanto quanto
redundante. Assim, a informação passada das últimas escolhas corretas
22
seria suficiente, fazendo com que o número de estratégias totais seja reduzido
para , que ainda aumenta bruscamente quando aumenta, mas é
independente do número de agentes . Segundo Challet et al. (2005), o último
passo para o modelo seria fazer com que o problema fosse simétrico, ou seja,
que o bar consiga atender metade dos agentes e dessa forma obtém-se o Jogo
Minoritário em sua forma original introduzida por Challet e Zhang (1997).
Challet et al. (2005) ressaltam que o trabalho realizado por Challet e
Zhang (1997) tinha como objetivo o entendimento da capacidade de
processamento de informação, a análise da performance através de uma certa
quantidade de informação, implementada pela quantidade de memória .
Assim, possibilitou-se a análise do comportamento de populações com
agentes de diferentes capacidades de informação, no qual o objetivo principal
do trabalho era o entendimento dessa interação, esse comportamento
simbiótico. Tal informação tem grande importância no entendimento de
mercados financeiros, pois indivíduos com diferentes conhecimentos,
habilidades e objetivos são forçados a interagir no mesmo espaço. Porém, de
acordo com Challet et al. (2005), o entendimento sistemático dessa simbiose
ocorreu em trabalhos posteriores como Zhang (1999) e Challet et al. (2000).
4. Conclusão
O estudo da economia até então era moldado segundo padrões
tradicionais que seguiam o método de raciocínio dedutivo. Esta linha de
pensamento não permitia a aproximação entre ciência econômica e questões
importantes que envolviam o comportamento humano. A abordagem utilizada
por Arthur (1994) promoveu uma quebra de paradigma, pois levou em conta o
método de pensamento humano em situações práticas e Challet e Zhang
(1997) trilharam esse novo caminho proposto por Arthur.
O El Farol Bar Problem mostrou que os agentes de uma população,
com racionalidade limitada, se auto organizam em torno de um equilíbrio, como
uma ecologia, apesar da própria definição do problema, não haver qualquer
tipo de troca de informação entre os agentes.
23
O Jogo Minoritário, por se tratar de um modelo binário e
consequentemente de menor complexidade, possibilitou uma análise de
importantes experimentos. Inicialmente se verificou novamente o
comportamento dos agentes em torno do equilíbrio; mas com o aumento da
memória, houve otimização do ganho, resultando em aprendizado da
população. Porém, esse aprendizado tende a se saturar com o aumento da
memória. Outra informação relevante é que, com o aumento do número de
estratégias, os agentes ficam confusos com as maiores possibilidades e
deixam de especializar-se em poucas estratégias, o que gera uma redução de
eficiência.
Quando analisados separadamente os 3 melhores jogadores, os 3
piores e 3 aleatórios, verificou-se que tanto os melhores quanto os piores
jogadores obedecem a um crescimento ou decaimento lineares em uma
situação com chance de reversão. Numa situação da evolução de espécie, na
qual o pior jogador é substituído por um novo que é cópia do melhor jogador
porém com experiência zero e chance de mutação, verifica-se aprendizado da
população com o passar do tempo. Em contrapartida, quando não se permite a
possibilidade de mutação, há grande perda de rendimento da população,
resultado de endogamia e incesto.
Como último experimento, ainda em relação à evolução da espécie,
comparando populações de tamanhos diferentes, sendo o novo jogador com
possibilidade de ter maior ou menor memória, constatou-se que, em
populações maiores, o tamanho cerebral médio é maior do que o de
populações menores, devido à maior competitividade por parte da quantidade
de agentes com cérebros maiores. Porém o tempo de aprendizado é
proporcional ao tamanho da população.
As ideias discutidas por Brian Arthur possibilitaram uma nova
compreensão da dinâmica do comportamento entre agentes de uma população
pela introdução do El Farol Bar Problem, através dos conceitos de
racionalidade limitada e raciocínio indutivo. Isso devido à impraticabilidade de
se utilizar o raciocínio lógico dedutivo, como na Teoria dos Jogos, em situações
do nosso cotidiano, na qual é necessária a tomada de decisões. Além disso, foi
crucial para a introdução e desenvolvimento do Jogo Minoritário, o que
possibilitou um modelo para o tratamento de mercados financeiros reais. Estes
24
trabalhos certamente deram novos rumos aos estudos em economia e
econofísica, vista a extensa publicação de trabalhos sobre o tema.
Ademais, o Jogo Minoritário, mostrando-se como um modelo binário
bem definido, permitiu a análise de situações extremamente relevantes para a
compreensão de mercados financeiros, uma vez que agentes com diferentes
conhecimentos, habilidades e objetivos, são forçados a interagir e habitar em
lugar comum.
Referências
ARTHUR, B. W. Inductive reasoning and bounded rationality: the El Farol problem. Am. Econ. Rev. 84, 406–411, 1994. CHALLET, D.; MARSILI, M.; ZHANG, Y.-C. Modeling market mechanisms with minority game. Physica A 276, 284. cond-mat/9909265, 2000. CHALLET, D.; MARSILI, M.; ZHANG, Y.-C. Minority Games: interacting agentes in financial markets, Oxford University. Press, 2005. CHALLET, D.; ZHANG, Y.-C. Emergence of cooperation and organization in an evolutionary game. Physica A 246, 407. adap-org/9708006, 1997. PINDYCK, R. S. Microeconomia, 7 ed. São Paulo: Person, 2010. POLAK, B. Game Theory Open Yale Course – Yale University, 2007. Disponível em, <http://oyc.yale.edu/economics/econ-159> Acesso em: 18/04/2012. SIMON, H. The Sciences of the Artificial. MIT Press. Cambridge, MA, 1981. SINHA, S.; CHATTERJEE, A.; CHAKRABORTI, B.; CHAKRABARTI, B. K. Econophysics: an introduction. Wiley-VCH, Weinheim, 2011. VARIAN, H. R. Microeconomia: conceitos básicos, 10ª reimpressão. Rio de Janeiro : Elsevier, 2006. ZHANG, Y.-C. Towards a theory of marginally efficient markets. Physica A 269,
30, 1999.