El Farol Bar Problem e Jogo Minoritário: uma introdução à...

1

El Farol Bar Problem e Jogo Minoritário: uma introdução à

econofísica

(El Farol Bar Problem and Minority Game: An introduction to econophysics)

Diogo de Toledo Bertulino1, Diego O. Nolasco1,2

1Curso de Física - Universidade Católica de Brasília 2Programa de Pós-Graduação em Ciências Genômicas e Biotecnologia – Universidade

Católica de Brasília

Propõe-se nesse trabalho um estudo do El Farol Bar Problem e do Jogo Minoritário, a partir dos conceitos de racionalidade limitada e raciocínio indutivo na tomada de decisões em situações cotidianas, quando o número de agentes é grande. Nesses casos, verifica-se a impraticabilidade da Teoria dos Jogos. As novas linhas de pensamento, principalmente as propostas pelo Jogo Minoritário, revelam grande importância para o estudo da Econofísica porque servem de instrumento para a análise de situações reais, como mercados financeiros. Palavras-chave: El Farol Bar Problem, Jogo Minoritário, Teoria dos Jogos, Econofísica, modelos mercadológicos. The purpose in this paper is to make a study about the El Farol Bar Problem and the Minority Game, based on the concepts of bounded rationality and inductive reasoning in everyday situation decision-making, when there is a large number of players. In such cases, Game Theory is impractical. Those new thoughts, especially the ones proposed by the Minority Game, reveal great importance for studies in the field of Econophysics, as they are an essential tool for real situations analysis, like financial markets. Keywords: El Farol Bar Problem, Minority Game, Game Theory, Econophysics, market models.

1. Introdução

Nos últimos anos, a Econofísica se tornou uma das áreas de grande

interesse de cientistas, principalmente físicos e economistas. Isso ocorreu

devido à possibilidade de modelagem de comportamentos econômicos por

meio de teorias físicas vastamente conhecidas.

A Teoria dos Jogos, um ramo da matemática aplicada, tem-se mostrado

de grande aplicação em várias áreas do conhecimento, mas principalmente em

Economia, devido ao estudo da tomada “racional” de decisões estratégicas.

Porém, em situações onde o número de agentes é grande, a análise das

possibilidades de estratégias à luz da Teoria dos Jogos torna-se extremamente

complexa.

2

Assim, novas linhas de pensamento com base no raciocínio indutivo

foram exploradas, nas quais os métodos utilizados incorporam a racionalidade

humana. No presente trabalho são analisados o El Farol Bar Problem (Arthur,

1994) e o Jogo Minoritário (Challet e Zhang, 1997). No El Farol Bar Problem,

discutem-se os conceitos de racionalidade limitada e raciocínio indutivo em

situações de tomada de decisão. No Jogo Minoritário, seguindo a mesma linha

de pensamento, são explorados experimentos computacionais com o objetivo

de analisar a dinâmica comportamental dos agentes.

Neste trabalho realizou-se uma análise dos estudos mencionados, com

o objetivo de verificar a importância dessas ideias no entendimento das

interações humanas, especialmente as de caráter econômico, como no

mercado financeiro.

2. Referencial Teórico

2.1 Teoria dos Jogos

A Teoria dos Jogos é um ramo da matemática aplicada que foi

originalmente utilizada em ciências humanas, principalmente em economia

ciências políticas e relações internacionais, e tem sido aplicada em uma vasta

área de assuntos como biologia, ciência da computação e filosofia.

Tem-se considerado que o campo da Teoria dos Jogos tornou-se

firmemente estabelecido em 1944 com o livro “Theory of Games and Economic

Behavior” de John Von Neumann e Oskar Morgenstern (Sinha et al., 2011).

Pode-se dizer que o termo “Jogo” é uma situação em que os jogadores,

também conhecidos como participantes, tomam decisões estratégicas, ou seja,

decisões que levam em consideração as atitudes e respostas de todos os

jogadores (Pindyck, 2010). Assim, a Teoria dos Jogos dedica-se à análise

dessas interações estratégicas (Varian, 2006).

Uma maneira de se representar um jogo é construir uma “Matriz de

Ganhos de um Jogo”, a qual contém as possíveis jogadas dos jogadores e os

“payoffs”, ou seja, os valores associados a um resultado possível (Varian,

2006). Um exemplo de jogo seria: um professor propõe para dois alunos

escolherem entre as letras e . Se ambos os alunos escolherem a letra ,

3

ambos terão nota 8 naquela matéria. Se ambos os alunos escolherem a letra ,

ambos terão nota 9. E se apenas um escolher a letra , este terá nota 10 e o

outro terá nota 7. A matriz de ganhos do jogo é a seguinte:

Figura 1: Jogo das Notas representado pela Matriz de Ganhos do jogo.

O primeiro número de cada célula é o payoff do Aluno , já o segundo

número corresponde ao payoff do Aluno . Define-se “estratégia” como um

plano de ação para o jogo. No jogo citado, as estratégias são escolher a letra

ou a . Analisando a matriz, qual seria a melhor estratégia para o Aluno ? Se

ele optar pela letra ele pode obter notas 8, se o Aluno optar pela letra ou

10, se o Aluno optar pela letra . Se o Aluno optar pela letra , ele pode

obter notas 7, se o Aluno optar pela letra ou 9, se o Aluno optar pela letra

. Assim, conclui-se que a opção pela letra é melhor do que a letra ,

independentemente da escolha do Aluno , pois suas notas podem ser

melhores. O mesmo ocorre para o Aluno , já que os payoffs são os mesmos.

Dessa forma, define-se que a opção pela letra é a “estratégia dominante”.

Assim, pode-se dizer que estratégia dominante é a estratégia ótima, ou seja,

que resulta em melhor payoff, independentemente, das escolhas de estratégias

dos outros jogadores (Pindyck, 2010).

Um problema muito semelhante a esse é o famoso “Dilema do

Prisioneiro”, um dos jogos mais conhecidos na área, tratando-se de uma

situação em que dois prisioneiros, comparsas num crime, eram interrogados

separadamente. Cada prisioneiro tinha uma escolha de confessar o crime ou

negá-lo. Se apenas um deles confessasse o crime, ele seria libertado e o outro

seria condenado a seis meses de prisão. Se ambos confessassem, ambos

passariam três meses na prisão. E se ambos prisioneiros negassem, ambos

4

passariam apenas um mês na prisão. A matriz de ganhos desse jogo está

representada abaixo:

Figura 2: Dilema do Prisioneiro.

Analisando a melhor estratégia para cada jogador, também conhecida

como estratégia ótima, pode-se dizer que se o jogador escolhe confessar,

então a melhor estratégia para o jogador também é confessar, pois ele ficaria

apenas três meses preso. Já se o jogador escolhe negar, então a melhor

estratégia para o jogador é confessar. Assim vemos que a opção confessar é

uma estratégia dominante. O mesmo acontece para o jogador com relação

ao jogador . Utilizando marcações circulares para o jogador e marcações

quadrangulares para o jogador , temos a matriz dos ganhos com as

estratégias ótimas para cada jogador.

Figura 3: Dilema do Prisioneiro e marcações das estratégias ótimas para cada jogador

dependendo da estratégia do oponente.

Assim, diz-se que o par de estratégias “confessa” é um equilíbrio de

estratégias dominantes, pois é a melhor combinação de respostas para ambos

os jogadores, independentemente da estratégia de cada jogador. Porém, existe

5

a possibilidade de jogos sem a existência de estratégias dominantes para todos

os jogadores, ou mesmo, sem a existência de quaisquer estratégias

dominantes. Analisemos a matriz de ganhos do Dilema do Prisioneiro

Modificado abaixo:

Figura 4: Dilema do Prisioneiro Modificado.

Percebe-se que o jogador A não possui mais uma estratégia dominante.

Dessa forma, qual seria a melhor estratégia para o jogador A? Para responder

tal questão, o jogador A deve posicionar-se frente às condições do jogador B.

Assim, analisando as estratégias do jogador B, percebe-se que ele ainda

detém a estratégia “confessa” como estratégia dominante. Logo, o jogador A

supõe que o jogador B escolherá a estratégia “confessa”, pois é sua estratégia

ótima. Assim, sua melhor estratégia para esse caso também é “confessa”, pois

é preferível uma pena de 3 meses ao invés de uma pena de 6 meses. Assim, o

equilíbrio do jogo ocorre devido ao jogador A escolher sua melhor estratégia,

dado a decisão do jogador B, e o jogador B escolhe sua melhor estratégia,

dado a decisão do Jogador A. Tal situação é dita como um equilíbrio de Nash.

Ou seja, um equilíbrio de Nash é um par de estratégias na qual cada jogador

escolhe uma estratégia ótima em função das ações dos outros jogadores

(Pindyck, 2010). Percebe-se que a definição de equilíbrio de Nash é mais geral

do que a de equilíbrio de estratégias dominantes, pois essa ocorre qualquer

que seja a estratégia dos oponentes. Assim, equilíbrio de estratégias

dominantes é um caso especial do Equilíbrio de Nash. Existem jogos onde há

mais de um Equilíbrio de Nash e podem existir casos sem a existência de tal

equilíbrio. No caso do Dilema do Prisioneiro Modificado, como nos anteriores,

vemos que o equilíbrio de Nash não coincide com a melhor combinação de

6

respostas para ambos jogadores. No caso do Jogo das Notas, a melhor

estratégia seria se ambos escolhessem a letra ficando ambos com nota 9.

Nos casos do Dilema do Prisioneiro e no Dilema do Prisioneiro Modificado, a

melhor estratégia seria se ambos negassem o crime, ficando presos apenas

um mês. No Dilema do Prisioneiro, mesmo que o jogador soubesse que o

jogador escolherá a opção negar, sua estratégia ótima para este caso é

confessar, pois não existe nenhuma obrigação para que ele não o faça. Ou

seja, escolhas racionais podem levar a resultados ruins. Nesse caso o

equilíbrio de Nash também é chamado de “Pareto ineficiente” (Polak, 2007).

Agora, e se esse jogo fosse repetido? Digamos que esse jogo seja

repetido um número finito de vezes. Por exemplo, três vezes. Suponha-se a

análise da terceira rodada. Nesse caso, pode-se dizer que é provável que os

jogadores escolham a estratégia dominante, pois jogar a última vez é como

jogar uma só vez. Se pensarmos na segunda jogada, como na terceira jogada

cada jogador escolherá a estratégia dominante, então se pode dizer que a

escolha da estratégia dominante neste caso também é provável, pois cada

jogador não quer ser “enganado”, e ser “passado para trás”. Assim, se não

existir um meio de impor a cooperação entre os jogadores, não haverá um

meio de impor cooperação nas outras jogadas (Varian, 2006). Porém, se o jogo

tiver um número ilimitado de repetições, pode-se tentar impor um meio de

cooperação dos outros jogadores, se ele não cooperar nessa jogada, você

pode se recusar a cooperar na próxima jogada.

2.2 Racionalidade Limitada e Raciocínio Indutivo

De acordo com Arthur (1994), o tipo de raciocínio utilizado para

encontrar soluções de problemas em economia é o raciocínio lógico, dedutivo.

Porém, muitos destes problemas a serem enfrentados são de alta

complexidade e de difícil, se não impossível, solução dedutiva. Como exemplo,

podemos citar o “Jogo da Velha”, onde se pode determinar uma solução

totalmente racional, ao contrário de jogos como “Xadrez” e “Go”, nos quais

soluções racionais não são encontradas. Dessa forma Arthur (1994) destaca

que existem dois motivos para que a racionalidade dedutiva perfeita deixe de

funcionar. Quando enfrentamos um problema com certa complexidade, nosso

7

raciocínio lógico deixa de responder, ou seja, nossa “racionalidade é limitada”.

Ou quando em situações interativas entre agentes, não é possível saber

exatamente qual será o comportamento dos outros agentes, assim, somos

levados a imaginar seus comportamentos. Tais subjetividades e indefinições

não estão de acordo com raciocínio lógico, dedutivo e objetivo. De acordo com

Challet et al. (2005), esse conceito de racionalidade limitada foi introduzido por

Simon (1981).

Em economia sabemos que há grande presença de problemas similares,

pois em muitos casos, um agente não tem conhecimento de quais serão as

estratégias utilizadas pelos outros agentes e, nesse caso, há necessidade de

supor ou imaginar seus comportamentos. Essa maneira de pensar, esse

raciocínio utilizado é chamado indutivo. Dessa forma mostra-se necessário um

tipo de modelo diferenciado, que leve em conta a racionalidade limitada e o

raciocínio indutivo.

Arthur (1994) destaca que, de acordo com a psicologia moderna, a

racionalidade de humanos frente a problemas complicados ou mal definidos

ocorre através de reconhecimento de padrões. Humanos são bons em dedução

lógica porém, têm excelente habilidade de reconhecimento e determinação de

padrões. Tenta-se elaborar um modelo mais simples que solucione o problema

encontrado a partir da análise de comportamento, na tentativa de reconhecer

um padrão para que o agente toma sua decisão. Assim, um agente prepara

sua estratégia de acordo com um histórico privado, podendo ele tomar sua

decisão a partir de uma só estratégia ou uma combinação delas.

À medida que decisões são tomadas, o agente enfraquece ou fortalece

suas crenças de acordo com a performance de seus resultados, fazendo com

que novas hipóteses sejam formadas e novas decisões sejam tomadas, torna-

se um jogo de eterno aprendizado.

Além disso, Arthur (1994) destaca que todo o processo é evolucionário,

ou mais especificamente, co-evolucionário. Isso por se tratar de um processo

onde cada agente toma sua decisão a partir de seu histórico de decisões, à

medida que essas decisões vão sendo tomadas, esse histórico muda, e tal

processo ocorre com um “aprendizado”. À medida que cada agente, através da

competição com outros agentes, deve provar-se e estar adaptado ao ambiente

8

criado pelas hipóteses dos outros agentes, este conjunto de ideias e hipóteses

co-evoluem.

2.3 O problema do Bar “El Farol”

De acordo com Arthur (1994), o “El Farol Bar Problem” consiste no

seguinte: Imagine que pessoas decidem independentemente toda semana

a ir ou não a um bar que oferece entretenimento determinada noite. Como o

espaço é restrito, então o ambiente é agradável se menos que das

pessoas estiverem presentes. Não existe possibilidade de saber o número de

pessoas que vão. Dessa maneira, um agente vai, se ele acredita que estarão

presentes menos de das pessoas, ou ele fica em casa se acredita que mais

de das pessoas irão ao bar. As escolhas não são afetadas pelas visitas

prévias e não existe comunicação entre os agentes, sendo que a única

informação disponível é o número de pessoas que foram ao bar nas semanas

anteriores. Dessa forma, o interesse no problema é a dinâmica do número de

pessoas frequentando o bar semana a semana.

Arthur (1994) destaca nesse problema duas características

interessantes. A primeira é que não existe um modelo para que os agentes

possam basear suas decisões, logo, não é possível uma solução dedutiva.

Cada agente não tem conhecimento da estratégia que será utilizada pelos

outros agentes, tornando-se um problema mal definido do ponto de vista dos

agentes, o que leva a um processo de indução. A segunda vem do seguinte

raciocínio: imaginemos que todos os agentes acreditam que poucas pessoas

irão, dessa forma todos tenderão a ir, invalidando a hipótese. Ou se todos

agentes acreditam que mais de irão, então ninguém vai, invalidando a

hipótese. Logo, todas as hipóteses são forçadas a divergir.

2.3.1 Testes Computacionais

Uma simulação computacional nesse caso mostra-se de grande

importância no intuito de analisar a dinâmica da frequência de pessoas. Dessa

forma, Arthur (1994) utiliza um método gerador de hipóteses a partir de

números aleatórios, ou como ele mesmo diz, “sopa de letras”. Reunindo-os em

9

diversas dúzias, aleatoriamente, escolhe hipóteses para cada um dos

agentes. Assim, cada agente tem hipóteses para que possa utilizar. Dessa

forma, obtém-se o gráfico da figura 5.

Figura 5: Gráfico da frequência de agentes simulado por Arthur (1994) para as

primeiras semanas.

Do gráfico, pode-se concluir que onde existe uma repetição cíclica de

frequência, ela rapidamente tende a não mais acontecer. Ou seja, uma vez que

muitos agentes imaginam que a maioria irá, pois foi o padrão de

comportamento de ou semanas atrás, logo eles tenderão a ficar em casa.

Porém o mais relevante é o fato de que a frequência converge para . Arthur

(1994) descreve tal comportamento como uma auto-organização para um

padrão de equilíbrio, como uma ecologia, explicado talvez por ser um jogo de

predição, no qual uma estratégia mista de predição para uma frequência acima

de seja de probabilidade e para uma frequência abaixo de com

probabilidade , na qual o equilíbrio é o Equilíbrio de Nash.

2.4 Jogo Minoritário

Inspirado pelo “El Farol Bar Problem” e pelas ideias de racionalidade

limitada, Challet e Zhang (1997) introduzem um novo jogo, chamado “Minority

Game”, que pode ser melhor explicado pelas próprias palavras dos autores:

“Vamos considerar uma população de (ímpar) jogadores, cada tem um

número finito de estratégias . A cada intervalo de tempo, todos tem que

escolher em estar do lado ou do lado . O payoff do jogo é declarar que,

10

depois de todos terem escolhido o lado independentemente, aqueles que estão

do lado minoritário vencem.”

Por questão de conveniência, é estipulado ponto aos jogadores

vencedores e ponto aos jogadores perdedores. É importante ressaltar que

todos os jogadores têm acesso à informação correspondente ao registro dos

resultados anteriores. Esse registro pode ser colocado como uma string de

memória, onde cada jogador tem acesso a resultados mais recentes. Assim,

pode-se definir as estratégias como e , de maneira que corresponde a

estar do lado , por exemplo, e corresponde a não estar do lado . Dessa

forma, imaginemos que exista uma grande limitação da capacidade de análise

dos agentes, uma racionalidade limitada, e que informação disponível para

todos os agentes seja das duas últimas jogadas, ou seja, . Na tabela 1

tem-se um exemplo da situação.

Na tabela, para cada bit de informação possível (sinal), existe uma

estratégia correspondente a qual o agente utilizará. Então, de acordo com a

informação dada, a estratégia a utilizar seria . Como , então o número

de possibilidades de bits de informação é , como mostrado. Então o

número total de estratégias possíveis é . A figura 6 ilustra a

situação.

11

Figura 6: Espaço de estratégias possíveis para , inspirado no modelo de Sinha et al.(2011).

Dessa forma, Challet e Zhang (1997) simularam a dinâmica do comportamento

do jogo para 1001 agentes com diversos tamanhos cerebrais, ou seja,

diferentes valores de . Inicialmente foi cedido um

sinal artificial como informação pública e cada agente utilizou uma de suas

estratégias aleatoriamente. Todas as estratégias de cada agente recebem

pontos de acordo com a informação cedida, possibilitando a formação de um

ranking dos pontos acumulados para cada estratégia. Assim, o jogador utilizará

a que tiver a melhor posição no ranking, ou seja, a que tem mais pontos

acumulados. Dessa forma, o agente só ganhará o ponto real se a estratégia

que ele utilizar resultar em vitória. Tais simulações estão ilustradas pelos

gráficos da Figura 7.

13

Figura 7: Simulações realizadas por Challet e Zhang (1997) da presença do lado

para uma população de agentes com diferentes tamanhos cerebrais a) ,

b) e c) .

Dos gráficos, percebe-se que em todas as situações há flutuação da

presença em torno dos , porém jogadores mais “inteligentes” (valores de

maiores) mostram menor flutuação em torno do equilíbrio se comparado aos

jogadores menos “inteligentes”. Mas o que isso significa? Imaginemos que,

numa jogada, apenas um agente escolha o lado e os outros o lado . Então,

apenas o jogador que optou pelo lado é o vencedor e recebe ponto. Agora,

se agentes escolhem o lado e escolhem o lado , todos os

agentes que escolheram o lado são os vencedores e cada um recebe

ponto. Do ponto de vista quantitativo, a segunda situação é mais interessante,

pois muito mais pessoas pontuam, otimizando a eficiência. Assim, os gráficos

mostram que populações mais “inteligentes” tendem a aumentar a eficiência de

seu comportamento. Challet e Zhang (1997) destacam que, por definição, cada

agente é egoísta por preocupar-se apenas com a suas estratégias e sua

jogada, mas de alguma forma conseguem compartilhar os limitados recursos

disponíveis.

Os autores também ressaltam que se algum agente adotasse a

estratégia de permanecer fixo a um só lado, isto não funcionaria, pois

rapidamente os outros agentes perceberiam que ganhariam menos

frequentemente se escolhessem o mesmo lado. Assim, os outros agentes

adotariam estratégias de acordo com a situação. A Figura 8 mostra a diferença

do ganho médio para agentes com diferentes tamanhos cerebrais.

14

Figura 8: Simulação realizada por Challet e Zhang (1997) mostrando a diferença da

taxa de sucesso de acordo com os tamanhos cerebrais.

Challet e Zhang (1997) discutem que a média de ganho entre

populações com tamanhos cerebrais menores é menor do que a de populações

com tamanhos cerebrais maiores. Porém, a partir de um determinado tamanho

cerebral ( ), o ganho médio parece saturar. Isso ocorre devido à estrutura

binária do jogo, ou seja, a única informação cedida é sim ou não. Informações

mais precisas como o número de frequência, mais poder de análise entre

outros podem ser implementados para gerar cérebros mais desenvolvidos.

Outra situação abordada por Challet e Zhang (1997) é a possibilidade de

aumentar o número de estratégias para cada agente. A Figura 9 exemplifica a

situação para varias populações de agentes, memória e número

de estratégias .

15

Figura 9: Simulação realizada por Challet e Zhang (1997) da taxa de sucesso para

várias populações de 1001 agentes, com memória e número de estratégias

.

Analisando o gráfico, percebe-se que quanto maior o número de

estratégias, menor é o rendimento dos agentes. De acordo com Challet e

Zhang (1997), isso ocorre devido aos agentes ficarem “confusos” com a

possibilidade de estratégias. Na Figura 10 os autores simulam um gráfico da

taxa de troca de possibilidades para diversas populações, pela taxa de

sucesso. Percebe-se que maior é o sucesso se apenas uma estratégia é

utilizada.

Figura 10: Simulação realizada por Challet e Zhang (1997) da taxa de troca de

estratégias pela taxa de sucesso para diversas populações.

16

Outra informação de grande relevância destacada por Challet e Zhang

(1997) é o conhecimento da performance dos agentes. Assim, os autores

selecionam, de uma população com agentes, e , os três

melhores jogadores, os três piores e mais três de forma aleatória. O gráfico da

Figura 11 mostra a simulação.

Figura 11: Simulação realizada por Challet e Zhang (1997) do ganho acumulado em

função do tempo para os três melhores jogadores, os três piores e três selecionados

aleatoriamente, para uma população de jogadores, memória e número

de estratégias .

Pelo gráfico, observa-se que tanto os jogadores melhores sucedidos

quanto os piores obedecem a um crescimento, ou decaimento, que parece ser

linear. Isso mostra que os jogadores bem sucedidos tendem a continuar seu

bom desempenho e os mal sucedidos, ficam cada vez mais “pobres”. Challet e

Zhang (1997) destacam que tal situação pode ser revertida pela definição do

jogo, porém não é o que acontece com o passar do tempo. Assim, uma

questão pode ser levantada. Será que o desempenho dos piores jogadores

acontece devido a suas estratégias equivocadas ou por outro motivo? Challet e

Zhang (1997) discutem tal desempenho a partir do gráfico do ganho virtual dos

jogadores pela taxa de sucesso, com diferentes números de

interações( ), conforme a Figura 12.

17

Figura 12: Simulação realizada por Challet e Zhang (1997) do ganho virtual dos

agentes pela taxa de sucesso para a) b) e c) interações.

Challet e Zhang (1997) ressaltam que tal comportamento mostra que

todas as estratégias são iguais quando o tempo tender ao infinito, mostrando

que o desempenho dos piores jogadores acontece simplesmente devido à falta

de sorte ou a jogadas inoportunas.

Outro experimento de grande relevância discutido por Challet e Zhang

(1997) é o caso da “evolução de espécie”. O pior jogador é substituído por um

novo jogador depois de um número finito de interações, o qual este é cópia do

melhor jogador, porém com capital virtual acumulado igual a . Outra

característica do experimento é a introdução da possibilidade de mutação.

Cada novo jogador tem possibilidade de uma de suas estratégias ser trocada

por outra. Assim, os resultados estão mostrados na Figura 13.

18

Figura 13: Simulações realizadas por Challet e Zhang (1997) da presença do lado A

para a situação de “evolução de espécie” com relação ao tempo, com possibilidade de

mutação.

É possível perceber que tal experimento reflete uma situação de

aprendizado, na qual as flutuações são reduzidas e saturadas e há aumento do

ganho médio. Já para o caso de não ocorrer mutação, ou seja, os novos

jogadores são cópias perfeitas dos melhores jogadores, Challet e Zhang (1997)

obtiveram o gráfico da Figura 14.

Figura 14: Simulações realizadas por Challet e Zhang (1997) da presença do lado A

para a situação de “evolução de espécie” com relação ao tempo, sem possibilidade de

mutação.

19

Tal experimento exibe um comportamento com grandes flutuações e

total falta de coordenação da população, gerando grande perda. Challet e

Zhang (1997) relatam que tal comportamento é resultado de endogamia e

incesto.

Outra situação abordada por Challet e Zhang (1997) ainda com relação

à evolução da espécie, durante o processo de clonagem, o novo jogador tem

probabilidade de ter maior ou menor memória. O interesse dos autores neste

experimento refere-se ao domínio dos agentes com maiores cérebros sobre os

de menores. Assim, para duas populações, uma com agentes e outra com

e memórias iniciais de , obtém-se o gráfico da Figura 15.

Figura 15: Simulações realizadas por Challet e Zhang (1997) da média de memória

para duas populações, (a) e (b), ambas com memória inicial

.

Observa-se que a população com maior número de agentes detém

maior média de memória quando o tempo é grande, porém, seu crescimento é

mais lento do que a população com menos agentes. Challet e Zhang (1997)

relatam que tal comportamento ocorre porque quanto maior o número de

agentes, a competição entre eles é mais acirrada, pois há maior número de

jogadores com tamanhos cerebrais maiores. Porém, em ambas populações, tal

desenvolvimento tende a saturar em valores que não são universais, pois

dependem do tempo de interação entre os agentes. Outra observação feita

pelos autores é que nas populações com maiores números de agentes, o

tempo necessário para tal equilíbrio deve ser maior do que para populações

20

menores, pois cérebros maiores levam mais tempo para “aprender” do que

cérebros menores.

3. Discussões

O “El Farol Bar Problem” colocado por Brian Artur trata-se de um

exemplo que se assemelha a situações que são enfrentadas no nosso

cotidiano quando decisões devem ser tomadas. Artur apontava que em

situações cotidianas, é irreal que pessoas utilizem raciocínio dedutivo conforme

a Teoria dos Jogos antes de tomar uma decisão. De acordo com Challet et al.

(2005), um dos aspectos centrais do trabalho de Arthur (1994) é sem dúvida

fazer a contraposição entre raciocínio indutivo e raciocínio dedutivo, mostrando

que agentes, utilizando as ideias de racionalidade limitada através de padrões,

conseguem reduzir bruscamente a complexidade de tais problemas,

sacrificando talvez certa eficiência. Um segundo aspecto de extrema relevância

é a não existência de uma “melhor estratégia”, pois se houvesse, todos os

agentes a utilizariam. Isso faz com que as estratégias sejam divergentes.

Então, a simulação de Brian Arthur para o “El Farol Bar Problem” foi

realizada de forma com que todos os agentes tivessem um conjunto de

estratégias diferentes uns dos outros. E o resultado de tal experimento foi

surpreendente, a frequência média dos agentes no bar correspondeu a um

resultado ótimo, alcançado a partir do pressuposto de que não havia

coordenação entre os agentes, ou seja, cada um agiu da melhor forma para si.

Conforme Challet et al. (2005), este comportamento está de acordo com a

teoria da seleção natural de Darwin, pois mostra que uma espécie, a partir de

mutações aleatórias, se desenvolve sem que aconteça uma intervenção

“divina”.

O “Jogo Minoritário”, elaborado a partir de fortes influências das ideias

de Brian Artur e o “El Farol Bar Problem”, tem objetivos diferenciados de seu

precessor. Challet et al. (2005) destacam que o El Farol Bar Problem discute a

ideia de raciocínio indutivo como caminho para o equilíbrio, já o Jogo

Minoritário discute principalmente as flutuações em torno do equilíbrio, que são

de grande relevância para o entendimento de comportamentos de mercados

financeiros, como por exemplo, o mercado de ações. Tal diferença ocorre, de

21

acordo com Challet et al. (2005), principalmente devido à definição das

estratégias dos agentes. Como visto anteriormente, no Jogo Minoritário, o

número de estratégias possíveis é .

Agora, analisando o El Farol Bar Problem, suponhamos que agentes

tomem suas decisões a partir dos últimos dados de frequência. Então,

existem ( ) possibilidades de valores de frequência, incluindo a

possibilidade de ninguém comparecer. Assim, existem possibilidades

de combinações de informações passadas. Porém, de acordo com Artur

(1994), as estratégias são baseadas nas predições de frequência passada.

Assim, existem ( ) predições para cada combinação possível, resultando

em possíveis estratégias de predição.

Isso faz com que o número de estratégias do El Farol Bar Problem

dependa do número de agentes, ao contrário do Jogo Minoritário, fazendo com

que o espaço de estratégias possíveis do El Farol Bar Problem seja muito

maior do que o do Jogo Minoritário, fazendo do El Farol Bar Problem um caso

muito mais complexo.

Challet et al. (2005) discutem tal caso, no qual , o

número de estratégias cresce dramaticamente com o aumento de , porém

uma situação com uma população de agentes e outra onde

agentes, não deve haver grandes diferenças entre os comportamento dos

agentes de ambas populações. Assim, para que seja possível a elaboração de

um modelo do “El Farol Bar Problem”, é necessário reduzir a complexidade do

problema a partir da simplificação das estratégias, para que o número total de

estratégias não dependa do número de agentes .

Challet et al. (2005) analisam o fato de que o objetivo de cada agente é

saber se ele deve ir ao bar ou não. Não há necessidade da predição da

frequência exata de comparecimento no bar. Assim, o número de estratégias

passa a ser . Porém, o número de estratégias ainda depende da

variável . O segundo passo para a redução de complexidade discutido por

Challet et al. (2005) é o fato de que os agentes agora, criam suas estratégias

de decisão a partir de uma situação binária, então ter informação passada da

frequência exata de comparecimento ao bar parece um tanto quanto

redundante. Assim, a informação passada das últimas escolhas corretas

22

seria suficiente, fazendo com que o número de estratégias totais seja reduzido

para , que ainda aumenta bruscamente quando aumenta, mas é

independente do número de agentes . Segundo Challet et al. (2005), o último

passo para o modelo seria fazer com que o problema fosse simétrico, ou seja,

que o bar consiga atender metade dos agentes e dessa forma obtém-se o Jogo

Minoritário em sua forma original introduzida por Challet e Zhang (1997).

Challet et al. (2005) ressaltam que o trabalho realizado por Challet e

Zhang (1997) tinha como objetivo o entendimento da capacidade de

processamento de informação, a análise da performance através de uma certa

quantidade de informação, implementada pela quantidade de memória .

Assim, possibilitou-se a análise do comportamento de populações com

agentes de diferentes capacidades de informação, no qual o objetivo principal

do trabalho era o entendimento dessa interação, esse comportamento

simbiótico. Tal informação tem grande importância no entendimento de

mercados financeiros, pois indivíduos com diferentes conhecimentos,

habilidades e objetivos são forçados a interagir no mesmo espaço. Porém, de

acordo com Challet et al. (2005), o entendimento sistemático dessa simbiose

ocorreu em trabalhos posteriores como Zhang (1999) e Challet et al. (2000).

4. Conclusão

O estudo da economia até então era moldado segundo padrões

tradicionais que seguiam o método de raciocínio dedutivo. Esta linha de

pensamento não permitia a aproximação entre ciência econômica e questões

importantes que envolviam o comportamento humano. A abordagem utilizada

por Arthur (1994) promoveu uma quebra de paradigma, pois levou em conta o

método de pensamento humano em situações práticas e Challet e Zhang

(1997) trilharam esse novo caminho proposto por Arthur.

O El Farol Bar Problem mostrou que os agentes de uma população,

com racionalidade limitada, se auto organizam em torno de um equilíbrio, como

uma ecologia, apesar da própria definição do problema, não haver qualquer

tipo de troca de informação entre os agentes.

23

O Jogo Minoritário, por se tratar de um modelo binário e

consequentemente de menor complexidade, possibilitou uma análise de

importantes experimentos. Inicialmente se verificou novamente o

comportamento dos agentes em torno do equilíbrio; mas com o aumento da

memória, houve otimização do ganho, resultando em aprendizado da

população. Porém, esse aprendizado tende a se saturar com o aumento da

memória. Outra informação relevante é que, com o aumento do número de

estratégias, os agentes ficam confusos com as maiores possibilidades e

deixam de especializar-se em poucas estratégias, o que gera uma redução de

eficiência.

Quando analisados separadamente os 3 melhores jogadores, os 3

piores e 3 aleatórios, verificou-se que tanto os melhores quanto os piores

jogadores obedecem a um crescimento ou decaimento lineares em uma

situação com chance de reversão. Numa situação da evolução de espécie, na

qual o pior jogador é substituído por um novo que é cópia do melhor jogador

porém com experiência zero e chance de mutação, verifica-se aprendizado da

população com o passar do tempo. Em contrapartida, quando não se permite a

possibilidade de mutação, há grande perda de rendimento da população,

resultado de endogamia e incesto.

Como último experimento, ainda em relação à evolução da espécie,

comparando populações de tamanhos diferentes, sendo o novo jogador com

possibilidade de ter maior ou menor memória, constatou-se que, em

populações maiores, o tamanho cerebral médio é maior do que o de

populações menores, devido à maior competitividade por parte da quantidade

de agentes com cérebros maiores. Porém o tempo de aprendizado é

proporcional ao tamanho da população.

As ideias discutidas por Brian Arthur possibilitaram uma nova

compreensão da dinâmica do comportamento entre agentes de uma população

pela introdução do El Farol Bar Problem, através dos conceitos de

racionalidade limitada e raciocínio indutivo. Isso devido à impraticabilidade de

se utilizar o raciocínio lógico dedutivo, como na Teoria dos Jogos, em situações

do nosso cotidiano, na qual é necessária a tomada de decisões. Além disso, foi

crucial para a introdução e desenvolvimento do Jogo Minoritário, o que

possibilitou um modelo para o tratamento de mercados financeiros reais. Estes

24

trabalhos certamente deram novos rumos aos estudos em economia e

econofísica, vista a extensa publicação de trabalhos sobre o tema.

Ademais, o Jogo Minoritário, mostrando-se como um modelo binário

bem definido, permitiu a análise de situações extremamente relevantes para a

compreensão de mercados financeiros, uma vez que agentes com diferentes

conhecimentos, habilidades e objetivos, são forçados a interagir e habitar em

lugar comum.

Referências

ARTHUR, B. W. Inductive reasoning and bounded rationality: the El Farol problem. Am. Econ. Rev. 84, 406–411, 1994. CHALLET, D.; MARSILI, M.; ZHANG, Y.-C. Modeling market mechanisms with minority game. Physica A 276, 284. cond-mat/9909265, 2000. CHALLET, D.; MARSILI, M.; ZHANG, Y.-C. Minority Games: interacting agentes in financial markets, Oxford University. Press, 2005. CHALLET, D.; ZHANG, Y.-C. Emergence of cooperation and organization in an evolutionary game. Physica A 246, 407. adap-org/9708006, 1997. PINDYCK, R. S. Microeconomia, 7 ed. São Paulo: Person, 2010. POLAK, B. Game Theory Open Yale Course – Yale University, 2007. Disponível em, <http://oyc.yale.edu/economics/econ-159> Acesso em: 18/04/2012. SIMON, H. The Sciences of the Artificial. MIT Press. Cambridge, MA, 1981. SINHA, S.; CHATTERJEE, A.; CHAKRABORTI, B.; CHAKRABARTI, B. K. Econophysics: an introduction. Wiley-VCH, Weinheim, 2011. VARIAN, H. R. Microeconomia: conceitos básicos, 10ª reimpressão. Rio de Janeiro : Elsevier, 2006. ZHANG, Y.-C. Towards a theory of marginally efficient markets. Physica A 269,

30, 1999.

http://oyc.yale.edu/economics/econ-159

El Farol Bar Problem e Jogo Minoritário: uma introdução à...

Documents

Transcript of El Farol Bar Problem e Jogo Minoritário: uma introdução à...