Planejamento Amostral Otimo em Geoestat stica sob Efeito ... · (direita) os efeitos da amostragem...

Planejamento Amostral Otimo em

Geoestatıstica sob Efeito de Amostragem

Preferencial

Tese de Doutorado

por

Gustavo da Silva Ferreira

Departamento de Metodos Estatısticos

Instituto de Matematica

Universidade Federal do Rio de Janeiro

2013

Planejamento Amostral Otimo emGeoestatıstica sob Efeito de Amostragem

Preferencial


Tese de Doutorado submetida ao Corpo

Docente do Instituto de Matematica - Depar-

tamento de Metodos Estatısticos da Universi-

dade Federal do Rio de Janeiro - UFRJ, como

parte dos requisitos necessarios a obtencao do

grau de Doutor em Estatıstica.

Orientador: Dani Gamerman

Rio de Janeiro, Outubro de 2013

F383g Ferreira, Gustavo da Silva

Planejamento amostral otimo em geoestatıstica sob efeito de amos-

tragem preferencial / Gustavo da Silva Ferreira. - Rio de Janeiro,

2013.

105 f.: il.; 30cm.

Orientador: Dani Gamerman

Tese (doutorado) - UFRJ/Instituto de Matematica, Programa de

Pos-graduacao em Estatıstica, 2013.

Referencias: f.100-105.

1. Geologia-metodos estatısticos - Tese. 2. Amostragem (Es-

tatıstica). I. Gamerman, Dani (Orient.). II. Universidade Federal do

Rio de Janeiro, Instituto de Matematica, Programa de Pos-graduacao

em Estatıstica. III. Tıtulo.

CDD 519.2.

Planejamento Amostral Otimo emGeoestatıstica sob Efeito de Amostragem

Preferencial


Tese de Doutorado submetida ao Corpo Docente do Instituto de Matematica - Depar-

tamento de Metodos Estatısticos da Universidade Federal do Rio de Janeiro - UFRJ, como

parte dos requisitos necessarios a obtencao do grau de Doutor em Estatıstica.

Aprovada por:

Prof. Dani Gamerman, Ph.D., UFRJ

Prof. Helio S. Migon, Ph.D., UFRJ

Prof. Fernando Antonio da Silva Moura, Ph.D., UFRJ

Prof. Sergio Wechsler, Ph.D., USP

Profa. Edna Afonso Reis, Ph.D., UFMG

Rio de Janeiro, Outubro de 2013

Agradecimentos

Aos professores Dani Gamerman e Helio Migon pelos conselhos e por terem acreditado

no meu trabalho do inıcio ao fim.

Aos demais professores do DME/UFRJ pelo conhecimento transmitido e tambem aos

professores Sergio Wechsler e Edna Reis pelas sugestoes e comentarios.

Aos meus colegas de pos-graduacao, em especial Joao, Jony, Kelly, Larissa, Valmaria e

Vera.

Aos meus amigos, em especial Aline, Marinho, Cristiane e meus padrinhos Leo e Thais.

Aos meus irmaos, Guilherme e Gisele, meus primos, tios, sogros e todos os parentes que

torceram muito por mim.

Aos meus pais, Glenio e Graziela, pois tudo que conquistei foi fruto do amor e da

dedicacao de voces.

A minha esposa Carla pelo amor, companheirismo, compreensao e apoio em todos os

momentos e ao meu filho Davi que, mesmo sem saber, teve influencia na conclusao deste

trabalho.

A Deus pela direcao da minha vida.

v

Resumo

Esta tese analisa o efeito da amostragem preferencial em Geoestatıstica quando a esco-

lha de um novo local amostral e o principal interesse do pesquisador. Um criterio Bayesiano

baseado na maximizacao de funcoes utilidade e utilizado. Estudos simulados sao apresen-

tados e evidenciam a grande influencia da amostragem preferencial nas decisoes. Dados de

precipitacao pluviometrica coletados durante a estacao da Primavera no Rio de Janeiro sao

analisados e o planejamento amostral otimo e obtido sob efeito de amostragem preferen-

cial. A complexidade computacional da metodologia e tratada assumindo-se que o novo local

amostral e um parametro do modelo e considerando que a decisao otima e obtida via analise

da sua distribuicao a posteriori. Por fim, algumas modificacoes do modelo sob amostragem

preferencial sao realizadas a fim de se obter maior flexibilidade para situacoes praticas por

meio da inclusao de efeitos de repulsao de pequenas escala. Os resultados mostraram que o

planejamento amostral otimo e substancialmente afetado sob efeito da amostragem preferen-

cial. Adicionalmente, foi possıvel identificar outros aspectos interessantes relacionados aos

efeitos da amostragem preferencial na estimacao e predicao em Geoestatıstica.

Palavras-chave: planejamento amostral otimo; Geoestatıstica; amostragem preferencial;

processos pontuais.

vi

Abstract

This thesis analyses the effect of preferential sampling in Geostatistics when the choice

of new sampling locations is the main interest of the researcher. A Bayesian criteria based

on maximizing utility functions is used. Simulated studies are presented and highlighted

the strong influence of preferential sampling in the decisions. Rainfall data collected during

Spring in Rio de Janeiro are analysed and the optimal design is obtained under preferential

sampling influence. The computacional complexity is faced by treating the new local sampling

as a model parameter and the optimal choice is then made by analysing their posterior

distribution. Finally, some modifications of the model under preferential sampling are made

in order to achieve more flexibility in practical situations through inclusion of small-scale

repulsion effects. The results showed that the optimal design is substantially changed under

preferential sampling effects. Furthermore, it was possible to identify other interesting aspects

related to preferential sampling effects in estimation and prediction in Geostatistics.

keywords: optimal design; Geostatistics; preferential sampling; point process.

vii

Lista de Figuras

5.1 Valores observados (cırculos), preditos (linha) e respectivos IC 95% (linha tracejada)

para a serie de infestacao do Aedes aegypti na cidade do Rio de Janeiro. . . . . . 37

5.2 Histograma das amostras da distribuicao artificial h(d), onde o eixo das abscissas

representa o numero de dias apos a realizacao do ultimo LIRAa. . . . . . . . . . 38

6.1 Realizacao do processo simulado unidimensional S+µ (linha cheia) e valores obser-

vados (cırculos). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

6.2 Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito

da amostragem preferencial para o processo simulado unidimensional (os cırculos

representam os valores verdadeiros dos parametros). . . . . . . . . . . . . . . . . 46

6.3 Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito

da amostragem preferencial para o processo simulado unidimensional (os cırculos


6.4 Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar

o efeito da amostragem preferencial para o processo simulado unidimensional (os

cırculos representam os valores verdadeiros dos parametros). . . . . . . . . . . . 48

viii

6.5 Medianas a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo

sob amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o

processo simulado unidimensional. Os cırculos representam o variograma amostral

observado e a linha preta representa o verdadeiro variograma. . . . . . . . . . . . 49

6.6 Processo simulado (linha cheia), mediana a posteriori da distribuicao preditiva (linha

vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para S

obtidos considerando (esquerda) e sem considerar (direita) o efeito da amostragem

preferencial no processo simulado unidimensional. . . . . . . . . . . . . . . . . . 49

6.7 Processo simulado (linha cheia), medias a posteriori da distribuicao preditiva (linha

vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para

S obtidos pelas distribuicoes preditivas [S | y,x, θ] (esquerda) e [S | y, θ] (direita)

para o processo simulado unidimensional. . . . . . . . . . . . . . . . . . . . . . 50

6.8 Realizacao do processo simulado bidimensional I juntamente com as posicoes das

amostras observadas (cırculos). . . . . . . . . . . . . . . . . . . . . . . . . . . . 51


da amostragem preferencial para o processo simulado bidimensional I (os cırculos



da amostragem preferencial para o processo simulado bidimensional I (os cırculos



o efeito da amostragem preferencial para o processo simulado bidimensional I (os


6.12 Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo


processo simulado bidimensional I . Os cırculos representam o variograma amostral


ix

6.13 Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem

considerar (direita) o efeito da amostragem preferencial para o processo simulado

bidimensional I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

6.14 Realizacao do processo simulado bidimensional II juntamente com as posicoes das

amostras observadas (cırculos). . . . . . . . . . . . . . . . . . . . . . . . . . . . 56


da amostragem preferencial para o processo simulado bidimensional II (os cırculos



da amostragem preferencial para o processo simulado bidimensional II (os cırculos



o efeito da amostragem preferencial para o processo simulado bidimensional II (os




processo simulado bidimensional II . Os cırculos representam o variograma amostral



considerar (direita) o efeito da amostragem preferencial para o processo simulado

bidimensional II. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

6.20 Boxplots dos Erros de Predicao Locais (EPL) considerando (esquerda) e sem consi-

derar (direita) os efeitos da amostragem preferencial no estudo simulado unidimen-

sional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

x

6.21 Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem con-

siderar (direita) os efeitos da amostragem preferencial nos estudos simulados bidi-

mensionais I (acima) e II (abaixo). . . . . . . . . . . . . . . . . . . . . . . . . . 63

7.1 Histograma da pseudo-distribuicao a posteriori de d considerando (esquerda) e sem

considerar (direita) o efeito da amostragem preferencial no exemplo simulado uni-

dimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

7.2 Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem prefe-

rencial para o exemplo simulado bidimensional I. Os valores da densidade desta

pseudo-distribuicao encontram-se multiplicados por 100 para melhor visualizacao. 69

7.3 Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem pre-

ferencial para o exemplo simulado bidimensional I. Os valores da densidade desta


7.4 Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem prefe-

rencial para o exemplo simulado bidimensional II. Os valores da densidade desta


7.5 Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem pre-

ferencial para o exemplo simulado bidimensional II. Os valores da densidade desta

pseudo-distribuicoes encontra-se multiplicado por 100 para melhor visualizacao. . 72

7.6 Locais otimos apontados pelos modelos considerando (esquerda) e sem considerar

(direita) os efeitos da amostragem preferencial no estudo simulado bidimensional I. 74

7.7 Media a posteriori da distribuicao preditiva de S obtidos considerando (esquerda) e

sem considerar (direita) o efeito da amostragem preferencial para o processo simu-

lado bidimensional I apos a obtencao do planejamento amostral otimo. . . . . . . 75

7.8 Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem con-

siderar (direita) o efeito da amostragem preferencial no exemplo simulado bidimen-

sional I apos a obtencao do planejamento amostral otimo. . . . . . . . . . . . . . 75

xi

8.1 Precipitacao Pluviometrica na cidade do Rio de Janeiro em Out/2005 (as estacoes

estao separadas de acordo com os quantis de 20%, 40%, 60% e 80% e agrupadas

pelas cores azul, verde, amarelo, marrom e vermelho, respectivamente). . . . . . . 78


considerando (esquerda) e sem considerar (direita) efeitos da amostragem preferen-

cial para os dados de precipitacao pluviometrica na cidade do Rio de Janeiro (os

cırculos representam o variograma amostral observado). . . . . . . . . . . . . . . 80

8.3 Media a posteriori da distribuicao preditiva de S obtida considerando (acima) e

sem considerar (abaixo) o efeito da amostragem preferencial para os dados de pre-

cipitacao pluviometrica na cidade do Rio de Janeiro. . . . . . . . . . . . . . . . 82

8.4 Media a posteriori da distribuicao preditiva de Y obtida considerando (acima) e

sem considerar (abaixo) o efeito da amostragem preferencial para os dados de pre-

cipitacao pluviometrica na cidade do Rio de Janeiro. . . . . . . . . . . . . . . . 83

8.5 Pseudo-distribuicao a posteriori de d obtida sob amostragem preferencial (acima) e

sem considerar este efeito (abaixo) para os dados de precipitacao pluviometrica na

cidade do Rio de Janeiro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

9.1 Realizacao do processo simulado bidimensional sob efeito de amostragem preferen-

cial com repulsao juntamente com as posicoes das amostras observadas (cırculos). 89


da amostragem preferencial para o processo simulado com efeito de repulsao (os



da amostragem preferencial para o processo simulado sem efeito de repulsao (os


xii


sob amostragem preferencial com repulsao (esquerda) e sem repulsao (direita) para

o processo simulado. Os cırculos representam o variograma amostral observado e a

linha preta representa o verdadeiro variograma. . . . . . . . . . . . . . . . . . . 91


considerar (direita) o efeito da amostragem preferencial com repulsao para o processo

simulado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

9.6 Curvas de nıvel da distribuicao a posteriori conjunta de α e β, exceto por uma

constante, condicional a S para a simulacao que utiliza a regiao D discretizada em

16 sub-regioes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

9.7 Curvas de nıvel da distribuicao a posteriori conjunta de α e β (exceto por uma

constante) obtida utilizando as prioris A (esquerda) e B (direita) para a simulacao

que utiliza a regiao D discretizada em 16 sub-regioes. O ponto no mapa (em preto)

representa o valor verdadeiro do par de parametros. . . . . . . . . . . . . . . . . 94

xiii

Lista de Tabelas

6.1 Erro de Predicao Global (EPG) para cada uma das simulacoes realizadas. . . . . 61

7.1 Erro de Predicao Global (EPG) no exemplo simulado bidimensional I apos a ob-

tencao do planejamento amostral otimo apontado por cada um dos modelos consi-

derados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

8.1 Media a posteriori e IC 95% (entre parentesis) para os parametros de ambos os

modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

xiv

Sumario

1 Introducao 1

1.1 Motivacao da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Contribuicao da tese na literatura . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Potenciais de aplicacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Organizacao da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Inferencia Bayesiana 6

2.1 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 Estimacao de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.3 Distribuicao preditiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4 Inferencia via simulacao estocastica . . . . . . . . . . . . . . . . . . . . . . . 9

2.5 Inferencia via MCMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.5.1 Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.5.2 Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3 Geoestatıstica 14

xv

3.1 Modelo Geoestatıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.2 Processos Gaussianos estacionarios e isotropicos . . . . . . . . . . . . . . . . 15

3.3 Inferencia em processos Gaussianos . . . . . . . . . . . . . . . . . . . . . . . 17

4 Processos Pontuais 21

4.1 Processos pontuais espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4.2 Processo de Cox e de Cox log-Gaussiano . . . . . . . . . . . . . . . . . . . . 24

4.3 Inferencia em processos pontuais . . . . . . . . . . . . . . . . . . . . . . . . . 25

4.4 Efeitos da discretizacao na inferencia . . . . . . . . . . . . . . . . . . . . . . 25

5 Planejamento Amostral Otimo 27

5.1 Planejamento amostral otimo em Geoestatıstica . . . . . . . . . . . . . . . . 32

5.2 Exemplo: Planejamento amostral otimo no estudo da serie temporal de in-

festacao pelo mosquito Aedes aegypti . . . . . . . . . . . . . . . . . . . . . . 35

6 Geoestatıstica sob Efeito de Amostragem Preferencial 39

6.1 Estudo de simulacao unidimensional . . . . . . . . . . . . . . . . . . . . . . . 44

6.2 Estudo de simulacao bidimensional I . . . . . . . . . . . . . . . . . . . . . . 50

6.3 Estudo de simulacao bidimensional II . . . . . . . . . . . . . . . . . . . . . . 53

6.4 Consideracoes a respeito das simulacoes . . . . . . . . . . . . . . . . . . . . . 56

7 Planejamento Amostral Otimo sob Efeito de Amostragem Preferencial 64

7.1 Estudo de simulacao unidimensional . . . . . . . . . . . . . . . . . . . . . . . 67

xvi

7.2 Estudo de simulacao bidimensional I . . . . . . . . . . . . . . . . . . . . . . 68

7.3 Estudo de simulacao bidimensional II . . . . . . . . . . . . . . . . . . . . . . 70

7.4 Consideracoes a respeito das simulacoes . . . . . . . . . . . . . . . . . . . . . 71

7.5 Analise da efetividade do planejamento amostral otimo . . . . . . . . . . . . 73

8 Aplicacao a Dados de Precipitacao Pluviometrica no Rio de Janeiro 77

8.1 Predicao espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

8.2 Planejamento amostral otimo . . . . . . . . . . . . . . . . . . . . . . . . . . 81

9 Amostragem Preferencial com Repulsao em Geoestatıstica 85

9.1 Estudo de simulacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

9.2 Consideracoes sobre os resultados . . . . . . . . . . . . . . . . . . . . . . . . 92

10 Conclusoes 96

Referencias Bibliograficas 100

xvii

Capıtulo 1

Introducao

1.1 Motivacao da tese

O projeto de tese ora apresentado foi motivado pelo interesse especial que os efeitos da

amostragem preferencial proporcionam as etapas de uma analise Geoestatıstica.

Neste sentido, o trabalho de Diggle et al. (2010) trouxe uma perspectiva inedita dos

efeitos da amostragem preferencial nos metodos tradicionais de inferencia em Geoestatıstica.

Em Geoestatıstica o pesquisador esta interessado em estudar as caracterısticas de um

processo estocastico S(x) : x ∈ D, onde D representa uma regiao qualquer no espaco

k-dimensional.

Ao contrario do que usualmente se supoe na abordagem tradicional de Geoestatıstica,

sob efeito de amostragem preferencial considera-se que os pontos amostrais x sao dependentes

do processo estocastico subjacente de interesse S(x). Mais especificamente, considera-se que,

condicional a S, X e um processo de Cox log-Gaussiano, com intensidade λ(x) = expα +

βS(x).

A luz deste trabalho, muitas outras perguntas puderam ser levantadas e uma delas diz

respeito a influencia da amostragem preferencial no processo de escolha otima de novos locais

1

para amostragem.

Este processo, tambem conhecido como design otimo, e bastante difundido na literatura

de Estatıstica. Sua aplicacao no contexto de Geoestatıstica possui inumeros artigos recentes,

como os trabalhos de Zidek et al. (2000), Fernandez et al. (2005), Zhu e Stein (2005),

Diggle e Lophaven (2006), Gumprecht et al. (2007), Muller e Stehlık (2008), Boukouvalas

et al. (2009), entre outros. Os avancos produzidos por Muller (1999), Muller et al. (2004)

e Muller et al. (2007), os quais baseiam o planejamento amostral otimo na maximizacao

de funcoes utilidades, sao de especial interesse na pesquisa desenvolvida nesta tese. Por

incorporar de forma natural a abordagem Bayesiana e a utilizacao de metodos de simulacao

intensivos, a metodologia proposta nestes trabalhos torna-se bastante vantajosa no contexto

da Geoestatıstica.

Utilizando-se a informacao fornecida pela configuracao espacial da amostra, pretende-se

mostrar nesta tese que a decisao associada ao planejamento amostral otimo e significativa-

mente alterada quando estamos sob influencia de amostragem preferencial.

1.2 Contribuicao da tese na literatura

Diggle et al. (2010) apresentaram uma metodologia para realizar a inferencia no modelo

Geoestatıstico tradicional sob a hipotese de influencia da amostragem preferencial. Neste

artigo os autores consideraram que o processo de amostragem dos locais observados era

governado por um processo de Cox log-Gaussiano (Moller et al., 1998) e utilizaram metodos

de simulacao para produzir estimativas de maxima verossimilhanca para os parametros do

modelo. Adicionalmente, realizaram simulacoes para avaliar a influencia da amostragem

preferencial no processo de inferencia para os parametros do modelo. Em todos os casos, as

predicoes espaciais foram realizadas pelo metodo plug-in utilizando-se os metodos de krigagem

tradicionais de Geoestatıstica, como aqueles descritos nos trabalhos classicos de Cressie (1993)

e Diggle et al. (1998).

Pati et al. (2011) estendeu a metodologia proposta por Diggle et al. (2010) para o

2

enfoque Bayesiano e, paralelamente ao desenvolvimento desta tese, Gelfand et al. (2012)

apresentaram um artigo avaliando aspectos da amostragem preferencial na predicao espacial,

sugerindo em suas conclusoes que este impacto e mais significativo na predicao do que na

estimacao de parametros.

Nesta tese, detalha-se uma metodologia para realizacao da inferencia em Geoestatıstica

sob amostragem preferencial utilizando o metodo Markov Chain Monte Carlo (MCMC) e

avalia-se, por meio de simulacoes, o impacto deste efeito na estimacao de parametros, na

predicao espacial e na escolha do planejamento amostral otimo.

Em relacao a estimacao, as simulacoes permitiram avaliar a forma como os parametros

do modelo Geoestatıstico sao impactados pelos efeitos da amostragem preferencial. Por outro

lado, na avaliacao do impacto deste efeito sobre a predicao espacial, sao evidenciadas as

vantagens da utilizacao do arranjo amostral observado para realizacao das predicoes. Assim

como nos resultados de Gelfand et al. (2012), as simulacoes realizadas nesta tese tambem

sugerem um impacto maior da amostragem preferencial na predicao.

A avaliacao do impacto da amostragem preferencial na estimacao e predicao de um

processo Gaussiano subjacente sao essenciais para a analise de sua influencia na escolha de

novos locais para amostragem, isto e, no planejamento amostral otimo.

Assim, a maior contribuicao desta tese diz repeito a analise da influencia da amos-

tragem preferencial no processo de obtencao do planejamento amostral otimo em modelos

Geoestatısticos. Em situacoes onde a decisao do pesquisador baseia-se na maximizacao de

funcoes utilidades (Muller, 1999), avalia-se a influencia da amostragem preferencial no pla-

nejamento amostral otimo. Em especial, serao avaliadas situacoes onde deseja-se obter uma

reducao da variancia preditiva do processo Gaussiano subjacente ou nos casos em que existe

o interesse no monitoramento de eventos extremos.

Por fim, na tentativa de avaliar-se melhorias no modelo e torna-lo mais aplicavel a

determinadas situacoes praticas, serao tambem avaliados nesta tese alguns dos impactos da

amostragem preferencial quando tambem considera-se a existencia de um efeito de repulsao

espacial de pequena escala. Neste caso, supoe-se adicionalmente que a observacao de uma

3

amostra em um local x produz um efeito repulsivo que diminui a probabilidade de que outras

amostras sejam observadas na sua vizinhanca.

1.3 Potenciais de aplicacao

Os potenciais de aplicacao englobam o estudo de fenomenos de difıcil deteccao primaria e

aqueles que, por interesse do pesquisador ou por escassez de recursos, so podem ser observados

em locais considerados crıticos. Dentre os fenomenos de difıcil deteccao pode-se destacar o

monitoramento de infestacao de mosquitos ou outras pragas que so tornam-se detectaveis

nos locais em que sua ocorrencia e muito elevada.

O outro potencial de aplicacao reside no monitoramento de fenomenos considerados

crıticos sob o ponto de vista do planejamento ou execucao de atividades influenciadas por es-

tes. Como exemplo, podemos citar o monitoramento da temperatura e precipitacao nos locais

proximos aos aeroportos ou ainda em locais onde objetiva-se estudar ocorrencias extremas

destes fenomenos.

Em ambas as situacoes citadas, parece razoavel inferir que a forma como o fenomeno

e monitorado ou observado esta intimamente relacionada com a intensidade do processo

subjacente. A partir desta hipotese, o problema da escolha otima de um novo local amostral

para simples observacao ou monitoramento sofre alteracoes significativas, uma vez que as

regioes pouco amostradas tornam-se informativas para o pesquisador e produzem alteracoes

na utilidade esperada de cada escolha possıvel.

1.4 Organizacao da tese

No Capıtulo 2 sao apresentados os conceitos basicos de inferencia Bayesiana e os aspectos

computacionais gerais utilizados nesta tese. Os Capıtulos 3 e 4 apresentam um pequeno

resumo das grandes areas da Estatıstica Espacial que serao abordados posteriormente, a sa-

4

ber, Geoestatıstica e Processos Pontuais. O Capıtulo 5 trata da metodologia de obtencao do

planejamento amostral otimo baseada em maximizacao de funcoes utilidades. O Capıtulo 6

apresenta os aspectos da Geoestatıstica sob Amostragem Preferencial e o Capıtulo 7 combina

esta metodologia com a obtencao do planejamento amostral otimo. O Capıtulo 8 apresenta

uma aplicacao no contexto de redes de monitoramento de precipitacao pluviometrica e, por

fim, o Capıtulo 9 trata de uma extensao do modelo Geoestatıstico sob amostragem preferen-

cial incluindo efeitos de repulsao de pequena escala.

5

Capıtulo 2

Inferencia Bayesiana

As conclusoes obtidas atraves da inferencia Bayesiana a respeito de um determinado parametro

θ, ou de uma variavel nao observada y, sao baseadas em especificacoes probabilısticas. Tais

especificacoes sao feitas condicionalmente a uma amostra de valores observados, relacionados

de alguma forma com as quantidades de interesse.

2.1 Teorema de Bayes

Todo o processo de inferencia Bayesiana e baseado na atualizacao da informacao atraves do

Teorema de Bayes.

A descricao apresentada a seguir define o Teorema de Bayes no contexto da inferencia

Bayesiana (Migon e Gamerman, 1999):

Seja H a informacao disponıvel inicialmente para alguma quantidade de interesse. Seja

θ o vetor de parametros desconhecidos que assume valores em Θ. Supondo que a informacao

inicial pode ser expressa em termos probabilısticos p(θ|H), temos uma descricao completa

da incerteza a respeito de θ condicionalmente a informacao inicial H.

Para atualizar a informacao a respeito de θ, podemos observar uma amostra x de um

6

vetor aleatorio X relacionado com θ. Assim, a informacao disponıvel para a inferencia passara

a ser H∗ = H ∩ X = x.

Precisamos ainda conhecer a distribuicao amostral de X para realizar a atualizacao.

Esta distribuicao, leva a funcao de verossimilhanca p(x | θ,H), que associa para cada valor

de θ, a probabilidade de x ser observado.

A partir da especificacao dos elementos da inferencia, temos:

p(θ|H∗) = p(θ|x, H) =p(θ,x|H)

p(x|H)=p(x|θ,H)p(θ|H)

p(x|H)(2.1)

onde p(θ|H) e p(θ|H∗) representam as distribuicoes a priori e posteriori, respectivamente, e

p(x|H) =

∫p(θ,x|H)dθ.

Como p(x|H) nao depende de θ e como H e comum a todos os termos, podemos

reescrever o teorema da seguinte forma:

p(θ|x) ∝ p(x|θ)p(θ). (2.2)

O resultado apresentado em (2.2) e conhecido como Teorema de Bayes e se constitui

como a base de todos os procedimentos da inferencia Bayesiana.

2.2 Estimacao de parametros

O processo de estimacao de parametros pode ser realizado a partir de uma estimacao por

ponto ou por intervalo.

(i) Estimacao Pontual

7

No contexto da inferencia Bayesiana, a estimacao pontual de um determinado parametro

θ pode ser vista como um problema de decisao. Os elementos que compoem este pro-

blema de decisao sao (Migon e Gamerman, 1999):

• espaco de parametros Θ;

• espaco de resultados do experimento Ω;

• espaco de acoes possıveis A.

Uma regra de decisao δ e uma funcao definida em Ω que assume valores em A, tal que

δ : Ω→ A.

Associamos entao uma funcao perda L a cada regra de decisao δ(x), x ∈ Ω, e a cada

possıvel valor de θ ∈ Θ. Assim, temos uma medida de quanto perdemos quando

tomamos a decisao δ(x) e o valor verdadeiro do parametro e θ.

O risco associado a uma determinada regra de decisao δ(x) e obtido tomando-se a

esperanca da funcao perda L(δ, θ) com relacao a distribuicao a posteriori de θ, ou seja,

R(δ) = Eθ|x(L(δ, θ)).

Um estimador pontual de θ e dado pela regra de decisao que minimiza o risco esperado

segundo uma funcao perda especificada.

Os estimadores pontuais associados as perdas quadraticas, perdas absolutas e perdas

zero-um sao a media, a mediana e a moda da distribuicao a posteriori de θ, respectiva-

mente.

(i) Estimacao por Intervalo

Sob o ponto de vista Bayesiano, a forma mais adequada de avaliar a informacao dis-

ponıvel a respeito de uma quantidade desconhecida θ e atraves da distribuicao a pos-

teriori (Migon e Gamerman, 1999). Assim, sumarizar a informacao desta distribuicao

em um unico valor nao fornece ao pesquisador uma medida de quao preciso ele e. Uma

alternativa para este problema e calcular intervalos de credibilidade para estes valores.

Um intervalo de credibilidade Bayesiano e defindo da seguinte maneira:

8

• Seja θ uma quantidade desconhecida em Θ. Uma regiao C ⊂ Θ e um Intervalo de

Credibilidade Bayesiano 100(1− α)% para θ se p(θ ∈ C|x) ≥ 1− α.

Desta forma, o Intervalo de Credibilidade Bayesiano, com nıvel de credibilidade (1−α),

e denotado por IC 100(1− α)%.

2.3 Distribuicao preditiva

O processo de predicao sob a perspectiva Bayesiana e tratado naturalmente atraves da analise

da distribuicao preditiva.

A distribuicao preditiva para um determinado valor y, baseada num conjunto de dados

y, e dada por:

p(y|y) =

∫p(y, θ|y)dθ =

∫p(y|θ,y)p(θ|y)dθ =

∫p(y|θ)p(θ|y)dθ (2.3)

onde a ultima igualdade segue da independencia entre y e y dado θ.

Analisando a forma de obtencao da distribuicao preditiva, podemos ver que ela repre-

senta a verossimilhanca esperada com relacao a distribuicao a posteriori de θ, ou seja,

p(y|y) = Eθ|y[p(y|θ)].

2.4 Inferencia via simulacao estocastica

No contexto da inferencia estatıstica, a simulacao estocastica tem o objetivo de estimar

caracterısticas probabilısticas de modelos ou distribuicoes de interesse que nao podem ser

obtidas analiticamente.

Na inferencia Bayesiana, os metodos de simulacao estao relacionados ao processo de

obtencao de amostras de distribuicoes a posteriori. Nos casos em que lidamos com problemas

9

altamente complexos, em virtude do grande numero de parametros envolvidos, geralmente

temos de recorrer aos metodos de Monte Carlo via Cadeias de Markov para concluırmos o

processo inferencial.

2.5 Inferencia via MCMC

Os metodos computacionais baseados nos metodos de Monte Carlo via Cadeias de Markov

(MCMC) tem sido amplamente utilizados na inferencia Bayesiana quando o pesquisador esta

interessado em simular amostras de uma determinada distribuicao a posteriori, cuja funcao

densidade de probabilidade nao possui forma conhecida ou e demasiadamente complicada.

Em linhas gerais, a ideia basica do metodo e construir uma cadeia de Markov cuja

distribuicao de equilıbrio e igual a distribuicao de interesse. Apos um numero finito de

simulacoes desta cadeia, esperamos atingir a distribuicao de equilıbrio e, a partir deste ponto,

dar origem a uma amostra da distribuicao de interesse.

Considere que θ1, ..., θp possuem densidade conjunta p(θ) = p(θ1, ..., θp) e que q(θ, θ∗)

define a distribuicao condicional das transicoes do estado θ. Assim, e possıvel construir

uma cadeia com probabilidades de transicao invariantes no tempo, onde cada estado pode

ser obtido de um outro estado com um numero finito de iteracoes. Assim, independemente

do estagio inicial, uma tragetoria pode ser gerada e, consequentemente, pode-se alcancar a

distribuicao de equilıbrio p(θ).

Dentre os metodos mais utilizados para a contrucao da cadeia de Markov, temos o

Amostrador de Gibbs, proposto por Geman e Geman (1984) e popularizado por Gelfand e

Smith (1990), e o metodo de Metropolis-Hastings, proposto por Metropolis et al. (1953)

e Hastings (1970). Gamerman e Lopes (2006) apresentam uma descricao detalhada dos

metodos de simulacao baseados nos metodos de Monte Carlo via Cadeias de Markov.

10

2.5.1 Amostrador de Gibbs

O Amostrador de Gibbs e um esquema iterativo de amostragem de uma cadeia de Mar-

kov, cujas probabilidades de transicao dos estados sao realizadas a partir das distribuicoes

condicionais completas.

Considere pi(θi|θ−i) como a funcao densidade condicional de θi, dados os valores de

todos os outros θj’s (j 6= i), e assuma que e possıvel amostrar valores destas distribuicoes

para cada i = 1, ..., p.

A partir disto, especificamos valores iniciais θ0 = (θ01, ..., θ

0p) para todas as quantidades

desconhecidas do modelo. Assim, na j-esima iteracao a cadeia se encontra no estado θ(j) e a

posicao da cadeia na iteracao seguinte (j + 1) e obtida a partir dos seguintes passos:

• gerar θ(j+1)1 de p1(θ1|θ(j)

2 , ..., θ(j)p );

• gerar θ(j+1)2 de p2(θ2|θ(j+1)

1 , θ(j)3 , ..., θ

(j)p );

• repetir sucessivamente os passos anteriores para i = 3, ..., p, onde no ultimo passo

geramos θ(j+1)p de

pp(θp|θ(j+1)1 , θ

(j+1)2 , ..., θ

(j+1)p−1 )

obtendo-se entao o vetor θ(j+1) = (θ(j+1)1 , ..., θ

(j+1)p ).

Sob certas condicoes de regularidade, a distribuicao limite de θ(j) e p(θ).

2.5.2 Metropolis-Hastings

Outro metodo bastante utilizado para a construcao da cadeia e o algoritmo de Metropolis-

Hastings, que e baseado na utilizacao de distribuicoes auxiliares.

Considere q(θ, ·) como um nucleo arbitrario de transicao e assuma que na iteracao (j)

a cadeia se encontra no estado θ(j). Assim, a posicao da cadeia na iteracao (j + 1) sera

denotada por θ(j+1) e e obtida a partir dos seguintes passos:

11

• proponha um movimento da cadeia para o estado θ∗ a partir de q(θ(j), ·);

• aceitar o movimento proposto com probabilidade

α(θ(j),θ(∗)) = min

1,

p(θ∗)/q(θ(j),θ∗)

p(θ(j))/q(θ∗,θ(j))

e fazer θ(j+1) = θ∗ ou rejeitar o movimento com probabilidade 1− α(θ(j),θ(∗)) e fazer

θ(j+1) = θ(j) caso contrario.

Apesar do movimento da cadeia se fazer em blocos para todos os parametros do modelo,

na pratica e muito difıcil encontrar funcoes q(θ, ·) apropriadas quando trabalha-se com mo-

delos de alta dimensionalidade. Uma variacao do algoritmo resolve este problema movendo

uma componente do vetor de parametros θ por vez. Assim, forma-se uma transicao completa

apos o ciclo de p transicoes a partir de funcoes q(θi, ·), para i = 1, ..., p.

Alguns autores indicam como razoaveis taxas de aceitacao entre 20% e 50% das pro-

postas durante o MCMC (Gamerman e Lopes, 2006) e, em determinados cenarios multidi-

mensionais, Roberts et al. (1997) sugerem uma taxa otima de 23.4%.

Apos decidido o metodo a ser utilizado e obtida uma simulacao da cadeia, devemos nos

certificar se a convergencia foi obtida. Somente apos esta confirmacao poderemos formar a

amostra da distribuicao a posteriori das quantidades desconhecidas do modelo.

Existem varias formas de se realizar uma analise da convergencia da cadeia. Uma das

formas e baseada em uma inspecao grafica, onde analisa-se a trajetoria de uma ou mais

cadeias em perıodos distintos de tempo. Neste estudo sera utilizado um criterio semelhante

a este, onde o comportamento de duas cadeias com valores iniciais distintos sera observado

e concluir-se-a que a convergencia foi alcancada quando ambas as cadeias permanecerem em

torno de um mesmo ponto. Criterios mais formais tambem podem ser utilizados, como os

metodos propostos por Gelman e Rubin (1992) e Geweke (1992).

Apos a obtencao da amostra, deve-se analisar a autocorrelacao existente entre θ(j) e

θ(j+1). Como estamos lidando com uma amostra de uma cadeia de Markov, temos uma

amostra aleatoria, mas nao independente. Isto nao afeta as estimativas dos parametros,

12

mas tem influencia sobre as variancias das estimativas resultantes desse procedimento de

amostragem (Gamerman e Lopes, 1997). Portanto, nos casos em que, apos verificada a

convergencia, for constatada uma forte correlacao serial na cadeia, recomenda-se a retirada

de uma amostra sistematica de seus valores para compor uma nova amostra. A forma como

a amostragem sistematica sera realizada pode ser baseada em um grafico contendo a funcao

de autocorrelacao da cadeia.

Apos a verificacao destes itens, a inferencia tem prosseguimento a partir do metodo de

Monte Carlo. A ideia basica deste metodo consiste em estimar o valor de uma integral a partir

da obtencao de seu valor esperado com relacao a alguma distribuicao de probabilidade. Para

se obter, por exemplo, uma estimativa para o valor esperado a posteriori de um parametro θ

do modelo, basta tomar a media das j-esimas componentes dos valores amostrados, ou seja,

θ =

∑j θj

n.

13

Capıtulo 3

Geoestatıstica

Um processo estocastico definido sobre uma regiao D do espaco e chamado de processo espa-

cial. O campo da estatıstica que lida com a inferencia e a predicao de fenomenos modelados

via processos espaciais e conhecido como Estatıstica Espacial.

Segundo Cressie (1993), a Estatıstica Espacial pode ser subdividida em tres grandes

areas, a saber: Padroes de Pontos, Dados de Area e Geoestatıstica.

Na analise de Padroes de Pontos lidamos com fenomenos que podem ser modelados

segundo Processos Pontuais. Neste caso, o interesse do pesquisador reside na analise da

intensidade de ocorrencia de determinados eventos e na avaliacao da existencia de padroes

de agregacao ou repulsao espacial. A analise da ocorrencia de crimes em grandes cidades e o

monitoramento do local de ocorrencia de eventos raros sao exemplos de fenomenos modelados

via Processos Pontuais.

No caso da analise de Dados de Area lidamos com fenomenos que, apesar de poderem

se distribuir de forma contınua no espaco, sao observados em sub-regioes que compoem uma

particao da regiao de interesse. Neste caso, o pesquisador dispoe de medicoes individuais as-

sociadas a cada sub-regiao e possui o interesse em detectar padroes subjacentes ou quantificar

o grau de correlacao espacial na regiao. Dados economicos agregados por bairros, municıpios

e Estados sao exemplos de processos analisados via Dados de Area.

14

Por fim, a Geoestatıstica lida com processos estocasticos definidos em regioes do <d,

onde d usualmente e o plano euclidiano bidimensional. Os Processos Gaussianos sao os mode-

los mais utilizados em Geoestatıstica em virtude das facilidades provenientes das propriedades

da distribuicao Normal multivarida. Fenomenos climatologicos, como temperatura, umidade

e precipitacao sao alguns dos exemplos onde aplicam-se modelos Geoestatısticos. O proximo

Capıtulo apresenta mais detalhes a respeito dos Processos Gaussianos e de sua utilizacao na

Geoestatıstica.

3.1 Modelo Geoestatıstico

Seguindo a abordagem de Diggle et al. (1998), podemos supor que estamos interessados em

estudar as caracterısticas de um processo estocastico S(x) : x ∈ D, onde D representa uma

regiao qualquer no espaco k-dimensional. Adicionalmente podemos supor que o S(x) possui

variancia constante σ2 e funcao de autocorrelacao ρ(S(x), S(x + h);φ), x ∈ D, a qual pode

depender de um (φ) ou mais parametros.

3.2 Processos Gaussianos estacionarios e isotropicos

O processo S e dito Gaussiano se todas as distribuicoes finito-dimensionais (S(x1), ..., S(xn)),

n = 1, 2, ..., sao tambem Gaussianas.

Diz-se que um processo estocastico e estritamente (ou fortemente) estacionario se as

suas respectivas distribuicoes finito-dimensionais sao invariantes a translacao.

Outro tipo de estacionariedade, conhecida como estacionariedade de segunda ordem

(ou estacionariedade fraca), pressupoe apenas que

E[S(x)] = µ, x ∈ D

15

e

ρ(S(x), S(x+ h);φ) = ρ(| h |;φ),

onde x, x+ h ∈ D.

No caso de um processo Gaussiano a estacionariedade de segunda ordem garante a

estacionariedade estrita.

Caso a funcao de autocorrelacao nao dependa da direcao, isto e, for invariante a

rotacoes, dizemos adicionalmente que o processo e isotropico.

Assim, um processo Gaussiano estacionario e isotropico possui variancia constante σ2 e

funcao de autocorrelacao ρ(S(x), S(x+h);φ) = ρ(‖ h ‖;φ), onde ‖ h ‖ representa a distancia

entre quaisquer dois pontos x e x+ h.

Inumeras famılias de funcoes de autocorrelacao podem ser encontradas na literatura,

como em Cressie (1993) e Diggle e Ribeiro (2007). Sem perda de generalidade no que tange

aos objetivos definidos no Capıtulo 1, todos os desenvolvimentos e aplicacoes desta tese

utitilizarao a funcao de autocorrelacao exponencial, definida por:

ρ(‖ h ‖;φ) = exp

(− ‖ h ‖

φ

),

onde φ > 0 e o parametro que representa o alcance da correlacao espacial.

Existem extensoes deste modelo basico de Geoestatıstica, grande parte delas desenvol-

vidas para lidar com falta de estacionariedade ou para permitir o relaxamento da hipotese de

Normalidade do processo estocastico subjacente. Dentre as abordagens para lidar com pro-

cessos nao-estacionarios destacam-se: Hass (1995), que utiliza o conceito de janelas moveis

estacionarias; Higdon et al. (1999), baseada na convolucao de processos estacionarios e

identicos; Fuentes e Smith (2001) e Fuentes (2002), baseadas na convolucao de diferentes

processos estacionarios; e Sampson e Guttorp (1992) e Schmidt e O’Hagan (2003), que utili-

zam a deformacao do espaco para tornar o processo estacionario. Por outro lado, para lidar

com a nao-Normalidade pode-se destacar o trabalho de Diggle et al. (1998), que introduziu

16

os modelos lineares generalizados para processos espaciais. Nesta tese nos restringiremos aos

processos Gaussianos estacionarios subjacentes.

3.3 Inferencia em processos Gaussianos

Assumindo que dispomos de observacoes Yi, i = 1, ..., n, onde

Yi = µ+ S(xi) + Zi

E[Zi] = 0, V ar[Zi] = τ 2,∀i,

podemos interpretar Y = (Y1, ..., Yn) como uma versao do processo S observada com ruıdo.

Vamos supor que o vetor Z e Normalmente distribuıdo e independente do processo S.

Sob o enfoque Bayesiano, precisamos obter as distribuicoes a posteriori para fazer

inferencia acerca dos parametros do modelo. Supondo que θ represente o conjunto de

parametros desconhecidos do modelo, complementamos a verossimilhanca p(y | θ) com uma

distribuicao a priori p(θ) a fim de obtermos a posteriori p(θ | y).

A obtencao da distribuicao a posteriori de [θ | y] e obtida primeiramente verificando-se

que θ = (φ, σ2, τ 2, µ) e que

p(θ | y) ∝ p(y | σ2, τ 2, µ)p(φ)p(σ2)p(τ 2)p(µ)

onde [y | σ2, τ 2, µ] ∼ N(1µ, τ 2In+σ2Rn) e assumindo a independencia a priori entre φ, σ2, τ 2 e

µ. A matriz de autocorrelacoes do processo S entre locais observados (S(x1), S(x2), ..., S(xn))

e representada pela matriz Rn.

Para os parametros φ, σ2 e τ 2 e usual atribuir-se distribuicoes a priori Gama e para µ

uma distribuicao Normal, todas pouco informativas.

17

Como as distribuicoes a posteriori destes parametros nao possuem forma fechada, po-

demos aproxima-las utilizando o metodo MCMC.

Quando existe o interesse adicional em obter-se predicoes do processo S em localizacoes

nao observadas da regiao de estudo D, os aspectos computacionais que envolvem o procedi-

mento de inferencia costumam ser implementados a partir da definicao de uma grade de M

pontos para predicao na regiao em estudo D. Estes M pontos, por sua vez, podem entao ser

considerados como centroides de M sub-regioes ou celulas, as quais definem uma discretizacao

de D. Assim, podemos redefinir o processo Gaussiano subjacente nos centroides destas sub-

regioes, isto e, em S = S1, ..., SM. Adicionalmente, definimos a particao S = Sy, SN

para distinguir o processo subjacente associado aos locais observados e aquele associado aos

locais nao-observados. Esta discretizacao torna a distribuicao de S uma Normal multivariada

de dimensao M = n+N , com vetor de medias 0 e matriz de autocorrelacao

RM =

Rn Rn,N

RN,n RN

,

onde os elementos desta matriz sao definidos pela funcao de autocorrelacao ρ(· ;φ) escolhida.

O modelo completo e apresentado abaixo:

[y | Sy, µ, τ−2] ∼ N(1µ+ Sy, τ

2In)

[S | σ−2, φ] ∼ N(0, σ2RM)

µ ∼ N(0, k)

τ−2 ∼ Gama(aτ , bτ )

σ−2 ∼ Gama(aσ, bσ)

φ ∼ Gama(aφ, bφ),

onde k, aτ , bτ , aσ, bσ, aφ e bφ representam hiperparametros considerados como conhecidos a

priori.

18

As distribuicoes condicionais completas dos parametros µ, τ−2 e σ−2 sao dadas por

[µ | τ−2, σ−2, S, φ,y] ∼ N

(n(y − Sy)k

τ 2 + nk;

τ 2k

τ 2 + nk

),

[τ−2 | µ, σ−2, S, φ,y] ∼ Gama

(aτ +

n

2; bτ +

(y − 1µ− Sy)′(y − 1µ− Sy)

2

)e

[σ−2 | µ, τ−2, S, φ,y] ∼ Gama

(aσ +

M

2; bσ +

S ′R−1M S

2

),

podendo ser atualizadas pelo metodo do Amostrador de Gibbs dentro do algoritmo do

MCMC.

Por outro lado, a distribuicao condicional completa de S e Normal com vetor de medias

e matriz de covariancias dados por

σ2RN,n(τ 2In + σ2Rn)−1(y − 1µ) (3.1)

e

σ2RN − σ2RN,n(τ 2In + σ2Rn)−1σ2Rn,N , (3.2)

respectivamente, podendo tambem ser atualizada pelo metodo do Amostrador de Gibbs den-

tro do algoritmo do MCMC. As expressoes 3.1 e 3.2 sao conhecidas como Preditor de Kriga-

gem e Variancia de Krigagem, respectivamente.

O parametro de alcance φ da funcao de autocorrelacao do processo possui distribuicao

condicional completa dada por

19

p(φ | S, µ, τ−2, σ−2, α, β,y) ∝ |RM |−1/2φaφ−1 exp

−S

′R−1M S

2σ2− bφφ

e podemos gerar propostas no passo de Metropolis a partir de uma distribuicao Lognormal

com parametros

q(φprop | φ) ∼ Lognormal (ln(φ)− δ/2; δ) ,

onde δ deve ser escolhido de forma a produzir uma taxa de aceitacao razoavel das propostas

durante o MCMC. Neste caso, as probabilidades de aceitacao das propostas no MCMC sao

dadas por

pφ =(|RM |prop|RM |

)−1/2 (φprop

φ

)aφ×

exp− (S′Rprop−1

M S−S′R−1M S)

2σ2 + bφ(φ− φprop)− (lnφ−lnφprop+δ/2)2−(lnφprop−lnφ+δ/2)2

2δ

.

Alternativamente ao uso do MCMC, Ribeiro e Diggle (2001) desenvolveram um pa-

cote para o ambiente do software R, chamado GeoR, que realiza o processo de inferencia e

predicao a partir de versoes discretizadas das distribuicoes a priori dos parametros do modelo

Geoestatıstico.

20

Capıtulo 4

Processos Pontuais

Neste Capıtulo sao apresentados os aspectos relevantes associados aos Processos Pontuais no

espaco, assim como alguns dos avancos recentes na metodologia para realizacao da inferencia.

Em especial, sera apresentado o processo de Cox log-Gaussiano (Møller et al., 1998), o qual

sera a base para a construcao do modelo Geoestatıstico sob efeito de amostragem preferencial

a ser apresentado no Capıtulo 7.

4.1 Processos pontuais espaciais

A utilizacao de processos pontuais para modelagem de padroes de pontos no espaco tem se

intensificado nas ultimas decadas, especialmente apos a publicacao dos textos classicos de

Ripley (1981) e Diggle (1983).

A partir dos avancos computacionais recentes, os quais acabaram impulsionando o

desenvolvimento de metodos estatısticos mais sofisticados como os metodos MCMC, o estudo

dos processos pontuais evoluiu significativamente. Møller e Waagepetersen (2007) apresentam

uma revisao completa dos modelos mais utilizados para a modelagem de processos pontuais

espaciais e destacam inumeras aplicacoes e aspectos computacionais associados a inferencia.

Um processo pontual espacial X pode ser entendido como um subcojunto aleatorio finito

21

de uma determinada regiao limitada D ⊂ <k, onde geralmente k = 1, 2 ou 3. Uma realizacao

deste processo e chamada de padrao de pontos ou arranjo pontual, denotado x = (x1, ..., xn).

Na maior parte das aplicacoes a regiao D nao e totalmente observavel e o pesquisador

acaba sendo obrigado a analisar apenas uma janela W ⊂ D onde o arranjo pontual foi

observado. Nas situacoes em que a regiao D pode ser considerada homogenea, costuma-

se supor que o processo pontual espacial e estacionario e isotropico, ou seja, que possui

distribuicao invariante a translacoes e rotacoes em <k. Entretanto, estas suposicoes nao se

mostram realistas para inumeras situacoes praticas.

Os conceitos de media e covariancia dos processos pontuais espaciais sao definidos em

funcao dos efeitos de primeira e segunda ordem. Em particular, os efeitos de primeira ordem

sao analisados em termos da funcao intensidade de primeira ordem λ(x), ou seja, em termos

do numero de eventos esperado por unidade de area no ponto x. Assim,

λ(x) = limdx→0

E[Y (dx)]

|dx|

,

onde dx representa uma pequena regiao em torno de x, |dx| representa a area ou volume

desta regiao e Y (B) e a variavel aleatoria associada ao numero de pontos observados em

B ⊂ D.

Por outro lado, os efeitos de segunda ordem sao utilizados como medida de dependencia

espacial e sao definidos pela funcao intensidade de segunda ordem dada por

λ2(xi, xj) = limdxi,dxj→0

E[Y (dxi)Y (dxj)]

|dxi||dxj|

,

onde xi e xj representam duas localizacoes em D. Para um processo pontual espacial, a

estacionariedade de segunda ordem e a isotropia ocorrem quando λ2(xi, xj) = λ2(‖ xi−xj ‖).

Alem de analisar a intensidade de ocorrencia dos eventos na regiao D, a modelagem

dos padroes pontuais espaciais tambem procura classifica-los em algum dos padroes a seguir:

22

• Padrao Aleatorio: tambem conhecido como aleatoriedade espacial completa, esta asso-

ciado ao processo de Poisson homogeneo sobre toda a regiao em estudo D;

• Padrao de Agregacao (ou clustered): neste caso, a ocorrencia de um evento em de-

terminado local x esta associada a ocorrencia de outros eventos em locais proximos;

e

• Padrao Regular ou de Repulsao: neste caso, a ocorrencia de um evento em um local

x repele a ocorrencia de eventos proximos, ocasionando um padrao regular do arranjo

pontual.

No contexto de processos espaciais com funcoes intensidade determinısticas, o processo

de Poisson e um dos modelos mais conhecidos. Um processo de Poisson X, definido em

D ⊂ <k, com funcao intensidade λ(x), satisfaz:

• A variavel aleatoria Y (B), a qual representa o numero de eventos em B ⊂ D, possui

distribuicao Poisson com media µ(B) =∫Bλ(x)dx;

• Condicional a Y (B), os pontos que ocorrem em B sao independentes e identicamente

distribuıdos com densidade proporcional a λ(x), x ∈ B.

A funcao de verossimilhanca associada ao processo de Poisson, baseada em um conjunto

de n pontos x = x1, ..., xn, e dada por

p(x | λ) ∝ exp

(−∫D

λ(x)dx

) n∏i=1

λ(xi).

Se λ(x) = λ, ∀x ∈ D, dizemos que o processo de Poisson e homogeneo e sua funcao de

verossimilhanca deixa de depender das localizacoes dos eventos, resumindo-se a

p(x | λ) = p(n | λ) ∝ exp−|D|λ(|D|λ)n,

onde |D| e a area da regiao D.

23

O processo de Poisson pressupoe a nao-existencia de interacoes entre os pontos e, para

regioes disjuntas B1, B2 ⊂ D, as contagens sao independentes.

Todos os padroes de arranjos pontuais podem acontecer devido a diferentes intensidades

ou por efeitos de associacao entre os eventos. A seguir sao apresentados dois importantes

processos pontuais espaciais caracterizados por funcoes intensidades aleatorias, a saber: o

processo de Cox e o processo de Cox log-Gaussiano.

4.2 Processo de Cox e de Cox log-Gaussiano

Um processo pontual espacial, definido em uma regiao D ⊂ <k, e governado por uma funcao

aleatoria nao-negativa Λ = Λ(x) : x ∈ <k, e um processo de Cox se a distribuicao condici-

onal de X | Λ = λ e um processo de Poisson com funcao intensidade λ(x).

Se, adicionalmente, pudermos supor que

Λ(x) = expZ(x),

onde Z = Z(x) ∈ <k e um processo Gaussiano, dizemos que o processo pontual espacial

com funcao intensidade aleatoria Λ e um processo de Cox log-Gaussiano (Møller et al., 1998).

Neste caso, a funcao de verossimilhanca torna-se

p(x | Z) ∝ exp

(−∫D

expZ(x)dx) n∏

i=1

expZ(xi). (4.1)

Esta funcao nao e analiticamente tratavel e sera de suma importancia na definicao do

modelo Geoestatıstico sob amostragem preferencial (Capıtulo 7).

Ao contrario do que acontece com os processos pontuais de funcao intensidade deter-

minıstica, os processos de Cox e de Cox log-Gaussiano nao sofrem os efeitos negativos das

bordas (edge effects). Estes efeitos nas bordas caracterizam-se pela impossibilidade de se

24

realizar a inferencia de maneira satisfatoria nas bordas de uma janela observavel W , onde

W ⊂ D. Condicionais ao conhecimento de Λ(x) = λ(x), x ∈ D, a inferencia nestes proces-

sos com funcao intensidade aleatoria pode ser realizada normalmente independentemente da

janela observavel.

4.3 Inferencia em processos pontuais

Dependendo da escolha da funcao aleatoria Λ, a inferencia em processos de Cox pode se tornar

bastante complexa. Por outro lado, a inferencia em processos de Cox log-Gaussianos pode ser

realizada de forma razoavelmente simples por meio de metodos de simulacao de Monte Carlo

(Møller et al., 1998). Para isto, e necessario representar o domınio D do processo pontual

como uma grade e realizar a aproximacao do processo Gaussiano Z(x) de acordo com uma

distribuicao Normal finito-dimensional definida sobre a regiao discretizada.

A inferencia realizada sob a perspectiva Bayesiana, por meio dos metodos de MCMC,

torna razoavelmente simples a obtencao de aproximacoes da funcao de verosimilhanca p(x |

Z). Em contrapartida, o custo computacional associado e bastante elevado (Møller e Waa-

gepetersen, 2007).

4.4 Efeitos da discretizacao na inferencia

Waagepetersen (2004) demonstrou que as posterioris aproximadas para processos de Cox log-

Gaussianos convergem para as posterioris exatas quando o tamanho das celulas que compoem

a grade tendem a zero.

Ao modelar dados pontuais de infeccao por doencas utilizando processos de Cox log-

Gaussianos, Benes et al. (2002), concluıram que os resultados obtidos na inferencia via

MCMC podem variar consideravelmente dependendo da grade escolhida.

Entretanto, segundo Møller et al. (1998), se o processo pontual espacial for razoavel-

25

mente agregado e de intensidade moderada, a escolha da grade nao necessitara ser fina para

produzir bons resultados na inferencia, uma vez que nestes casos nao seria esperado observar

grandes areas sem amostras na regiao de estudo.

Apesar de varios autores trabalharem com particoes da regiao D formando sub-regioes

regulares, isto nao e uma regra. Heikkinen e Arjas (1998 e 1999), por exemplo, utilizam uma

particao denominada tesselagem de Voronoi, a qual particiona a regiao D em sub-regioes

de diferentes tamanhos, mas procurando manter uma grade mais fina em locais com maior

intensidade de ocorrencia de eventos.

A generalizacao dos processos pontuais espaciais para o caso espaco-temporal motiva

o estudo do efeito da discretizacao e da agregacao espacial e temporal dos dados. Alguns

exemplos de aplicacoes que avaliam ou discutem estes efeitos sao Brix e Diggle (2001), Paez

e Diggle (2009) e Benes et al. (2002).

26

Capıtulo 5

Planejamento Amostral Otimo

A definicao do planejamento amostral otimo e uma tarefa que costuma envolver metodo-

logias para obtencao de maximos e mınimos de funcoes objetivo. Estas funcoes objetivos

quantificam os ganhos e perdas associados as decisoes possıveis a serem tomadas.

Quando o fenomeno de interesse do pesquisador e estudado por meio da suposicao de

modelos estatısticos subjacentes, a metodologia para obtencao do planejamento amostral

otimo costuma se basear no conceito de Teoria da Decisao, onde precisamos decidir em quais

locais, no tempo ou espaco, devemos planejar uma nova coleta amostral a fim de compreender

melhor certas caracterısticas do fenomeno.

Em problemas da Teoria da Decisao que envolvem escolhas dependentes de resulta-

dos aleatorios, a combinacao de uma decisao d com um resultado aleatorio ω produz uma

recompensa r. Adicionalmente, para cada recompensa r, associa-se uma utilidade U(r), a

qual precisa satisfazer determinados pressupostos e pode ser interpretada como uma repre-

sentacao numerica das preferencias do decisor. Assim, uma decisao sera preferida em relacao

a outra se, e somente se, a utilidade esperada da recompensa obtida com a primeira for maior

que aquela obtida com a segunda. Mais detalhes e formalizacoes a respeito destes pressupos-

tos e outras propriedades das funcoes utilidades no contexto de Teoria da Decisao podem ser

encontrados em DeGroot (1970).

27

Seguindo a abordagem de Muller (1999), o procedimento para obtencao do planejamento

amostral otimo deve ser realizado a partir da definicao de uma funcao utilidade u(d, θ, yd),

onde d representa o novo ponto do plano amostral, θ o vetor de parametros e yd representa o

vetor de futuras observacoes oriundas deste novo ponto amostral. Apos a definicao da funcao

utilidade, temos que o ponto do planejamento amostral otimo d∗ e aquele que maximiza a

funcao:

U(d) =

∫u(d, θ, yd)pd(yd | θ)p(θ)dθdyd = E[θ,yd][u(d, θ, yd)] (5.1)

para o caso de um planejamento amostral a priori, e

U(d) =

∫u(d, θ, yd)pd(yd | θ,y)p(θ | y)dθdyd = E[θ,yd|y][u(d, θ, yd)] (5.2)

para o caso de um planejamento amostral apos a observacao de dados y.

Em outras palavras, apos obter o conjunto de observacoes y, o novo ponto do plano

amostral otimo sera o valor d∗ que maximixa a utilidade esperada.

Dentre os criterios para escolha da funcao utilidade, destacam-se aqueles que buscam re-

duzir incertezas a respeito de parametros de interesse e aqueles que buscam reduzir variancias

preditivas associadas ao processo em estudo. No primeiro caso, costumam ser utilizadas

funcoes que bonificam reducoes da variancia a posteriori de θ. Ja no segundo caso, sao mais

apropriadas funcoes que bonificam reducoes na variancia preditiva de S. Zidek et al. (2000)

utilizou o criterio da entropia (medida que se assemelha a nocao de variancia de uma variavel

aleatoria) para definicao do planejamento amostral otimo.

A fim de evitar que sejam escolhidos pontos amostrais associados a elevados custos

financeiros, materiais ou temporais, varios autores modificam suas funcoes utilidade a fim

de penalizar estes pontos amostrais. Zidek et al. (2000) e um exemplo, onde utilizam-se os

custos financeiros para penalizar as utilidades associadas a implantacao de uma nova estacao

de monitoramento de poluicao.

28

Outras estrategias para agregacao de informacao aos criterios de obtencao do planeja-

mento amostral sao encontradas na literatura. Especificamente em estudos de planejamento

amostral no tempo, Stroud et al. (2001) utilizou covariaveis para reduzir as incertezas as-

sociadas aos parametros desconhecidos do modelo e, assim, definir o instante otimo para

retorno de um paciente em tratamento. Ding et al. (2008), por sua vez, utilizou uma mo-

delagem hierarquica para relacionar os efeitos de diferentes tratamentos a fim de definir o

planejamento amostral otimo em estudos clınicos de um especıfico tratamento.

Com relacao as estrategias para otimizacao da utilidade esperada, Muller (1999) destaca

as principais utilizadas:

1. Simulacao a priori: neste caso, a partir de diferentes combinacoes dos parametros θ

do modelo, geradas de p(θ) ou de p(θ | y), calcula-se U(d) para diferentes candidados

a local otimo amostral d. Caso o procedimento tenha sido realizado avaliando-se U(d)

para uma malha fina de valores de d, escolhe-se o ponto do plano amostral que forneceu

maior utilidade esperada como d∗. Caso as avaliacoes de U(d) tenham sido feita para

uma malha nao tao fina, costuma-se ajustar uma curva U(d), utilizando algum metodo

nao-parametrico, e depois proceder a escolha de d∗ que maximiza a funcao U(d).

Este metodo possui um elevado custo computacional e, nos casos em que d e um vetor,

torna-se praticamente inviavel. Muller et al. (2004) lida com o problema de integracao e

maximizacao da funcao utilidade para os casos em que a dimensao de d e alta. Para isso,

utilizam uma versao do metodo de MCMC com simulated annealing onde a distribuicao

estacionaria da cadeia de Markov varia (MCMC nao-homogeneo);

2. MCMC em modelo aumentado: neste caso, o novo local do planejamento amostral

e considerado como um parametro a ser estimado no modelo. Sendo assim, considera-se

que d pode asssumir valores dentro de uma regiao fechada D, que u(d, θ, yd) e nao-

negativa e limitada e define-se a distribuicao artificial

h(d, θ, yd) ∝ u(d, θ, yd)pd(yd | θ)p(θ) (5.3)

29

em (d, θ, yd). Sob estas suposicoes, temos que a distribuicao marginal de d e proporci-

onal a

h(d) ∝∫u(d, θ, y)pd(yd | θ)p(θ)dθdyd = U(d), (5.4)

ou seja, encontrar a moda de h(d) torna-se equivalente a maximizar a utilidade esperada

de d. Assim, ganha-se tempo na simulacao, ja que os valores amostrados de d no

algoritmo MCMC tenderao a se concentrar proximos de regioes com alta utilidade

esperada. Desta forma, alteramos o nosso problema de otimizacao para um problema

de busca de moda.

Ainda dois outros pontos importantes precisam ser lembrados ao utilizar-se este metodo.

O primeiro ponto e que a introducao deste modelo aumentado produz mudancas nas

distribuicoes marginais de (θ, yd). O segundo ponto esta relacionado ao cuidado de

escolha da distribuicao que fornece os valores propostos de d no MCMC. Neste sentido,

a utilizacao de distribuicoes simetricas, onde g(d(i+1) | d(i)

)= g

(d(i) | d(i+1)

), acabam

por simplificar a expressao da probabilidade de aceitacao a cada iteracao j do MCMC,

reduzindo-a a

pd = min

1,

u(dprop, θj, ydprop)

u(dj−1, θj−1, ydj−1)

.

3. MCMC com simulated annealing: A utilizacao do metodo MCMC com o mo-

delo aumentado, conforme descrita no item anterior, ainda nao resolve totalmente o

problema da otimizacao de U(d). Um dos problemas restantes esta associado ao fato

de que, em muitos casos, a funcao de utilidade esperada e pouco concentrada na vi-

zinhanca de sua moda, alocando utilidades semelhantes para uma grande quantidade

de possıveis pontos do plano amostral. No caso em que d e unidimensional, a simples

inspecao do grafico ou histograma de U(d) pode nao ser suficiente para obtencao de

d∗. Ja no caso multimensional, a situacao e ainda mais complicada, uma vez que nao

terıamos como construir graficos de U(d).

Para lidar com este problema, incorporam-se as ideias de simulated annealing, onde

substitui-se a funcao objetivo do problema por uma transformacao potencia dela, ou

30

seja, h(d)J . A escolha de J deve ser realizada com cuidado e, em certos casos, pode-se

aumentar o valor de J apos identificar ”clusters”de pontos amostrais de maior utilidade,

possivelmente concentrados em torno da moda de d.

Varios procedimentos para obtencao de um planejamento amostral otimo de k locais,

k ≥ 2, podem ser empregados. A forma mais simples esta contida na metodologia de Muller

(1999), bastando para isto considerar um conjunto de decisoes d = d1, ..., dk associadas

a uma funcao utilidade u(d, θ,yd). Neste caso, a cada iteracao j do MCMC precisarıamos

amostrar um vetor de decisoes (ou locais) dj = (dj1, ...,djk) e aceita-lo ou rejeita-lo de acordo

com a sua pseudo-distribuicao no passo de Metropolis. Ao final, seria necessario encontrar

d∗, ou seja, o conjunto de locais que produz a utilidade maxima. Entretanto, para k > 2 este

procedimento torna-se demasiadamente complexo.

Outra opcao e considerar esta escolha como um problema de decisao sequencial, es-

pecificando regras de parada e custos de amostragem associados. DeGroot (1970) descreve

os principais aspectos associados a problemas desta natureza. Para contornar problemas

associados a decisoes sequenciais no tempo dependentes de todas as decisoes passadas, isto

e, dt = f(d1, ..., dt−1, y1, ..., yt−1), Muller et al. (2007) utiliza estatısticas suficientes carre-

gando a informacao necessaria obtida ate o instante t−1, substituindo dt = f(dt−1, yt−1) por

dt = f(St(dt−1, yt−1)).

A utilizacao da abordagem de decisoes sequenciais possui a vantagem de produzir,

em geral, maiores utilidades esperadas. Entretanto, no contexto de planejamento amostral,

decisoes sequenciais so podem ser utilizadas quando o pesquisador pode aguardar cada ob-

servacao antes de decidir o momento ou local de coletar uma nova observacao. Alem disso, os

custos associados a decisoes sequenciais podem ser muito mais elevados, sejam eles financei-

ros ou nao. Na Secao 5.2 e apresentada uma funcao utilidade que quantifica os custos como

forma de risco no contexto de infestacao de mosquitos.

31

5.1 Planejamento amostral otimo em Geoestatıstica

Em Geoestatıstica e comum o foco do pesquisador concentrar-se muito mais na predicao

espacial do processo subjacente do que na inferencia a respeito de seus parametros.

Neste sentido, a variancia de predicao associada ao local x ∈ D, V (S(x) | y), fornece ao

pesquisador o grau de incerteza a respeito de suas predicoes apos observar os dados y. Assim,

reduzir esta variancia ao longo da regiao de estudo D se constitui de um criterio bastante

razoavel para escolha de um novo ponto d do plano amostral.

Partindo-se deste princıpio podemos definir a seguinte funcao utilidade para aplicacao

da abordagem de Muller (1999) no contexto de Geoestatıstica:

u(d, θ, yd) =

∫[V (S(x) | θ,y)− V (S(x) | θ,y, yd)]dx, (5.5)

a qual pode ser interpretada como o ganho obtido ao se utilizar yd para reducao da incerteza

associada ao processo S, onde d ∈ <k.

Para avaliacao da integral existente na expressao de u(d, θ, yd) pode-se aplicar a discre-

tizacao da regiao em estudo D em M sub-regioes, conforme descrito no Capıtulo anterior.

Neste caso, apos a discretizacao, temos que u(d, θ, yd) e aproximada pela expressao

u(d, θ, yd) ≈1

M

∑i

[V (Si | θ,y)− V (Si | θ,y, yd)].

Ja as distribuicoes de [Si | θ,y] e [Si | θ,y, yd] sao normais com medias

σ2r′

n(τ 2In + σ2Rn)−1(y − 1µ)

e

σ2r′

n+1(τ 2In+1 + σ2Rn+1)−1(y − 1µ)

e variancias

32

σ2 − σ2r′

n(τ 2In + σ2Rn)−1σ2rn

σ2 − σ2r′

n+1(τ 2In+1 + σ2Rn+1)−1σ2rn+1,

respectivamente. Para verificar este resultado, defina y = y, yd e S = Sy, Sd. Desta

forma, temos

[y | S, θ] ∼ N(1µ+ S, τ 2In+1)

[S | θ] ∼ N(0, σ2Rn+1)

de onde podemos obter a distribuicao conjunta de [y, S | θ]

y

S

∼ N

1µ

0

,

τ 2In+1 + σ2Rn+1 σ2Rn+1

σ2Rn+1 σ2Rn+1

.Por fim, utilizando-se as propriedades da distribuicao Normal condicional, obtem-se as

respectivas medias e variancias condicionais apresentadas acima.

Alguns exemplos de funcoes utilidade empregadas no contexto de planejamento amos-

tral otimo que dependem de valores observados y, como a empregada aqui, podem ser en-

contrados em Cardenas (2007) e Muller et al. (2004), entre outros.

Dando seguimento ao procedimento de escolha do planejamento amostral otimo, e ne-

cessario maximizar a funcao

U(d) =

∫u(d, θ, yd)p(yd, θ | y)dθdyd =

∫u(d, θ, yd)p(yd | θ,y)p(θ | y)dθdyd

onde [θ | y] = [φ, σ2, τ 2, µ | y].

Para obtermos a distribuicao de [yd | θ,y], podemos utilizar novamente a distribuicao

conjunta de [y, S | θ] ou, alternativamente, seguir os passos:

33

• Note que [y | S, θ] ∼ N(1µ+ S, τ 2In+1) e [S | θ] ∼ N(0, σ2Rn+1);

• Como y = 1µ+ S + Z e Z e independente de S, temos que [y | θ] e Normal com media

1µ e matriz de covariancias τ 2In+1 + σ2Rn+1;

• Como [y | θ] = [yd,y | θ], pelas propriedades da Normal Multivariada temos que

[yd | θ,y] e Normal com media µ+ σ2r′n(τ 2In + σ2Rn)−1(y− 1µ) e variancia τ 2 + σ2 −

σ2r′n(τ 2In + σ2Rn)−1σ2rn.

Apos a obtencao de todas as distribuicoes que compoem a funcao utilidade escolhida,

o planejamento amostral otimo pode ser obtido utilizando-se uma das propostas de Muller

(1999) descritas neste Capıtulo a partir das amostras a posteriori de θ. Uma revisao de outros

procedimentos para a otimizacao de funcoes objetivo, em especial no contexto de redes de

monitoramento ambiental e mapeamento de QTL (quantitative trait loci) pode ser encontrada

em Cardenas (2007).

Por fim, e importante notar tambem que as expressoes das variancias preditivas empre-

gadas na funcao utilidade apresentada u(d, θ, yd) nao dependem dos valores de yd, mas apenas

de sua localizacao na regiao D. Esta caracterıstica das variancias preditivas de krigagem evita

a necessidade de se avaliar todos os possıveis valores de yd durante o processo de maximizacao

de U(d), reduzindo significativamente o custo computacional envolvido. Entretanto, outras

ponderacoes podem fazer parte da funcao de utilidade escolhida de forma que a utilizacao das

amostras a posteriori de yd sejam imprescindıveis para obtencao do planejamento amostral

otimo.

34

5.2 Exemplo: Planejamento amostral otimo no estudo

da serie temporal de infestacao pelo mosquito Ae-

des aegypti

No contexto da serie historica de infestacao do mosquito Aedes aegypti, principal vetor de

transmissao do vırus da dengue, o processo de selecao dos tempos de amostragem para

obtencao de ındices de infestacao precisa levar em conta questoes de praticidade, eficacia e

economia de recursos.

Pela praticidade e reprodutividade demonstrados, os ındices de infestacao baseados em

larvas acabam sendo os mais empregados como medidas de infestacao e como indicadores

de risco de transmissao de dengue (Gomes, 1998). Dentre os mais conhecidos destacam-se

o Indice Predial, que avalia o percentual de edifıcios infestados, e o Indice de Breteau, que

avalia o percentual de recipientes positivos com larvas por domicılio pesquisado.

A fim de orientar os orgaos de saude existentes no Brasil, a Secretaria de Vigilancia

em Saude do Ministerio da Saude disponibilizou um documento contendo a metodologia

para realizacao de um diagnostico rapido conhecido como Levantamento de Indice Rapido

de Infestacao por Aedes aegypti - LIRAa (Ministerio da Saude, 2005).

Na constante busca pela otimizacao dos recursos para avaliacao dos ındices de in-

festacao, evidencia-se a necessidade de planejar a periodicidade com que os agentes de saude

serao enviados a campo para obtencao do LIRAa. O conhecimento do comportamento da

serie de infestacao do mosquito pode ser util para definir esta periodicidade. Um bom pla-

nejamento deve ser realizado a fim de mobilizar os recursos disponıveis para os perıodos de

maior risco de surtos de infestacao do mosquito e de epidemias de dengue. Neste sentido,

pode-se desenvolver um criterio que auxilie no planejamento do momento otimo no tempo

para realizacao de novo LIRAa levando-se em conta fatores associados ao poder de predicao

e ao risco de surtos de infestacao do mosquito.

A fim de incorporar pesos diferentes aos candidatos a local amostral otimo de acordo

35

com o seu poder preditivo e de acordo com o risco iminente de surto de infestacoes do

mosquito, utilizou-se a seguinte funcao utilidade

u(d, θ, yd) =

∫[V (S(t) | θ,y)− V (S(t) | θ,y, yd)]dt+ exp−α(P [Yd > a | y]− pa)2

Na funcao utilidade escolhida, o termo dentro da integral quantifica a reducao da in-

certeza associada ao processo S apos a escolha do instante d como novo ponto amostral. Por

outro lado, o termo exponencial da expressao cumpre o papel de atribuir maior utilidade

para os candidatos a novo ponto amostral que estejam associados a instantes de tempo onde

as probabilidades de eventos extremos nao sao muito baixas e nem muito elevadas. No con-

texto de infestacao pelo mosquito, estes criterio evita a escolha de instantes associados aos

perıodos de baixo risco, onde os gastos com o trabalho de campo para obtencao do LIRAa

poderiam ser desnecessarios, e de extremo risco, onde a realizacao da coleta poderia ser re-

alizada demasiadamente tarde. De uma maneira geral, esta componente do criterio permite

que o modelo aponte para um instante no tempo que antecipe a ocorrencia de um surto de

infestacao. O grau de moderacao e definido pelo parametro pa. Por fim, fixamos o parametro

α a fim de ponderar o grau de influencia desta componente de risco na funcao utilidade.

Para o procedimento de inferencia utilizou-se uma versao discretizada desta funcao a

partir de uma particao da regiao D em estudo em M sub-intervalos.

Utilizou-se a abordagem Bayesiana e aproximou-se esta integral a partir de simulacoes

da distribuicao a posteriori dos parametros do modelo e das respectivas distribuicoes pre-

ditivas. O modelo Geoestatıstico apresentado no Capıtulo 3 foi utilizado e o procedimento

de inferencia seguiu a abordagem de MCMC em modelo aumentado, conforme descrito na

Secao anterior. Para a media do processo utilizou-se uma priori flat e considerou-se prioris

recıprocas para σ2 e φ. Para τ 2rel = τ2

σ2 utilizou-se uma distribuicao U[0,1].

Para a realizacao da inferencia foram utilizadas versoes discretizadas aproximadas das

distribuicoes dos parametros do modelo com o auxılio do pacote GeoR (www.R-project.org).

Os dados de infestacao utilizados neste estudo referem-se aos estudos do LIRAa realiza-

36

dos entre 02/01/2005 e 05/11/2009 na cidade do Rio de Janeiro, totalizando 18 levantamentos

(y1, ..., y18). Estes dados estao disponibilizados do site da Secretaria Municipal de Saude do

municıpio do Rio de Janeiro (www.saude.rio.rj.gov.br). Para a analise dos dados realizou-se

uma transformacao na variavel de infestacao de forma a permitir o ajuste e as predicoes

supondo um processo Gaussiano subjacente.

Foram utilizadas 5000 amostras simuladas das distribuicoes a posteriori dos parametros

do modelo para obtencao das distribuicoes preditivas e para o calculo da funcao utilidade.

A Figura 5.1 apresenta os ındices de infestacao observados bem como os valores preditos

para o perıodo estudado e seus respectivos intervalos de 95% de credibilidade.

Figura 5.1: Valores observados (cırculos), preditos (linha) e respectivos IC 95% (linha tracejada)

para a serie de infestacao do Aedes aegypti na cidade do Rio de Janeiro.

A reducao na variancia preditiva baseou-se em uma particao de 341 instantes de tempo

entre nov/2009 e jun/2010 e as medias encontradas foram utilizadas no calculo da funcao

utilidade de cada candidato a ponto do plano amostral. O valor de a utilizado foi 4%, baseado

nos patamares de alerta atualmente empregados e recomendados pelo Ministerio da Saude

no Brasil. A probabilidade maxima aceitavel para este risco foi fixada em pa = 0, 3.

A Figura 5.2 apresenta a distribuicao artificial de d obtida a partir de 10.000 amostras

simuladas considerando-se α = 100. Pode-se observar que a moda da distribuicao encontra-se

37

no intervalo de 12/mar a 22/mar de 2010, evidenciando que o instante otimo para realizacao

de nova coleta deveria se dar em torno de 135 dias apos a ultima coleta. Alguns estudos de

simulacao demonstraram que a decisao de escolha e sensıvel a escolha do valor de α.

Figura 5.2: Histograma das amostras da distribuicao artificial h(d), onde o eixo das abscissas

representa o numero de dias apos a realizacao do ultimo LIRAa.

O elevado custo computacional ao se realizar simulacoes das distribuicoes preditivas

para obtencao das variancias preditivas medias e o principal desafio desta metodologia, o

que nos evidencia a necessidade de utilizacao de metodos aproximados de inferencia. As

discretizacoes das distribuicoes a priori dos parametros do modelo permite a obtencao de

distribuicoes a posteriori discretas, as quais sao utilizadas para geracao das distribuicoes

preditivas de S. Apesar da metodologia depender do nıvel de discretizacao utilizado, estudos

de sensibilidade mostraram que este efeito nao alterava a escolha do novo instante para o

planejamento amostral. Os parametros associados ao custo e ao risco de surtos de infestacoes

se mostraram bastante flexıveis e se configuram como opcao para atender as exigencias de

orgaos de saude que necessitem otimizar seus recursos fısicos e financeiros.

38

Capıtulo 6

Geoestatıstica sob Efeito de

Amostragem Preferencial

Na literatura Geoestatıstica em geral, costuma-se considerar os pontos amostrais x como

fixos ou, caso oriundos de um processo estocastico, independentes do processo S(x) (ver, por

exemplo, Banerjee et al., 2004; Diggle e Ribeiro, 2007).

No caso em que o planejamento amostral e estocastico, temos que especificar a distri-

buicao de [Y, S,X]. Seguindo a abordagem de Diggle et al. (2010), temos um processo sob

amostragem nao-preferencial se

[S, Y,X] = [Y | S,X][S,X] = [Y | S,X][S][X],

isto e, o planejamento amostral e independente do processo espacial em estudo. Nesta si-

tuacao, pode-se utilizar os metodos tradicionais de Geoestatıstica para realizacao da in-

ferencia para os parametros envolvidos.

Por outro lado, denomina-se amostragem preferencial o caso onde [S,X] 6= [S][X].

Assim, o modelo sob amostragem preferencial assume que o processo espacial S e observado

com ruıdo em pontos do planejamento amostral oriundos de um processo pontual X, cuja

39

distribuicao depende de S.

A classe de modelos sob amostragem preferencial proposta por Diggle et al. (2010)

adiciona as seguintes suposicoes ao modelo Geoestatıstico apresentado no Capıtulo 3:

1. Condicional a S, X e um processo de Cox log-Gaussiano, com intensidade

λ(x) = expα + βS(x); (6.1)

2. Condicional a [S,X], Yi ∼ N [µ+ S(xi), τ2].

Quando β = 0, temos um processo de Poisson com intensidade exp(α). Adicionalmente,

assumindo-se que µ = 0, pode-se mostrar que

[S(xi) | xi, θ] ∼ N(βσ2, σ2)

[Yi | xi, θ] ∼ N(βσ2, σ2 + τ 2)

nos locais xi onde foram tomadas observacoes Yi, i = 1, ..., n. Em outras palavras, o valor

do processo Gaussiano S em um local observado xi e influenciado de forma proporcional ao

valor de β.

Sob o ponto de vista Bayesiano, a inferencia para os parametros θ = (µ, φ, σ2, τ 2) e

feita por meio da distribuicao a posteriori

p(θ | y) ∝ p(x,y, θ)

=

∫p(x,y, θ, S)dS

=

∫p(y | S, θ,x)p(x | θ, S)p(S | θ)p(θ)dS

=

∫p(y | Sy, θ)p(x | S)p(S | θ)p(θ)dS,

40

onde Sy representa o vetor de valores de S associados aos locais x onde foram observados os

valores y. Para os parametros α e β atribuımos prioris normais vagas.

E importante notar que, para obtencao de p[x | S], precisarıamos dos valores de S em

todos os locais x ∈ D. Diggle et al. (2010) apresenta uma forma para avaliar esta distribuicao

utilizando uma fina discretizacao da regiao D. Neste caso, particiona-se a regiao em estudo

em M celulas com centroides xi, i = 1, ...,M , onde espera-se que, no maximo, um ponto

amostral esteja localizado em cada celula. Neste caso, o modelo completo e modificado para

[y | Sy, θ] ∼ N(1µ+ Sy, τ2In)

p(x | S, θ) ∝n∏i=1

exp(α + βS(xi)) exp(−∑i

∆i exp(α + βS(xi)))

[S | θ] ∼ N(0, σ2RM),

onde ∆i representa o comprimento, a area ou volume da celula (ou sub-regiao) i, de acordo

com a dimensao da regiao em estudo D.

Uma dificuldade da abordagem de Diggle et al. (2008) ocorre na ausencia de efeito

pepita, isto e, quando τ 2 = 0. Como o metodo de inferencia avalia a funcao de verossimilhanca

baseando-se em medias de simulacoes de S, as mesmas tornam-se incompatıveis com os valores

observados Y na ausencia deste efeito. O mesmo ocorre quando τ 2/σ2 e pequeno.

Sob o enfoque Bayesiano, precisamos obter as distribuicoes a posteriori para fazer

inferencia acerca dos parametros do modelo. Como as distribuicoes a posteriori destes

parametros nao possuem forma fechada, podemos aproxima-las utilizando MCMC.

Baseando-se no procedimento descrito por Diggle et al. (2010), podemos realizar a

inferencia sem a exigencia de que apenas um ponto amostral pertenca a cada celula. Proce-

dendo desta forma, o numero de eventos que ocorrem na sub-regiao i, condicional ao valor

de S(xi), tera uma distribuicao Poisson e a funcao de verossimilhanca de x sera dada por

41

p(x | S, α, β) ∝M∏i=1

[exp(α + βS(xi))]ni exp(−

∑i

∆i exp(α + βS(xi))). (6.2)

Os aspectos computacionais que envolvem o procedimento de inferencia sao implemen-

tados a partir desta particao.

Supondo que a particao da regiao D seja regular, isto e, ∆i = ∆, ∀i, temos o seguinte

modelo completo:

[y | Sy, µ, τ−2] ∼ N(1µ+ Sy, τ

2In),

p(x | S, α, β) ∝M∏i=1

[exp(α + βS(xi))]ni exp(−∆

M∑i=1

exp(α + βS(xi))),

[S | σ−2, φ] ∼ N(0, σ2RM),

onde as prioris para os parametros do modelo sao µ ∼ N(0, k), τ−2 ∼ Gama(aτ , bτ ), σ−2 ∼

Gama(aσ, bσ), φ ∼ Gama(aφ, bφ), α ∼ N(0, k) e β ∼ N(0, k).

As distribuicoes condicionais completas dos parametros µ, τ−2 e σ−2 sao dadas pelas

mesmas expressoes obtidas no caso de amostragem nao-preferencial. O mesmo tambem

acontece com a distribuicao condicional completa do parametro de alcance φ.

Por outro lado, as distribuicoes condicionais completas de S, β e α tornam-se

p(S | µ, τ−2, σ−2, φ, α, β,x,y) ∝ exp− 1

2τ2[S ′ySy − 2S ′y(y − µ1)] + βS ′n− S′R−1

M S

2σ2

×

× exp−∆eα

∑M exp(βS(xi))

,

p(β | S, µ, τ−2, σ−2, φ, α,x,y) ∝ p(x | S, α, β)p(β) ∝ expβS ′yn−∆eα

∑M exp(βS(xi))− β2

2k

,

p(α | S, µ, τ−2, σ−2, φ, β,x,y) ∝ expnα−∆eα

∑M exp(βS(xi))− α2

2k

e sao atualizadas por passos de Metropolis com propostas Gaussianas centradas nos valores

42

da iteracao anterior, onde as probabilidades de aceitacao das propostas no MCMC sao,

respectivamente, dadas por

pS = exp− 1

2τ2[S ′propy Spropy − S ′ySy − 2(Spropy − Sy)′(y − µ1)] + β(Sprop − S)′n

×

× exp

∆eα∑M [exp(βS(xi))− exp(βS(xi)

prop)] +(S′R−1

M S−S′propR−1M Sprop)

2σ2

pβ = exp

(βprop − β)S ′yn + ∆eα∑M(exp(βS(xi))− exp(βpropS(xi))) + (β2−β2prop)

2k

pα = exp

(αprop − α)n+ (eα − eαprop)∆∑M exp(βS(xi)) + (α2−α2prop)

2k

.

Nas expressoes acima, o vetor n′ = (n1, n2, ..., nM) representa o numero de pontos

observados em cada sub-regiao e considera-se que o numero total de pontos observados em

D e dado por∑M

i=1 ni = n.

A obtencao de p[x | S] e bastante custosa computacionalmente e inumeros procedimen-

tos alternativos tem sido propostos na literatura para lidar com este problema. No Capıtulo

9 sao discutidas algumas destas propostas.

Ho and Stoyan (2008) apresentam uma construcao equivalente a metodologia de Diggle

et al. (2010), baseada em processos pontuais marcados (marked point process). Neste caso,

considera-se um processo com duas componentes independentes: um processo pontual X e

um campo aleatorio Z(x), onde as marcas dos pontos x = x1, ..., xn, denotadas por

m(x) = m(x1), ...,m(xn), sao dadas por

m(x) = S(x) + ε(x),

e podem ser interpretadas como os valores do processo Gaussiano subjacente perturbados

por erros i.i.d. tambem Gaussianos. Os autores apresentam os efeitos destas suposicoes no

procedimento de inferencia sob o enfoque frequentista e obtem os momentos de primeira e

segunda ordem associados a este modelo.

43

Diggle et al. (2010) avaliaram a influencia da amostragem preferencial nas predicoes

do processo Gaussiano subjacente utilizando a distribuicao [S|y]. Em outras palavras, utili-

zando o metodo plug-in, foram utilizadas as estimativas de θ nas expressoes do preditor e da

variancia de krigagem para realizacao da predicao espacial. Entretanto, apesar do efeito da

amostragem preferencial ter sido mitigado no processo de estimacao dos parametros do mo-

delo, estas predicoes nao levaram em conta a informacao fornecida por x. Em contrapartida,

a abordagem Bayesiana apresentada neste Capıtulo fornece diretamente amostras da distri-

buicao [S|y,x], a qual e a correta distribuicao preditiva do processo Gaussiano subjacente.

No contexto frequentista, Zidek e Shaddick (2012) apresentam uma metodologia para

correcao do vıcio causado pela amostragem preferencial no contexto do monitoramento am-

biental. Sob o enfoque Bayesiano, Pati et al. (2011) provaram que a utilizacao da priori

impropria p(β) ∝ 1 para β produz uma posteriori propria. Assim, estes autores demonstra-

ram que os dados fornecem informacao para a realizacao da inferencia para este parametro

no modelo, mesmo sob priori nao informativa.

6.1 Estudo de simulacao unidimensional

Para ilustrar os efeitos da amostragem preferencial no processo de inferencia a respeito dos

parametros do processo S, foi realizado um estudo de simulacao considerando uma regiao D

unidimensional definida pelo intervalo [0, 100] e 100 sub-regioes de mesmo comprimento. Os

parametros utilizados na simulacao foram

(α; β;µ;σ2;φ; τ 2; ∆) = (−3; 2; 12; 2; 20; 0.1; 1)

e o tamanho da amostra obtido foi n = 18. A Figura 6.1 apresenta a realizacao do processo

Gaussiano S simulado juntamente com os valores observados y1, ..., y18. Uma vez que β > 0,

as observacoes concentraram-se proximas dos locais onde o processo S apresentava maiores

valores.

44

Figura 6.1: Realizacao do processo simulado unidimensional S+µ (linha cheia) e valores observados

(cırculos).

A partir das observacoes y procedeu-se a inferencia utilizando o metodo de MCMC

apresentado neste Capıtulo. Para permitir uma comparacao, foi realizado tambem o proce-

dimento de inferencia via MCMC sem considerar que as observacoes foram obtidas sob efeito

de amostragem preferencial.

Em ambos os casos foram utilizados os mesmos hiperparametros nas distribuicoes a

priori, a saber, µ ∼ α ∼ β ∼ N(0; 103), τ−2 ∼ σ−2 ∼ Gama(2; 0.5) e φ ∼ Gama(2; 0.05).

Foram utilizadas 500.000 iteracoes no algoritmo MCMC para ambos os modelos, das

quais apenas as 100.000 ultimas foram utilizadas para compor as amostras das distribuicoes

a posteriori dos parametros do modelo. A convergencia das cadeias foi avaliada a partir de

inspecao visual de diferentes cadeias geradas.

As Figuras 6.2 e 6.3 apresentam histogramas das distribuicoes a posteriori de cada um

dos parametros do modelo considerando o efeito da amostragem preferencial. Ja a Figura

45

6.4 apresenta os mesmos resultados para o modelo sem considerar o efeito da amostragem

preferencial.

Figura 6.2: Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito da amos-

tragem preferencial para o processo simulado unidimensional (os cırculos representam os valores

verdadeiros dos parametros).

Analisando-se a Figura 6.2 pode-se observar que as distribuicoes a posteriori encontram-

se concentradas em torno dos valores verdadeiros dos parametros do modelo, exceto para o

caso de σ2. Entretanto, este parametro tambem foi subestimado pelo modelo sem considerar

o efeito da amostragem preferencial.

Conforme pode-se notar na analise da Figura 6.3, a inferencia a respeito dos parametros

que definem o efeito da amostragem preferencial, isto e α e β, foi satisfatoria nesta simulacao.

46

Figura 6.3: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito da

amostragem preferencial para o processo simulado unidimensional (os cırculos representam os va-

lores verdadeiros dos parametros).

A Figura 6.5 apresenta os variogramas estimados por ambos os modelos juntamente com

os seus respectivos intervalos de 95% de credibilidade. Apesar de ambos estarem distantes

do verdadeiro variograma (linha preta), o variograma estimado sob a hipotese de efeito de

amostragem preferencial esta um pouco mais proximo do variograma verdadeiro. Outras

simulacoes realizadas sob as mesmas condicoes apontaram para resultados semelhantes e

algumas destas simulacoes serao apresentadas nas secoes subsequentes.

Entretanto, quando analisamos as predicoes realizadas para o processo S, podemos

observar que o modelo sem considerar o efeito da amostragem preferencial apresenta maior

dificuldade em predizer corretamente valores extremos do processo S. Por outro lado, o mo-

delo que considera o efeito da amostragem preferencial, utilizando-se da vantagem de extrair

informacao da configuracao espacial dos pontos amostrais, permite corrigir suas predicoes

de forma a acomodar valores extremos de S. A Figura 6.6 apresenta os valores preditos de

S, representados pelas medianas a posteriori de S, e os respectivos intervalos de 95% de

credibilidade para cada um dos dois modelos.

Analisando-se a Figura 6.6 pode-se observar que somente os intervalos de credibilidade

do modelo que considera o efeito da amostragem preferencial englobam a maior parte dos

47

Figura 6.4: Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar o

efeito da amostragem preferencial para o processo simulado unidimensional (os cırculos representam

os valores verdadeiros dos parametros).

valores extremos do processo simulado S, em especial no intervalo [0, 30]. Adicionalmente,

pode-se observar que as estimativas pontuais de S nas regioes onde o processo foi pouco ob-

servado sao melhor realizadas pelo modelo que considera o efeito da amostragem preferencial.

Apesar da inferencia a respeito dos parametros do modelo ter influenciado nas diferencas

de predicao observadas entre ambos os modelos, parece razoavel concluir que grande parte

destas diferencas e causada pelas diferencas entre as distribuicoes [S | y] e [S | y,x] utilizadas

na predicao. A fim de avaliar a razoabilidade desta conclusao, procedeu-se a uma segunda

simulacao de inferencia para ambos os modelos. A fim de isolar-se o efeito das diferencas

48

Figura 6.5: Medianas a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo sob

amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o processo simulado

unidimensional. Os cırculos representam o variograma amostral observado e a linha preta representa

o verdadeiro variograma.

Figura 6.6: Processo simulado (linha cheia), mediana a posteriori da distribuicao preditiva (linha

vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para S obtidos con-

siderando (esquerda) e sem considerar (direita) o efeito da amostragem preferencial no processo

simulado unidimensional.

entre as estimativas dos parametros, procedeu-se a predicao S a partir dos verdadeiros valores

dos parametros do modelo.

A Figura 6.7 apresenta os resultados obtidos desta simulacao. Como pode ser obser-

49

vado, mesmo que a predicao seja feita de forma condicional ao conhecimento dos parametros

do modelo, a utilizacao das distribuicoes preditivas [S | y,x, θ] e [S | y, θ] produz resultados

significativamente diferentes. No caso especıfico desta simulacao, pode-se observar que a in-

certeza associada as regioes que encontram-se razoavelmente distantes dos pontos amostrados

e maior quando nao consideramos o efeito da amostragem preferencial.

Figura 6.7: Processo simulado (linha cheia), medias a posteriori da distribuicao preditiva (linha

vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para S obtidos pe-

las distribuicoes preditivas [S | y,x, θ] (esquerda) e [S | y, θ] (direita) para o processo simulado

unidimensional.

6.2 Estudo de simulacao bidimensional I

A fim de avaliar os efeitos da amostragem preferencial quando D ⊂ <2 realizou-se uma

simulacao de um processo Gaussiano sobre a regiao D = [0, 100] × [0, 100]. A regiao D foi

particionada em 225 sub-regioes e os parametros utilizados foram os seguintes

(α; β;µ;σ2;φ; τ 2; ∆) =

(−8; 2; 12; 2; 20; 0.1;

20

3

).

A Figura 6.8 apresenta a realizacao do processo Gaussiano S simulado sobre a regiao

de estudo. A partir de um conjunto de 12 observacoes y procedeu-se a inferencia para ambos

50

os casos estudados, isto e, considerando e deixando de considerar o efeito da amostragem

preferencial.

Figura 6.8: Realizacao do processo simulado bidimensional I juntamente com as posicoes das amos-

tras observadas (cırculos).

Em ambos os casos foram utilizados os mesmos hiperparametros utilizados na simulacao

unidimensional. Foram monitoradas 400.000 iteracoes no algoritmo MCMC para ambos os

modelos e as 50.000 ultimas foram utilizadas para compor as amostras das distribuicoes a

posteriori dos parametros do modelo.

As Figuras 6.9 e 6.10 apresentam histogramas das distribuicoes a posteriori de cada um

dos parametros do modelo sob amostragem preferencial e a Figura 6.11 apresenta os mesmos

resultados para o modelo sem considerar o efeito da amostragem preferencial.

Analisando-se as Figura 6.9 e 6.11 pode-se observar que as distribuicoes a posteriori

nao se encontram concentradas em torno dos valores verdadeiros de todos os parametros do

modelo. Esta dificuldade e parcialmente justificada tendo-se em vista que o tamanho da

amostra e muito pequeno. Entretanto, e interessante observar que, mesmo nestas condicoes,

os resultados obtidos pelo modelo supondo a existencia do efeito de amostragem preferencial

foram mais satisfatorios. Isto pode ser claramente observado na analise das distribuicoes

a posteriori de φ, µ e σ2. Uma boa inferencia para o parametro µ e de especial interesse,

uma vez que este parametro tendera a ser superestimado nas situacoes em que β > 0 (ou

51

Figura 6.9: Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito da amos-

tragem preferencial para o processo simulado bidimensional I (os cırculos representam os valores

verdadeiros dos parametros).

subestimado, quando β < 0).

No que diz respeito aos parametros α e β, a Figura 6.10 evidencia que ambos foram

estimados de forma satisfatoria.

A Figura 6.12 apresenta os variogramas estimados por ambos os modelos juntamente

com os seus respectivos intervalos de 95% de credibilidade. Neste caso, o IC 95% obtido para

o variograma estimado supondo a existencia de efeito da amostragem preferencial engloba o

verdadeiro variograma. Em contrapartida, o variograma estimado sem considerar este efeito

se aproxima do variograma amostral, o qual encontra-se distante do verdadeiro.

52

Figura 6.10: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito

da amostragem preferencial para o processo simulado bidimensional I (os cırculos representam os

valores verdadeiros dos parametros).

Por fim, a Figura 6.13 apresenta as superfıcies preditas de S, representadas pelas medias

a posteriori obtidas por cada modelo.

Analisando-se esta figura pode-se observar que apenas o modelo que considera o efeito da

amostragem preferencial consegue captar regioes onde o processo subjacente declina. Ape-

sar de tambem ser influenciado pela pequena amostra observada, este modelo consegue ir

alem das previsoes em torno da media, conforme as predicoes tradicionalmente obtidas em

Geoestatıstica.

6.3 Estudo de simulacao bidimensional II

A proxima simulacao utiliza uma grade mais fina que a grade apresentada na simulacao

anterior, passando de 225 para 400 sub-regioes. Os parametros utilizados nesta simulacao

foram os mesmos utilizados na simulacao bidimensional I, exceto ∆ = 5, e foram produzidas

17 observacoes sob efeito de amostragem preferencial. A Figura 6.14 apresenta a realizacao

deste processo sobre a regiao de estudo.

Mais uma vez procedeu-se a inferencia pelos dois metodos utilizando-se os mesmos hi-

53


efeito da amostragem preferencial para o processo simulado bidimensional I (os cırculos representam


perparametros das simulacoes anteriores. Foram monitoradas 200.000 iteracoes no algoritmo

MCMC para ambos os modelos e as 30.000 ultimas foram utilizadas para compor as amostras

das distribuicoes a posteriori dos parametros do modelo.

As Figuras 6.15, 6.16 e 6.17 apresentam os histogramas das distribuicoes a posteriori

para cada um dos parametros dos modelos considerados.

Analisando-se as distribuicoes a posteriori obtidas, pode-se concluir que, exceto para

σ2 e µ, os demais parametros foram razoavelmente bem estimados por ambos os modelos.

Especificamente no caso do parametro µ, mais uma vez o modelo sem considerar o efeito da

54

Figura 6.12: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo sob

amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o processo simulado

bidimensional I . Os cırculos representam o variograma amostral observado e a linha preta representa

o verdadeiro variograma.

Figura 6.13: Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem con-

siderar (direita) o efeito da amostragem preferencial para o processo simulado bidimensional I.

amostragem preferencial superestimou-o significativamente. Entretanto, ambos os modelos

nao foram capazes de estimar σ2 de forma satisfatoria, apesar de uma pequena vantagem

para o modelo sob amostragem preferencial ter sido observada. No que diz respeito aos

parametros α e β, considerou-se o resultado satisfatorio, uma vez que os valores verdadeiros

destes parametros encontram-se entre os quantis de 2.5 % e 95% das distribuicoes a posteriori

55

Figura 6.14: Realizacao do processo simulado bidimensional II juntamente com as posicoes das

amostras observadas (cırculos).

obtidas.

A Figura 6.18 apresenta os variogramas estimados por ambos os modelos juntamente

com os seus respectivos intervalos de 95% de credibilidade. Apesar do variograma verdadeiro

nao estar contido dentro dos limites de 95% do intervalo de credibilidade, o modelo consi-

derando o efeito da amostragem preferencial apresenta estimativas mais satisfatorias quando

comparado com o modelo sem considerar este efeito.

Por fim, comparou-se as superfıcies preditas pela media a posteriori de S de ambos os

modelos. Pode-se observar na Figura 6.19 que, apesar de ambas as predicoes suavizarem os

valores de S, apenas o modelo que considera o efeito da amostragem preferencial consegue

captar o padrao da distribuicao espacial do processo subjacente, em especial na parte sul da

regiao de estudo.

6.4 Consideracoes a respeito das simulacoes

Apos a realizacao das simulacoes foi possıvel concluir que a inferencia realizada sob amos-

tragem preferencial e complexa, dependendo de fatores ligados a intensidade deste efeito, da

56

Figura 6.15: Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito da

amostragem preferencial para o processo simulado bidimensional II (os cırculos representam os


configuracao do planejamento amostral e tambem do nıvel de discretizacao utilizado para

obtencao das distribuicoes a posteriori.

Em relacao ao nıvel da discretizacao, as simulacoes evidenciaram que a utilizacao de

100 sub-regioes no caso unidimensional e 225 no caso bidimensional foram suficientes para

produzir boas estimativas dos parametros envolvidos nos processos. Especificamente no caso

bidimensional, uma discretizacao um pouco mais fina (simulacao bidimensional II), com

400 sub-regioes, nao produziu ganhos significativamente superiores aos obtidos com 225 (si-

mulacao bidimensional I).

57

Figura 6.16: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito

da amostragem preferencial para o processo simulado bidimensional II (os cırculos representam os


Tambem e importante mencionar que as simulacoes apresentadas neste Capıtulo refle-

tiram situacoes onde o numero de pontos amostrais observados nao era elevado. Entretanto,

mesmo nestas condicoes, a utilizacao dos modelos supondo a existencia da amostragem prefe-

rencial produziu variogramas e superfıcies de krigagem, em geral, mais proximas dos valores

verdadeiros quando comparadas as estimativas produzidas sem considerar este efeito.

Outra grande vantagem da utilizacao destes modelos esta na correcao produzida na

inferencia a respeito da media do processo subjacente µ. Este resultado foi satisfatorio prin-

cipalmente no caso de pequenas amostras, onde as estimativas tradicionais deste parametro

tendem a ser superestimadas (ou subestimadas, quando β < 0).

Por fim, tambem foi observada a capacidade que este modelo possui de identificar areas

da regiao de estudo onde o processo subjacente assume valores extremos, mesmo nas situacoes

em que nao dispomos de amostras proximas.

A comparacao entre as predicoes supondo θ conhecido reforcou a conclusao de que

que um metodo baseado na simples correcao de vıcio no variograma nao e suficiente para

reproduzir a verdadeira incerteza associada a distribuicao preditiva do processo subjacente

S. Conclusao equivalente foi obtida no caso da simulacao unidimensional, onde a inferencia

58


efeito da amostragem preferencial para o processo simulado bidimensional II (os cırculos represen-

tam os valores verdadeiros dos parametros).

para os parametros do modelo produziu resultados bastante semelhantes, mas o resultado da

predicao foi significativamente distinto.

Realizando diferentes cenarios simulados de predicao sob efeito de amostragem prefe-

rencial, Gelfand et al. (2012) tambem concluıram que estes efeitos afetam de forma mais

significativa a predicao espacial do que a estimacao dos parametros do modelo. Ainda neste

artigo, eles discutem algumas formas de avaliar os efeitos da amostragem preferencial por

meio da comparacao de duas superfıcies preditas. Uma das formas de comparacao mencio-

nada por estes autores esta associada ao erro quadratico de predicao, produzindo uma medida

59

Figura 6.18: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo

sob amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o processo simu-

lado bidimensional II . Os cırculos representam o variograma amostral observado e a linha preta

representa o verdadeiro variograma.

Figura 6.19: Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem con-

siderar (direita) o efeito da amostragem preferencial para o processo simulado bidimensional II.

local e uma medida global de erro.

O Erro de Predicao Local associado ao local x0, denotado EPL(x0), e definido como

EPL(x0) = E[S(x0)− S(x0)]2,

60

Tabela 6.1: Erro de Predicao Global (EPG) para cada uma das simulacoes realizadas.

Simulacao Sem Amostragem Preferencial Sob Amostragem Preferencial

Unidimensional 0.9496 0.7301

Bidimensional I 2.1336 1.6789

Bidimensional II 1.6214 1.3482

onde S(x0) representa o preditor de S no local x0, isto e, [S(x0) | θ,y]. A partir dos EPL’s,

definimos o Erro de Predicao Global como

EPG =1

|D|

∫D

EPL(x)dx.

A Tabela 6.1 apresenta os valores de EPG para cada uma das simulacoes realizadas.

Com base nesta tabela, pode-se observar a reducao obtida ao se considerar os efeitos da

amostragem preferencial. As Figuras 6.20 e 6.21 detalham um pouco mais este resultado

apresentando a distribuicao do EPL.

Analisando-se a Figura 6.20, podemos observar que os erros de predicao sofrem uma

reducao significativa para o modelo sob amostragem preferencial. Os mapas na Figura 6.21

fornecem conclusoes semelhantes, uma vez que os erros continuam a ser menores nas regioes

onde a magnitude de S e baixa quando o efeito da amostragem preferencial e levado em conta

na modelagem.

Outras simulacoes de utilizacao desta abordagem em situacoes onde efetivamente nao

ha efeito de amostragem preferencial foram tambem realizadas. Nestes casos, em geral,

a utilizacao desta abordagem produziu distribuicoes a posteriori de β centradas no valor

zero e distribuicoes preditivas muito semelhantes aquelas obtidas sem considerar o efeito da

amostragem preferencial. Esta observacao evidencia a utilidade desta abordagem quando

utilizada na forma de um teste de existencia de efeito de amostragem preferencial.

Em contrapartida, nas situacoes em que o planejamento amostral encontra-se irregu-

61

Figura 6.20: Boxplots dos Erros de Predicao Locais (EPL) considerando (esquerda) e sem considerar

(direita) os efeitos da amostragem preferencial no estudo simulado unidimensional.

larmente espacado, com grandes areas sem amostras e sem nenhum indicativo de que exista

justificativa teorica ou empırica para se assumir a existencia de efeito de amostragem prefe-

rencial, a utilizacao desta abordagem pode produzir resultados enganosos.

Nestes casos, a existencia de grandes areas da regiao D sem observacoes conduzira a

subestimacao (quando β > 0) ou superestimacao (quando β < 0) da media do processo e

produzira predicoes tendenciosas, uma vez que o enganoso padrao espacial das amostras sera

levado em conta na estimacao e predicao.

62

Figura 6.21: Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem conside-

rar (direita) os efeitos da amostragem preferencial nos estudos simulados bidimensionais I (acima)

e II (abaixo).

63

Capıtulo 7

Planejamento Amostral Otimo sob

Efeito de Amostragem Preferencial

Baseando-se na abordagem de Muller (1999) descrita no Capıtulo 5, o problema de escolha

do local otimo d∗ do planejamento amostral para processos espaciais cujas observacoes foram

obtidas via amostragem preferencial baseia-se na otimizacao de

U(d) = Eθ,yd|x,y[u(d, θ, yd)]. (7.1)

Para o caso onde a avaliacao de U(d) e realizada com base em simulacoes de θ a partir

de p(θ), temos

U(d) = Eθ,yd [u(d, θ, yd)]

=

∫u(d, θ, yd)p(θ, yd)dθdyd

=

∫u(d, θ, yd)p(yd | θ)p(θ)dθdyd

ou seja, conforme esperado, o planejamento amostral otimo a priori nao depende do processo

pontual gerador de pontos amostrais x. Sendo assim, a influencia da amostragem preferencial

64

nao impacta o planejamento amostral otimo.

Por outro lado, quando estao disponıveis observacoes x e y, utilizamos simulacoes de θ

a partir de p(θ | x,y) para avaliacao de U(d). Assim, temos

U(d) = Eθ,yd|x,y[u(d, θ, yd)]

=

∫u(d, θ, yd)p(θ, yd | x,y)dθdyd

=

∫u(d, θ, yd)p(yd | θ,x,y)p(θ | x,y)dθdyd

onde p(θ | x,y) e obtida conforme apresentado no Capıtulo 6. Por fim, dada a distribuicao

a posteriori de θ e a funcao utilidade, procede-se ao planejamento amostral otimo por meio

da obtencao da moda a posteriori da pseudo-distribuicao de d.

A dificuldade maior nesta etapa consiste em analisar os efeitos da amostragem prefe-

rencial na funcao utilidade u(d, θ, yd). Em muitos casos, a propria avaliacao desta funcao

torna-se nao-trivial.

Conforme observado no Capıtulo anterior, a amostragem preferencial impacta direta-

mente na estimacao da media µ do processo Gaussiano subjacente. Se a funcao utilidade

u(d, θ, yd) depender diretamente deste parametro, como nos casos em que existe uma maior

utilidade quando o processo assume valores extremos, o planejamento amostral otimo sera

grandemente afetado.

Por outro lado, seria esperado que a amostragem preferencial tambem afetasse significa-

tivamente funcoes utilidade definidas de forma a quantificar reducoes de incerteza associadas

ao ponto amostral escolhido. A razao para isto reside no fato da configuracao espacial dos

pontos amostrais tambem fornecer informacao a respeito do processo subjacente. Em outras

palavras, se β > 0 e em determinada sub-regiao D′, D′ ⊂ D, se observa que nao ha pon-

tos amostrais observados, podemos concluir que a magnitude do processo subjacente S(x) e

baixa em x ∈ D′. Conclusoes analogas podem ser obtidas caso β < 0.

Utilizando como exemplo a funcao utilidade definida no Capıtulo 5, precisarıamos in-

65

cluir a informacao obtida por meio da configuracao observada do processo pontual x, isto

e,

u(d, θ, yd) =

∫[V (S(x) | θ,x,y)− V (S | θ,x,y, yd)]dx, (7.2)

e precisarıamos conhecer a variancia da distribuicao de [S | θ,x,y]. Apesar de obtermos

amostras desta distribuicao durante a implementacao do MCMC descrito no Capıtulo 6, nao

temos como obter diretamente estimativas desta variancia a cada iteracao do algoritmo. Para

contornar esta dificuldade uma aproximacao desta distribuicao sera obtida a fim de que seja

possıvel avaliar os impactos da amostragem preferencial no planejamento amostral otimo.

Como alternativa, optou-se por realizar uma simples aproximacao na funcao

p(x | S, α, β) ∝M∏i=1

[exp(α + βS(xi))]ni exp(−∆

∑i

exp(α + βS(xi))).

Mais especificamente, utilizando o resultado da expansao da funcao exponencial em

series de Taylor ate o termo de segunda ordem em torno do ponto zero, foi obtida a seguinte

aproximacao

∑i

exp(α + βS(xi)) ≈ eα(

1M + β1M′S +

β2

2S ′S

).

Inserindo esta aproximacao em p(x | S, α, β), pode-se mostrar que a distribuicao con-

dicional completa de [S | θ,y,x] torna-se Gaussiana com vetor de medias Θ e matriz de

covariancias Σ dados por

Θ = Σ×

(yn − µn)τ−2 + βn−∆βeαn

−∆βeα1N

(7.3)

e

66

Σ =

(τ−2 + ∆β2eα)In +R−1n Rn,NA

−1RN,nR−1n + σ−2R−1

n −R−1n Rn,NA

−1

−A−1RN,nR−1n ∆β2eαIN + A−1

−1

, (7.4)

onde A = σ2RN − σ2RN,nR−1n Rn,N e os vetores n e yn representam o numero de observacoes

e os totais observados em cada sub-regiao de D. Assim, a variancia preditiva para um local

nao-observado xNi pode ser aproximada pelo elemento correspondente da diagonal de Σ, isto

e, ΣNi,Ni .

Caso β = 0, esta matriz torna-se equivalente a matriz de covariancias da distribuicao

preditiva de S tradicionalmente obtida pelos metodos de inferencia em Geoestatıstica, pro-

duzindo

V (SNi | θ,y, x) ≈ σ2RN − σ2RN,n(σ2Rn + Inτ2)−1σ2Rn,N ,

onde os ındices n e N indicam os blocos da matriz de covariancia associados aos locais

observados e nao-observados, respectivamente.

7.1 Estudo de simulacao unidimensional

Utilizando o exemplo simulado apresentado no Capıtulo 6, vamos ilustrar os efeitos da amos-

tragem preferencial no processo de definicao do planejamento amostral otimo unidimensional.

Para posterior avaliacao da funcao utilidade, foi utilizada ainda uma grade auxiliar de 83 pon-

tos para o calculo da reducao media das variancias preditivas.

A partir das amostras das distribuicoes a posteriori foram obtidas as amostras da

pseudo-distribuicao u(d) no caso onde existe a influencia da amostragem preferencial e para

o caso onde este efeito nao esta presente.

A Figura 7.1 apresenta os histogramas da pseudo-distribuicao a posteriori do local

amostral otimo d para o caso onde supomos a presenca do efeito da amostragem preferencial

67

e para o caso onde esta suposicao nao e realizada, respectivamente.

Figura 7.1: Histograma da pseudo-distribuicao a posteriori de d considerando (esquerda) e sem

considerar (direita) o efeito da amostragem preferencial no exemplo simulado unidimensional.

Analisando-se os histogramas pode-se notar que o planejamento amostral otimo sem

considerar o efeito da amostragem preferencial aponta fortemente para a escolha de um local

na regiao menos amostrada da serie, isto e, no intervalo [5, 35]. Por outro lado, quando o efeito

da amostragem preferencial e captado, esta percepcao e totalmente alterada. Neste caso,

exceto no intervalo onde existem varias amostras observadas, os demais intervalos possuem

utilidade esperada aproximadamente equivalentes. Em resumo, a consideracao do efeito

da amostragem preferencial alterou significativamente o processo decisorio do planejamento

amostral otimo.

7.2 Estudo de simulacao bidimensional I

Partindo do caso bidimensional I analisado anteriormente, foram obtidas as amostras da

pseudo-distribuicao u(d) nos casos onde temos a influencia da amostragem preferencial e

para o caso onde este efeito nao esta presente. Foi utilizada ainda uma grade auxiliar de 900

68

pontos para o calculo da reducao media das variancias preditivas para posterior avaliacao da

funcao utilidade.

As Figuras 7.2 e 7.3 apresentam as pseudo-distribuicoes do local amostral otimo d

obtidas para os dois casos. Analisando-se ambas as figuras pode-se notar que as areas com

maior utilidade esperada sao significativamente diferentes para os dois modelos. Conforme

esperado, o planejamento amostral otimo sem considerar o efeito da amostragem preferencial

acaba sendo direcionado para os locais mais distantes dos pontos amostrais observados. Por

outro lado, o modelo que considera estes efeitos distribui as maiores utilidades esperadas

entre varias sub-regioes da regiao D, alocando baixa utilidade apenas nas sub-regioes onde

foram observados os pontos amostrais.

Figura 7.2: Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem preferen-

cial para o exemplo simulado bidimensional I. Os valores da densidade desta pseudo-distribuicao

encontram-se multiplicados por 100 para melhor visualizacao.

69

Figura 7.3: Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem preferen-

cial para o exemplo simulado bidimensional I. Os valores da densidade desta pseudo-distribuicao


7.3 Estudo de simulacao bidimensional II

Por fim, as Figuras 7.4 e 7.5 apresentam as pseudo-distribuicoes do local amostral otimo d

obtidas para os dados da simulacao bidimensional II no caso onde supomos a presenca do

efeito da amostragem preferencial e no caso onde esta suposicao nao e realizada, respecti-

vamente. Foi utilizada ainda uma grade auxiliar de 400 pontos para o calculo da reducao

media das variancias preditivas para posterior avaliacao da funcao utilidade.

Assim como nas simulacoes anteriores, o padrao de alteracao na decisao do planejamento

amostral otimo sob amostragem preferencial parece seguir a mesma direcao, isto e, apontando

para uma distribuicao de utilidades mais homogenea entre os diferentes locais candidatos a

novo ponto amostral.

70

Figura 7.4: Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem preferen-

cial para o exemplo simulado bidimensional II. Os valores da densidade desta pseudo-distribuicao


7.4 Consideracoes a respeito das simulacoes

Apos a realizacao das simulacoes pode-se concluir que a consideracao do efeito da amostra-

gem preferencial altera significativamente o processo decisorio de escolha de um novo ponto

amostral.

Os tres casos simulados envolviam processos cujos resultados obtidos no processo de

inferencia pelos dois modelos variavam significativamente. Curiosamente, mesmo no caso da

simulacao unidimensional, onde os variogramas estimados eram bastante proximos, o pro-

cesso de obtencao do planejamento amostral otimo conduziu a resultados significativamente

distintos.

Por outro lado, e importante lembrar que o tipo de funcao utilidade aplicado tambem

pode produzir diferencas nos resultados. Apesar da funcao utilidade escolhida ser razoavel

71

Figura 7.5: Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem preferen-

cial para o exemplo simulado bidimensional II. Os valores da densidade desta pseudo-distribuicoes

encontra-se multiplicado por 100 para melhor visualizacao.

e intrinsicamente associada aos objetivos da Geoestatıstica, outras funcoes poderiam ser

consideradas. De acordo com os resultados obtidos nesta tese, acredita-se que a utilizacao

de funcoes utilidade que dependam da media do processo subjacente podem ser tambem

bastante impactadas pelos efeitos da amostragem preferencial, conforme sera evidenciado na

aplicacao descrita no Capıtulo 8.

Existem ainda outros fatores com elevado potencial de influencia nos resultados, como

a escolha da malha auxiliar (utilizada para avaliacao da reducao da variancia preditiva),

bem como o nıvel de discretizacao da regiao D em estudo. Entretanto, o elevado custo

computacional associado a aplicacao de metodologias de otimizacao de funcoes torna-se um

desafio e uma barreira para a avaliacao de grau de influencia marginal de cada um destes

efeitos.

Como forma de auxiliar no processo de obtencao do planejamento amostral otimo,

72

pode-se ainda utilizar a estrategia de MCMC com simulated annealing, descrita no Capıtulo

5, para evitar a obtencao de pseudo-distribuicoes U(d) demasiadamente planas e auxiliar na

identificacao das areas com maior utilidade esperada.

7.5 Analise da efetividade do planejamento amostral

otimo

Apos a obtencao do planejamento amostral otimo segundo ambas as abordagens, podemos

avaliar se o resultado indicado pelo modelo sob efeito da amostragem preferencial realmente

produz uma maior reducao na variancia preditiva do processo subjacente S. Em outras

palavras, e de grande interesse avaliar a efetividade da utilizacao desta metodologia em

indicar um local para amostragem que produza maior utilidade (quantificada em termos da

funcao objetivo) para o pesquisador.

Com este intuito, procedeu-se a escolha dos locais apontados por ambos os modelos no

estudo simulado bidimensional I. Os locais para amostragem otima apontados pelos modelos

foram xd = (90.00; 76.66), para o modelo sob amostragem preferencial, e xd = (30.00; 50.00)

para o modelo sem considerar o efeito da amostragem preferencial. A Figura 7.6 apresenta

os locais amostrados que foram considerados para cada modelo.

Para a comparacao entre as abordagens considerou-se tambem que yd = µ+S(xd). Em

outras palavras, as observacoes associadas aos locais otimos foram tomadas sem incorporar

o erro associado ao efeito pepita τ 2. Assim, os valores considerados foram yd = S(xd) + 12 =

11.157 e yd = S(xd) + 12 = 10.719, para os modelos considerando e sem considerar o efeito

da amostragem preferencial, respectivamente.

A Figura 7.7 apresenta as predicoes realizadas apos a observacao do planejamento amos-

tral otimo para ambos os modelos. Assim como nas analises realizadas antes da escolha do

planejamento amostral otimo, os resultados obtidos para o modelo sob efeito de amostra-

gem preferencial foram mais satisfatorios. E interessante notar tambem que a inclusao do

73

Figura 7.6: Locais otimos apontados pelos modelos considerando (esquerda) e sem considerar (di-

reita) os efeitos da amostragem preferencial no estudo simulado bidimensional I.

local otimo apontado pelo modelo sem efeito de amostragem preferencial produziu uma sig-

nificativa melhora das previsoes realizadas na vizinhanca deste local. Contudo, esta escolha

acabou tambem produzindo um aumento no erro de predicao em locais cujo valor do processo

subjacente S era elevado. Por este motivo, os erros de previsao associados ao modelo sob

amostragem preferencial foram menos elevados. Esta constatacao pode ser melhor explorada

analisando-se a Figura 7.8.

A Tabela 7.1 apresenta os Erros de Predicao Globais (EPG) apos a observacao do

planejamento amostral otimo para ambos os modelos. A utilizacao do planejamento amostral

otimo apontado pelo modelo sob efeito de amostragem preferencial continou produzindo um

erro de predicao global inferior, apesar de apresentar um pequeno aumento em relacao a

analise anterior. Este aumento pode ser explicado em virtude da escolha do novo local

otimo de amostragem ter sido obtido de forma intencional. O fato da escolha nao ter sido

realizada a partir da consideracao de um processo pontual subjacente exerce uma influencia

nas posterioris de α e β e provoca um aumento nos erros de predicao.

Por fim, para ilustrar outra vantagem do local otimo apontado pelo modelo sob amos-

tragem preferencial, procedeu-se a inferencia incluindo-o na analise e assumindo o modelo

Geoestatıstico tradicional. Os resultados forneceram um EPG = 2.1719, o qual representa

74

Figura 7.7: Media a posteriori da distribuicao preditiva de S obtidos considerando (esquerda) e sem

considerar (direita) o efeito da amostragem preferencial para o processo simulado bidimensional I

apos a obtencao do planejamento amostral otimo.

Figura 7.8: Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem considerar

(direita) o efeito da amostragem preferencial no exemplo simulado bidimensional I apos a obtencao

do planejamento amostral otimo.

um valor inferior ao obtido utilizando-se o local apontado pelo modelo sem efeito de amos-

tragem preferencial, conforme mostra a Tabela 7.1.

Desta forma, podemos concluir que a utilizacao do local amostral otimo proposto pelo

modelo sob efeito de amostragem preferencial mostrou-se vantajosa mesmo quando a in-

75

Tabela 7.1: Erro de Predicao Global (EPG) no exemplo simulado bidimensional I apos a obtencao

do planejamento amostral otimo apontado por cada um dos modelos considerados.

Modelo Sem efeito de amostragem pref. Sob efeito de amostragem pref.

EPG 2.3348 1.8392

ferencia foi realizada via metodos tradicionais de Geoestatıstica.

76

Capıtulo 8

Aplicacao a Dados de Precipitacao

Pluviometrica no Rio de Janeiro

A metodologia de obtencao do planejamento amostral otimo foi aplicada a um cenario real

no contexto de redes de monitoramento ambientais. Mais especificamente, serao analisados

dados de precipitacao pluviometrica obtidos de 32 estacoes de monitoramento localizadas na

cidade do Rio de Janeiro.

Os dados se referem a precipitacao total (em mm) observada no perıodo de 01 a

31 de Outubro de 2005 e foram obtidos junto ao Instituto Pereira Passos (IPP) pelo site

www.armazemdedados.rio.rj.gov.br (acessado em 04 de setembro de 2012).

A analise da precipitacao no mes de Outubro, epoca do ano na qual inicia-se a estacao

chuvosa na regiao Sudeste do Brasil, e de interesse especial para meteorologistas e orgaos go-

vernamentais (Alves et al., 2005). A Figura 8.1 apresenta o mapa da cidade do Rio de Janeiro

juntamente com os respectivos nıveis de precipitacao (agrupados por quintis) observados no

perıodo de interesse.

A analise da distribuicao espacial das estacoes monitoradoras parece indicar uma maior

concentracao destas em locais onde os nıveis de precipitacao sao mais elevados. Mais pre-

cisamente, o padrao pontual associado as estacoes parece ter sido observado segundo uma

77

Figura 8.1: Precipitacao Pluviometrica na cidade do Rio de Janeiro em Out/2005 (as estacoes estao

separadas de acordo com os quantis de 20%, 40%, 60% e 80% e agrupadas pelas cores azul, verde,

amarelo, marrom e vermelho, respectivamente).

realizacao de um processo de Cox log-Gaussiano (com β > 0). Embora aspectos geograficos

e economicos da cidade tambem possam ser considerados como possıveis causas do planeja-

mento amostral amostral observado, o emprego da metodologia de obtencao do planejamento

amostral otimo sob amostragem preferencial parece adequado para estes dados.

8.1 Predicao espacial

Primeiramente realizou-se a inferencia no intuito de estudar os parametros da covariancia

espacial e obter a superfıcie predita de precipitacao sobre a cidade. Para isto, foram utilizados

o modelo Geoestatıstico tradicional e o modelo sob efeito de amostragem preferencial.

Para a inferencia, foram utilizadas as mesmas prioris utilizadas nos estudos de simulacao

bidimensionais apresentados no Capıtulo 6, exceto por alteracoes nos hiperparametros das

prioris de τ−2 (aτ = 5; bτ = 5), σ−2 (aσ = 1; bσ = 1000) e uma alteracao nos hiperparametros

da priori para φ (aφ = 1; bφ = 0.1), tendo em vista a mudanca de escala deD. Adicionalmente,

78

particionou-se a regiao em estudo em M = 332 sub-regioes.

Foram monitoradas 100.000 iteracoes no algoritmo MCMC para ambos os modelos e as

primeiras 10.000 amostras foram desprezadas. A convergencia das cadeias foi realizada por

meio de inspecao visual de cadeias que partiram de valores iniciais distintos.

Para evitar taxas de aceitacao muito baixas para as propostas de S durante o algoritmo

MCMC, optou-se por amostrar as componentes S1, ..., SM individualmente. Sem perda de

generalidade, suponha que Sy = S1, ..., Sn e SN = Sn+1, ..., SM, onde S = Sy, SN.

Neste caso, a distribuicao condicional completa de Si torna-se

p(Si | S−i, µ, τ−2, σ−2, φ, α, β,x,y) ∝ exp− 1

2τ2[S2i − 2Si(yi − µ)] + βSi −

S′R−1M S

2σ2

×

× exp−∆eα+βSi

, i = 1, ..., n

para os locais onde amostras foram observadas e

p(Si | S−i, µ, τ−2, σ−2, φ, α, β,x,y) ∝ exp−S′pR

−1M Sp

2σ2 −∆eα+βSi

, i = n+ 1, ...,M

para os locais onde nao foram observadas amostras. Assim, os Si’s sao atualizados por passos

de Metropolis com propostas Gaussianas unidimensionais centradas nos valores da iteracao

anterior, onde as probabilidades de aceitacao das propostas no MCMC sao, respectivamente,

dadas por

pSi = exp− 1

2τ2[(S2prop

i − S2i )− 2(Spropi − Si)(yi − µ)] + β(Spropi − Si)−

S′pR−1M Sp−S′R−1

M S

2σ2

×

× exp−∆eα(eβS

propi − eβSi)

, i = 1, ..., n

e

pSi = exp−S′pR

−1M Sp−S′R−1

M S

2σ2 −∆eα(eβSpropi − eβSi)

, i = n+ 1, ...,M.

Na expressao desta distribuicao condicional completa o vetor Sp e dado por Sp =(Sj−1

1 , . . . , Spropi , . . . , Sj−1M

)′, onde j representa o numero da iteracao do MCMC.

A Tabela 8.1 apresenta as medias a posteriori e os respectivos intervalos de 95% de credi-

bilidade para os parametros estimados considerando e sem considerar efeitos de amostragem

preferencial.

79

Tabela 8.1: Media a posteriori e IC 95% (entre parentesis) para os parametros de ambos os modelos.

Parametros do modelo Sob Amostragem Preferencial Sem amostragem preferencial

τ 2 1.25 (0.49 ; 2.90) 1.32 (0.51 ; 3.45)

σ2 4289.92 (2096.31 ; 10528.91) 4132.72 (2120.30 ; 8514.38)

µ 104.84 (97.73 ; 110.60) 119.88 (111.49 ; 130.32)

φ 10.69 (4.27 ; 26.75) 10.43 (4.51 ; 22.76)

α -3.84 (-4.24 ; -3.48) —

β 0.008 (0.002 ; 0.014) —

Os resultados obtidos evidenciam a significancia dos parametros associados ao efeito da

amostragem preferencial, sugerindo uma possıvel associacao entre o plano amostral amostral

e a magnitude da precipitacao no municıpio.

A inferencia para os parametros da estrutura de covariancia espacial resultou em re-

sultados semelhantes, conforme pode ser observado nos variogramas estimados por ambos os

modelos na Figura 8.2.

Figura 8.2: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo

considerando (esquerda) e sem considerar (direita) efeitos da amostragem preferencial para os dados

de precipitacao pluviometrica na cidade do Rio de Janeiro (os cırculos representam o variograma

amostral observado).

80

Em contrapartida, a distribuicao a posteriori da media µ produziu estimativas significa-

tivamente distintas para ambos os modelos. A media estimada pelo modelo sob amostragem

preferencial foi significativamente mais baixa do que a media estimada pelo modelo sem con-

siderar este efeito (104.84 contra 119.88, respectivamente). Este resultado e compatıvel com

a significancia do efeito da amostragem preferencial (β > 0).

Por fim, a Figura 8.3 apresenta as superfıcies preditas de S, representadas pelas medias a

posteriori obtidas por cada um dos modelos. Conforme observado nas simulacoes realizadas

no Capıtulo 6, a incorporacao do efeito da amostragem preferencial produziu diferencas

significativas nas superfıcies preditas. A distincao entre as predicoes torna-se ainda mais

evidente quando comparamos as distribuicoes preditivas [Y | x,y] e [Y | y] (ver Figura 8.4),

uma vez que a media µ estimada para ambos os modelos difere significativamente.

8.2 Planejamento amostral otimo

Para a escolha do planejamento amostral otimo foi utilizada a seguinte funcao utilidade

u(d, θ, yd) = P [Y (xd) > 200 | θ,x,y] = P [S(xd) > 200− µ | θ,x,y], (8.1)

onde xd representa o local associado a yd. Esta funcao associa maior utilidade para locais

onde exista maior probabilidade de que o nıvel de chuva seja elevado, isto e, com preci-

pitacao total no mes de Outubro superior a 200 mm. Esta funcao utilidade pode ser bastante

util quando o interesse do pesquisador e detectar o inıcio da estacao chuvosa por meio da

alocacao de estacoes de monitoramento em pontos da cidade mais sensıveis aos impactos desta

alteracao climatica. As pseudo-distribuicoes a posteriori de d obtidas para cada modelo sao

apresentadas na Figura 8.5.

Uma vez que a funcao utilidade favorece regioes com maior probabilidade de observacao

de eventos extremos, somado ao fato de que a media µ foi superestimada devido ao efeito da

amostragem preferencial, o modelo tradicional de Geoestatıstica concentrou a distribuicao a

81

Figura 8.3: Media a posteriori da distribuicao preditiva de S obtida considerando (acima) e sem

considerar (abaixo) o efeito da amostragem preferencial para os dados de precipitacao pluviometrica

na cidade do Rio de Janeiro.

posteriori de d sobre uma pequena area da cidade. Por outro lado, considerando o efeito da

amostragem preferencial, temos que esta distribuicao encontra-se mais dispersa ao longo do

sudoeste da cidade do Rio de Janeiro.

Os diferentes resultados obtidos reforcam a conclusao de que a amostragem preferencial

82

Figura 8.4: Media a posteriori da distribuicao preditiva de Y obtida considerando (acima) e sem

considerar (abaixo) o efeito da amostragem preferencial para os dados de precipitacao pluviometrica

na cidade do Rio de Janeiro.

produz grandes impactos na obtencao do planejamento amostral otimo, em especial quando

as funcoes utilidade empregadas dependem diretamente da media µ do processo subjacente.

83

Figura 8.5: Pseudo-distribuicao a posteriori de d obtida sob amostragem preferencial (acima) e sem

considerar este efeito (abaixo) para os dados de precipitacao pluviometrica na cidade do Rio de

Janeiro.

84

Capıtulo 9

Amostragem Preferencial com

Repulsao em Geoestatıstica

O modelo desenvolvido por Diggle et al. (2010) para lidar com efeitos de amostragem prefe-

rencial em Geoestatıstica pressupoe que, se β > 0, o numero esperado de pontos amostrais

observados e bastante elevado na vizinhanca de locais onde o processo subjacente assume

valores extremos (ou bastante reduzido, quando β < 0).

Assim, caso a regiao em estudo fosse discretizada, isto e, subdividida em M sub-regioes,

o numero esperado de pontos observados seria bastante elevado em algumas delas.

Entretanto, em muitas situacoes praticas isto pode nao acontecer. E razoavel supor

que um pesquisador, de posse de uma medicao do processo em um determinado local x, nao

buscaria outras observacoes proximas a este local, exceto se existisse o interesse em se estudar

a suavidade do processo, a existencia de efeitos de pequena escala ou ainda possıveis erros

de medicao nas variaveis y. Procedendo desta forma, o plano amostral realizado incluiria,

na pratica, uma janela de repulsao centrada em cada observacao amostral.

Diante deste cenario, pode ser razoavel assumir que, para determinadas particoes da

regiao D em estudo, cada sub-regiao contenha no maximo um ponto amostral. Esta hipotese

se assemelha com o procedimento adotado por Diggle et al. (2010) para acomodar os efeitos

85

da amostragem preferencial (onde previa-se que cada celula deveria ser pequena o bastante

para conter apenas um ponto amostral) e, deste modo, podemos supor uma distribuicao

Bernoulli para a ocorrencia de um evento amostral em cada celula ao inves de utilizar a

distribuicao Poisson.

Neste caso, assumindo que foi realizada uma particao na regiao D em estudo, pode-

mos assumir que, em cada uma das M sub-regioes, um evento pode ocorrer segundo uma

distribuicao Bernoulli com probabilidade de sucesso dada por

pi = P [Xi = 1] = 1− exp(−∆i exp(α + βSi)), (9.1)

onde Xi assume o valor 1 quando um ponto amostral e observado e e igual a zero caso

contrario (i = 1, ...,M). Esta probabilidade pi pode ser interpretada como a probabilidade

de observar-se ao menos 1 (um) ponto na sub-regiao i, caso estes eventos ocorressem em D

segundo um processo de Cox log-Gaussiano com intensidade λ(x) = exp(α + βS(x)).

Sob estas condicoes e condicional ao conhecimento de p = p1, ..., pM, temos que x

e um processo de Bernoulli nao-homogeneo (McDonald, 2004). Assumindo que ∆i = ∆,∀i,

e que p(x | p) =∏M

i=1 pxii (1− pi)1−xi , temos que a funcao de verossimilhanca de [x | S, α, β]

e dada por

p(x | S, α, β) =M∏i=1

[1− exp(−∆ exp(α + βS(xi)))]xi exp

−∆

M∑j=1

(1− xj) exp(α + βS(xj))

=n∏i=1

[1− exp(−∆ exp(α + βSyi(xi)))] exp

−∆

M∑j=1

(1− xj) exp(α + βS(xj))

,

onde xi = 0, 1, para i = 1, ...,M .

As distribuicoes de [y | Sy, µ, τ2] e de S permanecem as mesmas utilizadas no modelo

sob amostragem preferencial, assim como as distribuicoes a priori.

Realizando a inferencia por meio dos metodos MCMC para este modelo, temos que as

86

distribuicoes condicionais completas dos parametros µ, τ−2, σ−2 e φ sao dadas pelas mesmas

expressoes obtidas no Capıtulo 6. Por outro lado, as distribuicoes condicionais completas de

S, β e α sao modificadas para

p(S | µ, τ−2, σ−2, φ, α, β,x,y) ∝∏n

i=1[1− exp(−∆eα+βSyi )]×

× exp∑

yiSyiτ2− nSy

µτ2−

∑S2yi

2τ2−∆

∑M(1− xi) exp(α + βS(xi))−S′R−1

M S

2σ2

,

p(β | S, µ, τ−2, σ−2, φ, α,x,y) ∝ p(x | S, α, β)p(β) ∝∏n


× exp−∆

∑M(1− xi) exp(α + βS(xi))− β2

2k

,

p(α | S, µ, τ−2, σ−2, φ, β,x,y) ∝∏n


× exp−∆

∑M(1− xi) exp(α + βS(xi))− α2

2k

e sao atualizadas por passos de Metropolis com propostas Gaussianas centradas no valor

da iteracao anterior, onde as probabilidades de aceitacao das propostas no MCMC sao,

respectivamente, dadas por

pS = exp

∑yi(S

propyi−Syi )

τ2− n(Spropy − Sy) µ

τ2+

∑(S2yi−S2prop

yi)

2τ2

×

× exp

∆∑M(1− xi)[exp(α + βS(xi))− exp(α + βSprop(xi))] +

(S′R−1M S−S′propR−1

M Sprop)

2σ2

×

×∏n

i=1[1−exp(−∆e

α+βSpropyi )]

[1−exp(−∆eα+βSyi )],

pβ = exp

∆∑M(1− xi)[exp(α + βS(xi))− exp(α + βpropS(xi))] + (β2−β2prop)

2k

×

×∏n

i=1[1−exp(−∆eα+β

propSyi )]

[1−exp(−∆eα+βSyi )]e

pα = exp

∆∑M(1− xi)[exp(α + βS(xi))− exp(αprop + βS(xi))] + (α2−α2prop)

2k

×

×∏n

i=1[1−exp(−∆eα

prop+βSyi )]

[1−exp(−∆eα+βSyi )].

No caso ondeD ⊂ <2, a regiao em estudo pode ser particionada em sub-regioes regulares

com a maior area possıvel de forma a garantir que no maximo um ponto amostral pertenca

a cada uma delas. Neste caso, o valor de ∆ pode ser interpretado com uma estimativa da

87

janela de repulsao presente durante o processo de obtencao da amostra.

Com a utilizacao desta metodologia espera-se uma melhoria na identificacao da magni-

tude de efeitos de amostragem preferencial nos casos em que o arranjo amostral for influen-

ciado por um efeito secundario de repulsao (ou regularidade) espacial.

9.1 Estudo de simulacao

A fim de avaliar os efeitos da amostragem preferencial com repulsao foi realizada uma nova

simulacao considerando D ⊂ <2. De forma analoga a simulacao bidimensional I, discutida no

Capıtulo 6, realizou-se uma simulacao de um processo Gaussiano sobre a regiao D = [0, 100]×

[0, 100] utilizando-se a mesma particao de 225 sub-regioes e considerando os parametros

(α; β;µ;σ2;φ; τ 2; ∆) =

(−7; 3; 12; 2; 20; 0.1;

20

3

).

A partir do modelo sob amostragem preferencial com repulsao, foram obtidas ob-

servacoes y. A fim de permitir uma melhor avaliacao dos resultados, a simulacao foi re-

alizada em duas etapas. Primeiramente foram obtidas amostras dentro de cada sub-regiao

segundo uma distribuicao Poisson com parametro ∆λ(x). Nesta etapa, foram obtidas 914

observacoes distribuıdas entre 225 sub-regioes. Em seguida, procedeu-se a simulacao de ape-

nas uma observacao dentro de cada uma das 58 celulas onde observou-se ao menos 1 (um)

ponto amostral.

A Figura 9.1 apresenta a realizacao do processo Gaussiano S simulado sobre a regiao

de estudo e os locais das amostras obtidas.

Para a inferencia, foram utilizados os mesmos hiperparametros utilizados nas simulacoes

discutidas no Capıtulo 6, exceto para os parametros α e β, cuja variancia foi reduzida para

10 a fim de evitar problemas de nao-identificabilidade.

Foram monitoradas 500.000 iteracoes no algoritmo MCMC para ambos os modelos e

88

Figura 9.1: Realizacao do processo simulado bidimensional sob efeito de amostragem preferencial

com repulsao juntamente com as posicoes das amostras observadas (cırculos).

as 300.000 ultimas foram utilizadas para compor as amostras das distribuicoes a posteriori

dos parametros do modelo. Para fins de comparacao, tambem realizou-se a inferencia sob

amostragem preferencial sem repulsao.

As Figuras 9.2 e 9.3 apresentam os histogramas das distribuicoes a posteriori de α e

β para os modelos sob amostragem preferencial considerando e sem considerar o efeito de

repulsao, respectivamente.

As Figuras 9.2 e 9.3 mostram que o modelo sob amostragem preferencial considerando

o efeito da repulsao produziu distribuicoes a posteriori que englobam os verdadeiros valores

de α e β, com intervalos de 95% de credibilidade dados por (-8.63; -5.376) e (2.275; 6.771),

respectivamente. Por outro lado, o modelo sem efeito de repulsao nao produziu resultados

satisfatorios, fornecendo intervalos de 95% de credibilidade que nao incluem os valores verda-

deiros de α, (-6.541; -5.558), e β, (1.289; 2.681). Apesar da grande amplitude dos intervalos,

os resultados do modelo considerando o efeito da repulsao foram satisfatorios na estimacao

destes parametros.

A Figura 9.4 apresenta os variogramas estimados por ambos os modelos, juntamente

com os seus respectivos intervalos de 95% de credibilidade. Analisando os resultados, temos

que apenas o IC 95% obtido para o variograma estimado sob amostragem preferencial com

89


amostragem preferencial para o processo simulado com efeito de repulsao (os cırculos representam



amostragem preferencial para o processo simulado sem efeito de repulsao (os cırculos representam


repulsao engloba o verdadeiro variograma. Conforme esperado, o variograma estimado sem

considerar o efeito de repulsao se aproxima do variograma amostral, o qual encontra-se dis-

tante do verdadeiro. Como consequencia, temos que a inferencia a respeito dos parametros

que definem a estrutura de covariancia espacial do processo subjacente nao foram estimados

de forma satisfatoria.

90

Figura 9.4: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo sob

amostragem preferencial com repulsao (esquerda) e sem repulsao (direita) para o processo simulado.

Os cırculos representam o variograma amostral observado e a linha preta representa o verdadeiro

variograma.

Por fim, a Figura 9.5 apresenta as superfıcies preditas de S, representados pelas medias

a posteriori obtidas por cada um dos modelos.

Figura 9.5: Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem consi-

derar (direita) o efeito da amostragem preferencial com repulsao para o processo simulado.

Analisando as predicoes, pode-se concluir que ambos os modelos conseguem identificar

as regioes onde o processo subjacente possui menor magnitude, o que nao seria possıvel com a

91

utilizacao do modelo Geoestatıstico tradicional. Entretanto, o modelo que considera o efeito

da repulsao forneceu melhores predicoes, produzindo um EPG igual a 0.7858 contra um EPG

de 0.9681 para o modelo sem o efeito da repulsao.

Adicionalmente, analisando-se a menor distancia observada entre dois pontos amostrais,

podemos estimar a janela de repulsao em 6.667 u.d. (unidades de distancia).

9.2 Consideracoes sobre os resultados

De forma resumida, podemos dizer que o modelo Geoestatıstico sob amostragem preferencial

com repulsao representa um cenario onde o pesquisador, baseado na magnitude do processo

em estudo, planeja uma amostra que contemple ao menos uma observacao nos locais conside-

rados crıticos ou de interesse especial. Nestes casos, parece razoavel supor que a observacao

de mais de 1 (um) ponto amostral nao traria informacao relevante para a estimacao dos

parametros do processo subjacente.

Contudo, a realizacao da inferencia para o modelo Geoestatıstico sob amostragem prefe-

rencial com repulsao mostra-se complexa. Alem do aspecto computacional, outra dificuldade

diz respeito a problemas de nao-identificabilidade dos parametros que definem a intensidade

da amostragem preferencial.

Mesmo na hipotese de conhecimento dos parametros do modelo e dos valores do pro-

cesso subjacente S, a distribuicao a posteriori [α, β | S,x,y, µ, τ 2] forneceria intervalos de

credibilidade muito amplos, conforme mostra a Figura 9.6.

Para uma melhor visualizacao do problema da nao-identificabilidade destes parametros,

foi realizada uma simulacao em uma regiao D discretizada em apenas 16 sub-regioes regulares.

Nesta regiao foi simulado um processo Gaussiano com os mesmos parametros utilizados na

simulacao apresentada na Secao anterior, de onde foram obtidas cinco observacoes.

Foram consideradas duas prioris para os parametros α e β, a saber N(0, 103) e N(0, 10),

doravante denominadas prioris A e B, respectivamente. A Figura 9.7 apresenta a distribuicao

92

Figura 9.6: Curvas de nıvel da distribuicao a posteriori conjunta de α e β, exceto por uma constante,

condicional a S para a simulacao que utiliza a regiao D discretizada em 16 sub-regioes.

a posteriori [α, β | x,y, µ, τ 2] obtida via simulacao segundo cada uma das prioris utilizadas.

Nesta simulacao, foram geradas combinacoes dos parametros (φ, σ2) de suas distribuicoes a

priori para posterior geracao de superfıcies S e avaliacao da integral

p(α, β | x,y, µ, τ 2) ∝∫p(y | Sy, µ, τ

2)p(x | S, α, β)p(S | φ, σ2)p(φ)p(σ2)dφdσ2dS.

Analisando estas distribuicoes a posteriori podemos verificar que a utilizacao da priori

B elimina o problema da nao-identificabilidade, tornando muito improvaveis combinacoes de

(α, β) cujos valores absolutos sejam demasiadamente elevados.

Entretanto torna-se ainda necessario justificar a utilizacao de prioris razoavelmente in-

formativas como a priori B. Um argumento a favor da utilizacao da priori B em situacoes

praticas se deve ao fato de que um pesquisador pode considerar muito pouco plausıvel um

planejamento amostral ter sido obtido com β 0 e α 0. Sob este cenario, seria necessario

assumir que pequenas variacoes na magnitude do processo S no local x seriam determinantes

para a observacao (ou nao) de um ponto amostral em sua vizinhanca. Mais precisamente,

observarıamos amostras em todos os locais x onde S(x) > 0 e nunca observarıamos amostras

nos locais onde S(x) < 0. A consideracao deste cenario seria equivalente a supor que o plane-

93

Figura 9.7: Curvas de nıvel da distribuicao a posteriori conjunta de α e β (exceto por uma constante)

obtida utilizando as prioris A (esquerda) e B (direita) para a simulacao que utiliza a regiao D

discretizada em 16 sub-regioes. O ponto no mapa (em preto) representa o valor verdadeiro do par

de parametros.

jamento amostral nao tenha sido guiado pelo interesse em locais onde o processo subjacente

assumiu valores crıticos, mas sim pelo simples interesse em locais onde este processo esteve

acima (ou abaixo) da media.

Apesar do razoavel nıvel de subjetividade envolvido na especificacao destas prioris,

estas parecem adequadas ao se considerar o nıvel de subjetividade envolvido na especificacao

da funcao de verossimilhanca envolvendo efeitos da amostragem preferencial. Uma discussao

pertinente sobre a subjetividade do modelo e das prioris pode ser encontrado em Kadane

(2011).

Cabe tambem salientar que, a medida que a janela de repulsao ∆ e diminuıda, a proba-

bilidade de observacao de mais de um ponto em cada sub-regiao aproxima-se de zero. No caso

limite, onde ∆ → 0, o modelo torna-se equivalente ao modelo sob amostragem preferencial,

uma vez que as observacoes x comporao um arranjo pontual oriundo de um processo de Cox

log-Gaussiano com intensidade λ(x).

O modelo proposto, portanto, sera apropriado nas situacoes onde a janela ∆ nao pode

ser considerada como pequena o suficiente para uma aproximacao pelo modelo baseado no

94

processo de Cox log-Gaussiano.

Por outro lado, nas situacoes onde a magnitude do processo subjacente exerce pouca

influencia na distribuicao espacial das amostras (isto e, quando β ≈ 0), os efeitos da repulsao

tenderao a ser nao significativos. A realizacao de simulacoes nestas condicoes parecem indicar

que a inferencia produz resultados proximos aos obtidos assumindo-se apenas o efeito da

amostragem preferencial.

Por fim, em situacoes praticas, a aplicabilidade deste modelo pode ser avaliada levando-

se em conta o espacamento mınimo entre as amostras observadas na regiao em estudo, onde

padroes ou regularidades podem ser considerados como indıcios de efeito de repulsao.

Com relacao aos impactos na escolha do planejamento amostral otimo, as simulacoes

realizadas nos Capıtulos 6 e 7 nos permitem afirmar que maiores diferencas na decisao otima

serao esperadas na medida em que as diferencas nas predicoes destes modelos forem mais

acentuadas. Caso β ≈ 0, o planejamento amostral otimo fornecido por ambos os modelos

tendera a ser localizado em uma regiao proxima, uma vez que as diferencas esperadas nas

predicoes seriam pequenas.

95

Capıtulo 10

Conclusoes

Os resultados obtidos nesta tese foram bastante satisfatorios, uma vez que auxiliam o pesqui-

sador a entender melhor a influencia causada pela amostragem preferencial em Geoestatıstica

e, em especial, na tomada de decisao a respeito da escolha de um novo ponto para o plane-

jamento amostral.

A incorporacao e a avaliacao do efeito da amostragem preferencial na Geoestatıstica foi

alvo de polemicas por ser considerado como uma especie de teste de representatividade da

amostra (como argumentou E. Marian Scott na discussao do artigo de Diggle et al., 2010),

uma vez que pretende modelar o vies amostral do pesquisador por um processo estocastico.

Estas crıticas se baseiam no fato de que a obtencao de uma amostra intencional, segundo

algum criterio ou objetivo do pesquisador, de forma alguma poderia ser considerada como

provenientes de uma realizacao aleatoria de um processo pontual, como o processo de Cox

log-Gaussiano. Entretanto, como bem pontuado pelos autores do artigo, esta tentativa de

modelagem torna-se util na medida em que nos possibilita testar a sua adequacao e ainda

por fornecer um maior entendimento das consequencias quando ela prova-se inadequada.

Os resultados do Capıtulo 6 evidenciaram que uma simples correcao no processo de

estimacao dos parametros do modelo Geoestatıstico, usualmente representados na forma do

variograma, nao sao suficientes para garantir uma predicao satisfatoria. Neste sentido, a uti-

96

lizacao da abordagem Bayesiana permite a realizacao desta predicao a partir da distribuicao

[S | y,x], a qual representa a correta distribuicao preditiva do processo subjacente sob efeito

da amostragem preferencial. Apesar do alto custo computacional associado ao processo de

inferencia, a abordagem utilizada se mostrou factıvel computacionalmente e produziu resul-

tados satisfatorios.

Analisando-se o efeito provocado pela influencia da amostragem preferencial no processo

de escolha de um novo ponto amostral, pode-se verificar que este nao pode ser negligenci-

ado. Conforme evidenciaram as simulacoes realizadas, o conhecimento do padrao de arranjo

pontual amostral diminui a variancia preditiva do processo subjacente S em locais pouco

amostrados, alterando substancialmente a decisao otima.

Adicionalmente, sob influencia da amostragem preferencial, funcoes utilidade que de-

pendem diretamente da media do processo tambem sao grandemente afetadas, tendo em

vista o fato deste parametro ser sempre superestimado quando β > 0 (e subestimado quando

β < 0).

Nas situacoes onde se deseja realizar o planejamento amostral de forma sequencial, os

efeitos da amostragem preferencial tenderao a ser mitigados a medida que o procedimento

for realizado. Conforme observado na simulacao bidimensional realizada na Secao 7.5, a

obtencao e posterior observacao de um novo local amostral por meio da maximizacao de

funcoes utilidade produziu um aumento no erro de predicao. Isso ocorre devido a suposicao

erronea de que este local foi obtido segundo um processo aleatorio. Assim, a medida que mais

observacoes sao escolhidas de forma a comporem uma nova amostra de tamanho n∗, n∗ n, a

utilizacao do modelo Geoestatıstico tradicional produzira resultados semelhantes aos obtidos

assumindo-se a existencia de efeito de amostragem preferencial. Nesta situacao, pode-se ainda

especificar uma nova funcao de verossimilhanca p(y∗ | S, θ), onde y∗ = (y1, ..., yn, y∗1, ..., y

∗n)′.

Contudo, a obtencao da distribuicao preditiva [S | y∗,x, θ] tornar-se-ia uma tarefa bastante

complexa.

A opcao da utilizacao da abordagem de Muller (1999) para escolha do planejamento

amostral otimo apresenta grandes vantagens computacionais em relacao a procedimentos

97

de maximizacao baseados em varreduras no espaco de decisoes. Com relacao a escolha de

funcoes utilidades baseadas na reducao da variancia preditiva, estas se justificam pelo inte-

resse especial que a krigagem possui em Geoestatıstica. Entretanto, conforme evidenciado

pela analise das distribuicoes a posteriori nas simulacoes e na aplicacao realizada, as funcoes

utilidade que dependem da media do processo parecem ser ainda mais afetadas pelos efeitos

da amostragem preferencial.

Apesar de nao terem sido tratados nesta tese, problemas advindos da obtencao de

pseudo-distribuicoes a posteriori de d pouco concentradas na moda podem ser minimizados

utilizando-se a abordagem de MCMC com simulated annealing, mencionada no Capıtulo 5,

a qual produz distribuicoes mais concentradas em torno da moda.

O modelo desenvolvido para analisar dados espaciais sob efeito de amostragem prefe-

rencial com repulsao se mostrou util para situacoes praticas, onde nao seria razoavel assumir

que o planejamento amostral tivesse sido guiado exclusivamente por um processo de Cox

log-Gaussiano. Apesar das simulacoes terem produzido resultados satisfatorios, e necessario

ainda realizar um aprofundamento no estudo das caracterısticas e propriedades deste mo-

delo, assim como desenvolver reparametrizacoes em busca da eliminacao dos problemas de

nao-identificabilidade do modelo.

Outros modelos pressupondo efeitos de amostragem preferencial podem ser empregados

a fim de obter-se um melhor ajuste em situacoes praticas. Neste sentido, a abordagem de

Adams et al. (2009), a qual lida com processos de Cox log-Gaussianos sem a necessidade de

utilizar distribuicoes finito-dimensionais para aproximar a distribuicao de [x | S, θ], pode ser

interessante. Esta abordagem utiliza um processo de Cox com a seguinte funcao intensidade

asssociada

λ(x) = λ∗σ(g(x)),

onde λ∗ e um limite superior para λ(x), σ(u) = (1 + e−u)−1 e g(x) e uma funcao escalar

aleatoria com priori dada por um processo Gaussiano. O grande potencial desta metodologia

98

para aplicacao no contexto de Geoestatıstica sob amostragem preferencial esta no fato de

que ela permite a realizacao da inferencia aproximada com uma razoavel flexibilidade, uma

vez que nao e necessario especificar a forma funcional existente entre o processo Gaussiano

subjacente e a funcao intensidade.

Algumas estrategias tambem podem ser adotadas de forma a reduzir o custo compu-

tacional associado a inferencia no modelo Geoestatıstico sob amostragem preferencial e no

processo de obtencao do planejamento amostral otimo. Neste sentido, podemos citar a uti-

lizacao de modelos de processos preditivos para reduzir a dimensao e a complexidade em

modelos espaco-temporais (Banerjee et al., 2008), metodos de aproximacao da funcao de

verossimilhanca (Stein et al., 2004 e Fuentes, 2007) e a utilizacao de matrizes de covariancia

esparsas (Furrer et al., 2006), entre outros.

Por fim, uma estrategia alternativa pode ser a utilizacao do metodo INLA (Integrated

Nested Laplace Aproximation), Rue et al. (2009). Apesar da inferencia em processos de Cox

log-Gaussianos ja ter sido alvo de pesquisas utilizando a abordagem INLA, como a possibi-

lidade de realizar-se a inferencia sem a necessidade da utilizacao de finas discretizacoes da

regiao D (Simpson et al., 2011), pode ser interessante investigar a possibilidade de aplicacao

da metodologia no contexto da influencia da amostragem preferencial na obtencao do plane-

jamento amostral otimo. Outra grande vantagem desta abordagem reside na possibilidade

de utilizacao do pacote r-INLA na interface do software R. Este pacote pode ser obtido em

http://r-inla.org.

99

Referencias Bibliograficas

[1] Adams R.P., Murray I., MacKay D.J.C. (2009). Tractable Nonparametric Bayesian

Inference in Poisson Processes with Gaussian Process Intensities. In Proccedings of the

26th Annual International Conference on Machine Learning, Montreal, Canada.

[2] Alves L.M., Marengo J.A., Junior H.C., Castro C. (2005). Inıcio da estacao chuvosa no

Sudeste do Brasil: Parte 1 - Estudos Observacionais. Revista Brasileira de Meteorologia,

20, 3, 385-394.

[3] Banerjee S., Carlin B.P., Gelfand A.E. (2004). Hierarchical Modeling and Analysis for

Spatial Data. Chapman & Hall/CRC

[4] Banerjee S., Gelfand A.E., Finley A.O., Sang H. (2008). Gaussian predictive process

models for large spatial data sets. Journal of the Royal Statistical Society, B, 70(4),

825-848.

[5] Benes V., Bodlak K., Møller J. (2002). Bayesian analysis of log Gaussian Cox pro-

cesses for disease mapping. Relatorio Tecnico, Centre for Mathematical Physics and

Stochastics - MPS, University of Aarhus.

[6] Boukouvalas A., Cornford D., Stehlık M. (2009). Approximately Optimal Experimen-

tal Design for Heteroscedastic Gaussian Process Models. Unassigned Technical Report

from the Neural Computing Research Group. Aston University, Birmingham, UK, nov.

[7] Brasil, Ministerio da Saude (2005). Diagnostico rapido nos municıpios para vigilancia

entomologica do Aedes aegypti no Brasil - LIRAa: metodologia para avaliacao dos

100

ındices de Breteau e Predial. Serie A, Normas e Manuais Tecnicos. Secretaria de Vi-

gilancia em Saude. Brasılia-DF.

[8] Brix A., Diggle P.J. (2001). Spatiotemporal prediction for log-Gaussian Cox processes.

Journal of the Royal Statistical Society, B, 63(4), 823-841.

[9] Cardenas R.R. (2007). Sobre Algoritmos de Otimizacao Estocasticos: Aplicacoes em

Re-desenho de Redes de Monitoramento e Mapeamento de QTL. Tese de Doutorado

em Estatıstica, UFRJ/IM/DME.

[10] Cressie N. (1993). Statistics for Spatial Data. Revised Edition. Wiley, New York.

[11] DeGroot M.H. (1970). Optimal Statistical Decisions. McGraw-Hill

[12] Diggle P.J. (1983). Statistical Analysis of Spatial Point Patterns. Academic Press, Lon-

don.

[13] Diggle P.J., Lophaven S. (2006). Bayesian geoestatistical design. Scandinavian Journal

of Statistics, 33, p. 53-64.

[14] Diggle P.J., Menezes R., Su T. (2010). Geostatistical inference under preferential sam-

pling. Applied Statistics, 59(2), p. 1-20.

[15] Diggle P., Ribeiro Jr. P.J. (2007). Model-Based Geostatistics. New York: Springer.

[16] Diggle P.J., Tawn J.A., Moyeed R.A. (1998). Model-based geostatistics. Applied Sta-

tistics, 47, p. 299-350.

[17] Ding M., Rosner G.L., Muller P. (2008). Bayesian optimal design for Phase II screening

trials. Biometrics, 64(3), p. 886-894.

[18] Fernandez J.A., Real C., Couto J.A., Aboal J.R., Carballeira A. (2005). The effect of

sampling design on extensive bryomonitoring surveys of air pollution. Science of the

Total Environment, 337, 11-21.

[19] Fuentes M. (2002). Spectral methods for nonstationary spatial processes. Biometrika,

89,1, 197-210.

101

[20] Fuentes M. (2007). Approximate likelihood for large irregularly spaced spatial data.

Journal of the American Statistical Association, 102, 477, 321-331.

[21] Fuentes M., Smith R. (2001). A New class of nonstationary spatial models. Relatorio

tecnico, North Carolina State University.

[22] Furrer R., Genton M.G., Nychka D. (2006). Covariance tapering for interpolation of

large spatial datasets. Journal of Computational & Graphical Statistics, 15, 3, 502-523.

[23] Gamerman D., Lopes H.F. (2006). Markov Chain Monte Carlo - Stochastic Simulation

for Bayesian Inference. Chapman and Hall, 2a Ed.

[24] Gelfand A.E., Sahu S.K., Holland D.M. (2012). On the effect of preferential sampling

in spatial prediction. Environmetrics, 23, 398-409.

[25] Gelfand A.E., Smith A.F.M. (1990). Sampling-based approaches to calculating margi-

nal densities. Journal of the American Statistical Association, 85, 398-409.

[26] Gelman A., Rubin D.B. (1992). Inference from iterative simulation using multiple se-

quences. Statistical Science, 7, 457-472.

[27] Geman S., Geman D. (1984). Stochastic relaxation, Gibbs distributions and the baye-

sian restoration of images. IEEE Transactions on Pattern Analysis and Machine Intel-

ligence, 6, 721-741.

[28] Geweke J. (1992). Evaluating the accuracy of sampling-based approaches to calculating

posterior moments. Em Bayesian Statistics 4, 169-193 (Editors Bernardo, J.M., Berger,

J.O., Dawid, A.P. e Smith, A.F.M.).

[29] Gomes A.C. (1998). Medidas dos nıveis de infestacao urbana para Aedes (Stegomyia)

aegypti e Aedes (Stegomyia) albopictus em programa de vigilancia entomologica. In-

forme Epidemiologico do SUS - IESUS, VII(3), jul/set.

[30] Gumprecht D., Muller W.G., Rodrıguez-Dıaz J.M. (2007). Optimal design for detecting

spatial dependence. IFAS Research Paper Series - Johannes Kepler University Linz, 20,

jan.

102

[31] Haas T.C. (1995). Local prediction of a spatio-temporal process with an application

to wet sulfate deposition. Journal of the American Statistical Association, 90, 432, p.

1189-1199.

[32] Hastings W.K. (1970). Monte Carlo sampling methods using Markov Chains and their

applications. Biometrika, 57, 97-109.

[33] Heikkinen J., Arjas E. (1998). Non-parametric Bayesian estimation of a spatial Poisson

intensity. Scandinavian Journal of Statistics, 25, 435-450.

[34] Heikkinen J., Arjas E. (1999). Modelling a Poisson forest in variable elevations: A

nonparametric Bayesian approach. Biometrics, 55, 738-745.

[35] Higdon D., Swall J., Kern J. (1999). Non-stationary spatial modelling. Em Bayesian

Statistics 6 (J.M. Bernardo, J.O. Berger, A.P. Dawid e A.F.M. Smith), p. 761-768.

Oxford University Press.

[36] Ho L.P., Stoyan D. (2008). Modelling marked point patterns by intensity-marked Cox

processes. Statistics and Probability Letters, 78, p. 1194-1199.

[37] Kadane J.B. (2011). Principles of Uncertainty. Chapman and Hall.

[38] McDonald D. (2004). Elements of Applied Probability: For Engineering, Mathematics

and Systems Science. World Scientific.

[39] Metropolis N., Rosenbulth A.W., Rosenbulth M.N., Teller A.H., Teller E. (1953). Equa-

tion of state calculations by fast computing machine. Journal of Chemical Physics, 21,

1089-1091.

[40] Migon H.S., Gamerman D. (1999). Statistical Inference - an integrated approach. Ar-

nold.

[41] Møller J., Syversveen A.R., Waagepetersen R.P. (1998). Log Gaussian Cox processes.

Scandinavian Journal of Statistics, 25, 451-482.

[42] Møller J., Waagepetersen R.P. (2007). Modern statistics for spatial point processes.

Scandinavian Journal of Statistics, 34, 643-684.

103

[43] Muller P. (1999). Simulation-based optimal design. Em Bayesian Statistics 6 (eds J.M.

Bernardo, J.O. Berger, A.P. Dawid e A.F.M. Smith), p. 459-474. Oxford: Oxford

University Press.

[44] Muller P., Berry D., Grieve A., Smith M., Krams M. (2007). Simulation-based sequen-

tial Bayesian design. Journal of Statistical Planning and Inference, 137, p. 3140-3150.

[45] Muller P., Sanso B., De Iorio M. (2004). Optimal Bayesian design by inhomogeneous

Markov Chain simulation. Journal of the American Statistical Association, 99(467), p.

788-798.

[46] Muller W.G., Stehlık M. (2008). Compound optimal spatial designs. IFAS Research

Paper Series - Johannes Kepler University Linz, 37, out.

[47] Paez M.S., Diggle P.J. (2009). Cox processes for estimating temporal variation in disease

risk. Environmetrics, 20, 981-1003.

[48] Pati D., Reich B.J., Dunson D.B. (2011). Bayesian geoestatistical modelling with in-

formative sampling locations. Biometrika, 98, 1, 35-48.

[49] Ribeiro Jr., P.J. and Diggle, P.J. (2001). geoR: A package for geostatistical analysis.

R-News, 1.

[50] Ripley B.D. (1981) Spatial Statistics. Wiley, New York.

[51] Rue H., Martino S., Chopin N. (2009). Approximate Bayesian inference for latent

Gaussian models using integrated nested Laplace approximations. Journal of the Royal

Statistical Society, B, 71(2), 319-392.

[52] Roberts G.O., Gelman A., Gilks W.R. (1997). Weak convergence and optimal scaling

of random walk Metropolis algorithms. Annals of Applied Probability, 7, 1, 110-120.

[53] Sampson P., Guttorp P. (1992). Nonparametric estimation of nonstationary spatial

covariance structure. Journal of the American Statistical Association, 87, 108-119.

104

[54] Schmidt A.M., O’Hagan A. (2003). Bayesian inference for nonstationary spatial covari-

ance structures via spatial deformations. Journal of the Royal Statistical Society Series

B, 65, 3, 743-758.

[55] Simpson D., Illian J., Lindgren F., Sørbye S.H., Rue H. (2011). Going off grid: Compu-

tationally efficient inference for log-Gaussian Cox processes. Relatorio Tecnico - Depar-

tamento de Ciencias Matematicas da Norwegian University of Science and Technology,

10.

[56] Stein M.L., Chi Z., Welty L.J. (2004). Approximating likelihoods for large spatial data

sets. Journal of the Royal Statistical Society, B, 66(2), 275-296.

[57] Stroud J., Muller P., Rosner G.L. (2001). Optimal sampling times in population phar-

macokinetic studies. Applied Statistics, 50(3), p. 345-359.

[58] Waagepetersen R. (2004). Convergence of posterioris for discretized log Gaussian Cox

processes. Statistics and Probability Letters, 66, 229-235.

[59] Zhu Z., Stein M.L. (2005). Spatial sampling design for parameter estimation of the

covariance function. Journal of Statistical Planning and Inference, 134, 583-603.

[60] Zidek J.V., Shaddick G. (2012). Unbiasing estimates from preferentially sampled spa-

tial data. Relatorio Tecnico, 268, Department of Statistics, The University of British

Columbia, CAN.

[61] Zidek J.V., Sun W., Le N.D. (2000). Designing and integrating composite networks

for monitoring multivariate Gaussian pollution fields. Applied Statistics, 49, Part 1, p.

63-79.

105

Planejamento Amostral Otimo em Geoestat stica sob Efeito ... · (direita) os efeitos da amostragem...

Documents

Transcript of Planejamento Amostral Otimo em Geoestat stica sob Efeito ... · (direita) os efeitos da amostragem...