Planejamento Amostral Otimo em Geoestat stica sob Efeito ... · (direita) os efeitos da amostragem...
Transcript of Planejamento Amostral Otimo em Geoestat stica sob Efeito ... · (direita) os efeitos da amostragem...
Planejamento Amostral Otimo em
Geoestatıstica sob Efeito de Amostragem
Preferencial
Tese de Doutorado
por
Gustavo da Silva Ferreira
Departamento de Metodos Estatısticos
Instituto de Matematica
Universidade Federal do Rio de Janeiro
2013
Planejamento Amostral Otimo emGeoestatıstica sob Efeito de Amostragem
Preferencial
Gustavo da Silva Ferreira
Tese de Doutorado submetida ao Corpo
Docente do Instituto de Matematica - Depar-
tamento de Metodos Estatısticos da Universi-
dade Federal do Rio de Janeiro - UFRJ, como
parte dos requisitos necessarios a obtencao do
grau de Doutor em Estatıstica.
Orientador: Dani Gamerman
Rio de Janeiro, Outubro de 2013
F383g Ferreira, Gustavo da Silva
Planejamento amostral otimo em geoestatıstica sob efeito de amos-
tragem preferencial / Gustavo da Silva Ferreira. - Rio de Janeiro,
2013.
105 f.: il.; 30cm.
Orientador: Dani Gamerman
Tese (doutorado) - UFRJ/Instituto de Matematica, Programa de
Pos-graduacao em Estatıstica, 2013.
Referencias: f.100-105.
1. Geologia-metodos estatısticos - Tese. 2. Amostragem (Es-
tatıstica). I. Gamerman, Dani (Orient.). II. Universidade Federal do
Rio de Janeiro, Instituto de Matematica, Programa de Pos-graduacao
em Estatıstica. III. Tıtulo.
CDD 519.2.
Planejamento Amostral Otimo emGeoestatıstica sob Efeito de Amostragem
Preferencial
Gustavo da Silva Ferreira
Tese de Doutorado submetida ao Corpo Docente do Instituto de Matematica - Depar-
tamento de Metodos Estatısticos da Universidade Federal do Rio de Janeiro - UFRJ, como
parte dos requisitos necessarios a obtencao do grau de Doutor em Estatıstica.
Aprovada por:
Prof. Dani Gamerman, Ph.D., UFRJ
Prof. Helio S. Migon, Ph.D., UFRJ
Prof. Fernando Antonio da Silva Moura, Ph.D., UFRJ
Prof. Sergio Wechsler, Ph.D., USP
Profa. Edna Afonso Reis, Ph.D., UFMG
Rio de Janeiro, Outubro de 2013
Agradecimentos
Aos professores Dani Gamerman e Helio Migon pelos conselhos e por terem acreditado
no meu trabalho do inıcio ao fim.
Aos demais professores do DME/UFRJ pelo conhecimento transmitido e tambem aos
professores Sergio Wechsler e Edna Reis pelas sugestoes e comentarios.
Aos meus colegas de pos-graduacao, em especial Joao, Jony, Kelly, Larissa, Valmaria e
Vera.
Aos meus amigos, em especial Aline, Marinho, Cristiane e meus padrinhos Leo e Thais.
Aos meus irmaos, Guilherme e Gisele, meus primos, tios, sogros e todos os parentes que
torceram muito por mim.
Aos meus pais, Glenio e Graziela, pois tudo que conquistei foi fruto do amor e da
dedicacao de voces.
A minha esposa Carla pelo amor, companheirismo, compreensao e apoio em todos os
momentos e ao meu filho Davi que, mesmo sem saber, teve influencia na conclusao deste
trabalho.
A Deus pela direcao da minha vida.
v
Resumo
Esta tese analisa o efeito da amostragem preferencial em Geoestatıstica quando a esco-
lha de um novo local amostral e o principal interesse do pesquisador. Um criterio Bayesiano
baseado na maximizacao de funcoes utilidade e utilizado. Estudos simulados sao apresen-
tados e evidenciam a grande influencia da amostragem preferencial nas decisoes. Dados de
precipitacao pluviometrica coletados durante a estacao da Primavera no Rio de Janeiro sao
analisados e o planejamento amostral otimo e obtido sob efeito de amostragem preferen-
cial. A complexidade computacional da metodologia e tratada assumindo-se que o novo local
amostral e um parametro do modelo e considerando que a decisao otima e obtida via analise
da sua distribuicao a posteriori. Por fim, algumas modificacoes do modelo sob amostragem
preferencial sao realizadas a fim de se obter maior flexibilidade para situacoes praticas por
meio da inclusao de efeitos de repulsao de pequenas escala. Os resultados mostraram que o
planejamento amostral otimo e substancialmente afetado sob efeito da amostragem preferen-
cial. Adicionalmente, foi possıvel identificar outros aspectos interessantes relacionados aos
efeitos da amostragem preferencial na estimacao e predicao em Geoestatıstica.
Palavras-chave: planejamento amostral otimo; Geoestatıstica; amostragem preferencial;
processos pontuais.
vi
Abstract
This thesis analyses the effect of preferential sampling in Geostatistics when the choice
of new sampling locations is the main interest of the researcher. A Bayesian criteria based
on maximizing utility functions is used. Simulated studies are presented and highlighted
the strong influence of preferential sampling in the decisions. Rainfall data collected during
Spring in Rio de Janeiro are analysed and the optimal design is obtained under preferential
sampling influence. The computacional complexity is faced by treating the new local sampling
as a model parameter and the optimal choice is then made by analysing their posterior
distribution. Finally, some modifications of the model under preferential sampling are made
in order to achieve more flexibility in practical situations through inclusion of small-scale
repulsion effects. The results showed that the optimal design is substantially changed under
preferential sampling effects. Furthermore, it was possible to identify other interesting aspects
related to preferential sampling effects in estimation and prediction in Geostatistics.
keywords: optimal design; Geostatistics; preferential sampling; point process.
vii
Lista de Figuras
5.1 Valores observados (cırculos), preditos (linha) e respectivos IC 95% (linha tracejada)
para a serie de infestacao do Aedes aegypti na cidade do Rio de Janeiro. . . . . . 37
5.2 Histograma das amostras da distribuicao artificial h(d), onde o eixo das abscissas
representa o numero de dias apos a realizacao do ultimo LIRAa. . . . . . . . . . 38
6.1 Realizacao do processo simulado unidimensional S+µ (linha cheia) e valores obser-
vados (cırculos). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.2 Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito
da amostragem preferencial para o processo simulado unidimensional (os cırculos
representam os valores verdadeiros dos parametros). . . . . . . . . . . . . . . . . 46
6.3 Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito
da amostragem preferencial para o processo simulado unidimensional (os cırculos
representam os valores verdadeiros dos parametros). . . . . . . . . . . . . . . . . 47
6.4 Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar
o efeito da amostragem preferencial para o processo simulado unidimensional (os
cırculos representam os valores verdadeiros dos parametros). . . . . . . . . . . . 48
viii
6.5 Medianas a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo
sob amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o
processo simulado unidimensional. Os cırculos representam o variograma amostral
observado e a linha preta representa o verdadeiro variograma. . . . . . . . . . . . 49
6.6 Processo simulado (linha cheia), mediana a posteriori da distribuicao preditiva (linha
vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para S
obtidos considerando (esquerda) e sem considerar (direita) o efeito da amostragem
preferencial no processo simulado unidimensional. . . . . . . . . . . . . . . . . . 49
6.7 Processo simulado (linha cheia), medias a posteriori da distribuicao preditiva (linha
vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para
S obtidos pelas distribuicoes preditivas [S | y,x, θ] (esquerda) e [S | y, θ] (direita)
para o processo simulado unidimensional. . . . . . . . . . . . . . . . . . . . . . 50
6.8 Realizacao do processo simulado bidimensional I juntamente com as posicoes das
amostras observadas (cırculos). . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.9 Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito
da amostragem preferencial para o processo simulado bidimensional I (os cırculos
representam os valores verdadeiros dos parametros). . . . . . . . . . . . . . . . . 52
6.10 Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito
da amostragem preferencial para o processo simulado bidimensional I (os cırculos
representam os valores verdadeiros dos parametros). . . . . . . . . . . . . . . . . 53
6.11 Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar
o efeito da amostragem preferencial para o processo simulado bidimensional I (os
cırculos representam os valores verdadeiros dos parametros). . . . . . . . . . . . 54
6.12 Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo
sob amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o
processo simulado bidimensional I . Os cırculos representam o variograma amostral
observado e a linha preta representa o verdadeiro variograma. . . . . . . . . . . . 55
ix
6.13 Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem
considerar (direita) o efeito da amostragem preferencial para o processo simulado
bidimensional I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.14 Realizacao do processo simulado bidimensional II juntamente com as posicoes das
amostras observadas (cırculos). . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.15 Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito
da amostragem preferencial para o processo simulado bidimensional II (os cırculos
representam os valores verdadeiros dos parametros). . . . . . . . . . . . . . . . . 57
6.16 Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito
da amostragem preferencial para o processo simulado bidimensional II (os cırculos
representam os valores verdadeiros dos parametros). . . . . . . . . . . . . . . . . 58
6.17 Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar
o efeito da amostragem preferencial para o processo simulado bidimensional II (os
cırculos representam os valores verdadeiros dos parametros). . . . . . . . . . . . 59
6.18 Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo
sob amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o
processo simulado bidimensional II . Os cırculos representam o variograma amostral
observado e a linha preta representa o verdadeiro variograma. . . . . . . . . . . . 60
6.19 Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem
considerar (direita) o efeito da amostragem preferencial para o processo simulado
bidimensional II. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.20 Boxplots dos Erros de Predicao Locais (EPL) considerando (esquerda) e sem consi-
derar (direita) os efeitos da amostragem preferencial no estudo simulado unidimen-
sional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
x
6.21 Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem con-
siderar (direita) os efeitos da amostragem preferencial nos estudos simulados bidi-
mensionais I (acima) e II (abaixo). . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1 Histograma da pseudo-distribuicao a posteriori de d considerando (esquerda) e sem
considerar (direita) o efeito da amostragem preferencial no exemplo simulado uni-
dimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
7.2 Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem prefe-
rencial para o exemplo simulado bidimensional I. Os valores da densidade desta
pseudo-distribuicao encontram-se multiplicados por 100 para melhor visualizacao. 69
7.3 Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem pre-
ferencial para o exemplo simulado bidimensional I. Os valores da densidade desta
pseudo-distribuicao encontram-se multiplicados por 100 para melhor visualizacao. 70
7.4 Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem prefe-
rencial para o exemplo simulado bidimensional II. Os valores da densidade desta
pseudo-distribuicao encontram-se multiplicados por 100 para melhor visualizacao. 71
7.5 Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem pre-
ferencial para o exemplo simulado bidimensional II. Os valores da densidade desta
pseudo-distribuicoes encontra-se multiplicado por 100 para melhor visualizacao. . 72
7.6 Locais otimos apontados pelos modelos considerando (esquerda) e sem considerar
(direita) os efeitos da amostragem preferencial no estudo simulado bidimensional I. 74
7.7 Media a posteriori da distribuicao preditiva de S obtidos considerando (esquerda) e
sem considerar (direita) o efeito da amostragem preferencial para o processo simu-
lado bidimensional I apos a obtencao do planejamento amostral otimo. . . . . . . 75
7.8 Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem con-
siderar (direita) o efeito da amostragem preferencial no exemplo simulado bidimen-
sional I apos a obtencao do planejamento amostral otimo. . . . . . . . . . . . . . 75
xi
8.1 Precipitacao Pluviometrica na cidade do Rio de Janeiro em Out/2005 (as estacoes
estao separadas de acordo com os quantis de 20%, 40%, 60% e 80% e agrupadas
pelas cores azul, verde, amarelo, marrom e vermelho, respectivamente). . . . . . . 78
8.2 Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo
considerando (esquerda) e sem considerar (direita) efeitos da amostragem preferen-
cial para os dados de precipitacao pluviometrica na cidade do Rio de Janeiro (os
cırculos representam o variograma amostral observado). . . . . . . . . . . . . . . 80
8.3 Media a posteriori da distribuicao preditiva de S obtida considerando (acima) e
sem considerar (abaixo) o efeito da amostragem preferencial para os dados de pre-
cipitacao pluviometrica na cidade do Rio de Janeiro. . . . . . . . . . . . . . . . 82
8.4 Media a posteriori da distribuicao preditiva de Y obtida considerando (acima) e
sem considerar (abaixo) o efeito da amostragem preferencial para os dados de pre-
cipitacao pluviometrica na cidade do Rio de Janeiro. . . . . . . . . . . . . . . . 83
8.5 Pseudo-distribuicao a posteriori de d obtida sob amostragem preferencial (acima) e
sem considerar este efeito (abaixo) para os dados de precipitacao pluviometrica na
cidade do Rio de Janeiro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
9.1 Realizacao do processo simulado bidimensional sob efeito de amostragem preferen-
cial com repulsao juntamente com as posicoes das amostras observadas (cırculos). 89
9.2 Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito
da amostragem preferencial para o processo simulado com efeito de repulsao (os
cırculos representam os valores verdadeiros dos parametros). . . . . . . . . . . . 90
9.3 Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito
da amostragem preferencial para o processo simulado sem efeito de repulsao (os
cırculos representam os valores verdadeiros dos parametros). . . . . . . . . . . . 90
xii
9.4 Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo
sob amostragem preferencial com repulsao (esquerda) e sem repulsao (direita) para
o processo simulado. Os cırculos representam o variograma amostral observado e a
linha preta representa o verdadeiro variograma. . . . . . . . . . . . . . . . . . . 91
9.5 Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem
considerar (direita) o efeito da amostragem preferencial com repulsao para o processo
simulado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
9.6 Curvas de nıvel da distribuicao a posteriori conjunta de α e β, exceto por uma
constante, condicional a S para a simulacao que utiliza a regiao D discretizada em
16 sub-regioes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.7 Curvas de nıvel da distribuicao a posteriori conjunta de α e β (exceto por uma
constante) obtida utilizando as prioris A (esquerda) e B (direita) para a simulacao
que utiliza a regiao D discretizada em 16 sub-regioes. O ponto no mapa (em preto)
representa o valor verdadeiro do par de parametros. . . . . . . . . . . . . . . . . 94
xiii
Lista de Tabelas
6.1 Erro de Predicao Global (EPG) para cada uma das simulacoes realizadas. . . . . 61
7.1 Erro de Predicao Global (EPG) no exemplo simulado bidimensional I apos a ob-
tencao do planejamento amostral otimo apontado por cada um dos modelos consi-
derados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
8.1 Media a posteriori e IC 95% (entre parentesis) para os parametros de ambos os
modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
xiv
Sumario
1 Introducao 1
1.1 Motivacao da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Contribuicao da tese na literatura . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Potenciais de aplicacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Organizacao da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Inferencia Bayesiana 6
2.1 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2 Estimacao de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Distribuicao preditiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4 Inferencia via simulacao estocastica . . . . . . . . . . . . . . . . . . . . . . . 9
2.5 Inferencia via MCMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5.1 Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5.2 Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Geoestatıstica 14
xv
3.1 Modelo Geoestatıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Processos Gaussianos estacionarios e isotropicos . . . . . . . . . . . . . . . . 15
3.3 Inferencia em processos Gaussianos . . . . . . . . . . . . . . . . . . . . . . . 17
4 Processos Pontuais 21
4.1 Processos pontuais espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2 Processo de Cox e de Cox log-Gaussiano . . . . . . . . . . . . . . . . . . . . 24
4.3 Inferencia em processos pontuais . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.4 Efeitos da discretizacao na inferencia . . . . . . . . . . . . . . . . . . . . . . 25
5 Planejamento Amostral Otimo 27
5.1 Planejamento amostral otimo em Geoestatıstica . . . . . . . . . . . . . . . . 32
5.2 Exemplo: Planejamento amostral otimo no estudo da serie temporal de in-
festacao pelo mosquito Aedes aegypti . . . . . . . . . . . . . . . . . . . . . . 35
6 Geoestatıstica sob Efeito de Amostragem Preferencial 39
6.1 Estudo de simulacao unidimensional . . . . . . . . . . . . . . . . . . . . . . . 44
6.2 Estudo de simulacao bidimensional I . . . . . . . . . . . . . . . . . . . . . . 50
6.3 Estudo de simulacao bidimensional II . . . . . . . . . . . . . . . . . . . . . . 53
6.4 Consideracoes a respeito das simulacoes . . . . . . . . . . . . . . . . . . . . . 56
7 Planejamento Amostral Otimo sob Efeito de Amostragem Preferencial 64
7.1 Estudo de simulacao unidimensional . . . . . . . . . . . . . . . . . . . . . . . 67
xvi
7.2 Estudo de simulacao bidimensional I . . . . . . . . . . . . . . . . . . . . . . 68
7.3 Estudo de simulacao bidimensional II . . . . . . . . . . . . . . . . . . . . . . 70
7.4 Consideracoes a respeito das simulacoes . . . . . . . . . . . . . . . . . . . . . 71
7.5 Analise da efetividade do planejamento amostral otimo . . . . . . . . . . . . 73
8 Aplicacao a Dados de Precipitacao Pluviometrica no Rio de Janeiro 77
8.1 Predicao espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.2 Planejamento amostral otimo . . . . . . . . . . . . . . . . . . . . . . . . . . 81
9 Amostragem Preferencial com Repulsao em Geoestatıstica 85
9.1 Estudo de simulacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
9.2 Consideracoes sobre os resultados . . . . . . . . . . . . . . . . . . . . . . . . 92
10 Conclusoes 96
Referencias Bibliograficas 100
xvii
Capıtulo 1
Introducao
1.1 Motivacao da tese
O projeto de tese ora apresentado foi motivado pelo interesse especial que os efeitos da
amostragem preferencial proporcionam as etapas de uma analise Geoestatıstica.
Neste sentido, o trabalho de Diggle et al. (2010) trouxe uma perspectiva inedita dos
efeitos da amostragem preferencial nos metodos tradicionais de inferencia em Geoestatıstica.
Em Geoestatıstica o pesquisador esta interessado em estudar as caracterısticas de um
processo estocastico S(x) : x ∈ D, onde D representa uma regiao qualquer no espaco
k-dimensional.
Ao contrario do que usualmente se supoe na abordagem tradicional de Geoestatıstica,
sob efeito de amostragem preferencial considera-se que os pontos amostrais x sao dependentes
do processo estocastico subjacente de interesse S(x). Mais especificamente, considera-se que,
condicional a S, X e um processo de Cox log-Gaussiano, com intensidade λ(x) = expα +
βS(x).
A luz deste trabalho, muitas outras perguntas puderam ser levantadas e uma delas diz
respeito a influencia da amostragem preferencial no processo de escolha otima de novos locais
1
para amostragem.
Este processo, tambem conhecido como design otimo, e bastante difundido na literatura
de Estatıstica. Sua aplicacao no contexto de Geoestatıstica possui inumeros artigos recentes,
como os trabalhos de Zidek et al. (2000), Fernandez et al. (2005), Zhu e Stein (2005),
Diggle e Lophaven (2006), Gumprecht et al. (2007), Muller e Stehlık (2008), Boukouvalas
et al. (2009), entre outros. Os avancos produzidos por Muller (1999), Muller et al. (2004)
e Muller et al. (2007), os quais baseiam o planejamento amostral otimo na maximizacao
de funcoes utilidades, sao de especial interesse na pesquisa desenvolvida nesta tese. Por
incorporar de forma natural a abordagem Bayesiana e a utilizacao de metodos de simulacao
intensivos, a metodologia proposta nestes trabalhos torna-se bastante vantajosa no contexto
da Geoestatıstica.
Utilizando-se a informacao fornecida pela configuracao espacial da amostra, pretende-se
mostrar nesta tese que a decisao associada ao planejamento amostral otimo e significativa-
mente alterada quando estamos sob influencia de amostragem preferencial.
1.2 Contribuicao da tese na literatura
Diggle et al. (2010) apresentaram uma metodologia para realizar a inferencia no modelo
Geoestatıstico tradicional sob a hipotese de influencia da amostragem preferencial. Neste
artigo os autores consideraram que o processo de amostragem dos locais observados era
governado por um processo de Cox log-Gaussiano (Moller et al., 1998) e utilizaram metodos
de simulacao para produzir estimativas de maxima verossimilhanca para os parametros do
modelo. Adicionalmente, realizaram simulacoes para avaliar a influencia da amostragem
preferencial no processo de inferencia para os parametros do modelo. Em todos os casos, as
predicoes espaciais foram realizadas pelo metodo plug-in utilizando-se os metodos de krigagem
tradicionais de Geoestatıstica, como aqueles descritos nos trabalhos classicos de Cressie (1993)
e Diggle et al. (1998).
Pati et al. (2011) estendeu a metodologia proposta por Diggle et al. (2010) para o
2
enfoque Bayesiano e, paralelamente ao desenvolvimento desta tese, Gelfand et al. (2012)
apresentaram um artigo avaliando aspectos da amostragem preferencial na predicao espacial,
sugerindo em suas conclusoes que este impacto e mais significativo na predicao do que na
estimacao de parametros.
Nesta tese, detalha-se uma metodologia para realizacao da inferencia em Geoestatıstica
sob amostragem preferencial utilizando o metodo Markov Chain Monte Carlo (MCMC) e
avalia-se, por meio de simulacoes, o impacto deste efeito na estimacao de parametros, na
predicao espacial e na escolha do planejamento amostral otimo.
Em relacao a estimacao, as simulacoes permitiram avaliar a forma como os parametros
do modelo Geoestatıstico sao impactados pelos efeitos da amostragem preferencial. Por outro
lado, na avaliacao do impacto deste efeito sobre a predicao espacial, sao evidenciadas as
vantagens da utilizacao do arranjo amostral observado para realizacao das predicoes. Assim
como nos resultados de Gelfand et al. (2012), as simulacoes realizadas nesta tese tambem
sugerem um impacto maior da amostragem preferencial na predicao.
A avaliacao do impacto da amostragem preferencial na estimacao e predicao de um
processo Gaussiano subjacente sao essenciais para a analise de sua influencia na escolha de
novos locais para amostragem, isto e, no planejamento amostral otimo.
Assim, a maior contribuicao desta tese diz repeito a analise da influencia da amos-
tragem preferencial no processo de obtencao do planejamento amostral otimo em modelos
Geoestatısticos. Em situacoes onde a decisao do pesquisador baseia-se na maximizacao de
funcoes utilidades (Muller, 1999), avalia-se a influencia da amostragem preferencial no pla-
nejamento amostral otimo. Em especial, serao avaliadas situacoes onde deseja-se obter uma
reducao da variancia preditiva do processo Gaussiano subjacente ou nos casos em que existe
o interesse no monitoramento de eventos extremos.
Por fim, na tentativa de avaliar-se melhorias no modelo e torna-lo mais aplicavel a
determinadas situacoes praticas, serao tambem avaliados nesta tese alguns dos impactos da
amostragem preferencial quando tambem considera-se a existencia de um efeito de repulsao
espacial de pequena escala. Neste caso, supoe-se adicionalmente que a observacao de uma
3
amostra em um local x produz um efeito repulsivo que diminui a probabilidade de que outras
amostras sejam observadas na sua vizinhanca.
1.3 Potenciais de aplicacao
Os potenciais de aplicacao englobam o estudo de fenomenos de difıcil deteccao primaria e
aqueles que, por interesse do pesquisador ou por escassez de recursos, so podem ser observados
em locais considerados crıticos. Dentre os fenomenos de difıcil deteccao pode-se destacar o
monitoramento de infestacao de mosquitos ou outras pragas que so tornam-se detectaveis
nos locais em que sua ocorrencia e muito elevada.
O outro potencial de aplicacao reside no monitoramento de fenomenos considerados
crıticos sob o ponto de vista do planejamento ou execucao de atividades influenciadas por es-
tes. Como exemplo, podemos citar o monitoramento da temperatura e precipitacao nos locais
proximos aos aeroportos ou ainda em locais onde objetiva-se estudar ocorrencias extremas
destes fenomenos.
Em ambas as situacoes citadas, parece razoavel inferir que a forma como o fenomeno
e monitorado ou observado esta intimamente relacionada com a intensidade do processo
subjacente. A partir desta hipotese, o problema da escolha otima de um novo local amostral
para simples observacao ou monitoramento sofre alteracoes significativas, uma vez que as
regioes pouco amostradas tornam-se informativas para o pesquisador e produzem alteracoes
na utilidade esperada de cada escolha possıvel.
1.4 Organizacao da tese
No Capıtulo 2 sao apresentados os conceitos basicos de inferencia Bayesiana e os aspectos
computacionais gerais utilizados nesta tese. Os Capıtulos 3 e 4 apresentam um pequeno
resumo das grandes areas da Estatıstica Espacial que serao abordados posteriormente, a sa-
4
ber, Geoestatıstica e Processos Pontuais. O Capıtulo 5 trata da metodologia de obtencao do
planejamento amostral otimo baseada em maximizacao de funcoes utilidades. O Capıtulo 6
apresenta os aspectos da Geoestatıstica sob Amostragem Preferencial e o Capıtulo 7 combina
esta metodologia com a obtencao do planejamento amostral otimo. O Capıtulo 8 apresenta
uma aplicacao no contexto de redes de monitoramento de precipitacao pluviometrica e, por
fim, o Capıtulo 9 trata de uma extensao do modelo Geoestatıstico sob amostragem preferen-
cial incluindo efeitos de repulsao de pequena escala.
5
Capıtulo 2
Inferencia Bayesiana
As conclusoes obtidas atraves da inferencia Bayesiana a respeito de um determinado parametro
θ, ou de uma variavel nao observada y, sao baseadas em especificacoes probabilısticas. Tais
especificacoes sao feitas condicionalmente a uma amostra de valores observados, relacionados
de alguma forma com as quantidades de interesse.
2.1 Teorema de Bayes
Todo o processo de inferencia Bayesiana e baseado na atualizacao da informacao atraves do
Teorema de Bayes.
A descricao apresentada a seguir define o Teorema de Bayes no contexto da inferencia
Bayesiana (Migon e Gamerman, 1999):
Seja H a informacao disponıvel inicialmente para alguma quantidade de interesse. Seja
θ o vetor de parametros desconhecidos que assume valores em Θ. Supondo que a informacao
inicial pode ser expressa em termos probabilısticos p(θ|H), temos uma descricao completa
da incerteza a respeito de θ condicionalmente a informacao inicial H.
Para atualizar a informacao a respeito de θ, podemos observar uma amostra x de um
6
vetor aleatorio X relacionado com θ. Assim, a informacao disponıvel para a inferencia passara
a ser H∗ = H ∩ X = x.
Precisamos ainda conhecer a distribuicao amostral de X para realizar a atualizacao.
Esta distribuicao, leva a funcao de verossimilhanca p(x | θ,H), que associa para cada valor
de θ, a probabilidade de x ser observado.
A partir da especificacao dos elementos da inferencia, temos:
p(θ|H∗) = p(θ|x, H) =p(θ,x|H)
p(x|H)=p(x|θ,H)p(θ|H)
p(x|H)(2.1)
onde p(θ|H) e p(θ|H∗) representam as distribuicoes a priori e posteriori, respectivamente, e
p(x|H) =
∫p(θ,x|H)dθ.
Como p(x|H) nao depende de θ e como H e comum a todos os termos, podemos
reescrever o teorema da seguinte forma:
p(θ|x) ∝ p(x|θ)p(θ). (2.2)
O resultado apresentado em (2.2) e conhecido como Teorema de Bayes e se constitui
como a base de todos os procedimentos da inferencia Bayesiana.
2.2 Estimacao de parametros
O processo de estimacao de parametros pode ser realizado a partir de uma estimacao por
ponto ou por intervalo.
(i) Estimacao Pontual
7
No contexto da inferencia Bayesiana, a estimacao pontual de um determinado parametro
θ pode ser vista como um problema de decisao. Os elementos que compoem este pro-
blema de decisao sao (Migon e Gamerman, 1999):
• espaco de parametros Θ;
• espaco de resultados do experimento Ω;
• espaco de acoes possıveis A.
Uma regra de decisao δ e uma funcao definida em Ω que assume valores em A, tal que
δ : Ω→ A.
Associamos entao uma funcao perda L a cada regra de decisao δ(x), x ∈ Ω, e a cada
possıvel valor de θ ∈ Θ. Assim, temos uma medida de quanto perdemos quando
tomamos a decisao δ(x) e o valor verdadeiro do parametro e θ.
O risco associado a uma determinada regra de decisao δ(x) e obtido tomando-se a
esperanca da funcao perda L(δ, θ) com relacao a distribuicao a posteriori de θ, ou seja,
R(δ) = Eθ|x(L(δ, θ)).
Um estimador pontual de θ e dado pela regra de decisao que minimiza o risco esperado
segundo uma funcao perda especificada.
Os estimadores pontuais associados as perdas quadraticas, perdas absolutas e perdas
zero-um sao a media, a mediana e a moda da distribuicao a posteriori de θ, respectiva-
mente.
(i) Estimacao por Intervalo
Sob o ponto de vista Bayesiano, a forma mais adequada de avaliar a informacao dis-
ponıvel a respeito de uma quantidade desconhecida θ e atraves da distribuicao a pos-
teriori (Migon e Gamerman, 1999). Assim, sumarizar a informacao desta distribuicao
em um unico valor nao fornece ao pesquisador uma medida de quao preciso ele e. Uma
alternativa para este problema e calcular intervalos de credibilidade para estes valores.
Um intervalo de credibilidade Bayesiano e defindo da seguinte maneira:
8
• Seja θ uma quantidade desconhecida em Θ. Uma regiao C ⊂ Θ e um Intervalo de
Credibilidade Bayesiano 100(1− α)% para θ se p(θ ∈ C|x) ≥ 1− α.
Desta forma, o Intervalo de Credibilidade Bayesiano, com nıvel de credibilidade (1−α),
e denotado por IC 100(1− α)%.
2.3 Distribuicao preditiva
O processo de predicao sob a perspectiva Bayesiana e tratado naturalmente atraves da analise
da distribuicao preditiva.
A distribuicao preditiva para um determinado valor y, baseada num conjunto de dados
y, e dada por:
p(y|y) =
∫p(y, θ|y)dθ =
∫p(y|θ,y)p(θ|y)dθ =
∫p(y|θ)p(θ|y)dθ (2.3)
onde a ultima igualdade segue da independencia entre y e y dado θ.
Analisando a forma de obtencao da distribuicao preditiva, podemos ver que ela repre-
senta a verossimilhanca esperada com relacao a distribuicao a posteriori de θ, ou seja,
p(y|y) = Eθ|y[p(y|θ)].
2.4 Inferencia via simulacao estocastica
No contexto da inferencia estatıstica, a simulacao estocastica tem o objetivo de estimar
caracterısticas probabilısticas de modelos ou distribuicoes de interesse que nao podem ser
obtidas analiticamente.
Na inferencia Bayesiana, os metodos de simulacao estao relacionados ao processo de
obtencao de amostras de distribuicoes a posteriori. Nos casos em que lidamos com problemas
9
altamente complexos, em virtude do grande numero de parametros envolvidos, geralmente
temos de recorrer aos metodos de Monte Carlo via Cadeias de Markov para concluırmos o
processo inferencial.
2.5 Inferencia via MCMC
Os metodos computacionais baseados nos metodos de Monte Carlo via Cadeias de Markov
(MCMC) tem sido amplamente utilizados na inferencia Bayesiana quando o pesquisador esta
interessado em simular amostras de uma determinada distribuicao a posteriori, cuja funcao
densidade de probabilidade nao possui forma conhecida ou e demasiadamente complicada.
Em linhas gerais, a ideia basica do metodo e construir uma cadeia de Markov cuja
distribuicao de equilıbrio e igual a distribuicao de interesse. Apos um numero finito de
simulacoes desta cadeia, esperamos atingir a distribuicao de equilıbrio e, a partir deste ponto,
dar origem a uma amostra da distribuicao de interesse.
Considere que θ1, ..., θp possuem densidade conjunta p(θ) = p(θ1, ..., θp) e que q(θ, θ∗)
define a distribuicao condicional das transicoes do estado θ. Assim, e possıvel construir
uma cadeia com probabilidades de transicao invariantes no tempo, onde cada estado pode
ser obtido de um outro estado com um numero finito de iteracoes. Assim, independemente
do estagio inicial, uma tragetoria pode ser gerada e, consequentemente, pode-se alcancar a
distribuicao de equilıbrio p(θ).
Dentre os metodos mais utilizados para a contrucao da cadeia de Markov, temos o
Amostrador de Gibbs, proposto por Geman e Geman (1984) e popularizado por Gelfand e
Smith (1990), e o metodo de Metropolis-Hastings, proposto por Metropolis et al. (1953)
e Hastings (1970). Gamerman e Lopes (2006) apresentam uma descricao detalhada dos
metodos de simulacao baseados nos metodos de Monte Carlo via Cadeias de Markov.
10
2.5.1 Amostrador de Gibbs
O Amostrador de Gibbs e um esquema iterativo de amostragem de uma cadeia de Mar-
kov, cujas probabilidades de transicao dos estados sao realizadas a partir das distribuicoes
condicionais completas.
Considere pi(θi|θ−i) como a funcao densidade condicional de θi, dados os valores de
todos os outros θj’s (j 6= i), e assuma que e possıvel amostrar valores destas distribuicoes
para cada i = 1, ..., p.
A partir disto, especificamos valores iniciais θ0 = (θ01, ..., θ
0p) para todas as quantidades
desconhecidas do modelo. Assim, na j-esima iteracao a cadeia se encontra no estado θ(j) e a
posicao da cadeia na iteracao seguinte (j + 1) e obtida a partir dos seguintes passos:
• gerar θ(j+1)1 de p1(θ1|θ(j)
2 , ..., θ(j)p );
• gerar θ(j+1)2 de p2(θ2|θ(j+1)
1 , θ(j)3 , ..., θ
(j)p );
• repetir sucessivamente os passos anteriores para i = 3, ..., p, onde no ultimo passo
geramos θ(j+1)p de
pp(θp|θ(j+1)1 , θ
(j+1)2 , ..., θ
(j+1)p−1 )
obtendo-se entao o vetor θ(j+1) = (θ(j+1)1 , ..., θ
(j+1)p ).
Sob certas condicoes de regularidade, a distribuicao limite de θ(j) e p(θ).
2.5.2 Metropolis-Hastings
Outro metodo bastante utilizado para a construcao da cadeia e o algoritmo de Metropolis-
Hastings, que e baseado na utilizacao de distribuicoes auxiliares.
Considere q(θ, ·) como um nucleo arbitrario de transicao e assuma que na iteracao (j)
a cadeia se encontra no estado θ(j). Assim, a posicao da cadeia na iteracao (j + 1) sera
denotada por θ(j+1) e e obtida a partir dos seguintes passos:
11
• proponha um movimento da cadeia para o estado θ∗ a partir de q(θ(j), ·);
• aceitar o movimento proposto com probabilidade
α(θ(j),θ(∗)) = min
1,
p(θ∗)/q(θ(j),θ∗)
p(θ(j))/q(θ∗,θ(j))
e fazer θ(j+1) = θ∗ ou rejeitar o movimento com probabilidade 1− α(θ(j),θ(∗)) e fazer
θ(j+1) = θ(j) caso contrario.
Apesar do movimento da cadeia se fazer em blocos para todos os parametros do modelo,
na pratica e muito difıcil encontrar funcoes q(θ, ·) apropriadas quando trabalha-se com mo-
delos de alta dimensionalidade. Uma variacao do algoritmo resolve este problema movendo
uma componente do vetor de parametros θ por vez. Assim, forma-se uma transicao completa
apos o ciclo de p transicoes a partir de funcoes q(θi, ·), para i = 1, ..., p.
Alguns autores indicam como razoaveis taxas de aceitacao entre 20% e 50% das pro-
postas durante o MCMC (Gamerman e Lopes, 2006) e, em determinados cenarios multidi-
mensionais, Roberts et al. (1997) sugerem uma taxa otima de 23.4%.
Apos decidido o metodo a ser utilizado e obtida uma simulacao da cadeia, devemos nos
certificar se a convergencia foi obtida. Somente apos esta confirmacao poderemos formar a
amostra da distribuicao a posteriori das quantidades desconhecidas do modelo.
Existem varias formas de se realizar uma analise da convergencia da cadeia. Uma das
formas e baseada em uma inspecao grafica, onde analisa-se a trajetoria de uma ou mais
cadeias em perıodos distintos de tempo. Neste estudo sera utilizado um criterio semelhante
a este, onde o comportamento de duas cadeias com valores iniciais distintos sera observado
e concluir-se-a que a convergencia foi alcancada quando ambas as cadeias permanecerem em
torno de um mesmo ponto. Criterios mais formais tambem podem ser utilizados, como os
metodos propostos por Gelman e Rubin (1992) e Geweke (1992).
Apos a obtencao da amostra, deve-se analisar a autocorrelacao existente entre θ(j) e
θ(j+1). Como estamos lidando com uma amostra de uma cadeia de Markov, temos uma
amostra aleatoria, mas nao independente. Isto nao afeta as estimativas dos parametros,
12
mas tem influencia sobre as variancias das estimativas resultantes desse procedimento de
amostragem (Gamerman e Lopes, 1997). Portanto, nos casos em que, apos verificada a
convergencia, for constatada uma forte correlacao serial na cadeia, recomenda-se a retirada
de uma amostra sistematica de seus valores para compor uma nova amostra. A forma como
a amostragem sistematica sera realizada pode ser baseada em um grafico contendo a funcao
de autocorrelacao da cadeia.
Apos a verificacao destes itens, a inferencia tem prosseguimento a partir do metodo de
Monte Carlo. A ideia basica deste metodo consiste em estimar o valor de uma integral a partir
da obtencao de seu valor esperado com relacao a alguma distribuicao de probabilidade. Para
se obter, por exemplo, uma estimativa para o valor esperado a posteriori de um parametro θ
do modelo, basta tomar a media das j-esimas componentes dos valores amostrados, ou seja,
θ =
∑j θj
n.
13
Capıtulo 3
Geoestatıstica
Um processo estocastico definido sobre uma regiao D do espaco e chamado de processo espa-
cial. O campo da estatıstica que lida com a inferencia e a predicao de fenomenos modelados
via processos espaciais e conhecido como Estatıstica Espacial.
Segundo Cressie (1993), a Estatıstica Espacial pode ser subdividida em tres grandes
areas, a saber: Padroes de Pontos, Dados de Area e Geoestatıstica.
Na analise de Padroes de Pontos lidamos com fenomenos que podem ser modelados
segundo Processos Pontuais. Neste caso, o interesse do pesquisador reside na analise da
intensidade de ocorrencia de determinados eventos e na avaliacao da existencia de padroes
de agregacao ou repulsao espacial. A analise da ocorrencia de crimes em grandes cidades e o
monitoramento do local de ocorrencia de eventos raros sao exemplos de fenomenos modelados
via Processos Pontuais.
No caso da analise de Dados de Area lidamos com fenomenos que, apesar de poderem
se distribuir de forma contınua no espaco, sao observados em sub-regioes que compoem uma
particao da regiao de interesse. Neste caso, o pesquisador dispoe de medicoes individuais as-
sociadas a cada sub-regiao e possui o interesse em detectar padroes subjacentes ou quantificar
o grau de correlacao espacial na regiao. Dados economicos agregados por bairros, municıpios
e Estados sao exemplos de processos analisados via Dados de Area.
14
Por fim, a Geoestatıstica lida com processos estocasticos definidos em regioes do <d,
onde d usualmente e o plano euclidiano bidimensional. Os Processos Gaussianos sao os mode-
los mais utilizados em Geoestatıstica em virtude das facilidades provenientes das propriedades
da distribuicao Normal multivarida. Fenomenos climatologicos, como temperatura, umidade
e precipitacao sao alguns dos exemplos onde aplicam-se modelos Geoestatısticos. O proximo
Capıtulo apresenta mais detalhes a respeito dos Processos Gaussianos e de sua utilizacao na
Geoestatıstica.
3.1 Modelo Geoestatıstico
Seguindo a abordagem de Diggle et al. (1998), podemos supor que estamos interessados em
estudar as caracterısticas de um processo estocastico S(x) : x ∈ D, onde D representa uma
regiao qualquer no espaco k-dimensional. Adicionalmente podemos supor que o S(x) possui
variancia constante σ2 e funcao de autocorrelacao ρ(S(x), S(x + h);φ), x ∈ D, a qual pode
depender de um (φ) ou mais parametros.
3.2 Processos Gaussianos estacionarios e isotropicos
O processo S e dito Gaussiano se todas as distribuicoes finito-dimensionais (S(x1), ..., S(xn)),
n = 1, 2, ..., sao tambem Gaussianas.
Diz-se que um processo estocastico e estritamente (ou fortemente) estacionario se as
suas respectivas distribuicoes finito-dimensionais sao invariantes a translacao.
Outro tipo de estacionariedade, conhecida como estacionariedade de segunda ordem
(ou estacionariedade fraca), pressupoe apenas que
E[S(x)] = µ, x ∈ D
15
e
ρ(S(x), S(x+ h);φ) = ρ(| h |;φ),
onde x, x+ h ∈ D.
No caso de um processo Gaussiano a estacionariedade de segunda ordem garante a
estacionariedade estrita.
Caso a funcao de autocorrelacao nao dependa da direcao, isto e, for invariante a
rotacoes, dizemos adicionalmente que o processo e isotropico.
Assim, um processo Gaussiano estacionario e isotropico possui variancia constante σ2 e
funcao de autocorrelacao ρ(S(x), S(x+h);φ) = ρ(‖ h ‖;φ), onde ‖ h ‖ representa a distancia
entre quaisquer dois pontos x e x+ h.
Inumeras famılias de funcoes de autocorrelacao podem ser encontradas na literatura,
como em Cressie (1993) e Diggle e Ribeiro (2007). Sem perda de generalidade no que tange
aos objetivos definidos no Capıtulo 1, todos os desenvolvimentos e aplicacoes desta tese
utitilizarao a funcao de autocorrelacao exponencial, definida por:
ρ(‖ h ‖;φ) = exp
(− ‖ h ‖
φ
),
onde φ > 0 e o parametro que representa o alcance da correlacao espacial.
Existem extensoes deste modelo basico de Geoestatıstica, grande parte delas desenvol-
vidas para lidar com falta de estacionariedade ou para permitir o relaxamento da hipotese de
Normalidade do processo estocastico subjacente. Dentre as abordagens para lidar com pro-
cessos nao-estacionarios destacam-se: Hass (1995), que utiliza o conceito de janelas moveis
estacionarias; Higdon et al. (1999), baseada na convolucao de processos estacionarios e
identicos; Fuentes e Smith (2001) e Fuentes (2002), baseadas na convolucao de diferentes
processos estacionarios; e Sampson e Guttorp (1992) e Schmidt e O’Hagan (2003), que utili-
zam a deformacao do espaco para tornar o processo estacionario. Por outro lado, para lidar
com a nao-Normalidade pode-se destacar o trabalho de Diggle et al. (1998), que introduziu
16
os modelos lineares generalizados para processos espaciais. Nesta tese nos restringiremos aos
processos Gaussianos estacionarios subjacentes.
3.3 Inferencia em processos Gaussianos
Assumindo que dispomos de observacoes Yi, i = 1, ..., n, onde
Yi = µ+ S(xi) + Zi
E[Zi] = 0, V ar[Zi] = τ 2,∀i,
podemos interpretar Y = (Y1, ..., Yn) como uma versao do processo S observada com ruıdo.
Vamos supor que o vetor Z e Normalmente distribuıdo e independente do processo S.
Sob o enfoque Bayesiano, precisamos obter as distribuicoes a posteriori para fazer
inferencia acerca dos parametros do modelo. Supondo que θ represente o conjunto de
parametros desconhecidos do modelo, complementamos a verossimilhanca p(y | θ) com uma
distribuicao a priori p(θ) a fim de obtermos a posteriori p(θ | y).
A obtencao da distribuicao a posteriori de [θ | y] e obtida primeiramente verificando-se
que θ = (φ, σ2, τ 2, µ) e que
p(θ | y) ∝ p(y | σ2, τ 2, µ)p(φ)p(σ2)p(τ 2)p(µ)
onde [y | σ2, τ 2, µ] ∼ N(1µ, τ 2In+σ2Rn) e assumindo a independencia a priori entre φ, σ2, τ 2 e
µ. A matriz de autocorrelacoes do processo S entre locais observados (S(x1), S(x2), ..., S(xn))
e representada pela matriz Rn.
Para os parametros φ, σ2 e τ 2 e usual atribuir-se distribuicoes a priori Gama e para µ
uma distribuicao Normal, todas pouco informativas.
17
Como as distribuicoes a posteriori destes parametros nao possuem forma fechada, po-
demos aproxima-las utilizando o metodo MCMC.
Quando existe o interesse adicional em obter-se predicoes do processo S em localizacoes
nao observadas da regiao de estudo D, os aspectos computacionais que envolvem o procedi-
mento de inferencia costumam ser implementados a partir da definicao de uma grade de M
pontos para predicao na regiao em estudo D. Estes M pontos, por sua vez, podem entao ser
considerados como centroides de M sub-regioes ou celulas, as quais definem uma discretizacao
de D. Assim, podemos redefinir o processo Gaussiano subjacente nos centroides destas sub-
regioes, isto e, em S = S1, ..., SM. Adicionalmente, definimos a particao S = Sy, SN
para distinguir o processo subjacente associado aos locais observados e aquele associado aos
locais nao-observados. Esta discretizacao torna a distribuicao de S uma Normal multivariada
de dimensao M = n+N , com vetor de medias 0 e matriz de autocorrelacao
RM =
Rn Rn,N
RN,n RN
,
onde os elementos desta matriz sao definidos pela funcao de autocorrelacao ρ(· ;φ) escolhida.
O modelo completo e apresentado abaixo:
[y | Sy, µ, τ−2] ∼ N(1µ+ Sy, τ
2In)
[S | σ−2, φ] ∼ N(0, σ2RM)
µ ∼ N(0, k)
τ−2 ∼ Gama(aτ , bτ )
σ−2 ∼ Gama(aσ, bσ)
φ ∼ Gama(aφ, bφ),
onde k, aτ , bτ , aσ, bσ, aφ e bφ representam hiperparametros considerados como conhecidos a
priori.
18
As distribuicoes condicionais completas dos parametros µ, τ−2 e σ−2 sao dadas por
[µ | τ−2, σ−2, S, φ,y] ∼ N
(n(y − Sy)k
τ 2 + nk;
τ 2k
τ 2 + nk
),
[τ−2 | µ, σ−2, S, φ,y] ∼ Gama
(aτ +
n
2; bτ +
(y − 1µ− Sy)′(y − 1µ− Sy)
2
)e
[σ−2 | µ, τ−2, S, φ,y] ∼ Gama
(aσ +
M
2; bσ +
S ′R−1M S
2
),
podendo ser atualizadas pelo metodo do Amostrador de Gibbs dentro do algoritmo do
MCMC.
Por outro lado, a distribuicao condicional completa de S e Normal com vetor de medias
e matriz de covariancias dados por
σ2RN,n(τ 2In + σ2Rn)−1(y − 1µ) (3.1)
e
σ2RN − σ2RN,n(τ 2In + σ2Rn)−1σ2Rn,N , (3.2)
respectivamente, podendo tambem ser atualizada pelo metodo do Amostrador de Gibbs den-
tro do algoritmo do MCMC. As expressoes 3.1 e 3.2 sao conhecidas como Preditor de Kriga-
gem e Variancia de Krigagem, respectivamente.
O parametro de alcance φ da funcao de autocorrelacao do processo possui distribuicao
condicional completa dada por
19
p(φ | S, µ, τ−2, σ−2, α, β,y) ∝ |RM |−1/2φaφ−1 exp
−S
′R−1M S
2σ2− bφφ
e podemos gerar propostas no passo de Metropolis a partir de uma distribuicao Lognormal
com parametros
q(φprop | φ) ∼ Lognormal (ln(φ)− δ/2; δ) ,
onde δ deve ser escolhido de forma a produzir uma taxa de aceitacao razoavel das propostas
durante o MCMC. Neste caso, as probabilidades de aceitacao das propostas no MCMC sao
dadas por
pφ =(|RM |prop|RM |
)−1/2 (φprop
φ
)aφ×
exp− (S′Rprop−1
M S−S′R−1M S)
2σ2 + bφ(φ− φprop)− (lnφ−lnφprop+δ/2)2−(lnφprop−lnφ+δ/2)2
2δ
.
Alternativamente ao uso do MCMC, Ribeiro e Diggle (2001) desenvolveram um pa-
cote para o ambiente do software R, chamado GeoR, que realiza o processo de inferencia e
predicao a partir de versoes discretizadas das distribuicoes a priori dos parametros do modelo
Geoestatıstico.
20
Capıtulo 4
Processos Pontuais
Neste Capıtulo sao apresentados os aspectos relevantes associados aos Processos Pontuais no
espaco, assim como alguns dos avancos recentes na metodologia para realizacao da inferencia.
Em especial, sera apresentado o processo de Cox log-Gaussiano (Møller et al., 1998), o qual
sera a base para a construcao do modelo Geoestatıstico sob efeito de amostragem preferencial
a ser apresentado no Capıtulo 7.
4.1 Processos pontuais espaciais
A utilizacao de processos pontuais para modelagem de padroes de pontos no espaco tem se
intensificado nas ultimas decadas, especialmente apos a publicacao dos textos classicos de
Ripley (1981) e Diggle (1983).
A partir dos avancos computacionais recentes, os quais acabaram impulsionando o
desenvolvimento de metodos estatısticos mais sofisticados como os metodos MCMC, o estudo
dos processos pontuais evoluiu significativamente. Møller e Waagepetersen (2007) apresentam
uma revisao completa dos modelos mais utilizados para a modelagem de processos pontuais
espaciais e destacam inumeras aplicacoes e aspectos computacionais associados a inferencia.
Um processo pontual espacial X pode ser entendido como um subcojunto aleatorio finito
21
de uma determinada regiao limitada D ⊂ <k, onde geralmente k = 1, 2 ou 3. Uma realizacao
deste processo e chamada de padrao de pontos ou arranjo pontual, denotado x = (x1, ..., xn).
Na maior parte das aplicacoes a regiao D nao e totalmente observavel e o pesquisador
acaba sendo obrigado a analisar apenas uma janela W ⊂ D onde o arranjo pontual foi
observado. Nas situacoes em que a regiao D pode ser considerada homogenea, costuma-
se supor que o processo pontual espacial e estacionario e isotropico, ou seja, que possui
distribuicao invariante a translacoes e rotacoes em <k. Entretanto, estas suposicoes nao se
mostram realistas para inumeras situacoes praticas.
Os conceitos de media e covariancia dos processos pontuais espaciais sao definidos em
funcao dos efeitos de primeira e segunda ordem. Em particular, os efeitos de primeira ordem
sao analisados em termos da funcao intensidade de primeira ordem λ(x), ou seja, em termos
do numero de eventos esperado por unidade de area no ponto x. Assim,
λ(x) = limdx→0
E[Y (dx)]
|dx|
,
onde dx representa uma pequena regiao em torno de x, |dx| representa a area ou volume
desta regiao e Y (B) e a variavel aleatoria associada ao numero de pontos observados em
B ⊂ D.
Por outro lado, os efeitos de segunda ordem sao utilizados como medida de dependencia
espacial e sao definidos pela funcao intensidade de segunda ordem dada por
λ2(xi, xj) = limdxi,dxj→0
E[Y (dxi)Y (dxj)]
|dxi||dxj|
,
onde xi e xj representam duas localizacoes em D. Para um processo pontual espacial, a
estacionariedade de segunda ordem e a isotropia ocorrem quando λ2(xi, xj) = λ2(‖ xi−xj ‖).
Alem de analisar a intensidade de ocorrencia dos eventos na regiao D, a modelagem
dos padroes pontuais espaciais tambem procura classifica-los em algum dos padroes a seguir:
22
• Padrao Aleatorio: tambem conhecido como aleatoriedade espacial completa, esta asso-
ciado ao processo de Poisson homogeneo sobre toda a regiao em estudo D;
• Padrao de Agregacao (ou clustered): neste caso, a ocorrencia de um evento em de-
terminado local x esta associada a ocorrencia de outros eventos em locais proximos;
e
• Padrao Regular ou de Repulsao: neste caso, a ocorrencia de um evento em um local
x repele a ocorrencia de eventos proximos, ocasionando um padrao regular do arranjo
pontual.
No contexto de processos espaciais com funcoes intensidade determinısticas, o processo
de Poisson e um dos modelos mais conhecidos. Um processo de Poisson X, definido em
D ⊂ <k, com funcao intensidade λ(x), satisfaz:
• A variavel aleatoria Y (B), a qual representa o numero de eventos em B ⊂ D, possui
distribuicao Poisson com media µ(B) =∫Bλ(x)dx;
• Condicional a Y (B), os pontos que ocorrem em B sao independentes e identicamente
distribuıdos com densidade proporcional a λ(x), x ∈ B.
A funcao de verossimilhanca associada ao processo de Poisson, baseada em um conjunto
de n pontos x = x1, ..., xn, e dada por
p(x | λ) ∝ exp
(−∫D
λ(x)dx
) n∏i=1
λ(xi).
Se λ(x) = λ, ∀x ∈ D, dizemos que o processo de Poisson e homogeneo e sua funcao de
verossimilhanca deixa de depender das localizacoes dos eventos, resumindo-se a
p(x | λ) = p(n | λ) ∝ exp−|D|λ(|D|λ)n,
onde |D| e a area da regiao D.
23
O processo de Poisson pressupoe a nao-existencia de interacoes entre os pontos e, para
regioes disjuntas B1, B2 ⊂ D, as contagens sao independentes.
Todos os padroes de arranjos pontuais podem acontecer devido a diferentes intensidades
ou por efeitos de associacao entre os eventos. A seguir sao apresentados dois importantes
processos pontuais espaciais caracterizados por funcoes intensidades aleatorias, a saber: o
processo de Cox e o processo de Cox log-Gaussiano.
4.2 Processo de Cox e de Cox log-Gaussiano
Um processo pontual espacial, definido em uma regiao D ⊂ <k, e governado por uma funcao
aleatoria nao-negativa Λ = Λ(x) : x ∈ <k, e um processo de Cox se a distribuicao condici-
onal de X | Λ = λ e um processo de Poisson com funcao intensidade λ(x).
Se, adicionalmente, pudermos supor que
Λ(x) = expZ(x),
onde Z = Z(x) ∈ <k e um processo Gaussiano, dizemos que o processo pontual espacial
com funcao intensidade aleatoria Λ e um processo de Cox log-Gaussiano (Møller et al., 1998).
Neste caso, a funcao de verossimilhanca torna-se
p(x | Z) ∝ exp
(−∫D
expZ(x)dx) n∏
i=1
expZ(xi). (4.1)
Esta funcao nao e analiticamente tratavel e sera de suma importancia na definicao do
modelo Geoestatıstico sob amostragem preferencial (Capıtulo 7).
Ao contrario do que acontece com os processos pontuais de funcao intensidade deter-
minıstica, os processos de Cox e de Cox log-Gaussiano nao sofrem os efeitos negativos das
bordas (edge effects). Estes efeitos nas bordas caracterizam-se pela impossibilidade de se
24
realizar a inferencia de maneira satisfatoria nas bordas de uma janela observavel W , onde
W ⊂ D. Condicionais ao conhecimento de Λ(x) = λ(x), x ∈ D, a inferencia nestes proces-
sos com funcao intensidade aleatoria pode ser realizada normalmente independentemente da
janela observavel.
4.3 Inferencia em processos pontuais
Dependendo da escolha da funcao aleatoria Λ, a inferencia em processos de Cox pode se tornar
bastante complexa. Por outro lado, a inferencia em processos de Cox log-Gaussianos pode ser
realizada de forma razoavelmente simples por meio de metodos de simulacao de Monte Carlo
(Møller et al., 1998). Para isto, e necessario representar o domınio D do processo pontual
como uma grade e realizar a aproximacao do processo Gaussiano Z(x) de acordo com uma
distribuicao Normal finito-dimensional definida sobre a regiao discretizada.
A inferencia realizada sob a perspectiva Bayesiana, por meio dos metodos de MCMC,
torna razoavelmente simples a obtencao de aproximacoes da funcao de verosimilhanca p(x |
Z). Em contrapartida, o custo computacional associado e bastante elevado (Møller e Waa-
gepetersen, 2007).
4.4 Efeitos da discretizacao na inferencia
Waagepetersen (2004) demonstrou que as posterioris aproximadas para processos de Cox log-
Gaussianos convergem para as posterioris exatas quando o tamanho das celulas que compoem
a grade tendem a zero.
Ao modelar dados pontuais de infeccao por doencas utilizando processos de Cox log-
Gaussianos, Benes et al. (2002), concluıram que os resultados obtidos na inferencia via
MCMC podem variar consideravelmente dependendo da grade escolhida.
Entretanto, segundo Møller et al. (1998), se o processo pontual espacial for razoavel-
25
mente agregado e de intensidade moderada, a escolha da grade nao necessitara ser fina para
produzir bons resultados na inferencia, uma vez que nestes casos nao seria esperado observar
grandes areas sem amostras na regiao de estudo.
Apesar de varios autores trabalharem com particoes da regiao D formando sub-regioes
regulares, isto nao e uma regra. Heikkinen e Arjas (1998 e 1999), por exemplo, utilizam uma
particao denominada tesselagem de Voronoi, a qual particiona a regiao D em sub-regioes
de diferentes tamanhos, mas procurando manter uma grade mais fina em locais com maior
intensidade de ocorrencia de eventos.
A generalizacao dos processos pontuais espaciais para o caso espaco-temporal motiva
o estudo do efeito da discretizacao e da agregacao espacial e temporal dos dados. Alguns
exemplos de aplicacoes que avaliam ou discutem estes efeitos sao Brix e Diggle (2001), Paez
e Diggle (2009) e Benes et al. (2002).
26
Capıtulo 5
Planejamento Amostral Otimo
A definicao do planejamento amostral otimo e uma tarefa que costuma envolver metodo-
logias para obtencao de maximos e mınimos de funcoes objetivo. Estas funcoes objetivos
quantificam os ganhos e perdas associados as decisoes possıveis a serem tomadas.
Quando o fenomeno de interesse do pesquisador e estudado por meio da suposicao de
modelos estatısticos subjacentes, a metodologia para obtencao do planejamento amostral
otimo costuma se basear no conceito de Teoria da Decisao, onde precisamos decidir em quais
locais, no tempo ou espaco, devemos planejar uma nova coleta amostral a fim de compreender
melhor certas caracterısticas do fenomeno.
Em problemas da Teoria da Decisao que envolvem escolhas dependentes de resulta-
dos aleatorios, a combinacao de uma decisao d com um resultado aleatorio ω produz uma
recompensa r. Adicionalmente, para cada recompensa r, associa-se uma utilidade U(r), a
qual precisa satisfazer determinados pressupostos e pode ser interpretada como uma repre-
sentacao numerica das preferencias do decisor. Assim, uma decisao sera preferida em relacao
a outra se, e somente se, a utilidade esperada da recompensa obtida com a primeira for maior
que aquela obtida com a segunda. Mais detalhes e formalizacoes a respeito destes pressupos-
tos e outras propriedades das funcoes utilidades no contexto de Teoria da Decisao podem ser
encontrados em DeGroot (1970).
27
Seguindo a abordagem de Muller (1999), o procedimento para obtencao do planejamento
amostral otimo deve ser realizado a partir da definicao de uma funcao utilidade u(d, θ, yd),
onde d representa o novo ponto do plano amostral, θ o vetor de parametros e yd representa o
vetor de futuras observacoes oriundas deste novo ponto amostral. Apos a definicao da funcao
utilidade, temos que o ponto do planejamento amostral otimo d∗ e aquele que maximiza a
funcao:
U(d) =
∫u(d, θ, yd)pd(yd | θ)p(θ)dθdyd = E[θ,yd][u(d, θ, yd)] (5.1)
para o caso de um planejamento amostral a priori, e
U(d) =
∫u(d, θ, yd)pd(yd | θ,y)p(θ | y)dθdyd = E[θ,yd|y][u(d, θ, yd)] (5.2)
para o caso de um planejamento amostral apos a observacao de dados y.
Em outras palavras, apos obter o conjunto de observacoes y, o novo ponto do plano
amostral otimo sera o valor d∗ que maximixa a utilidade esperada.
Dentre os criterios para escolha da funcao utilidade, destacam-se aqueles que buscam re-
duzir incertezas a respeito de parametros de interesse e aqueles que buscam reduzir variancias
preditivas associadas ao processo em estudo. No primeiro caso, costumam ser utilizadas
funcoes que bonificam reducoes da variancia a posteriori de θ. Ja no segundo caso, sao mais
apropriadas funcoes que bonificam reducoes na variancia preditiva de S. Zidek et al. (2000)
utilizou o criterio da entropia (medida que se assemelha a nocao de variancia de uma variavel
aleatoria) para definicao do planejamento amostral otimo.
A fim de evitar que sejam escolhidos pontos amostrais associados a elevados custos
financeiros, materiais ou temporais, varios autores modificam suas funcoes utilidade a fim
de penalizar estes pontos amostrais. Zidek et al. (2000) e um exemplo, onde utilizam-se os
custos financeiros para penalizar as utilidades associadas a implantacao de uma nova estacao
de monitoramento de poluicao.
28
Outras estrategias para agregacao de informacao aos criterios de obtencao do planeja-
mento amostral sao encontradas na literatura. Especificamente em estudos de planejamento
amostral no tempo, Stroud et al. (2001) utilizou covariaveis para reduzir as incertezas as-
sociadas aos parametros desconhecidos do modelo e, assim, definir o instante otimo para
retorno de um paciente em tratamento. Ding et al. (2008), por sua vez, utilizou uma mo-
delagem hierarquica para relacionar os efeitos de diferentes tratamentos a fim de definir o
planejamento amostral otimo em estudos clınicos de um especıfico tratamento.
Com relacao as estrategias para otimizacao da utilidade esperada, Muller (1999) destaca
as principais utilizadas:
1. Simulacao a priori: neste caso, a partir de diferentes combinacoes dos parametros θ
do modelo, geradas de p(θ) ou de p(θ | y), calcula-se U(d) para diferentes candidados
a local otimo amostral d. Caso o procedimento tenha sido realizado avaliando-se U(d)
para uma malha fina de valores de d, escolhe-se o ponto do plano amostral que forneceu
maior utilidade esperada como d∗. Caso as avaliacoes de U(d) tenham sido feita para
uma malha nao tao fina, costuma-se ajustar uma curva U(d), utilizando algum metodo
nao-parametrico, e depois proceder a escolha de d∗ que maximiza a funcao U(d).
Este metodo possui um elevado custo computacional e, nos casos em que d e um vetor,
torna-se praticamente inviavel. Muller et al. (2004) lida com o problema de integracao e
maximizacao da funcao utilidade para os casos em que a dimensao de d e alta. Para isso,
utilizam uma versao do metodo de MCMC com simulated annealing onde a distribuicao
estacionaria da cadeia de Markov varia (MCMC nao-homogeneo);
2. MCMC em modelo aumentado: neste caso, o novo local do planejamento amostral
e considerado como um parametro a ser estimado no modelo. Sendo assim, considera-se
que d pode asssumir valores dentro de uma regiao fechada D, que u(d, θ, yd) e nao-
negativa e limitada e define-se a distribuicao artificial
h(d, θ, yd) ∝ u(d, θ, yd)pd(yd | θ)p(θ) (5.3)
29
em (d, θ, yd). Sob estas suposicoes, temos que a distribuicao marginal de d e proporci-
onal a
h(d) ∝∫u(d, θ, y)pd(yd | θ)p(θ)dθdyd = U(d), (5.4)
ou seja, encontrar a moda de h(d) torna-se equivalente a maximizar a utilidade esperada
de d. Assim, ganha-se tempo na simulacao, ja que os valores amostrados de d no
algoritmo MCMC tenderao a se concentrar proximos de regioes com alta utilidade
esperada. Desta forma, alteramos o nosso problema de otimizacao para um problema
de busca de moda.
Ainda dois outros pontos importantes precisam ser lembrados ao utilizar-se este metodo.
O primeiro ponto e que a introducao deste modelo aumentado produz mudancas nas
distribuicoes marginais de (θ, yd). O segundo ponto esta relacionado ao cuidado de
escolha da distribuicao que fornece os valores propostos de d no MCMC. Neste sentido,
a utilizacao de distribuicoes simetricas, onde g(d(i+1) | d(i)
)= g
(d(i) | d(i+1)
), acabam
por simplificar a expressao da probabilidade de aceitacao a cada iteracao j do MCMC,
reduzindo-a a
pd = min
1,
u(dprop, θj, ydprop)
u(dj−1, θj−1, ydj−1)
.
3. MCMC com simulated annealing: A utilizacao do metodo MCMC com o mo-
delo aumentado, conforme descrita no item anterior, ainda nao resolve totalmente o
problema da otimizacao de U(d). Um dos problemas restantes esta associado ao fato
de que, em muitos casos, a funcao de utilidade esperada e pouco concentrada na vi-
zinhanca de sua moda, alocando utilidades semelhantes para uma grande quantidade
de possıveis pontos do plano amostral. No caso em que d e unidimensional, a simples
inspecao do grafico ou histograma de U(d) pode nao ser suficiente para obtencao de
d∗. Ja no caso multimensional, a situacao e ainda mais complicada, uma vez que nao
terıamos como construir graficos de U(d).
Para lidar com este problema, incorporam-se as ideias de simulated annealing, onde
substitui-se a funcao objetivo do problema por uma transformacao potencia dela, ou
30
seja, h(d)J . A escolha de J deve ser realizada com cuidado e, em certos casos, pode-se
aumentar o valor de J apos identificar ”clusters”de pontos amostrais de maior utilidade,
possivelmente concentrados em torno da moda de d.
Varios procedimentos para obtencao de um planejamento amostral otimo de k locais,
k ≥ 2, podem ser empregados. A forma mais simples esta contida na metodologia de Muller
(1999), bastando para isto considerar um conjunto de decisoes d = d1, ..., dk associadas
a uma funcao utilidade u(d, θ,yd). Neste caso, a cada iteracao j do MCMC precisarıamos
amostrar um vetor de decisoes (ou locais) dj = (dj1, ...,djk) e aceita-lo ou rejeita-lo de acordo
com a sua pseudo-distribuicao no passo de Metropolis. Ao final, seria necessario encontrar
d∗, ou seja, o conjunto de locais que produz a utilidade maxima. Entretanto, para k > 2 este
procedimento torna-se demasiadamente complexo.
Outra opcao e considerar esta escolha como um problema de decisao sequencial, es-
pecificando regras de parada e custos de amostragem associados. DeGroot (1970) descreve
os principais aspectos associados a problemas desta natureza. Para contornar problemas
associados a decisoes sequenciais no tempo dependentes de todas as decisoes passadas, isto
e, dt = f(d1, ..., dt−1, y1, ..., yt−1), Muller et al. (2007) utiliza estatısticas suficientes carre-
gando a informacao necessaria obtida ate o instante t−1, substituindo dt = f(dt−1, yt−1) por
dt = f(St(dt−1, yt−1)).
A utilizacao da abordagem de decisoes sequenciais possui a vantagem de produzir,
em geral, maiores utilidades esperadas. Entretanto, no contexto de planejamento amostral,
decisoes sequenciais so podem ser utilizadas quando o pesquisador pode aguardar cada ob-
servacao antes de decidir o momento ou local de coletar uma nova observacao. Alem disso, os
custos associados a decisoes sequenciais podem ser muito mais elevados, sejam eles financei-
ros ou nao. Na Secao 5.2 e apresentada uma funcao utilidade que quantifica os custos como
forma de risco no contexto de infestacao de mosquitos.
31
5.1 Planejamento amostral otimo em Geoestatıstica
Em Geoestatıstica e comum o foco do pesquisador concentrar-se muito mais na predicao
espacial do processo subjacente do que na inferencia a respeito de seus parametros.
Neste sentido, a variancia de predicao associada ao local x ∈ D, V (S(x) | y), fornece ao
pesquisador o grau de incerteza a respeito de suas predicoes apos observar os dados y. Assim,
reduzir esta variancia ao longo da regiao de estudo D se constitui de um criterio bastante
razoavel para escolha de um novo ponto d do plano amostral.
Partindo-se deste princıpio podemos definir a seguinte funcao utilidade para aplicacao
da abordagem de Muller (1999) no contexto de Geoestatıstica:
u(d, θ, yd) =
∫[V (S(x) | θ,y)− V (S(x) | θ,y, yd)]dx, (5.5)
a qual pode ser interpretada como o ganho obtido ao se utilizar yd para reducao da incerteza
associada ao processo S, onde d ∈ <k.
Para avaliacao da integral existente na expressao de u(d, θ, yd) pode-se aplicar a discre-
tizacao da regiao em estudo D em M sub-regioes, conforme descrito no Capıtulo anterior.
Neste caso, apos a discretizacao, temos que u(d, θ, yd) e aproximada pela expressao
u(d, θ, yd) ≈1
M
∑i
[V (Si | θ,y)− V (Si | θ,y, yd)].
Ja as distribuicoes de [Si | θ,y] e [Si | θ,y, yd] sao normais com medias
σ2r′
n(τ 2In + σ2Rn)−1(y − 1µ)
e
σ2r′
n+1(τ 2In+1 + σ2Rn+1)−1(y − 1µ)
e variancias
32
σ2 − σ2r′
n(τ 2In + σ2Rn)−1σ2rn
σ2 − σ2r′
n+1(τ 2In+1 + σ2Rn+1)−1σ2rn+1,
respectivamente. Para verificar este resultado, defina y = y, yd e S = Sy, Sd. Desta
forma, temos
[y | S, θ] ∼ N(1µ+ S, τ 2In+1)
[S | θ] ∼ N(0, σ2Rn+1)
de onde podemos obter a distribuicao conjunta de [y, S | θ]
y
S
∼ N
1µ
0
,
τ 2In+1 + σ2Rn+1 σ2Rn+1
σ2Rn+1 σ2Rn+1
.Por fim, utilizando-se as propriedades da distribuicao Normal condicional, obtem-se as
respectivas medias e variancias condicionais apresentadas acima.
Alguns exemplos de funcoes utilidade empregadas no contexto de planejamento amos-
tral otimo que dependem de valores observados y, como a empregada aqui, podem ser en-
contrados em Cardenas (2007) e Muller et al. (2004), entre outros.
Dando seguimento ao procedimento de escolha do planejamento amostral otimo, e ne-
cessario maximizar a funcao
U(d) =
∫u(d, θ, yd)p(yd, θ | y)dθdyd =
∫u(d, θ, yd)p(yd | θ,y)p(θ | y)dθdyd
onde [θ | y] = [φ, σ2, τ 2, µ | y].
Para obtermos a distribuicao de [yd | θ,y], podemos utilizar novamente a distribuicao
conjunta de [y, S | θ] ou, alternativamente, seguir os passos:
33
• Note que [y | S, θ] ∼ N(1µ+ S, τ 2In+1) e [S | θ] ∼ N(0, σ2Rn+1);
• Como y = 1µ+ S + Z e Z e independente de S, temos que [y | θ] e Normal com media
1µ e matriz de covariancias τ 2In+1 + σ2Rn+1;
• Como [y | θ] = [yd,y | θ], pelas propriedades da Normal Multivariada temos que
[yd | θ,y] e Normal com media µ+ σ2r′n(τ 2In + σ2Rn)−1(y− 1µ) e variancia τ 2 + σ2 −
σ2r′n(τ 2In + σ2Rn)−1σ2rn.
Apos a obtencao de todas as distribuicoes que compoem a funcao utilidade escolhida,
o planejamento amostral otimo pode ser obtido utilizando-se uma das propostas de Muller
(1999) descritas neste Capıtulo a partir das amostras a posteriori de θ. Uma revisao de outros
procedimentos para a otimizacao de funcoes objetivo, em especial no contexto de redes de
monitoramento ambiental e mapeamento de QTL (quantitative trait loci) pode ser encontrada
em Cardenas (2007).
Por fim, e importante notar tambem que as expressoes das variancias preditivas empre-
gadas na funcao utilidade apresentada u(d, θ, yd) nao dependem dos valores de yd, mas apenas
de sua localizacao na regiao D. Esta caracterıstica das variancias preditivas de krigagem evita
a necessidade de se avaliar todos os possıveis valores de yd durante o processo de maximizacao
de U(d), reduzindo significativamente o custo computacional envolvido. Entretanto, outras
ponderacoes podem fazer parte da funcao de utilidade escolhida de forma que a utilizacao das
amostras a posteriori de yd sejam imprescindıveis para obtencao do planejamento amostral
otimo.
34
5.2 Exemplo: Planejamento amostral otimo no estudo
da serie temporal de infestacao pelo mosquito Ae-
des aegypti
No contexto da serie historica de infestacao do mosquito Aedes aegypti, principal vetor de
transmissao do vırus da dengue, o processo de selecao dos tempos de amostragem para
obtencao de ındices de infestacao precisa levar em conta questoes de praticidade, eficacia e
economia de recursos.
Pela praticidade e reprodutividade demonstrados, os ındices de infestacao baseados em
larvas acabam sendo os mais empregados como medidas de infestacao e como indicadores
de risco de transmissao de dengue (Gomes, 1998). Dentre os mais conhecidos destacam-se
o Indice Predial, que avalia o percentual de edifıcios infestados, e o Indice de Breteau, que
avalia o percentual de recipientes positivos com larvas por domicılio pesquisado.
A fim de orientar os orgaos de saude existentes no Brasil, a Secretaria de Vigilancia
em Saude do Ministerio da Saude disponibilizou um documento contendo a metodologia
para realizacao de um diagnostico rapido conhecido como Levantamento de Indice Rapido
de Infestacao por Aedes aegypti - LIRAa (Ministerio da Saude, 2005).
Na constante busca pela otimizacao dos recursos para avaliacao dos ındices de in-
festacao, evidencia-se a necessidade de planejar a periodicidade com que os agentes de saude
serao enviados a campo para obtencao do LIRAa. O conhecimento do comportamento da
serie de infestacao do mosquito pode ser util para definir esta periodicidade. Um bom pla-
nejamento deve ser realizado a fim de mobilizar os recursos disponıveis para os perıodos de
maior risco de surtos de infestacao do mosquito e de epidemias de dengue. Neste sentido,
pode-se desenvolver um criterio que auxilie no planejamento do momento otimo no tempo
para realizacao de novo LIRAa levando-se em conta fatores associados ao poder de predicao
e ao risco de surtos de infestacao do mosquito.
A fim de incorporar pesos diferentes aos candidatos a local amostral otimo de acordo
35
com o seu poder preditivo e de acordo com o risco iminente de surto de infestacoes do
mosquito, utilizou-se a seguinte funcao utilidade
u(d, θ, yd) =
∫[V (S(t) | θ,y)− V (S(t) | θ,y, yd)]dt+ exp−α(P [Yd > a | y]− pa)2
Na funcao utilidade escolhida, o termo dentro da integral quantifica a reducao da in-
certeza associada ao processo S apos a escolha do instante d como novo ponto amostral. Por
outro lado, o termo exponencial da expressao cumpre o papel de atribuir maior utilidade
para os candidatos a novo ponto amostral que estejam associados a instantes de tempo onde
as probabilidades de eventos extremos nao sao muito baixas e nem muito elevadas. No con-
texto de infestacao pelo mosquito, estes criterio evita a escolha de instantes associados aos
perıodos de baixo risco, onde os gastos com o trabalho de campo para obtencao do LIRAa
poderiam ser desnecessarios, e de extremo risco, onde a realizacao da coleta poderia ser re-
alizada demasiadamente tarde. De uma maneira geral, esta componente do criterio permite
que o modelo aponte para um instante no tempo que antecipe a ocorrencia de um surto de
infestacao. O grau de moderacao e definido pelo parametro pa. Por fim, fixamos o parametro
α a fim de ponderar o grau de influencia desta componente de risco na funcao utilidade.
Para o procedimento de inferencia utilizou-se uma versao discretizada desta funcao a
partir de uma particao da regiao D em estudo em M sub-intervalos.
Utilizou-se a abordagem Bayesiana e aproximou-se esta integral a partir de simulacoes
da distribuicao a posteriori dos parametros do modelo e das respectivas distribuicoes pre-
ditivas. O modelo Geoestatıstico apresentado no Capıtulo 3 foi utilizado e o procedimento
de inferencia seguiu a abordagem de MCMC em modelo aumentado, conforme descrito na
Secao anterior. Para a media do processo utilizou-se uma priori flat e considerou-se prioris
recıprocas para σ2 e φ. Para τ 2rel = τ2
σ2 utilizou-se uma distribuicao U[0,1].
Para a realizacao da inferencia foram utilizadas versoes discretizadas aproximadas das
distribuicoes dos parametros do modelo com o auxılio do pacote GeoR (www.R-project.org).
Os dados de infestacao utilizados neste estudo referem-se aos estudos do LIRAa realiza-
36
dos entre 02/01/2005 e 05/11/2009 na cidade do Rio de Janeiro, totalizando 18 levantamentos
(y1, ..., y18). Estes dados estao disponibilizados do site da Secretaria Municipal de Saude do
municıpio do Rio de Janeiro (www.saude.rio.rj.gov.br). Para a analise dos dados realizou-se
uma transformacao na variavel de infestacao de forma a permitir o ajuste e as predicoes
supondo um processo Gaussiano subjacente.
Foram utilizadas 5000 amostras simuladas das distribuicoes a posteriori dos parametros
do modelo para obtencao das distribuicoes preditivas e para o calculo da funcao utilidade.
A Figura 5.1 apresenta os ındices de infestacao observados bem como os valores preditos
para o perıodo estudado e seus respectivos intervalos de 95% de credibilidade.
Figura 5.1: Valores observados (cırculos), preditos (linha) e respectivos IC 95% (linha tracejada)
para a serie de infestacao do Aedes aegypti na cidade do Rio de Janeiro.
A reducao na variancia preditiva baseou-se em uma particao de 341 instantes de tempo
entre nov/2009 e jun/2010 e as medias encontradas foram utilizadas no calculo da funcao
utilidade de cada candidato a ponto do plano amostral. O valor de a utilizado foi 4%, baseado
nos patamares de alerta atualmente empregados e recomendados pelo Ministerio da Saude
no Brasil. A probabilidade maxima aceitavel para este risco foi fixada em pa = 0, 3.
A Figura 5.2 apresenta a distribuicao artificial de d obtida a partir de 10.000 amostras
simuladas considerando-se α = 100. Pode-se observar que a moda da distribuicao encontra-se
37
no intervalo de 12/mar a 22/mar de 2010, evidenciando que o instante otimo para realizacao
de nova coleta deveria se dar em torno de 135 dias apos a ultima coleta. Alguns estudos de
simulacao demonstraram que a decisao de escolha e sensıvel a escolha do valor de α.
Figura 5.2: Histograma das amostras da distribuicao artificial h(d), onde o eixo das abscissas
representa o numero de dias apos a realizacao do ultimo LIRAa.
O elevado custo computacional ao se realizar simulacoes das distribuicoes preditivas
para obtencao das variancias preditivas medias e o principal desafio desta metodologia, o
que nos evidencia a necessidade de utilizacao de metodos aproximados de inferencia. As
discretizacoes das distribuicoes a priori dos parametros do modelo permite a obtencao de
distribuicoes a posteriori discretas, as quais sao utilizadas para geracao das distribuicoes
preditivas de S. Apesar da metodologia depender do nıvel de discretizacao utilizado, estudos
de sensibilidade mostraram que este efeito nao alterava a escolha do novo instante para o
planejamento amostral. Os parametros associados ao custo e ao risco de surtos de infestacoes
se mostraram bastante flexıveis e se configuram como opcao para atender as exigencias de
orgaos de saude que necessitem otimizar seus recursos fısicos e financeiros.
38
Capıtulo 6
Geoestatıstica sob Efeito de
Amostragem Preferencial
Na literatura Geoestatıstica em geral, costuma-se considerar os pontos amostrais x como
fixos ou, caso oriundos de um processo estocastico, independentes do processo S(x) (ver, por
exemplo, Banerjee et al., 2004; Diggle e Ribeiro, 2007).
No caso em que o planejamento amostral e estocastico, temos que especificar a distri-
buicao de [Y, S,X]. Seguindo a abordagem de Diggle et al. (2010), temos um processo sob
amostragem nao-preferencial se
[S, Y,X] = [Y | S,X][S,X] = [Y | S,X][S][X],
isto e, o planejamento amostral e independente do processo espacial em estudo. Nesta si-
tuacao, pode-se utilizar os metodos tradicionais de Geoestatıstica para realizacao da in-
ferencia para os parametros envolvidos.
Por outro lado, denomina-se amostragem preferencial o caso onde [S,X] 6= [S][X].
Assim, o modelo sob amostragem preferencial assume que o processo espacial S e observado
com ruıdo em pontos do planejamento amostral oriundos de um processo pontual X, cuja
39
distribuicao depende de S.
A classe de modelos sob amostragem preferencial proposta por Diggle et al. (2010)
adiciona as seguintes suposicoes ao modelo Geoestatıstico apresentado no Capıtulo 3:
1. Condicional a S, X e um processo de Cox log-Gaussiano, com intensidade
λ(x) = expα + βS(x); (6.1)
2. Condicional a [S,X], Yi ∼ N [µ+ S(xi), τ2].
Quando β = 0, temos um processo de Poisson com intensidade exp(α). Adicionalmente,
assumindo-se que µ = 0, pode-se mostrar que
[S(xi) | xi, θ] ∼ N(βσ2, σ2)
[Yi | xi, θ] ∼ N(βσ2, σ2 + τ 2)
nos locais xi onde foram tomadas observacoes Yi, i = 1, ..., n. Em outras palavras, o valor
do processo Gaussiano S em um local observado xi e influenciado de forma proporcional ao
valor de β.
Sob o ponto de vista Bayesiano, a inferencia para os parametros θ = (µ, φ, σ2, τ 2) e
feita por meio da distribuicao a posteriori
p(θ | y) ∝ p(x,y, θ)
=
∫p(x,y, θ, S)dS
=
∫p(y | S, θ,x)p(x | θ, S)p(S | θ)p(θ)dS
=
∫p(y | Sy, θ)p(x | S)p(S | θ)p(θ)dS,
40
onde Sy representa o vetor de valores de S associados aos locais x onde foram observados os
valores y. Para os parametros α e β atribuımos prioris normais vagas.
E importante notar que, para obtencao de p[x | S], precisarıamos dos valores de S em
todos os locais x ∈ D. Diggle et al. (2010) apresenta uma forma para avaliar esta distribuicao
utilizando uma fina discretizacao da regiao D. Neste caso, particiona-se a regiao em estudo
em M celulas com centroides xi, i = 1, ...,M , onde espera-se que, no maximo, um ponto
amostral esteja localizado em cada celula. Neste caso, o modelo completo e modificado para
[y | Sy, θ] ∼ N(1µ+ Sy, τ2In)
p(x | S, θ) ∝n∏i=1
exp(α + βS(xi)) exp(−∑i
∆i exp(α + βS(xi)))
[S | θ] ∼ N(0, σ2RM),
onde ∆i representa o comprimento, a area ou volume da celula (ou sub-regiao) i, de acordo
com a dimensao da regiao em estudo D.
Uma dificuldade da abordagem de Diggle et al. (2008) ocorre na ausencia de efeito
pepita, isto e, quando τ 2 = 0. Como o metodo de inferencia avalia a funcao de verossimilhanca
baseando-se em medias de simulacoes de S, as mesmas tornam-se incompatıveis com os valores
observados Y na ausencia deste efeito. O mesmo ocorre quando τ 2/σ2 e pequeno.
Sob o enfoque Bayesiano, precisamos obter as distribuicoes a posteriori para fazer
inferencia acerca dos parametros do modelo. Como as distribuicoes a posteriori destes
parametros nao possuem forma fechada, podemos aproxima-las utilizando MCMC.
Baseando-se no procedimento descrito por Diggle et al. (2010), podemos realizar a
inferencia sem a exigencia de que apenas um ponto amostral pertenca a cada celula. Proce-
dendo desta forma, o numero de eventos que ocorrem na sub-regiao i, condicional ao valor
de S(xi), tera uma distribuicao Poisson e a funcao de verossimilhanca de x sera dada por
41
p(x | S, α, β) ∝M∏i=1
[exp(α + βS(xi))]ni exp(−
∑i
∆i exp(α + βS(xi))). (6.2)
Os aspectos computacionais que envolvem o procedimento de inferencia sao implemen-
tados a partir desta particao.
Supondo que a particao da regiao D seja regular, isto e, ∆i = ∆, ∀i, temos o seguinte
modelo completo:
[y | Sy, µ, τ−2] ∼ N(1µ+ Sy, τ
2In),
p(x | S, α, β) ∝M∏i=1
[exp(α + βS(xi))]ni exp(−∆
M∑i=1
exp(α + βS(xi))),
[S | σ−2, φ] ∼ N(0, σ2RM),
onde as prioris para os parametros do modelo sao µ ∼ N(0, k), τ−2 ∼ Gama(aτ , bτ ), σ−2 ∼
Gama(aσ, bσ), φ ∼ Gama(aφ, bφ), α ∼ N(0, k) e β ∼ N(0, k).
As distribuicoes condicionais completas dos parametros µ, τ−2 e σ−2 sao dadas pelas
mesmas expressoes obtidas no caso de amostragem nao-preferencial. O mesmo tambem
acontece com a distribuicao condicional completa do parametro de alcance φ.
Por outro lado, as distribuicoes condicionais completas de S, β e α tornam-se
p(S | µ, τ−2, σ−2, φ, α, β,x,y) ∝ exp− 1
2τ2[S ′ySy − 2S ′y(y − µ1)] + βS ′n− S′R−1
M S
2σ2
×
× exp−∆eα
∑M exp(βS(xi))
,
p(β | S, µ, τ−2, σ−2, φ, α,x,y) ∝ p(x | S, α, β)p(β) ∝ expβS ′yn−∆eα
∑M exp(βS(xi))− β2
2k
,
p(α | S, µ, τ−2, σ−2, φ, β,x,y) ∝ expnα−∆eα
∑M exp(βS(xi))− α2
2k
e sao atualizadas por passos de Metropolis com propostas Gaussianas centradas nos valores
42
da iteracao anterior, onde as probabilidades de aceitacao das propostas no MCMC sao,
respectivamente, dadas por
pS = exp− 1
2τ2[S ′propy Spropy − S ′ySy − 2(Spropy − Sy)′(y − µ1)] + β(Sprop − S)′n
×
× exp
∆eα∑M [exp(βS(xi))− exp(βS(xi)
prop)] +(S′R−1
M S−S′propR−1M Sprop)
2σ2
pβ = exp
(βprop − β)S ′yn + ∆eα∑M(exp(βS(xi))− exp(βpropS(xi))) + (β2−β2prop)
2k
pα = exp
(αprop − α)n+ (eα − eαprop)∆∑M exp(βS(xi)) + (α2−α2prop)
2k
.
Nas expressoes acima, o vetor n′ = (n1, n2, ..., nM) representa o numero de pontos
observados em cada sub-regiao e considera-se que o numero total de pontos observados em
D e dado por∑M
i=1 ni = n.
A obtencao de p[x | S] e bastante custosa computacionalmente e inumeros procedimen-
tos alternativos tem sido propostos na literatura para lidar com este problema. No Capıtulo
9 sao discutidas algumas destas propostas.
Ho and Stoyan (2008) apresentam uma construcao equivalente a metodologia de Diggle
et al. (2010), baseada em processos pontuais marcados (marked point process). Neste caso,
considera-se um processo com duas componentes independentes: um processo pontual X e
um campo aleatorio Z(x), onde as marcas dos pontos x = x1, ..., xn, denotadas por
m(x) = m(x1), ...,m(xn), sao dadas por
m(x) = S(x) + ε(x),
e podem ser interpretadas como os valores do processo Gaussiano subjacente perturbados
por erros i.i.d. tambem Gaussianos. Os autores apresentam os efeitos destas suposicoes no
procedimento de inferencia sob o enfoque frequentista e obtem os momentos de primeira e
segunda ordem associados a este modelo.
43
Diggle et al. (2010) avaliaram a influencia da amostragem preferencial nas predicoes
do processo Gaussiano subjacente utilizando a distribuicao [S|y]. Em outras palavras, utili-
zando o metodo plug-in, foram utilizadas as estimativas de θ nas expressoes do preditor e da
variancia de krigagem para realizacao da predicao espacial. Entretanto, apesar do efeito da
amostragem preferencial ter sido mitigado no processo de estimacao dos parametros do mo-
delo, estas predicoes nao levaram em conta a informacao fornecida por x. Em contrapartida,
a abordagem Bayesiana apresentada neste Capıtulo fornece diretamente amostras da distri-
buicao [S|y,x], a qual e a correta distribuicao preditiva do processo Gaussiano subjacente.
No contexto frequentista, Zidek e Shaddick (2012) apresentam uma metodologia para
correcao do vıcio causado pela amostragem preferencial no contexto do monitoramento am-
biental. Sob o enfoque Bayesiano, Pati et al. (2011) provaram que a utilizacao da priori
impropria p(β) ∝ 1 para β produz uma posteriori propria. Assim, estes autores demonstra-
ram que os dados fornecem informacao para a realizacao da inferencia para este parametro
no modelo, mesmo sob priori nao informativa.
6.1 Estudo de simulacao unidimensional
Para ilustrar os efeitos da amostragem preferencial no processo de inferencia a respeito dos
parametros do processo S, foi realizado um estudo de simulacao considerando uma regiao D
unidimensional definida pelo intervalo [0, 100] e 100 sub-regioes de mesmo comprimento. Os
parametros utilizados na simulacao foram
(α; β;µ;σ2;φ; τ 2; ∆) = (−3; 2; 12; 2; 20; 0.1; 1)
e o tamanho da amostra obtido foi n = 18. A Figura 6.1 apresenta a realizacao do processo
Gaussiano S simulado juntamente com os valores observados y1, ..., y18. Uma vez que β > 0,
as observacoes concentraram-se proximas dos locais onde o processo S apresentava maiores
valores.
44
Figura 6.1: Realizacao do processo simulado unidimensional S+µ (linha cheia) e valores observados
(cırculos).
A partir das observacoes y procedeu-se a inferencia utilizando o metodo de MCMC
apresentado neste Capıtulo. Para permitir uma comparacao, foi realizado tambem o proce-
dimento de inferencia via MCMC sem considerar que as observacoes foram obtidas sob efeito
de amostragem preferencial.
Em ambos os casos foram utilizados os mesmos hiperparametros nas distribuicoes a
priori, a saber, µ ∼ α ∼ β ∼ N(0; 103), τ−2 ∼ σ−2 ∼ Gama(2; 0.5) e φ ∼ Gama(2; 0.05).
Foram utilizadas 500.000 iteracoes no algoritmo MCMC para ambos os modelos, das
quais apenas as 100.000 ultimas foram utilizadas para compor as amostras das distribuicoes
a posteriori dos parametros do modelo. A convergencia das cadeias foi avaliada a partir de
inspecao visual de diferentes cadeias geradas.
As Figuras 6.2 e 6.3 apresentam histogramas das distribuicoes a posteriori de cada um
dos parametros do modelo considerando o efeito da amostragem preferencial. Ja a Figura
45
6.4 apresenta os mesmos resultados para o modelo sem considerar o efeito da amostragem
preferencial.
Figura 6.2: Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito da amos-
tragem preferencial para o processo simulado unidimensional (os cırculos representam os valores
verdadeiros dos parametros).
Analisando-se a Figura 6.2 pode-se observar que as distribuicoes a posteriori encontram-
se concentradas em torno dos valores verdadeiros dos parametros do modelo, exceto para o
caso de σ2. Entretanto, este parametro tambem foi subestimado pelo modelo sem considerar
o efeito da amostragem preferencial.
Conforme pode-se notar na analise da Figura 6.3, a inferencia a respeito dos parametros
que definem o efeito da amostragem preferencial, isto e α e β, foi satisfatoria nesta simulacao.
46
Figura 6.3: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito da
amostragem preferencial para o processo simulado unidimensional (os cırculos representam os va-
lores verdadeiros dos parametros).
A Figura 6.5 apresenta os variogramas estimados por ambos os modelos juntamente com
os seus respectivos intervalos de 95% de credibilidade. Apesar de ambos estarem distantes
do verdadeiro variograma (linha preta), o variograma estimado sob a hipotese de efeito de
amostragem preferencial esta um pouco mais proximo do variograma verdadeiro. Outras
simulacoes realizadas sob as mesmas condicoes apontaram para resultados semelhantes e
algumas destas simulacoes serao apresentadas nas secoes subsequentes.
Entretanto, quando analisamos as predicoes realizadas para o processo S, podemos
observar que o modelo sem considerar o efeito da amostragem preferencial apresenta maior
dificuldade em predizer corretamente valores extremos do processo S. Por outro lado, o mo-
delo que considera o efeito da amostragem preferencial, utilizando-se da vantagem de extrair
informacao da configuracao espacial dos pontos amostrais, permite corrigir suas predicoes
de forma a acomodar valores extremos de S. A Figura 6.6 apresenta os valores preditos de
S, representados pelas medianas a posteriori de S, e os respectivos intervalos de 95% de
credibilidade para cada um dos dois modelos.
Analisando-se a Figura 6.6 pode-se observar que somente os intervalos de credibilidade
do modelo que considera o efeito da amostragem preferencial englobam a maior parte dos
47
Figura 6.4: Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar o
efeito da amostragem preferencial para o processo simulado unidimensional (os cırculos representam
os valores verdadeiros dos parametros).
valores extremos do processo simulado S, em especial no intervalo [0, 30]. Adicionalmente,
pode-se observar que as estimativas pontuais de S nas regioes onde o processo foi pouco ob-
servado sao melhor realizadas pelo modelo que considera o efeito da amostragem preferencial.
Apesar da inferencia a respeito dos parametros do modelo ter influenciado nas diferencas
de predicao observadas entre ambos os modelos, parece razoavel concluir que grande parte
destas diferencas e causada pelas diferencas entre as distribuicoes [S | y] e [S | y,x] utilizadas
na predicao. A fim de avaliar a razoabilidade desta conclusao, procedeu-se a uma segunda
simulacao de inferencia para ambos os modelos. A fim de isolar-se o efeito das diferencas
48
Figura 6.5: Medianas a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo sob
amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o processo simulado
unidimensional. Os cırculos representam o variograma amostral observado e a linha preta representa
o verdadeiro variograma.
Figura 6.6: Processo simulado (linha cheia), mediana a posteriori da distribuicao preditiva (linha
vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para S obtidos con-
siderando (esquerda) e sem considerar (direita) o efeito da amostragem preferencial no processo
simulado unidimensional.
entre as estimativas dos parametros, procedeu-se a predicao S a partir dos verdadeiros valores
dos parametros do modelo.
A Figura 6.7 apresenta os resultados obtidos desta simulacao. Como pode ser obser-
49
vado, mesmo que a predicao seja feita de forma condicional ao conhecimento dos parametros
do modelo, a utilizacao das distribuicoes preditivas [S | y,x, θ] e [S | y, θ] produz resultados
significativamente diferentes. No caso especıfico desta simulacao, pode-se observar que a in-
certeza associada as regioes que encontram-se razoavelmente distantes dos pontos amostrados
e maior quando nao consideramos o efeito da amostragem preferencial.
Figura 6.7: Processo simulado (linha cheia), medias a posteriori da distribuicao preditiva (linha
vermelha) e respectivos intervalos de 95% de credibilidade (linhas tracejadas) para S obtidos pe-
las distribuicoes preditivas [S | y,x, θ] (esquerda) e [S | y, θ] (direita) para o processo simulado
unidimensional.
6.2 Estudo de simulacao bidimensional I
A fim de avaliar os efeitos da amostragem preferencial quando D ⊂ <2 realizou-se uma
simulacao de um processo Gaussiano sobre a regiao D = [0, 100] × [0, 100]. A regiao D foi
particionada em 225 sub-regioes e os parametros utilizados foram os seguintes
(α; β;µ;σ2;φ; τ 2; ∆) =
(−8; 2; 12; 2; 20; 0.1;
20
3
).
A Figura 6.8 apresenta a realizacao do processo Gaussiano S simulado sobre a regiao
de estudo. A partir de um conjunto de 12 observacoes y procedeu-se a inferencia para ambos
50
os casos estudados, isto e, considerando e deixando de considerar o efeito da amostragem
preferencial.
Figura 6.8: Realizacao do processo simulado bidimensional I juntamente com as posicoes das amos-
tras observadas (cırculos).
Em ambos os casos foram utilizados os mesmos hiperparametros utilizados na simulacao
unidimensional. Foram monitoradas 400.000 iteracoes no algoritmo MCMC para ambos os
modelos e as 50.000 ultimas foram utilizadas para compor as amostras das distribuicoes a
posteriori dos parametros do modelo.
As Figuras 6.9 e 6.10 apresentam histogramas das distribuicoes a posteriori de cada um
dos parametros do modelo sob amostragem preferencial e a Figura 6.11 apresenta os mesmos
resultados para o modelo sem considerar o efeito da amostragem preferencial.
Analisando-se as Figura 6.9 e 6.11 pode-se observar que as distribuicoes a posteriori
nao se encontram concentradas em torno dos valores verdadeiros de todos os parametros do
modelo. Esta dificuldade e parcialmente justificada tendo-se em vista que o tamanho da
amostra e muito pequeno. Entretanto, e interessante observar que, mesmo nestas condicoes,
os resultados obtidos pelo modelo supondo a existencia do efeito de amostragem preferencial
foram mais satisfatorios. Isto pode ser claramente observado na analise das distribuicoes
a posteriori de φ, µ e σ2. Uma boa inferencia para o parametro µ e de especial interesse,
uma vez que este parametro tendera a ser superestimado nas situacoes em que β > 0 (ou
51
Figura 6.9: Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito da amos-
tragem preferencial para o processo simulado bidimensional I (os cırculos representam os valores
verdadeiros dos parametros).
subestimado, quando β < 0).
No que diz respeito aos parametros α e β, a Figura 6.10 evidencia que ambos foram
estimados de forma satisfatoria.
A Figura 6.12 apresenta os variogramas estimados por ambos os modelos juntamente
com os seus respectivos intervalos de 95% de credibilidade. Neste caso, o IC 95% obtido para
o variograma estimado supondo a existencia de efeito da amostragem preferencial engloba o
verdadeiro variograma. Em contrapartida, o variograma estimado sem considerar este efeito
se aproxima do variograma amostral, o qual encontra-se distante do verdadeiro.
52
Figura 6.10: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito
da amostragem preferencial para o processo simulado bidimensional I (os cırculos representam os
valores verdadeiros dos parametros).
Por fim, a Figura 6.13 apresenta as superfıcies preditas de S, representadas pelas medias
a posteriori obtidas por cada modelo.
Analisando-se esta figura pode-se observar que apenas o modelo que considera o efeito da
amostragem preferencial consegue captar regioes onde o processo subjacente declina. Ape-
sar de tambem ser influenciado pela pequena amostra observada, este modelo consegue ir
alem das previsoes em torno da media, conforme as predicoes tradicionalmente obtidas em
Geoestatıstica.
6.3 Estudo de simulacao bidimensional II
A proxima simulacao utiliza uma grade mais fina que a grade apresentada na simulacao
anterior, passando de 225 para 400 sub-regioes. Os parametros utilizados nesta simulacao
foram os mesmos utilizados na simulacao bidimensional I, exceto ∆ = 5, e foram produzidas
17 observacoes sob efeito de amostragem preferencial. A Figura 6.14 apresenta a realizacao
deste processo sobre a regiao de estudo.
Mais uma vez procedeu-se a inferencia pelos dois metodos utilizando-se os mesmos hi-
53
Figura 6.11: Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar o
efeito da amostragem preferencial para o processo simulado bidimensional I (os cırculos representam
os valores verdadeiros dos parametros).
perparametros das simulacoes anteriores. Foram monitoradas 200.000 iteracoes no algoritmo
MCMC para ambos os modelos e as 30.000 ultimas foram utilizadas para compor as amostras
das distribuicoes a posteriori dos parametros do modelo.
As Figuras 6.15, 6.16 e 6.17 apresentam os histogramas das distribuicoes a posteriori
para cada um dos parametros dos modelos considerados.
Analisando-se as distribuicoes a posteriori obtidas, pode-se concluir que, exceto para
σ2 e µ, os demais parametros foram razoavelmente bem estimados por ambos os modelos.
Especificamente no caso do parametro µ, mais uma vez o modelo sem considerar o efeito da
54
Figura 6.12: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo sob
amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o processo simulado
bidimensional I . Os cırculos representam o variograma amostral observado e a linha preta representa
o verdadeiro variograma.
Figura 6.13: Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem con-
siderar (direita) o efeito da amostragem preferencial para o processo simulado bidimensional I.
amostragem preferencial superestimou-o significativamente. Entretanto, ambos os modelos
nao foram capazes de estimar σ2 de forma satisfatoria, apesar de uma pequena vantagem
para o modelo sob amostragem preferencial ter sido observada. No que diz respeito aos
parametros α e β, considerou-se o resultado satisfatorio, uma vez que os valores verdadeiros
destes parametros encontram-se entre os quantis de 2.5 % e 95% das distribuicoes a posteriori
55
Figura 6.14: Realizacao do processo simulado bidimensional II juntamente com as posicoes das
amostras observadas (cırculos).
obtidas.
A Figura 6.18 apresenta os variogramas estimados por ambos os modelos juntamente
com os seus respectivos intervalos de 95% de credibilidade. Apesar do variograma verdadeiro
nao estar contido dentro dos limites de 95% do intervalo de credibilidade, o modelo consi-
derando o efeito da amostragem preferencial apresenta estimativas mais satisfatorias quando
comparado com o modelo sem considerar este efeito.
Por fim, comparou-se as superfıcies preditas pela media a posteriori de S de ambos os
modelos. Pode-se observar na Figura 6.19 que, apesar de ambas as predicoes suavizarem os
valores de S, apenas o modelo que considera o efeito da amostragem preferencial consegue
captar o padrao da distribuicao espacial do processo subjacente, em especial na parte sul da
regiao de estudo.
6.4 Consideracoes a respeito das simulacoes
Apos a realizacao das simulacoes foi possıvel concluir que a inferencia realizada sob amos-
tragem preferencial e complexa, dependendo de fatores ligados a intensidade deste efeito, da
56
Figura 6.15: Histogramas das distribuicoes a posteriori dos parametros do modelo sob efeito da
amostragem preferencial para o processo simulado bidimensional II (os cırculos representam os
valores verdadeiros dos parametros).
configuracao do planejamento amostral e tambem do nıvel de discretizacao utilizado para
obtencao das distribuicoes a posteriori.
Em relacao ao nıvel da discretizacao, as simulacoes evidenciaram que a utilizacao de
100 sub-regioes no caso unidimensional e 225 no caso bidimensional foram suficientes para
produzir boas estimativas dos parametros envolvidos nos processos. Especificamente no caso
bidimensional, uma discretizacao um pouco mais fina (simulacao bidimensional II), com
400 sub-regioes, nao produziu ganhos significativamente superiores aos obtidos com 225 (si-
mulacao bidimensional I).
57
Figura 6.16: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito
da amostragem preferencial para o processo simulado bidimensional II (os cırculos representam os
valores verdadeiros dos parametros).
Tambem e importante mencionar que as simulacoes apresentadas neste Capıtulo refle-
tiram situacoes onde o numero de pontos amostrais observados nao era elevado. Entretanto,
mesmo nestas condicoes, a utilizacao dos modelos supondo a existencia da amostragem prefe-
rencial produziu variogramas e superfıcies de krigagem, em geral, mais proximas dos valores
verdadeiros quando comparadas as estimativas produzidas sem considerar este efeito.
Outra grande vantagem da utilizacao destes modelos esta na correcao produzida na
inferencia a respeito da media do processo subjacente µ. Este resultado foi satisfatorio prin-
cipalmente no caso de pequenas amostras, onde as estimativas tradicionais deste parametro
tendem a ser superestimadas (ou subestimadas, quando β < 0).
Por fim, tambem foi observada a capacidade que este modelo possui de identificar areas
da regiao de estudo onde o processo subjacente assume valores extremos, mesmo nas situacoes
em que nao dispomos de amostras proximas.
A comparacao entre as predicoes supondo θ conhecido reforcou a conclusao de que
que um metodo baseado na simples correcao de vıcio no variograma nao e suficiente para
reproduzir a verdadeira incerteza associada a distribuicao preditiva do processo subjacente
S. Conclusao equivalente foi obtida no caso da simulacao unidimensional, onde a inferencia
58
Figura 6.17: Histogramas das distribuicoes a posteriori dos parametros do modelo sem considerar o
efeito da amostragem preferencial para o processo simulado bidimensional II (os cırculos represen-
tam os valores verdadeiros dos parametros).
para os parametros do modelo produziu resultados bastante semelhantes, mas o resultado da
predicao foi significativamente distinto.
Realizando diferentes cenarios simulados de predicao sob efeito de amostragem prefe-
rencial, Gelfand et al. (2012) tambem concluıram que estes efeitos afetam de forma mais
significativa a predicao espacial do que a estimacao dos parametros do modelo. Ainda neste
artigo, eles discutem algumas formas de avaliar os efeitos da amostragem preferencial por
meio da comparacao de duas superfıcies preditas. Uma das formas de comparacao mencio-
nada por estes autores esta associada ao erro quadratico de predicao, produzindo uma medida
59
Figura 6.18: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo
sob amostragem preferencial (esquerda) e sem considerar este efeito (direita) para o processo simu-
lado bidimensional II . Os cırculos representam o variograma amostral observado e a linha preta
representa o verdadeiro variograma.
Figura 6.19: Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem con-
siderar (direita) o efeito da amostragem preferencial para o processo simulado bidimensional II.
local e uma medida global de erro.
O Erro de Predicao Local associado ao local x0, denotado EPL(x0), e definido como
EPL(x0) = E[S(x0)− S(x0)]2,
60
Tabela 6.1: Erro de Predicao Global (EPG) para cada uma das simulacoes realizadas.
Simulacao Sem Amostragem Preferencial Sob Amostragem Preferencial
Unidimensional 0.9496 0.7301
Bidimensional I 2.1336 1.6789
Bidimensional II 1.6214 1.3482
onde S(x0) representa o preditor de S no local x0, isto e, [S(x0) | θ,y]. A partir dos EPL’s,
definimos o Erro de Predicao Global como
EPG =1
|D|
∫D
EPL(x)dx.
A Tabela 6.1 apresenta os valores de EPG para cada uma das simulacoes realizadas.
Com base nesta tabela, pode-se observar a reducao obtida ao se considerar os efeitos da
amostragem preferencial. As Figuras 6.20 e 6.21 detalham um pouco mais este resultado
apresentando a distribuicao do EPL.
Analisando-se a Figura 6.20, podemos observar que os erros de predicao sofrem uma
reducao significativa para o modelo sob amostragem preferencial. Os mapas na Figura 6.21
fornecem conclusoes semelhantes, uma vez que os erros continuam a ser menores nas regioes
onde a magnitude de S e baixa quando o efeito da amostragem preferencial e levado em conta
na modelagem.
Outras simulacoes de utilizacao desta abordagem em situacoes onde efetivamente nao
ha efeito de amostragem preferencial foram tambem realizadas. Nestes casos, em geral,
a utilizacao desta abordagem produziu distribuicoes a posteriori de β centradas no valor
zero e distribuicoes preditivas muito semelhantes aquelas obtidas sem considerar o efeito da
amostragem preferencial. Esta observacao evidencia a utilidade desta abordagem quando
utilizada na forma de um teste de existencia de efeito de amostragem preferencial.
Em contrapartida, nas situacoes em que o planejamento amostral encontra-se irregu-
61
Figura 6.20: Boxplots dos Erros de Predicao Locais (EPL) considerando (esquerda) e sem considerar
(direita) os efeitos da amostragem preferencial no estudo simulado unidimensional.
larmente espacado, com grandes areas sem amostras e sem nenhum indicativo de que exista
justificativa teorica ou empırica para se assumir a existencia de efeito de amostragem prefe-
rencial, a utilizacao desta abordagem pode produzir resultados enganosos.
Nestes casos, a existencia de grandes areas da regiao D sem observacoes conduzira a
subestimacao (quando β > 0) ou superestimacao (quando β < 0) da media do processo e
produzira predicoes tendenciosas, uma vez que o enganoso padrao espacial das amostras sera
levado em conta na estimacao e predicao.
62
Figura 6.21: Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem conside-
rar (direita) os efeitos da amostragem preferencial nos estudos simulados bidimensionais I (acima)
e II (abaixo).
63
Capıtulo 7
Planejamento Amostral Otimo sob
Efeito de Amostragem Preferencial
Baseando-se na abordagem de Muller (1999) descrita no Capıtulo 5, o problema de escolha
do local otimo d∗ do planejamento amostral para processos espaciais cujas observacoes foram
obtidas via amostragem preferencial baseia-se na otimizacao de
U(d) = Eθ,yd|x,y[u(d, θ, yd)]. (7.1)
Para o caso onde a avaliacao de U(d) e realizada com base em simulacoes de θ a partir
de p(θ), temos
U(d) = Eθ,yd [u(d, θ, yd)]
=
∫u(d, θ, yd)p(θ, yd)dθdyd
=
∫u(d, θ, yd)p(yd | θ)p(θ)dθdyd
ou seja, conforme esperado, o planejamento amostral otimo a priori nao depende do processo
pontual gerador de pontos amostrais x. Sendo assim, a influencia da amostragem preferencial
64
nao impacta o planejamento amostral otimo.
Por outro lado, quando estao disponıveis observacoes x e y, utilizamos simulacoes de θ
a partir de p(θ | x,y) para avaliacao de U(d). Assim, temos
U(d) = Eθ,yd|x,y[u(d, θ, yd)]
=
∫u(d, θ, yd)p(θ, yd | x,y)dθdyd
=
∫u(d, θ, yd)p(yd | θ,x,y)p(θ | x,y)dθdyd
onde p(θ | x,y) e obtida conforme apresentado no Capıtulo 6. Por fim, dada a distribuicao
a posteriori de θ e a funcao utilidade, procede-se ao planejamento amostral otimo por meio
da obtencao da moda a posteriori da pseudo-distribuicao de d.
A dificuldade maior nesta etapa consiste em analisar os efeitos da amostragem prefe-
rencial na funcao utilidade u(d, θ, yd). Em muitos casos, a propria avaliacao desta funcao
torna-se nao-trivial.
Conforme observado no Capıtulo anterior, a amostragem preferencial impacta direta-
mente na estimacao da media µ do processo Gaussiano subjacente. Se a funcao utilidade
u(d, θ, yd) depender diretamente deste parametro, como nos casos em que existe uma maior
utilidade quando o processo assume valores extremos, o planejamento amostral otimo sera
grandemente afetado.
Por outro lado, seria esperado que a amostragem preferencial tambem afetasse significa-
tivamente funcoes utilidade definidas de forma a quantificar reducoes de incerteza associadas
ao ponto amostral escolhido. A razao para isto reside no fato da configuracao espacial dos
pontos amostrais tambem fornecer informacao a respeito do processo subjacente. Em outras
palavras, se β > 0 e em determinada sub-regiao D′, D′ ⊂ D, se observa que nao ha pon-
tos amostrais observados, podemos concluir que a magnitude do processo subjacente S(x) e
baixa em x ∈ D′. Conclusoes analogas podem ser obtidas caso β < 0.
Utilizando como exemplo a funcao utilidade definida no Capıtulo 5, precisarıamos in-
65
cluir a informacao obtida por meio da configuracao observada do processo pontual x, isto
e,
u(d, θ, yd) =
∫[V (S(x) | θ,x,y)− V (S | θ,x,y, yd)]dx, (7.2)
e precisarıamos conhecer a variancia da distribuicao de [S | θ,x,y]. Apesar de obtermos
amostras desta distribuicao durante a implementacao do MCMC descrito no Capıtulo 6, nao
temos como obter diretamente estimativas desta variancia a cada iteracao do algoritmo. Para
contornar esta dificuldade uma aproximacao desta distribuicao sera obtida a fim de que seja
possıvel avaliar os impactos da amostragem preferencial no planejamento amostral otimo.
Como alternativa, optou-se por realizar uma simples aproximacao na funcao
p(x | S, α, β) ∝M∏i=1
[exp(α + βS(xi))]ni exp(−∆
∑i
exp(α + βS(xi))).
Mais especificamente, utilizando o resultado da expansao da funcao exponencial em
series de Taylor ate o termo de segunda ordem em torno do ponto zero, foi obtida a seguinte
aproximacao
∑i
exp(α + βS(xi)) ≈ eα(
1M + β1M′S +
β2
2S ′S
).
Inserindo esta aproximacao em p(x | S, α, β), pode-se mostrar que a distribuicao con-
dicional completa de [S | θ,y,x] torna-se Gaussiana com vetor de medias Θ e matriz de
covariancias Σ dados por
Θ = Σ×
(yn − µn)τ−2 + βn−∆βeαn
−∆βeα1N
(7.3)
e
66
Σ =
(τ−2 + ∆β2eα)In +R−1n Rn,NA
−1RN,nR−1n + σ−2R−1
n −R−1n Rn,NA
−1
−A−1RN,nR−1n ∆β2eαIN + A−1
−1
, (7.4)
onde A = σ2RN − σ2RN,nR−1n Rn,N e os vetores n e yn representam o numero de observacoes
e os totais observados em cada sub-regiao de D. Assim, a variancia preditiva para um local
nao-observado xNi pode ser aproximada pelo elemento correspondente da diagonal de Σ, isto
e, ΣNi,Ni .
Caso β = 0, esta matriz torna-se equivalente a matriz de covariancias da distribuicao
preditiva de S tradicionalmente obtida pelos metodos de inferencia em Geoestatıstica, pro-
duzindo
V (SNi | θ,y, x) ≈ σ2RN − σ2RN,n(σ2Rn + Inτ2)−1σ2Rn,N ,
onde os ındices n e N indicam os blocos da matriz de covariancia associados aos locais
observados e nao-observados, respectivamente.
7.1 Estudo de simulacao unidimensional
Utilizando o exemplo simulado apresentado no Capıtulo 6, vamos ilustrar os efeitos da amos-
tragem preferencial no processo de definicao do planejamento amostral otimo unidimensional.
Para posterior avaliacao da funcao utilidade, foi utilizada ainda uma grade auxiliar de 83 pon-
tos para o calculo da reducao media das variancias preditivas.
A partir das amostras das distribuicoes a posteriori foram obtidas as amostras da
pseudo-distribuicao u(d) no caso onde existe a influencia da amostragem preferencial e para
o caso onde este efeito nao esta presente.
A Figura 7.1 apresenta os histogramas da pseudo-distribuicao a posteriori do local
amostral otimo d para o caso onde supomos a presenca do efeito da amostragem preferencial
67
e para o caso onde esta suposicao nao e realizada, respectivamente.
Figura 7.1: Histograma da pseudo-distribuicao a posteriori de d considerando (esquerda) e sem
considerar (direita) o efeito da amostragem preferencial no exemplo simulado unidimensional.
Analisando-se os histogramas pode-se notar que o planejamento amostral otimo sem
considerar o efeito da amostragem preferencial aponta fortemente para a escolha de um local
na regiao menos amostrada da serie, isto e, no intervalo [5, 35]. Por outro lado, quando o efeito
da amostragem preferencial e captado, esta percepcao e totalmente alterada. Neste caso,
exceto no intervalo onde existem varias amostras observadas, os demais intervalos possuem
utilidade esperada aproximadamente equivalentes. Em resumo, a consideracao do efeito
da amostragem preferencial alterou significativamente o processo decisorio do planejamento
amostral otimo.
7.2 Estudo de simulacao bidimensional I
Partindo do caso bidimensional I analisado anteriormente, foram obtidas as amostras da
pseudo-distribuicao u(d) nos casos onde temos a influencia da amostragem preferencial e
para o caso onde este efeito nao esta presente. Foi utilizada ainda uma grade auxiliar de 900
68
pontos para o calculo da reducao media das variancias preditivas para posterior avaliacao da
funcao utilidade.
As Figuras 7.2 e 7.3 apresentam as pseudo-distribuicoes do local amostral otimo d
obtidas para os dois casos. Analisando-se ambas as figuras pode-se notar que as areas com
maior utilidade esperada sao significativamente diferentes para os dois modelos. Conforme
esperado, o planejamento amostral otimo sem considerar o efeito da amostragem preferencial
acaba sendo direcionado para os locais mais distantes dos pontos amostrais observados. Por
outro lado, o modelo que considera estes efeitos distribui as maiores utilidades esperadas
entre varias sub-regioes da regiao D, alocando baixa utilidade apenas nas sub-regioes onde
foram observados os pontos amostrais.
Figura 7.2: Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem preferen-
cial para o exemplo simulado bidimensional I. Os valores da densidade desta pseudo-distribuicao
encontram-se multiplicados por 100 para melhor visualizacao.
69
Figura 7.3: Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem preferen-
cial para o exemplo simulado bidimensional I. Os valores da densidade desta pseudo-distribuicao
encontram-se multiplicados por 100 para melhor visualizacao.
7.3 Estudo de simulacao bidimensional II
Por fim, as Figuras 7.4 e 7.5 apresentam as pseudo-distribuicoes do local amostral otimo d
obtidas para os dados da simulacao bidimensional II no caso onde supomos a presenca do
efeito da amostragem preferencial e no caso onde esta suposicao nao e realizada, respecti-
vamente. Foi utilizada ainda uma grade auxiliar de 400 pontos para o calculo da reducao
media das variancias preditivas para posterior avaliacao da funcao utilidade.
Assim como nas simulacoes anteriores, o padrao de alteracao na decisao do planejamento
amostral otimo sob amostragem preferencial parece seguir a mesma direcao, isto e, apontando
para uma distribuicao de utilidades mais homogenea entre os diferentes locais candidatos a
novo ponto amostral.
70
Figura 7.4: Pseudo-distribuicao a posteriori de d considerando o efeito da amostragem preferen-
cial para o exemplo simulado bidimensional II. Os valores da densidade desta pseudo-distribuicao
encontram-se multiplicados por 100 para melhor visualizacao.
7.4 Consideracoes a respeito das simulacoes
Apos a realizacao das simulacoes pode-se concluir que a consideracao do efeito da amostra-
gem preferencial altera significativamente o processo decisorio de escolha de um novo ponto
amostral.
Os tres casos simulados envolviam processos cujos resultados obtidos no processo de
inferencia pelos dois modelos variavam significativamente. Curiosamente, mesmo no caso da
simulacao unidimensional, onde os variogramas estimados eram bastante proximos, o pro-
cesso de obtencao do planejamento amostral otimo conduziu a resultados significativamente
distintos.
Por outro lado, e importante lembrar que o tipo de funcao utilidade aplicado tambem
pode produzir diferencas nos resultados. Apesar da funcao utilidade escolhida ser razoavel
71
Figura 7.5: Pseudo-distribuicao a posteriori de d sem considerar o efeito da amostragem preferen-
cial para o exemplo simulado bidimensional II. Os valores da densidade desta pseudo-distribuicoes
encontra-se multiplicado por 100 para melhor visualizacao.
e intrinsicamente associada aos objetivos da Geoestatıstica, outras funcoes poderiam ser
consideradas. De acordo com os resultados obtidos nesta tese, acredita-se que a utilizacao
de funcoes utilidade que dependam da media do processo subjacente podem ser tambem
bastante impactadas pelos efeitos da amostragem preferencial, conforme sera evidenciado na
aplicacao descrita no Capıtulo 8.
Existem ainda outros fatores com elevado potencial de influencia nos resultados, como
a escolha da malha auxiliar (utilizada para avaliacao da reducao da variancia preditiva),
bem como o nıvel de discretizacao da regiao D em estudo. Entretanto, o elevado custo
computacional associado a aplicacao de metodologias de otimizacao de funcoes torna-se um
desafio e uma barreira para a avaliacao de grau de influencia marginal de cada um destes
efeitos.
Como forma de auxiliar no processo de obtencao do planejamento amostral otimo,
72
pode-se ainda utilizar a estrategia de MCMC com simulated annealing, descrita no Capıtulo
5, para evitar a obtencao de pseudo-distribuicoes U(d) demasiadamente planas e auxiliar na
identificacao das areas com maior utilidade esperada.
7.5 Analise da efetividade do planejamento amostral
otimo
Apos a obtencao do planejamento amostral otimo segundo ambas as abordagens, podemos
avaliar se o resultado indicado pelo modelo sob efeito da amostragem preferencial realmente
produz uma maior reducao na variancia preditiva do processo subjacente S. Em outras
palavras, e de grande interesse avaliar a efetividade da utilizacao desta metodologia em
indicar um local para amostragem que produza maior utilidade (quantificada em termos da
funcao objetivo) para o pesquisador.
Com este intuito, procedeu-se a escolha dos locais apontados por ambos os modelos no
estudo simulado bidimensional I. Os locais para amostragem otima apontados pelos modelos
foram xd = (90.00; 76.66), para o modelo sob amostragem preferencial, e xd = (30.00; 50.00)
para o modelo sem considerar o efeito da amostragem preferencial. A Figura 7.6 apresenta
os locais amostrados que foram considerados para cada modelo.
Para a comparacao entre as abordagens considerou-se tambem que yd = µ+S(xd). Em
outras palavras, as observacoes associadas aos locais otimos foram tomadas sem incorporar
o erro associado ao efeito pepita τ 2. Assim, os valores considerados foram yd = S(xd) + 12 =
11.157 e yd = S(xd) + 12 = 10.719, para os modelos considerando e sem considerar o efeito
da amostragem preferencial, respectivamente.
A Figura 7.7 apresenta as predicoes realizadas apos a observacao do planejamento amos-
tral otimo para ambos os modelos. Assim como nas analises realizadas antes da escolha do
planejamento amostral otimo, os resultados obtidos para o modelo sob efeito de amostra-
gem preferencial foram mais satisfatorios. E interessante notar tambem que a inclusao do
73
Figura 7.6: Locais otimos apontados pelos modelos considerando (esquerda) e sem considerar (di-
reita) os efeitos da amostragem preferencial no estudo simulado bidimensional I.
local otimo apontado pelo modelo sem efeito de amostragem preferencial produziu uma sig-
nificativa melhora das previsoes realizadas na vizinhanca deste local. Contudo, esta escolha
acabou tambem produzindo um aumento no erro de predicao em locais cujo valor do processo
subjacente S era elevado. Por este motivo, os erros de previsao associados ao modelo sob
amostragem preferencial foram menos elevados. Esta constatacao pode ser melhor explorada
analisando-se a Figura 7.8.
A Tabela 7.1 apresenta os Erros de Predicao Globais (EPG) apos a observacao do
planejamento amostral otimo para ambos os modelos. A utilizacao do planejamento amostral
otimo apontado pelo modelo sob efeito de amostragem preferencial continou produzindo um
erro de predicao global inferior, apesar de apresentar um pequeno aumento em relacao a
analise anterior. Este aumento pode ser explicado em virtude da escolha do novo local
otimo de amostragem ter sido obtido de forma intencional. O fato da escolha nao ter sido
realizada a partir da consideracao de um processo pontual subjacente exerce uma influencia
nas posterioris de α e β e provoca um aumento nos erros de predicao.
Por fim, para ilustrar outra vantagem do local otimo apontado pelo modelo sob amos-
tragem preferencial, procedeu-se a inferencia incluindo-o na analise e assumindo o modelo
Geoestatıstico tradicional. Os resultados forneceram um EPG = 2.1719, o qual representa
74
Figura 7.7: Media a posteriori da distribuicao preditiva de S obtidos considerando (esquerda) e sem
considerar (direita) o efeito da amostragem preferencial para o processo simulado bidimensional I
apos a obtencao do planejamento amostral otimo.
Figura 7.8: Mapas com os Erros de Predicao Locais (EPL) considerando (esquerda) e sem considerar
(direita) o efeito da amostragem preferencial no exemplo simulado bidimensional I apos a obtencao
do planejamento amostral otimo.
um valor inferior ao obtido utilizando-se o local apontado pelo modelo sem efeito de amos-
tragem preferencial, conforme mostra a Tabela 7.1.
Desta forma, podemos concluir que a utilizacao do local amostral otimo proposto pelo
modelo sob efeito de amostragem preferencial mostrou-se vantajosa mesmo quando a in-
75
Tabela 7.1: Erro de Predicao Global (EPG) no exemplo simulado bidimensional I apos a obtencao
do planejamento amostral otimo apontado por cada um dos modelos considerados.
Modelo Sem efeito de amostragem pref. Sob efeito de amostragem pref.
EPG 2.3348 1.8392
ferencia foi realizada via metodos tradicionais de Geoestatıstica.
76
Capıtulo 8
Aplicacao a Dados de Precipitacao
Pluviometrica no Rio de Janeiro
A metodologia de obtencao do planejamento amostral otimo foi aplicada a um cenario real
no contexto de redes de monitoramento ambientais. Mais especificamente, serao analisados
dados de precipitacao pluviometrica obtidos de 32 estacoes de monitoramento localizadas na
cidade do Rio de Janeiro.
Os dados se referem a precipitacao total (em mm) observada no perıodo de 01 a
31 de Outubro de 2005 e foram obtidos junto ao Instituto Pereira Passos (IPP) pelo site
www.armazemdedados.rio.rj.gov.br (acessado em 04 de setembro de 2012).
A analise da precipitacao no mes de Outubro, epoca do ano na qual inicia-se a estacao
chuvosa na regiao Sudeste do Brasil, e de interesse especial para meteorologistas e orgaos go-
vernamentais (Alves et al., 2005). A Figura 8.1 apresenta o mapa da cidade do Rio de Janeiro
juntamente com os respectivos nıveis de precipitacao (agrupados por quintis) observados no
perıodo de interesse.
A analise da distribuicao espacial das estacoes monitoradoras parece indicar uma maior
concentracao destas em locais onde os nıveis de precipitacao sao mais elevados. Mais pre-
cisamente, o padrao pontual associado as estacoes parece ter sido observado segundo uma
77
Figura 8.1: Precipitacao Pluviometrica na cidade do Rio de Janeiro em Out/2005 (as estacoes estao
separadas de acordo com os quantis de 20%, 40%, 60% e 80% e agrupadas pelas cores azul, verde,
amarelo, marrom e vermelho, respectivamente).
realizacao de um processo de Cox log-Gaussiano (com β > 0). Embora aspectos geograficos
e economicos da cidade tambem possam ser considerados como possıveis causas do planeja-
mento amostral amostral observado, o emprego da metodologia de obtencao do planejamento
amostral otimo sob amostragem preferencial parece adequado para estes dados.
8.1 Predicao espacial
Primeiramente realizou-se a inferencia no intuito de estudar os parametros da covariancia
espacial e obter a superfıcie predita de precipitacao sobre a cidade. Para isto, foram utilizados
o modelo Geoestatıstico tradicional e o modelo sob efeito de amostragem preferencial.
Para a inferencia, foram utilizadas as mesmas prioris utilizadas nos estudos de simulacao
bidimensionais apresentados no Capıtulo 6, exceto por alteracoes nos hiperparametros das
prioris de τ−2 (aτ = 5; bτ = 5), σ−2 (aσ = 1; bσ = 1000) e uma alteracao nos hiperparametros
da priori para φ (aφ = 1; bφ = 0.1), tendo em vista a mudanca de escala deD. Adicionalmente,
78
particionou-se a regiao em estudo em M = 332 sub-regioes.
Foram monitoradas 100.000 iteracoes no algoritmo MCMC para ambos os modelos e as
primeiras 10.000 amostras foram desprezadas. A convergencia das cadeias foi realizada por
meio de inspecao visual de cadeias que partiram de valores iniciais distintos.
Para evitar taxas de aceitacao muito baixas para as propostas de S durante o algoritmo
MCMC, optou-se por amostrar as componentes S1, ..., SM individualmente. Sem perda de
generalidade, suponha que Sy = S1, ..., Sn e SN = Sn+1, ..., SM, onde S = Sy, SN.
Neste caso, a distribuicao condicional completa de Si torna-se
p(Si | S−i, µ, τ−2, σ−2, φ, α, β,x,y) ∝ exp− 1
2τ2[S2i − 2Si(yi − µ)] + βSi −
S′R−1M S
2σ2
×
× exp−∆eα+βSi
, i = 1, ..., n
para os locais onde amostras foram observadas e
p(Si | S−i, µ, τ−2, σ−2, φ, α, β,x,y) ∝ exp−S′pR
−1M Sp
2σ2 −∆eα+βSi
, i = n+ 1, ...,M
para os locais onde nao foram observadas amostras. Assim, os Si’s sao atualizados por passos
de Metropolis com propostas Gaussianas unidimensionais centradas nos valores da iteracao
anterior, onde as probabilidades de aceitacao das propostas no MCMC sao, respectivamente,
dadas por
pSi = exp− 1
2τ2[(S2prop
i − S2i )− 2(Spropi − Si)(yi − µ)] + β(Spropi − Si)−
S′pR−1M Sp−S′R−1
M S
2σ2
×
× exp−∆eα(eβS
propi − eβSi)
, i = 1, ..., n
e
pSi = exp−S′pR
−1M Sp−S′R−1
M S
2σ2 −∆eα(eβSpropi − eβSi)
, i = n+ 1, ...,M.
Na expressao desta distribuicao condicional completa o vetor Sp e dado por Sp =(Sj−1
1 , . . . , Spropi , . . . , Sj−1M
)′, onde j representa o numero da iteracao do MCMC.
A Tabela 8.1 apresenta as medias a posteriori e os respectivos intervalos de 95% de credi-
bilidade para os parametros estimados considerando e sem considerar efeitos de amostragem
preferencial.
79
Tabela 8.1: Media a posteriori e IC 95% (entre parentesis) para os parametros de ambos os modelos.
Parametros do modelo Sob Amostragem Preferencial Sem amostragem preferencial
τ 2 1.25 (0.49 ; 2.90) 1.32 (0.51 ; 3.45)
σ2 4289.92 (2096.31 ; 10528.91) 4132.72 (2120.30 ; 8514.38)
µ 104.84 (97.73 ; 110.60) 119.88 (111.49 ; 130.32)
φ 10.69 (4.27 ; 26.75) 10.43 (4.51 ; 22.76)
α -3.84 (-4.24 ; -3.48) —
β 0.008 (0.002 ; 0.014) —
Os resultados obtidos evidenciam a significancia dos parametros associados ao efeito da
amostragem preferencial, sugerindo uma possıvel associacao entre o plano amostral amostral
e a magnitude da precipitacao no municıpio.
A inferencia para os parametros da estrutura de covariancia espacial resultou em re-
sultados semelhantes, conforme pode ser observado nos variogramas estimados por ambos os
modelos na Figura 8.2.
Figura 8.2: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo
considerando (esquerda) e sem considerar (direita) efeitos da amostragem preferencial para os dados
de precipitacao pluviometrica na cidade do Rio de Janeiro (os cırculos representam o variograma
amostral observado).
80
Em contrapartida, a distribuicao a posteriori da media µ produziu estimativas significa-
tivamente distintas para ambos os modelos. A media estimada pelo modelo sob amostragem
preferencial foi significativamente mais baixa do que a media estimada pelo modelo sem con-
siderar este efeito (104.84 contra 119.88, respectivamente). Este resultado e compatıvel com
a significancia do efeito da amostragem preferencial (β > 0).
Por fim, a Figura 8.3 apresenta as superfıcies preditas de S, representadas pelas medias a
posteriori obtidas por cada um dos modelos. Conforme observado nas simulacoes realizadas
no Capıtulo 6, a incorporacao do efeito da amostragem preferencial produziu diferencas
significativas nas superfıcies preditas. A distincao entre as predicoes torna-se ainda mais
evidente quando comparamos as distribuicoes preditivas [Y | x,y] e [Y | y] (ver Figura 8.4),
uma vez que a media µ estimada para ambos os modelos difere significativamente.
8.2 Planejamento amostral otimo
Para a escolha do planejamento amostral otimo foi utilizada a seguinte funcao utilidade
u(d, θ, yd) = P [Y (xd) > 200 | θ,x,y] = P [S(xd) > 200− µ | θ,x,y], (8.1)
onde xd representa o local associado a yd. Esta funcao associa maior utilidade para locais
onde exista maior probabilidade de que o nıvel de chuva seja elevado, isto e, com preci-
pitacao total no mes de Outubro superior a 200 mm. Esta funcao utilidade pode ser bastante
util quando o interesse do pesquisador e detectar o inıcio da estacao chuvosa por meio da
alocacao de estacoes de monitoramento em pontos da cidade mais sensıveis aos impactos desta
alteracao climatica. As pseudo-distribuicoes a posteriori de d obtidas para cada modelo sao
apresentadas na Figura 8.5.
Uma vez que a funcao utilidade favorece regioes com maior probabilidade de observacao
de eventos extremos, somado ao fato de que a media µ foi superestimada devido ao efeito da
amostragem preferencial, o modelo tradicional de Geoestatıstica concentrou a distribuicao a
81
Figura 8.3: Media a posteriori da distribuicao preditiva de S obtida considerando (acima) e sem
considerar (abaixo) o efeito da amostragem preferencial para os dados de precipitacao pluviometrica
na cidade do Rio de Janeiro.
posteriori de d sobre uma pequena area da cidade. Por outro lado, considerando o efeito da
amostragem preferencial, temos que esta distribuicao encontra-se mais dispersa ao longo do
sudoeste da cidade do Rio de Janeiro.
Os diferentes resultados obtidos reforcam a conclusao de que a amostragem preferencial
82
Figura 8.4: Media a posteriori da distribuicao preditiva de Y obtida considerando (acima) e sem
considerar (abaixo) o efeito da amostragem preferencial para os dados de precipitacao pluviometrica
na cidade do Rio de Janeiro.
produz grandes impactos na obtencao do planejamento amostral otimo, em especial quando
as funcoes utilidade empregadas dependem diretamente da media µ do processo subjacente.
83
Figura 8.5: Pseudo-distribuicao a posteriori de d obtida sob amostragem preferencial (acima) e sem
considerar este efeito (abaixo) para os dados de precipitacao pluviometrica na cidade do Rio de
Janeiro.
84
Capıtulo 9
Amostragem Preferencial com
Repulsao em Geoestatıstica
O modelo desenvolvido por Diggle et al. (2010) para lidar com efeitos de amostragem prefe-
rencial em Geoestatıstica pressupoe que, se β > 0, o numero esperado de pontos amostrais
observados e bastante elevado na vizinhanca de locais onde o processo subjacente assume
valores extremos (ou bastante reduzido, quando β < 0).
Assim, caso a regiao em estudo fosse discretizada, isto e, subdividida em M sub-regioes,
o numero esperado de pontos observados seria bastante elevado em algumas delas.
Entretanto, em muitas situacoes praticas isto pode nao acontecer. E razoavel supor
que um pesquisador, de posse de uma medicao do processo em um determinado local x, nao
buscaria outras observacoes proximas a este local, exceto se existisse o interesse em se estudar
a suavidade do processo, a existencia de efeitos de pequena escala ou ainda possıveis erros
de medicao nas variaveis y. Procedendo desta forma, o plano amostral realizado incluiria,
na pratica, uma janela de repulsao centrada em cada observacao amostral.
Diante deste cenario, pode ser razoavel assumir que, para determinadas particoes da
regiao D em estudo, cada sub-regiao contenha no maximo um ponto amostral. Esta hipotese
se assemelha com o procedimento adotado por Diggle et al. (2010) para acomodar os efeitos
85
da amostragem preferencial (onde previa-se que cada celula deveria ser pequena o bastante
para conter apenas um ponto amostral) e, deste modo, podemos supor uma distribuicao
Bernoulli para a ocorrencia de um evento amostral em cada celula ao inves de utilizar a
distribuicao Poisson.
Neste caso, assumindo que foi realizada uma particao na regiao D em estudo, pode-
mos assumir que, em cada uma das M sub-regioes, um evento pode ocorrer segundo uma
distribuicao Bernoulli com probabilidade de sucesso dada por
pi = P [Xi = 1] = 1− exp(−∆i exp(α + βSi)), (9.1)
onde Xi assume o valor 1 quando um ponto amostral e observado e e igual a zero caso
contrario (i = 1, ...,M). Esta probabilidade pi pode ser interpretada como a probabilidade
de observar-se ao menos 1 (um) ponto na sub-regiao i, caso estes eventos ocorressem em D
segundo um processo de Cox log-Gaussiano com intensidade λ(x) = exp(α + βS(x)).
Sob estas condicoes e condicional ao conhecimento de p = p1, ..., pM, temos que x
e um processo de Bernoulli nao-homogeneo (McDonald, 2004). Assumindo que ∆i = ∆,∀i,
e que p(x | p) =∏M
i=1 pxii (1− pi)1−xi , temos que a funcao de verossimilhanca de [x | S, α, β]
e dada por
p(x | S, α, β) =M∏i=1
[1− exp(−∆ exp(α + βS(xi)))]xi exp
−∆
M∑j=1
(1− xj) exp(α + βS(xj))
=n∏i=1
[1− exp(−∆ exp(α + βSyi(xi)))] exp
−∆
M∑j=1
(1− xj) exp(α + βS(xj))
,
onde xi = 0, 1, para i = 1, ...,M .
As distribuicoes de [y | Sy, µ, τ2] e de S permanecem as mesmas utilizadas no modelo
sob amostragem preferencial, assim como as distribuicoes a priori.
Realizando a inferencia por meio dos metodos MCMC para este modelo, temos que as
86
distribuicoes condicionais completas dos parametros µ, τ−2, σ−2 e φ sao dadas pelas mesmas
expressoes obtidas no Capıtulo 6. Por outro lado, as distribuicoes condicionais completas de
S, β e α sao modificadas para
p(S | µ, τ−2, σ−2, φ, α, β,x,y) ∝∏n
i=1[1− exp(−∆eα+βSyi )]×
× exp∑
yiSyiτ2− nSy
µτ2−
∑S2yi
2τ2−∆
∑M(1− xi) exp(α + βS(xi))−S′R−1
M S
2σ2
,
p(β | S, µ, τ−2, σ−2, φ, α,x,y) ∝ p(x | S, α, β)p(β) ∝∏n
i=1[1− exp(−∆eα+βSyi )]×
× exp−∆
∑M(1− xi) exp(α + βS(xi))− β2
2k
,
p(α | S, µ, τ−2, σ−2, φ, β,x,y) ∝∏n
i=1[1− exp(−∆eα+βSyi )]×
× exp−∆
∑M(1− xi) exp(α + βS(xi))− α2
2k
e sao atualizadas por passos de Metropolis com propostas Gaussianas centradas no valor
da iteracao anterior, onde as probabilidades de aceitacao das propostas no MCMC sao,
respectivamente, dadas por
pS = exp
∑yi(S
propyi−Syi )
τ2− n(Spropy − Sy) µ
τ2+
∑(S2yi−S2prop
yi)
2τ2
×
× exp
∆∑M(1− xi)[exp(α + βS(xi))− exp(α + βSprop(xi))] +
(S′R−1M S−S′propR−1
M Sprop)
2σ2
×
×∏n
i=1[1−exp(−∆e
α+βSpropyi )]
[1−exp(−∆eα+βSyi )],
pβ = exp
∆∑M(1− xi)[exp(α + βS(xi))− exp(α + βpropS(xi))] + (β2−β2prop)
2k
×
×∏n
i=1[1−exp(−∆eα+β
propSyi )]
[1−exp(−∆eα+βSyi )]e
pα = exp
∆∑M(1− xi)[exp(α + βS(xi))− exp(αprop + βS(xi))] + (α2−α2prop)
2k
×
×∏n
i=1[1−exp(−∆eα
prop+βSyi )]
[1−exp(−∆eα+βSyi )].
No caso ondeD ⊂ <2, a regiao em estudo pode ser particionada em sub-regioes regulares
com a maior area possıvel de forma a garantir que no maximo um ponto amostral pertenca
a cada uma delas. Neste caso, o valor de ∆ pode ser interpretado com uma estimativa da
87
janela de repulsao presente durante o processo de obtencao da amostra.
Com a utilizacao desta metodologia espera-se uma melhoria na identificacao da magni-
tude de efeitos de amostragem preferencial nos casos em que o arranjo amostral for influen-
ciado por um efeito secundario de repulsao (ou regularidade) espacial.
9.1 Estudo de simulacao
A fim de avaliar os efeitos da amostragem preferencial com repulsao foi realizada uma nova
simulacao considerando D ⊂ <2. De forma analoga a simulacao bidimensional I, discutida no
Capıtulo 6, realizou-se uma simulacao de um processo Gaussiano sobre a regiao D = [0, 100]×
[0, 100] utilizando-se a mesma particao de 225 sub-regioes e considerando os parametros
(α; β;µ;σ2;φ; τ 2; ∆) =
(−7; 3; 12; 2; 20; 0.1;
20
3
).
A partir do modelo sob amostragem preferencial com repulsao, foram obtidas ob-
servacoes y. A fim de permitir uma melhor avaliacao dos resultados, a simulacao foi re-
alizada em duas etapas. Primeiramente foram obtidas amostras dentro de cada sub-regiao
segundo uma distribuicao Poisson com parametro ∆λ(x). Nesta etapa, foram obtidas 914
observacoes distribuıdas entre 225 sub-regioes. Em seguida, procedeu-se a simulacao de ape-
nas uma observacao dentro de cada uma das 58 celulas onde observou-se ao menos 1 (um)
ponto amostral.
A Figura 9.1 apresenta a realizacao do processo Gaussiano S simulado sobre a regiao
de estudo e os locais das amostras obtidas.
Para a inferencia, foram utilizados os mesmos hiperparametros utilizados nas simulacoes
discutidas no Capıtulo 6, exceto para os parametros α e β, cuja variancia foi reduzida para
10 a fim de evitar problemas de nao-identificabilidade.
Foram monitoradas 500.000 iteracoes no algoritmo MCMC para ambos os modelos e
88
Figura 9.1: Realizacao do processo simulado bidimensional sob efeito de amostragem preferencial
com repulsao juntamente com as posicoes das amostras observadas (cırculos).
as 300.000 ultimas foram utilizadas para compor as amostras das distribuicoes a posteriori
dos parametros do modelo. Para fins de comparacao, tambem realizou-se a inferencia sob
amostragem preferencial sem repulsao.
As Figuras 9.2 e 9.3 apresentam os histogramas das distribuicoes a posteriori de α e
β para os modelos sob amostragem preferencial considerando e sem considerar o efeito de
repulsao, respectivamente.
As Figuras 9.2 e 9.3 mostram que o modelo sob amostragem preferencial considerando
o efeito da repulsao produziu distribuicoes a posteriori que englobam os verdadeiros valores
de α e β, com intervalos de 95% de credibilidade dados por (-8.63; -5.376) e (2.275; 6.771),
respectivamente. Por outro lado, o modelo sem efeito de repulsao nao produziu resultados
satisfatorios, fornecendo intervalos de 95% de credibilidade que nao incluem os valores verda-
deiros de α, (-6.541; -5.558), e β, (1.289; 2.681). Apesar da grande amplitude dos intervalos,
os resultados do modelo considerando o efeito da repulsao foram satisfatorios na estimacao
destes parametros.
A Figura 9.4 apresenta os variogramas estimados por ambos os modelos, juntamente
com os seus respectivos intervalos de 95% de credibilidade. Analisando os resultados, temos
que apenas o IC 95% obtido para o variograma estimado sob amostragem preferencial com
89
Figura 9.2: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito da
amostragem preferencial para o processo simulado com efeito de repulsao (os cırculos representam
os valores verdadeiros dos parametros).
Figura 9.3: Histogramas das distribuicoes a posteriori dos parametros que configuram o efeito da
amostragem preferencial para o processo simulado sem efeito de repulsao (os cırculos representam
os valores verdadeiros dos parametros).
repulsao engloba o verdadeiro variograma. Conforme esperado, o variograma estimado sem
considerar o efeito de repulsao se aproxima do variograma amostral, o qual encontra-se dis-
tante do verdadeiro. Como consequencia, temos que a inferencia a respeito dos parametros
que definem a estrutura de covariancia espacial do processo subjacente nao foram estimados
de forma satisfatoria.
90
Figura 9.4: Mediana a posteriori e respectivos IC 95% dos variogramas estimados pelo modelo sob
amostragem preferencial com repulsao (esquerda) e sem repulsao (direita) para o processo simulado.
Os cırculos representam o variograma amostral observado e a linha preta representa o verdadeiro
variograma.
Por fim, a Figura 9.5 apresenta as superfıcies preditas de S, representados pelas medias
a posteriori obtidas por cada um dos modelos.
Figura 9.5: Media a posteriori da distribuicao preditiva de S considerando (esquerda) e sem consi-
derar (direita) o efeito da amostragem preferencial com repulsao para o processo simulado.
Analisando as predicoes, pode-se concluir que ambos os modelos conseguem identificar
as regioes onde o processo subjacente possui menor magnitude, o que nao seria possıvel com a
91
utilizacao do modelo Geoestatıstico tradicional. Entretanto, o modelo que considera o efeito
da repulsao forneceu melhores predicoes, produzindo um EPG igual a 0.7858 contra um EPG
de 0.9681 para o modelo sem o efeito da repulsao.
Adicionalmente, analisando-se a menor distancia observada entre dois pontos amostrais,
podemos estimar a janela de repulsao em 6.667 u.d. (unidades de distancia).
9.2 Consideracoes sobre os resultados
De forma resumida, podemos dizer que o modelo Geoestatıstico sob amostragem preferencial
com repulsao representa um cenario onde o pesquisador, baseado na magnitude do processo
em estudo, planeja uma amostra que contemple ao menos uma observacao nos locais conside-
rados crıticos ou de interesse especial. Nestes casos, parece razoavel supor que a observacao
de mais de 1 (um) ponto amostral nao traria informacao relevante para a estimacao dos
parametros do processo subjacente.
Contudo, a realizacao da inferencia para o modelo Geoestatıstico sob amostragem prefe-
rencial com repulsao mostra-se complexa. Alem do aspecto computacional, outra dificuldade
diz respeito a problemas de nao-identificabilidade dos parametros que definem a intensidade
da amostragem preferencial.
Mesmo na hipotese de conhecimento dos parametros do modelo e dos valores do pro-
cesso subjacente S, a distribuicao a posteriori [α, β | S,x,y, µ, τ 2] forneceria intervalos de
credibilidade muito amplos, conforme mostra a Figura 9.6.
Para uma melhor visualizacao do problema da nao-identificabilidade destes parametros,
foi realizada uma simulacao em uma regiao D discretizada em apenas 16 sub-regioes regulares.
Nesta regiao foi simulado um processo Gaussiano com os mesmos parametros utilizados na
simulacao apresentada na Secao anterior, de onde foram obtidas cinco observacoes.
Foram consideradas duas prioris para os parametros α e β, a saber N(0, 103) e N(0, 10),
doravante denominadas prioris A e B, respectivamente. A Figura 9.7 apresenta a distribuicao
92
Figura 9.6: Curvas de nıvel da distribuicao a posteriori conjunta de α e β, exceto por uma constante,
condicional a S para a simulacao que utiliza a regiao D discretizada em 16 sub-regioes.
a posteriori [α, β | x,y, µ, τ 2] obtida via simulacao segundo cada uma das prioris utilizadas.
Nesta simulacao, foram geradas combinacoes dos parametros (φ, σ2) de suas distribuicoes a
priori para posterior geracao de superfıcies S e avaliacao da integral
p(α, β | x,y, µ, τ 2) ∝∫p(y | Sy, µ, τ
2)p(x | S, α, β)p(S | φ, σ2)p(φ)p(σ2)dφdσ2dS.
Analisando estas distribuicoes a posteriori podemos verificar que a utilizacao da priori
B elimina o problema da nao-identificabilidade, tornando muito improvaveis combinacoes de
(α, β) cujos valores absolutos sejam demasiadamente elevados.
Entretanto torna-se ainda necessario justificar a utilizacao de prioris razoavelmente in-
formativas como a priori B. Um argumento a favor da utilizacao da priori B em situacoes
praticas se deve ao fato de que um pesquisador pode considerar muito pouco plausıvel um
planejamento amostral ter sido obtido com β 0 e α 0. Sob este cenario, seria necessario
assumir que pequenas variacoes na magnitude do processo S no local x seriam determinantes
para a observacao (ou nao) de um ponto amostral em sua vizinhanca. Mais precisamente,
observarıamos amostras em todos os locais x onde S(x) > 0 e nunca observarıamos amostras
nos locais onde S(x) < 0. A consideracao deste cenario seria equivalente a supor que o plane-
93
Figura 9.7: Curvas de nıvel da distribuicao a posteriori conjunta de α e β (exceto por uma constante)
obtida utilizando as prioris A (esquerda) e B (direita) para a simulacao que utiliza a regiao D
discretizada em 16 sub-regioes. O ponto no mapa (em preto) representa o valor verdadeiro do par
de parametros.
jamento amostral nao tenha sido guiado pelo interesse em locais onde o processo subjacente
assumiu valores crıticos, mas sim pelo simples interesse em locais onde este processo esteve
acima (ou abaixo) da media.
Apesar do razoavel nıvel de subjetividade envolvido na especificacao destas prioris,
estas parecem adequadas ao se considerar o nıvel de subjetividade envolvido na especificacao
da funcao de verossimilhanca envolvendo efeitos da amostragem preferencial. Uma discussao
pertinente sobre a subjetividade do modelo e das prioris pode ser encontrado em Kadane
(2011).
Cabe tambem salientar que, a medida que a janela de repulsao ∆ e diminuıda, a proba-
bilidade de observacao de mais de um ponto em cada sub-regiao aproxima-se de zero. No caso
limite, onde ∆ → 0, o modelo torna-se equivalente ao modelo sob amostragem preferencial,
uma vez que as observacoes x comporao um arranjo pontual oriundo de um processo de Cox
log-Gaussiano com intensidade λ(x).
O modelo proposto, portanto, sera apropriado nas situacoes onde a janela ∆ nao pode
ser considerada como pequena o suficiente para uma aproximacao pelo modelo baseado no
94
processo de Cox log-Gaussiano.
Por outro lado, nas situacoes onde a magnitude do processo subjacente exerce pouca
influencia na distribuicao espacial das amostras (isto e, quando β ≈ 0), os efeitos da repulsao
tenderao a ser nao significativos. A realizacao de simulacoes nestas condicoes parecem indicar
que a inferencia produz resultados proximos aos obtidos assumindo-se apenas o efeito da
amostragem preferencial.
Por fim, em situacoes praticas, a aplicabilidade deste modelo pode ser avaliada levando-
se em conta o espacamento mınimo entre as amostras observadas na regiao em estudo, onde
padroes ou regularidades podem ser considerados como indıcios de efeito de repulsao.
Com relacao aos impactos na escolha do planejamento amostral otimo, as simulacoes
realizadas nos Capıtulos 6 e 7 nos permitem afirmar que maiores diferencas na decisao otima
serao esperadas na medida em que as diferencas nas predicoes destes modelos forem mais
acentuadas. Caso β ≈ 0, o planejamento amostral otimo fornecido por ambos os modelos
tendera a ser localizado em uma regiao proxima, uma vez que as diferencas esperadas nas
predicoes seriam pequenas.
95
Capıtulo 10
Conclusoes
Os resultados obtidos nesta tese foram bastante satisfatorios, uma vez que auxiliam o pesqui-
sador a entender melhor a influencia causada pela amostragem preferencial em Geoestatıstica
e, em especial, na tomada de decisao a respeito da escolha de um novo ponto para o plane-
jamento amostral.
A incorporacao e a avaliacao do efeito da amostragem preferencial na Geoestatıstica foi
alvo de polemicas por ser considerado como uma especie de teste de representatividade da
amostra (como argumentou E. Marian Scott na discussao do artigo de Diggle et al., 2010),
uma vez que pretende modelar o vies amostral do pesquisador por um processo estocastico.
Estas crıticas se baseiam no fato de que a obtencao de uma amostra intencional, segundo
algum criterio ou objetivo do pesquisador, de forma alguma poderia ser considerada como
provenientes de uma realizacao aleatoria de um processo pontual, como o processo de Cox
log-Gaussiano. Entretanto, como bem pontuado pelos autores do artigo, esta tentativa de
modelagem torna-se util na medida em que nos possibilita testar a sua adequacao e ainda
por fornecer um maior entendimento das consequencias quando ela prova-se inadequada.
Os resultados do Capıtulo 6 evidenciaram que uma simples correcao no processo de
estimacao dos parametros do modelo Geoestatıstico, usualmente representados na forma do
variograma, nao sao suficientes para garantir uma predicao satisfatoria. Neste sentido, a uti-
96
lizacao da abordagem Bayesiana permite a realizacao desta predicao a partir da distribuicao
[S | y,x], a qual representa a correta distribuicao preditiva do processo subjacente sob efeito
da amostragem preferencial. Apesar do alto custo computacional associado ao processo de
inferencia, a abordagem utilizada se mostrou factıvel computacionalmente e produziu resul-
tados satisfatorios.
Analisando-se o efeito provocado pela influencia da amostragem preferencial no processo
de escolha de um novo ponto amostral, pode-se verificar que este nao pode ser negligenci-
ado. Conforme evidenciaram as simulacoes realizadas, o conhecimento do padrao de arranjo
pontual amostral diminui a variancia preditiva do processo subjacente S em locais pouco
amostrados, alterando substancialmente a decisao otima.
Adicionalmente, sob influencia da amostragem preferencial, funcoes utilidade que de-
pendem diretamente da media do processo tambem sao grandemente afetadas, tendo em
vista o fato deste parametro ser sempre superestimado quando β > 0 (e subestimado quando
β < 0).
Nas situacoes onde se deseja realizar o planejamento amostral de forma sequencial, os
efeitos da amostragem preferencial tenderao a ser mitigados a medida que o procedimento
for realizado. Conforme observado na simulacao bidimensional realizada na Secao 7.5, a
obtencao e posterior observacao de um novo local amostral por meio da maximizacao de
funcoes utilidade produziu um aumento no erro de predicao. Isso ocorre devido a suposicao
erronea de que este local foi obtido segundo um processo aleatorio. Assim, a medida que mais
observacoes sao escolhidas de forma a comporem uma nova amostra de tamanho n∗, n∗ n, a
utilizacao do modelo Geoestatıstico tradicional produzira resultados semelhantes aos obtidos
assumindo-se a existencia de efeito de amostragem preferencial. Nesta situacao, pode-se ainda
especificar uma nova funcao de verossimilhanca p(y∗ | S, θ), onde y∗ = (y1, ..., yn, y∗1, ..., y
∗n)′.
Contudo, a obtencao da distribuicao preditiva [S | y∗,x, θ] tornar-se-ia uma tarefa bastante
complexa.
A opcao da utilizacao da abordagem de Muller (1999) para escolha do planejamento
amostral otimo apresenta grandes vantagens computacionais em relacao a procedimentos
97
de maximizacao baseados em varreduras no espaco de decisoes. Com relacao a escolha de
funcoes utilidades baseadas na reducao da variancia preditiva, estas se justificam pelo inte-
resse especial que a krigagem possui em Geoestatıstica. Entretanto, conforme evidenciado
pela analise das distribuicoes a posteriori nas simulacoes e na aplicacao realizada, as funcoes
utilidade que dependem da media do processo parecem ser ainda mais afetadas pelos efeitos
da amostragem preferencial.
Apesar de nao terem sido tratados nesta tese, problemas advindos da obtencao de
pseudo-distribuicoes a posteriori de d pouco concentradas na moda podem ser minimizados
utilizando-se a abordagem de MCMC com simulated annealing, mencionada no Capıtulo 5,
a qual produz distribuicoes mais concentradas em torno da moda.
O modelo desenvolvido para analisar dados espaciais sob efeito de amostragem prefe-
rencial com repulsao se mostrou util para situacoes praticas, onde nao seria razoavel assumir
que o planejamento amostral tivesse sido guiado exclusivamente por um processo de Cox
log-Gaussiano. Apesar das simulacoes terem produzido resultados satisfatorios, e necessario
ainda realizar um aprofundamento no estudo das caracterısticas e propriedades deste mo-
delo, assim como desenvolver reparametrizacoes em busca da eliminacao dos problemas de
nao-identificabilidade do modelo.
Outros modelos pressupondo efeitos de amostragem preferencial podem ser empregados
a fim de obter-se um melhor ajuste em situacoes praticas. Neste sentido, a abordagem de
Adams et al. (2009), a qual lida com processos de Cox log-Gaussianos sem a necessidade de
utilizar distribuicoes finito-dimensionais para aproximar a distribuicao de [x | S, θ], pode ser
interessante. Esta abordagem utiliza um processo de Cox com a seguinte funcao intensidade
asssociada
λ(x) = λ∗σ(g(x)),
onde λ∗ e um limite superior para λ(x), σ(u) = (1 + e−u)−1 e g(x) e uma funcao escalar
aleatoria com priori dada por um processo Gaussiano. O grande potencial desta metodologia
98
para aplicacao no contexto de Geoestatıstica sob amostragem preferencial esta no fato de
que ela permite a realizacao da inferencia aproximada com uma razoavel flexibilidade, uma
vez que nao e necessario especificar a forma funcional existente entre o processo Gaussiano
subjacente e a funcao intensidade.
Algumas estrategias tambem podem ser adotadas de forma a reduzir o custo compu-
tacional associado a inferencia no modelo Geoestatıstico sob amostragem preferencial e no
processo de obtencao do planejamento amostral otimo. Neste sentido, podemos citar a uti-
lizacao de modelos de processos preditivos para reduzir a dimensao e a complexidade em
modelos espaco-temporais (Banerjee et al., 2008), metodos de aproximacao da funcao de
verossimilhanca (Stein et al., 2004 e Fuentes, 2007) e a utilizacao de matrizes de covariancia
esparsas (Furrer et al., 2006), entre outros.
Por fim, uma estrategia alternativa pode ser a utilizacao do metodo INLA (Integrated
Nested Laplace Aproximation), Rue et al. (2009). Apesar da inferencia em processos de Cox
log-Gaussianos ja ter sido alvo de pesquisas utilizando a abordagem INLA, como a possibi-
lidade de realizar-se a inferencia sem a necessidade da utilizacao de finas discretizacoes da
regiao D (Simpson et al., 2011), pode ser interessante investigar a possibilidade de aplicacao
da metodologia no contexto da influencia da amostragem preferencial na obtencao do plane-
jamento amostral otimo. Outra grande vantagem desta abordagem reside na possibilidade
de utilizacao do pacote r-INLA na interface do software R. Este pacote pode ser obtido em
http://r-inla.org.
99
Referencias Bibliograficas
[1] Adams R.P., Murray I., MacKay D.J.C. (2009). Tractable Nonparametric Bayesian
Inference in Poisson Processes with Gaussian Process Intensities. In Proccedings of the
26th Annual International Conference on Machine Learning, Montreal, Canada.
[2] Alves L.M., Marengo J.A., Junior H.C., Castro C. (2005). Inıcio da estacao chuvosa no
Sudeste do Brasil: Parte 1 - Estudos Observacionais. Revista Brasileira de Meteorologia,
20, 3, 385-394.
[3] Banerjee S., Carlin B.P., Gelfand A.E. (2004). Hierarchical Modeling and Analysis for
Spatial Data. Chapman & Hall/CRC
[4] Banerjee S., Gelfand A.E., Finley A.O., Sang H. (2008). Gaussian predictive process
models for large spatial data sets. Journal of the Royal Statistical Society, B, 70(4),
825-848.
[5] Benes V., Bodlak K., Møller J. (2002). Bayesian analysis of log Gaussian Cox pro-
cesses for disease mapping. Relatorio Tecnico, Centre for Mathematical Physics and
Stochastics - MPS, University of Aarhus.
[6] Boukouvalas A., Cornford D., Stehlık M. (2009). Approximately Optimal Experimen-
tal Design for Heteroscedastic Gaussian Process Models. Unassigned Technical Report
from the Neural Computing Research Group. Aston University, Birmingham, UK, nov.
[7] Brasil, Ministerio da Saude (2005). Diagnostico rapido nos municıpios para vigilancia
entomologica do Aedes aegypti no Brasil - LIRAa: metodologia para avaliacao dos
100
ındices de Breteau e Predial. Serie A, Normas e Manuais Tecnicos. Secretaria de Vi-
gilancia em Saude. Brasılia-DF.
[8] Brix A., Diggle P.J. (2001). Spatiotemporal prediction for log-Gaussian Cox processes.
Journal of the Royal Statistical Society, B, 63(4), 823-841.
[9] Cardenas R.R. (2007). Sobre Algoritmos de Otimizacao Estocasticos: Aplicacoes em
Re-desenho de Redes de Monitoramento e Mapeamento de QTL. Tese de Doutorado
em Estatıstica, UFRJ/IM/DME.
[10] Cressie N. (1993). Statistics for Spatial Data. Revised Edition. Wiley, New York.
[11] DeGroot M.H. (1970). Optimal Statistical Decisions. McGraw-Hill
[12] Diggle P.J. (1983). Statistical Analysis of Spatial Point Patterns. Academic Press, Lon-
don.
[13] Diggle P.J., Lophaven S. (2006). Bayesian geoestatistical design. Scandinavian Journal
of Statistics, 33, p. 53-64.
[14] Diggle P.J., Menezes R., Su T. (2010). Geostatistical inference under preferential sam-
pling. Applied Statistics, 59(2), p. 1-20.
[15] Diggle P., Ribeiro Jr. P.J. (2007). Model-Based Geostatistics. New York: Springer.
[16] Diggle P.J., Tawn J.A., Moyeed R.A. (1998). Model-based geostatistics. Applied Sta-
tistics, 47, p. 299-350.
[17] Ding M., Rosner G.L., Muller P. (2008). Bayesian optimal design for Phase II screening
trials. Biometrics, 64(3), p. 886-894.
[18] Fernandez J.A., Real C., Couto J.A., Aboal J.R., Carballeira A. (2005). The effect of
sampling design on extensive bryomonitoring surveys of air pollution. Science of the
Total Environment, 337, 11-21.
[19] Fuentes M. (2002). Spectral methods for nonstationary spatial processes. Biometrika,
89,1, 197-210.
101
[20] Fuentes M. (2007). Approximate likelihood for large irregularly spaced spatial data.
Journal of the American Statistical Association, 102, 477, 321-331.
[21] Fuentes M., Smith R. (2001). A New class of nonstationary spatial models. Relatorio
tecnico, North Carolina State University.
[22] Furrer R., Genton M.G., Nychka D. (2006). Covariance tapering for interpolation of
large spatial datasets. Journal of Computational & Graphical Statistics, 15, 3, 502-523.
[23] Gamerman D., Lopes H.F. (2006). Markov Chain Monte Carlo - Stochastic Simulation
for Bayesian Inference. Chapman and Hall, 2a Ed.
[24] Gelfand A.E., Sahu S.K., Holland D.M. (2012). On the effect of preferential sampling
in spatial prediction. Environmetrics, 23, 398-409.
[25] Gelfand A.E., Smith A.F.M. (1990). Sampling-based approaches to calculating margi-
nal densities. Journal of the American Statistical Association, 85, 398-409.
[26] Gelman A., Rubin D.B. (1992). Inference from iterative simulation using multiple se-
quences. Statistical Science, 7, 457-472.
[27] Geman S., Geman D. (1984). Stochastic relaxation, Gibbs distributions and the baye-
sian restoration of images. IEEE Transactions on Pattern Analysis and Machine Intel-
ligence, 6, 721-741.
[28] Geweke J. (1992). Evaluating the accuracy of sampling-based approaches to calculating
posterior moments. Em Bayesian Statistics 4, 169-193 (Editors Bernardo, J.M., Berger,
J.O., Dawid, A.P. e Smith, A.F.M.).
[29] Gomes A.C. (1998). Medidas dos nıveis de infestacao urbana para Aedes (Stegomyia)
aegypti e Aedes (Stegomyia) albopictus em programa de vigilancia entomologica. In-
forme Epidemiologico do SUS - IESUS, VII(3), jul/set.
[30] Gumprecht D., Muller W.G., Rodrıguez-Dıaz J.M. (2007). Optimal design for detecting
spatial dependence. IFAS Research Paper Series - Johannes Kepler University Linz, 20,
jan.
102
[31] Haas T.C. (1995). Local prediction of a spatio-temporal process with an application
to wet sulfate deposition. Journal of the American Statistical Association, 90, 432, p.
1189-1199.
[32] Hastings W.K. (1970). Monte Carlo sampling methods using Markov Chains and their
applications. Biometrika, 57, 97-109.
[33] Heikkinen J., Arjas E. (1998). Non-parametric Bayesian estimation of a spatial Poisson
intensity. Scandinavian Journal of Statistics, 25, 435-450.
[34] Heikkinen J., Arjas E. (1999). Modelling a Poisson forest in variable elevations: A
nonparametric Bayesian approach. Biometrics, 55, 738-745.
[35] Higdon D., Swall J., Kern J. (1999). Non-stationary spatial modelling. Em Bayesian
Statistics 6 (J.M. Bernardo, J.O. Berger, A.P. Dawid e A.F.M. Smith), p. 761-768.
Oxford University Press.
[36] Ho L.P., Stoyan D. (2008). Modelling marked point patterns by intensity-marked Cox
processes. Statistics and Probability Letters, 78, p. 1194-1199.
[37] Kadane J.B. (2011). Principles of Uncertainty. Chapman and Hall.
[38] McDonald D. (2004). Elements of Applied Probability: For Engineering, Mathematics
and Systems Science. World Scientific.
[39] Metropolis N., Rosenbulth A.W., Rosenbulth M.N., Teller A.H., Teller E. (1953). Equa-
tion of state calculations by fast computing machine. Journal of Chemical Physics, 21,
1089-1091.
[40] Migon H.S., Gamerman D. (1999). Statistical Inference - an integrated approach. Ar-
nold.
[41] Møller J., Syversveen A.R., Waagepetersen R.P. (1998). Log Gaussian Cox processes.
Scandinavian Journal of Statistics, 25, 451-482.
[42] Møller J., Waagepetersen R.P. (2007). Modern statistics for spatial point processes.
Scandinavian Journal of Statistics, 34, 643-684.
103
[43] Muller P. (1999). Simulation-based optimal design. Em Bayesian Statistics 6 (eds J.M.
Bernardo, J.O. Berger, A.P. Dawid e A.F.M. Smith), p. 459-474. Oxford: Oxford
University Press.
[44] Muller P., Berry D., Grieve A., Smith M., Krams M. (2007). Simulation-based sequen-
tial Bayesian design. Journal of Statistical Planning and Inference, 137, p. 3140-3150.
[45] Muller P., Sanso B., De Iorio M. (2004). Optimal Bayesian design by inhomogeneous
Markov Chain simulation. Journal of the American Statistical Association, 99(467), p.
788-798.
[46] Muller W.G., Stehlık M. (2008). Compound optimal spatial designs. IFAS Research
Paper Series - Johannes Kepler University Linz, 37, out.
[47] Paez M.S., Diggle P.J. (2009). Cox processes for estimating temporal variation in disease
risk. Environmetrics, 20, 981-1003.
[48] Pati D., Reich B.J., Dunson D.B. (2011). Bayesian geoestatistical modelling with in-
formative sampling locations. Biometrika, 98, 1, 35-48.
[49] Ribeiro Jr., P.J. and Diggle, P.J. (2001). geoR: A package for geostatistical analysis.
R-News, 1.
[50] Ripley B.D. (1981) Spatial Statistics. Wiley, New York.
[51] Rue H., Martino S., Chopin N. (2009). Approximate Bayesian inference for latent
Gaussian models using integrated nested Laplace approximations. Journal of the Royal
Statistical Society, B, 71(2), 319-392.
[52] Roberts G.O., Gelman A., Gilks W.R. (1997). Weak convergence and optimal scaling
of random walk Metropolis algorithms. Annals of Applied Probability, 7, 1, 110-120.
[53] Sampson P., Guttorp P. (1992). Nonparametric estimation of nonstationary spatial
covariance structure. Journal of the American Statistical Association, 87, 108-119.
104
[54] Schmidt A.M., O’Hagan A. (2003). Bayesian inference for nonstationary spatial covari-
ance structures via spatial deformations. Journal of the Royal Statistical Society Series
B, 65, 3, 743-758.
[55] Simpson D., Illian J., Lindgren F., Sørbye S.H., Rue H. (2011). Going off grid: Compu-
tationally efficient inference for log-Gaussian Cox processes. Relatorio Tecnico - Depar-
tamento de Ciencias Matematicas da Norwegian University of Science and Technology,
10.
[56] Stein M.L., Chi Z., Welty L.J. (2004). Approximating likelihoods for large spatial data
sets. Journal of the Royal Statistical Society, B, 66(2), 275-296.
[57] Stroud J., Muller P., Rosner G.L. (2001). Optimal sampling times in population phar-
macokinetic studies. Applied Statistics, 50(3), p. 345-359.
[58] Waagepetersen R. (2004). Convergence of posterioris for discretized log Gaussian Cox
processes. Statistics and Probability Letters, 66, 229-235.
[59] Zhu Z., Stein M.L. (2005). Spatial sampling design for parameter estimation of the
covariance function. Journal of Statistical Planning and Inference, 134, 583-603.
[60] Zidek J.V., Shaddick G. (2012). Unbiasing estimates from preferentially sampled spa-
tial data. Relatorio Tecnico, 268, Department of Statistics, The University of British
Columbia, CAN.
[61] Zidek J.V., Sun W., Le N.D. (2000). Designing and integrating composite networks
for monitoring multivariate Gaussian pollution fields. Applied Statistics, 49, Part 1, p.
63-79.
105