Post on 17-Apr-2015
Inferência Causal em Estudos Seccionais
IX Congresso de Epidemiologia - II Episeminário
Inferência causal em epidemiologia:
(ENSP/FIOCRUZ)departamento de
epidemiologia
Michael E. Reichenheim Evandro S. F. Coutinho
Rio de Janeiro, 14 de abril 2014
Retomando o modelo de desfechos potenciais
• É o mais usado em epidemiologia ...• Cenário contafactual a ideia de ‘expostos comparados a eles
mesmos quando não expostos’ ... • Controle de confundimento
– Operacionalizando via randomização ...– Operacionalizando via pós-estratificação modelos teóricos e
estatísticos robustos ...
• Contextualizando em estudos de abordagem transversal (‘estudos seccionais’)– Ao se usar um modelo de regressão, o que significa ‘controlar/ajustar
por covariadas’? Não é meramente ‘controlar por controlar’, mas ... Estimar o efeito direto de uma exposição no desfecho sem a interferência dos outros
elementos/nós do sistema (e.g., confundidores ou mediadores)
– Querendo ou não, estamos ‘acionando’ o MEP
Perguntas fundamentais
• Então, o que estamos fazendo quando partimos para uma modelagem em estudos de abordagem transversal?
• Quando e o que valem as estimativas obtidas?• O que significa “o exponencial de um coeficiente de regressão
obtido a partir de um modelo (supostamente) apropriado para desfechos categóricos”?
• Uma questão importante para motivar:
Se a definição de um risco (em um sentido ‘epidemiológico’ ... estudo de coorte [fixa]) requer a especificação de um período (t) e,
logo, uma Razão de Risco necessariamente requer a especificação do t que subjaz os dois riscos componentes (R0 e R1), que resposta daria
se alguém perguntasse, por exemplo:
“Qual o t subjacente de uma estimativa de 2,0 obtida a partir de um estudo transversal?”
???
Pano de fundo (identificando o problema)
• No começo livros proposta descritiva: pessoa, lugar, tempo estatísticas vitais ... papel importante prover prevalências agregadas e em sub-grupos de interesse (focalização)
• Progressivamente … 1980’ interesse em obter incidências a partir de abordagens transversais perspectiva (inferência) causal !
• A partir da década de 1990’ debate ‘caloroso’ sobre duas questões ...
Pano de fundo (identificando o problema)
• A partir da década de 1990’ debate ‘caloroso’ sobre duas questões– Que medida seria apropriada para captar contraste entre grupos
de exposição Razão de Prevalência (RP) ou Razão de Odds de Prevalência (ROP)?
– Que modelos de análise seriam os mais apropriados para estimar essas quantidades em contextos multivariados (pressupostamente em uma perspectiva causal)?
• Dois campos (‘racha’)– Lee & Chia, Axelson et al. e Thompson et al. se posicionam a
favor da RP – Strömberg e Pearce optam pela ROP (... e nós ...)
• Repercussões hoje (‘racha’)– Campo 1 modelagem da RP – Campo 2 modelagem da ROP
mas o que significam
numa perspectiva
causal?
Mas o que significam o que numa perspectiva causal?
• Causalidade conversão de ‘não doentes’ em ‘doentes’ ... • Estimadores de interesse?
– Prevalência? Não pode ser, já que – Incidência?
Ok, mas qual ? Incidência Acumulada/Risco? ... ... ... RR/RIA ? Densidade de Incidência/Taxa? ... ... ... RDI ?
• Mas se estamos num contexto ‘transversal’, o que estariam significando as RP ou ROP estimadas ?– Se RP, ‘vale’ um RIA (=RR)? Ou será que a RP ‘vale’ uma RDI?– Se ROP, ‘vale’ um RIA (=RR)? Ou será que ‘vale’ uma RDI?
• E dependendo, qual o modelo multivariado mais apropriado?
• E quais as condições nas quais um estudo transversal pode sustentar uma inferência causal?
1i
ii i
iDIP
DI
T
T
Condições estruturantes
• Cinco condições1) População em estado estacionário
2) Não haver sobrevida seletiva por sub-grupo de exposição
3) Duração média do desfecho igual nos grupos de exposição
4) Não haver causalidade reversa
5) Direcionalidade temporal E D sustentável mediante coleta de E antes de D ou por teoria (e.g. estudo de algum efeito ao nascimento via recordatório de evento na gravidez)
• Para ‘pensar’ essas condições, é necessário também entender o fenômeno em estudo as relações de ocorrência entre os ‘atores no palco’ (ED? C? M? I?)
• Uma vez que as cinco condições estejam exaustivamente atendidas, o próximo passo consiste em inspecionar em que condições as estimativas obtidas em estudos transversais captam parâmetros causais ou, ao contrário, nas quais eles desmontam ...
Relações formais entre medidas
1 exp ( )i iIA DI t ln 1 1 ii
IADI
t
1i i
ii i
DI TP
DI T
1 1 1 11
0 0 0 0 0
1
1
DI T DI TPRP
P DI T DI T
0 0
0
0 0
ln 1/ (1 )
ln 1/ (1 ) 1
IA t TP
IA t T
1 1
1
1 1
ln 1/ (1 )
ln 1/ (1 ) 1
IA t TP
IA t T
1 1 0 0
0 0 1 1
ln 1/ (1 ) ln 1/ (1 ) =
ln 1/ (1 ) ln 1/ (1 )
IA T IA T tRP
IA T IA T t
(1 ) i
ii i
PDI
P T
0
1
TRDI ROP
T
1 exp ii
i i i
P tIA
T PT
1
1 1 1
0
0 0 0
1 exp
1 exp
P tT PT
RIAP t
T PT
Stata ado-file: epiconv
Oito cenários que retratam estudos transversais realizados em diferentes condições subjacentes, mas todas as razões de prevalência entre grupos expostos e não expostos são 2,0.
Cenário Tipo de desfecho
Duração do desfecho ( iT ) RDI (viés) * RIA (viés) **
1 Raro Longo e igual 2.053 (+2.6) 2.025 (+1.2)
2 Raro Longo e desigual 0.205 (–89.7) 0.227 (–88.6)
3 Raro Curto e igual 2.053 (+2.6) 1.809 (–9.5)
4 Raro Curto e desigual 0.205 (–89.7) 0.443 (–77.8)
5 Comum Longo e igual 3.000 (+50.0) 2.230 (+11.5)
6 Comum Longo e desigual 0.300 (–85.0) 0.656 (–67.2)
7 Comum Curto e igual 3.000 (+50.0) 1.037 (–48.1)
8 Comum Curto e desigual 0.300 (–85.0) 1.000 (–50.0)
* % vies (RDI) calculado como ( ) / *100RP RDI RP , onde RP = 2.0 é fixa.
** % vies (RIA) calculado como ( ) / *100RP RIA RP onde RP = 2.0 é fixa.
Unidades de tempo suadas nos cenários
Duração média do desfecho longo e igual T1 = T0 = 1 Duração média do desfecho longo e desigual T1 = 1; T0 = 0.1 Duração média do desfecho curto e igual T1 = T0 = 0.1 Duração média do desfecho curto e desigual T1 = 0.1; T0 = 0.01
Intervalo de tempo para projetar RIA t = 1
Prevalências Segundo grupo de exposição e frequência do desfecho
Desfeho raro P1 = 0.05; P0 = 0.025 Desfecho comum P1 = 0.5; P0 = 0.25
Explorando cenários (i)
Estimativas de RP somente consistentes com RDI e RIA em
condições muito restritas !
Explorando cenários (ii)
Explorando cenários (iv)
2.0 2.0RP tb muito diferente de
RDI !
1.2 RP muito diferente de
RIA!
Retomando as perguntas ...
• ... mas se estamos num contexto ‘transversal’, o que estariam significando as estimada RP ou ROP?
• Se RP, ‘vale’ um RR (uma RIA)? – Não, pois vimos que a RP depende da duração T da ‘doença’
subjacente e de um pressuposto t (da janela temporal de seguimento de uma coorte [fixa]) ...
– E qual seria t se só o que temos é um corte transversal da população em (supostamente) seguimento?
– ... Incompreensível!
• Ou será que a RP ‘vale’ uma RDI?– Também não. Como vimos nas simulações e gráficos anteriores, o
valor da RP não conflui para RDI ... a exceção seria no caso de doenças raras ... mas quem investe em inquéritos para estudar
eventos raros?
Retomando as perguntas ...
• E se a RP não representa qualquer medida de efeito de ‘significado causal’, qual o significado das estimativas obtidas em modelos ‘multivariados’ conexos?
– ?!
• E , logo, qual(ais) o(s) modelo(s) multivariado(s) mais apropriado(s)?
– ?!
Retomando as perguntas ...
• ... mas se estamos num contexto ‘transversal’, o que estariam significando as estimadas RP ou ROP?
• Se ROP, ‘vale’ uma RIA (um RR)? – Não, pois vimos nas simulações que os valores da ROP
raríssimamente se aproximam dos valores de RIA/RR (e que mudam segundo específicos t’s)
• Ou será que a ROP ‘vale’ uma RDI?– Sim, em certas condições (estruturantes), incluindo a igualdade das
durações do desfecho T0 e T1 entre E0 e E1, respectivamente; ou se o
evento desfecho é pontual (T=0)
Retomando as perguntas ...
• E se a ROP representa alguma medida de efeito de ‘significado causal’, qual o significado das estimativas obtidas em modelos multivariados conexos?
– !
• E , logo, qual(ais) o(s) modelo(s) multivariado(s) mais apropriado(s)?
– ... Regressão logística RDI ROP
RDI
Árvore de decisão para analisar dados
seccionais
Considerações finais (i)
• A crescente literatura sobre modelos multivariados alternativos à RL para estimar efeitos a partir de dados seccionais, em vez de ajudar no entendimento e desenvolvimento da pesquisa epidemiológica, ao contrário, jogou mais sombras que luzes ao tema ...
Considerações finais (ii)
• Não porque haja algo incorreto nesses modelos, mas porque a real importância da construção de modelos foi completamente posta de lado ...
• As condições e adequação para modelar tem sido aceitas tacitamente, mas, como vimos, é fundamental no processo considerar antes as questões teóricas das relações entre eventos de interesse desfechos e exposições (bem como confundidores, modificadores de efeito, mediadores, colisores) não só exigem uma avaliação sobre questões de substância e significado, mas também no que diz respeito às suas relações temporais ...
Considerações finais (iii)
• E só depois disso ‘resolvido’ é possível tomar uma decisão quanto ao modelo estatístico a ser proposto ...
• E nas situações reconhecidamente restritas em que a modelagem causal é realmente possível e alcançável a partir de dados transversais, a ROP —ou melhor, a razão de produtos cruzados calculada como uma estimativa da RDI— merece ser o estimador indicado !