ANÁLISIS DE SUPERVIVENCIA · interés del investigador a la hora de interpretar los resultados es...
Transcript of ANÁLISIS DE SUPERVIVENCIA · interés del investigador a la hora de interpretar los resultados es...
ANÁLISIS DE SUPERVIVENCIA
TEMA VI
Modelos Multivariantes 2
Análisis de Supervivencia. En Rial, A. y Varela, J. (2008). Estadística
Práctica para la Investigación en Ciencias de la Salud. Coruña:
Netbiblo. Páginas 247-273.
LECTURA OBLIGATORIA
Modelos Multivariantes 3
TÉRMINOS QUE DEBES DOMINAR
Estudios de mortalidad/seguimiento
Período de Seguimiento
Tablas Kaplan-Meier
Probabilidad de Supervivencia
Media y Mediana de Supervivencia
Curva de Supervivencia
Función de Supervivencia
Test Log Rank
Regresión de Cox
Hazard
Hazard Ratio
Modelos Multivariantes 4
Orígenes en el ámbito médico, en los llamados estudios de mortalidad, cuyo
objetivo era predecir el tiempo que un paciente con una enfermedad terminal
podría mantenerse con vida, pudiendo estudiarse también el posible efecto de
distintos tratamientos.
Hoy en día se utiliza en contextos tan variados como el militar, la ingeniería, la
industria, la psicología o la economía.
Gracias a su utilización los investigadores pueden estimar para intervalos de
tiempo determinados la probabilidad que tiene un paciente de recaer de una
determinada patología, de que se produzca el alta médica o el tiempo que va a
tardar en ser eficaz un tratamiento…; cualquier evento que nos interese
modelizar y/o pronosticar.
pon EJEMPLOS
¿En qué consiste?
Modelos Multivariantes 5
La supervivencia viene a ser una medida del tiempo que transcurre hasta una
respuesta de interés: recaída, alta médica, manifestación de los primeros
síntomas de una determinada enfermedad, etc.
Cuando se trata de enfermedades graves, el análisis de supervivencia deriva
en la estimación de probabilidades de mantenerse con vida durante
determinados períodos de tiempo, informando así del grado de severidad de la
enfermedad, algo que menudo se desconoce.
ESTUDIOS DE SEGUIMIENTO. Muchas veces el investigador no puede
manipular, ni controlar las variables objeto de estudio, ni tampoco a los sujetos
que participan en él, sino que dispone de información relativa a sus
“pacientes” a lo largo de un determinado período de tiempo, que ni siquiera es
el mismo para todos.
¿En qué consiste?
Modelos Multivariantes 6
Trabajamos en una UAD y a lo largo de dos años hemos seguido a 100 sujetos, de
los cuales sabemos que algunos han llegado a abandonar su adicción, mientras que
otros no lo han hecho o bien desconocemos qué ha sucedido con ellos realmente,
bien porque han traslado su residencia o porque han dejado de venir a la consulta.
Si el período de registro comprende un total de 24 meses, es probable que
dispongamos de datos “incompletos” para alguno de los sujetos, bien porque
causan baja o bien se incorporan más tarde. Como consecuencia, cada sujeto
posee un tiempo de registro o seguimiento particular y una información específica
respecto a la variable de interés (si ha abandonado su adicción o no, o si ni siquiera
lo sabemos.
Durante el período de registro es probable que algunos sujetos no hayan sufrido el
evento de interés, mientras que otros sí, y es probable también que a algunos
sujetos le hayamos perdido la pista.
EJEMPLO
Modelos Multivariantes 7
ESQUEMA GENERAL
El análisis trabaja con información parcial (casos “censurados”)
1
2
..
.
n
Período de estudio
evento
evento
evento
sale (censurado)
muere por otra causa (censurado)
evento
Fin
ESQUEMA GENERAL
Paciente
Inicio
Modelos Multivariantes 8
VARIABLES
EXPLICATIVAS
TTiieemmppoo hasta que ocurre un evento
RESPUESTA DE CENSURA
Para indicar si se ha producido o no el evento (incluidos aquellos casos que han salido del estudio en el transcurso de éste)
Cuya influencia sobre la Respuesta se desea estudiar
• Tiempo desde la intervención hasta la muerte
• Tiempo libre de enfermedad o hasta recaída
• Sesiones de terapia hasta el alta
• Tiempo hasta acción del fármaco, rehabilitación, etc.
• Tiempo hasta desarrollo de
una enfermedad
•Incumplimiento terapéutico
•Pérdida del seguimiento
•Efectos secundarios
•Violaciones al protocolo
•Diagnóstico al inicio
•Tipo de tratamiento
•Dosis
•Sexo
•Edad
•Nivel de deterioro
•Adherencia
•Apoyo familiar
VARIABLES IMPLICADAS
Modelos Multivariantes 9
Lo verdaderamente interesante es que podemos aprovechar la información
disponible de cada sujeto para estimar una función de supervivencia global que
se derive en la elaboración de:
1. Tablas de Supervivencia, en las que se recoja la probabilidad de supervivencia
para diferentes momentos.
2. Gráficos o Curvas de Supervivencia, donde se puede ver cómo evoluciona la
probabilidad de supervivencia a lo largo del tiempo
3. Descriptivos de supervivencia (media, mediana y cuartiles).
4. Contrastes de supervivencia, para probar el posible efecto modulador de una VI.
5. Modelos de supervivencia, poniendo a prueba el efecto conjunto de varias VI o
variables explicativas, identificando factores de riesgo y de protección.
POTENCIAL
Modelos Multivariantes 10
Se trata más bien de supuestos teóricos y no tanto estadísticos.
SUPUESTOS de partida
DOS SUPUESTOS FUNDAMENTALES:
1. La censura debe tener un carácter aleatorio; no debe ser una censura
informativa. Los datos censurados deben ser representativos de los datos
no censurados. No debe existir relación entre las posibles fuentes de
censura y las diferentes VI a considerar en el análisis.
2. Proporcionalidad. Los efectos de las VI deben ser constantes a lo largo del
tiempo, sin mediar interacción alguna. Ello se traduce en que a nivel
gráfico las funciones deben transcurrir paralelas.
Modelos Multivariantes 11
Una vez garantizado el cumplimiento de dichas supuestos se procede al análisis,
que comienzan por la elaboración de las denominadas tablas de supervivencia y
las correspondientes curvas de supervivencia, junto con el cálculo de
descriptivos.
La función de supervivencia estimada para dos grupos (p.ej.: con y sin
tratamiento) puede ser comparada a través de un contraste estadístico (Log-Rank)
También puede ser modelizada, poniendo a prueba el posible efecto de distintas VI
(Regresión de Cox).
La interpretación de los resultados consiste en conocer la probabilidad de
supervivencia de un paciente en un momento o intervalo determinado, su tiempo
de supervivencia medio, así como la ventaja o desventaja de poseer una
característica o de haber sido sometido a un tratamiento.
ANÁLISIS de datos
Modelos Multivariantes 12
Para elaborar las tablas de supervivencia y las curvas de supervivencia se
suele recurrir al MÉTODO DE KAPLAN-MEIER.
Dicho método calcula la supervivencia cada vez que un paciente
experimenta el evento, generando las probabilidades en cada momento.
Las probabilidades de supervivencia se calculan a partir del número de
pacientes en riesgo justo en el momento de producirse el evento.
P7, por ejemplo, sería la probabilidad condicional de supervivencia en el
séptimo mes, habiendo sobrevivido los 6 anteriores.
TABLAS DE SUPERVIVENCIA
Modelos Multivariantes 13
Tenemos que:
Pk es la probabilidad de sobrevivir el k-ésimo mes
rk es el número de casos en riesgo, es decir, que aun no han
recaído justo antes del k-ésimo mes
fk es el número de eventos registrados el día k
Por lo que se podría estimar Pk a partir de la siguiente FÓRMULA:
Pk = Pk-1 [(rk - fk)/ rk]
EL CÁLCULO DE PROBABILIDADES
Modelos Multivariantes 14
Para cada momento la Prob. de supervivencia se calcula multiplicando la
supervivencia en el momento anterior por la tasa de supervivencia en dicho
momento.
En el denominador tendríamos el nº de pacientes que continuaban en el
estudio en el momento anterior (casos expuestos a riesgo) y en el
numerador ese mismo valor menos el nº de pacientes que sufren el evento
en ese momento.
Los valores de supervivencia se calculan sólo para aquellos momentos en
los que algún sujeto sufre el evento. En el resto de momentos se asume que
la Prob. de supervivencia es la misma que en el momento inmediatamente
anterior.
EL CÁLCULO DE PROBABILIDADES
Modelos Multivariantes 15
EJEMPLO
Nº SUJETO TIEMPO DE SUPERVIVENCIA (MESES) RECAÍDA (0: NO - 1: SÍ) 1 8 1
2 5 0
3 10 1
4 7 1
5 24 0
6 8 1
7 24 0
8 24 0
9 8 1
10 12 0
11 22 1
12 14 1
13 2 1
14 3 1
15 24 1
16 7 0
17 14 1
18 2 1
19 3 1
20 16 1
21 9 1
22 12 1
23 9 0
24 6 1
Modelos Multivariantes 16
SE ORDENAN LOS DATOS SEGÚN EL TIEMPO
TIEMPO DE SUPERVIVENCIA (MESES)
RECAÍDA (0: NO - 1: SÍ)
PROB SUPERVIVENCIA
2 1 0.916
2 1 0.916
3 1 0.833
3 1 0.833
5 0 0.833
6 1 0.789
7 0 0.745
7 1 0.745
8 1 0.605
8 1 0.605
8 1 0.605
9 1 0.559
9 0 0.559
10 1 0.508
12 0 0.457
12 1 0.457
14 1 0.343
14 1 0.343
16 1 0.286
22 1 0.228
24 1 0.171
24 0 0.171
24 0 0.171
24 0 0.171
Modelos Multivariantes 17
PRIMERO: ordenar los sujetos en función del tiempo de supervivencia de
cada uno.
SEGUNDO: calcular la probabilidad de supervivencia utilizando la fórmula
Pk = Pk-1 [(rk - fk)/ rk]
Los dos primeros sujetos que sufren el evento (recaída), lo hacen a los
dos meses, por lo que la probabilidad de supervivencia para el segundo
mes se puede calcular de manera muy sencilla:
P2 = 1 (24 - 2)/ 24 = 0.916
EL CÁLCULO DE PROBABILIDADES
Modelos Multivariantes 18
El cálculo del siguiente valor se hará de forma condicional, calculando
una nueva proporción y multiplicándola por la probabilidad del momento
anterior.
El cálculo de probabilidades para 3 y 6 meses sería:
P3 = 0.916 (22 - 2)/ 22 = 0.833
P6 = 0.833 (19 - 1)/ 19 = 0.789
NOTA: sólo es posible realizar los cálculos para aquellos momentos en los que
se ha registrado la presencia del evento (2, 3, 6, 7 meses…). En aquellos
momentos en los que no se haya registrado (5, 11 meses,…) se asume
que la Prob. de supervivencia es la misma que en el momento anterior.
EL CÁLCULO DE PROBABILIDADES
Modelos Multivariantes 19
Lo que se calcula de este modo es una función de probabilidad, que se
materializa en una probabilidad condicional en diferentes momentos o
períodos de tiempo.
La información puede recogerse en una Tabla Kaplan-Meier e ilustrarse en
un gráfico o Curva de Supervivencia.
Se puede calcular también la Media, la Mediana y los cuartiles de
Supervivencia .
EL CÁLCULO DE PROBABILIDADES
Modelos Multivariantes 20
TABLA KAPLAN-MEIER
Modelos Multivariantes 21
CURVA DE SUPERVIVENCIA
Modelos Multivariantes 22
Más que los valores concretos de probabilidad, lo que debe centrar el
interés del investigador a la hora de interpretar los resultados es la
TENDENCIA OBSERVADA EN LA CURVA Y SU INCLINACIÓN, que informa
de la aceleración que experimenta el tiempo con relación a la probabilidad
de supervivencia del paciente.
EVOLUCIÓN de una enfermedad
¡El tiempo corre demasiado de prisa en algunas enfermedades!
CURVA DE SUPERVIVENCIA
Modelos Multivariantes 23
También es posible realizar los cálculos para diferentes grupos, explorando
así el efecto de una VI. Tendríamos tantas tablas y curvas de supervivencia
como grupos se estableciesen en la VI.
Las media y medianas de supervivencia de cada uno de ellos podrían ser
comparadas, al igual que las pendientes de las curvas, evaluando con ello su
comportamiento diferencial.
A nivel estadístico, podríamos acudir a la prueba Log-Rank, para contrastar la
hipótesis de igualdad de las funciones.
Si no se cumple el supuesto de PROPORCIONALIDAD: Breslow o Tarone-Ware
ANÁLISIS POR GRUPOS
Modelos Multivariantes 24
ANÁLISIS POR GRUPOS
Tiem po Probabilidad de
Supervivencia
1
2
.... 5
6
0,70
0,50
.... 0,34
0,27
5
6
7 ....
12
0,66
0,89
0,78 ....
0,16
A
B
Permite comparar las curvas de supervivencia para distintos grupos
Tiempo (t)
Pro
b.
su
pe
rv
ive
nc
ia,
S(t)
1
Tablas y Gráficos Kaplan-M eier
0
Modelos Multivariantes 25
ANÁLISIS POR GRUPOS
Modelos Multivariantes 26
ANÁLISIS POR GRUPOS
Sin Cirugía (1)
Con Cirugía (0)
Modelos Multivariantes 27
EL TEST LOG-RANK
Modelos Multivariantes 28
En la Regresión de Cox se intenta modelizar una Función de Riesgo o
(Hazard) que se suele representar como t y que vendría a ser el riesgo de
fallecer (recaer, …) en el momento “t”, obtenida a partir del seguimiento
de un grupo de sujetos.
El modelo general podría ser expresado del siguiente modo:
REGRESIÓN DE COX
nnt XXXLn ...2211
Modelos Multivariantes 29
donde,
t es la función de riesgo o Hazard
es el valor de una constante que especifica el riesgo basal, en
ausencia de cualquier factor o variable explicativa
Xn son las diferentes variables explicativas cuyo efecto pretende
probarse
n son los pesos o coeficientes de regresión estimados para cada
variable explicativa
REGRESIÓN DE COX
Modelos Multivariantes 30
VIs
MÁXIMA VEROSIMILITUD
CHI-CUADRADO
CONTRASTE DE WALD
MÉTODO DE PASOS
-2LL
No hay R2
¿SIMILAR A LA REGRESIÓN LOGÍSTICA?
Modelos Multivariantes 31
El signo de los “B”
¿Aumenta ó disminuye el riesgo de que se produzca el evento (muerte,
recaída, alta, etc.) bajo determinadas condiciones o niveles de la VI?.
Hazard Ratio (HR). SPSS los designa como Exp (B). Es un cociente (ODD)
entre la Tasa de Riesgo (o Riesgo Relativo) para un sujeto bajo una
determinada condición (tratamiento “A”), frente a otra (tratamiento “B”), con
el que se intenta representar el efecto de cada VI.
Interpretación del HR: Valores próximos a “1” indican que dicha VI no implica
un cambio en la Tasa de Riesgo (numerador y denominador serían iguales).
Valores inferiores a “1” implican una disminución del riesgo y, por lo tanto,
un aumento de la probabilidad de supervivencia, correspondiéndose con
factores de protección y coeficientes B negativos. Valores superiores a “1”
se corresponderían con factores de riesgo y coeficientes B positivos.
INTERPRETACIÒN