Intervalos de confianza bootstrap métodos percentil
description
Transcript of Intervalos de confianza bootstrap métodos percentil
Departament d’Estadística
Divisió de Ciències Experimentals i Matemàtiques
Intervalos de confianza bootstrap
métodos percentil
Programa de doctoradoEstadística, Anàlisi de dades i Bioestadística
Métodos de Montecarlo y Estadística computacional
Intervalos de confianza percentil bootstrap
El método percentil. Definición
Situación de partida: parámetro de interés, su estimador “plug-in”,estimador bootstrap de la distribución de
IC percentil bootstrap de , con recubrimiento nominal 1 – :
En la práctica se suele aproximar mediante donde corresponde al percentil muestral p obtenido a partir de B réplicas bootstrap:
q
qG
( ) ( )1 12 2
ˆ ˆ, 1G Ga a- -é ù-ê úë û
( ) ( )2 2
* *1
ˆ ˆ,a aq q-
é ùê úë û ( )
*pq
* * *1 2ˆ ˆ ˆ, , , Bq q qK
Intervalos de confianza percentil bootstrap
Motivación método percentil (i)
Sea estimador de la desviación estándar de
Recordemos: si
entonces es IC “estándar” con recubrimiento 1 – aproximadamente
Extremos del IC estándar equivalentes a percentiles /2 y 1 – /2 de la distribución de
q( )
ˆ
ˆ0,1
ˆN
q
q qs-
»
ˆˆq
s
2 ˆˆ ˆza
qq s±
( )*ˆ
ˆ ˆ ˆ,Nq
q q s:
Intervalos de confianza percentil bootstrap
Motivación método percentil (ii)
Si cierto en general también a su vez bien emulada por
la estima bootstrap de la distribución de Es decir:
Pero ¿y si no normal? (p.e. = , coef. de correlación): ¿existe transformación normalizadora y estabilizadora de varianza?
q
( )ˆˆ , ,N
qq q s»
( )*ˆ
ˆ ˆ ˆ, ,Nq
q q s» ˆ,G
( ) ( )2 2
1 12 2ˆ ˆ
ˆ ˆˆ ˆˆ ˆ, 1z G z Ga aa a
q qq s q s- -- » + » -
q
Intervalos de confianza percentil bootstrap
Motivación método percentil (y iii)
Si existe g, monótona creciente, tal que
En escala , intervalo percentil estándar Monotonicidad de g en escala = g1(),
IC percentil (¡obtenido directamente, sin conocer g!) aproximadamente correcto
( ) ( ) ( )ˆ ˆˆ ˆ ˆ, , , , cte.g g N
q qf q f q ff s s= = »
( )13
1 1 ˆp.e. log , ,2 1 n
Nr
ff fr -
+= »
-
Intervalos de confianza percentil bootstrap
En resumen:
Esquemáticamente:
donde es la distribución bootstrap de y es la función de distribución N(0,1)
Por lo tanto, en estas condiciones define IC
( ) ( ) ( ) ( ) ( )2 2
* 1 * 1 12 2 2 ˆ
interpretable como percentil
ˆ ˆˆ ˆ,G Ha aa a a
qq ff s- - -= = @ + F
144444444444444424444444444444443
H f
( ) ( ) ( ) ( )( )2 2
1 1 12 2
ˆ ˆ ˆ, 1 ,G G G z za aa a- - -é ù- = F - Fë û
g1
Intervalos de confianza percentil bootstrap
Modelo para el sesgo y la heteroscedasticidad
Supongamos que existe una transformación g, normalizadora, pero que no corrige el sesgo ni estabiliza la varianza, en concreto sea( ) ( )
( )( ) ( )
( )
0 ˆˆ
*
0
ˆ ˆ,ˆ
0,1 , con 1
ˆ ˆy por lo tanto, también 0,1ˆ1
g g
z N a
z Na
ff
f q f q
ffs ff
s f
ff
f
= =
-+ » = +
-+ »
+
Intervalos de confianza percentil bootstrap
Construcción de los IC BCa. Intervalo en la escala normal
2 2
2 2
0
0 0
ˆDe 1 Pr
1o, equivalentemente,
ˆ ˆPr Pr ,
1 1llegamos a la conclusión de que un IC de nivel,
aproximado, 1 para
z z za
z z z za a
a a
a a
ffa
f
ff ffa
ff
a
ì üï ï-ï ï- @ - £ + £í ý+ï ïï ïî þ
ì ü ì üï ï ï ï- -ï ï ï ï@ - > + + > +í ý í ý+ +ï ï ï ïï ï ï ïî þ î þ
- viene dado por:f
( )( )
( )( )2 2
2 2
0 0ˆ ˆ
0 0
ˆ ˆ ˆ ˆPr1 1
z z z z
a z z a z z
a a
a aff
f s ff f s fì üï ï- +ï ïï ï+ £ £ +í ýï ï- - - +ï ïï ïî þ
Intervalos de confianza percentil bootstrap
Construcción de los IC Bca. Intervalo en la escala normal
( ) ( )( )
( )2
2
0 ˆ ˆ
01 0
0
Los extremos del intervalo anterior pueden considerarse
ˆ ˆ ˆpercentiles de una distribucion ,
pero no los percentiles / 2 y 1 / 2, sino percentiles
y1
1
N z
z zz
a z z
a
a
fff s f s f
a a
a
a
-
-
æ ö- ÷ç ÷ç ÷= F +ç ÷ç ÷- -ç ÷çè ø
-( )
2
2
02 0
0
1 2
1
respectivamente, con
z zz
a z z
a
a
a a a
æ ö+ ÷ç ÷ç ÷= F +ç ÷ç ÷- +ç ÷çè ø= +
Intervalos de confianza percentil bootstrap
Construcción de los IC Bca. Intervalo en la escala original
Por lo tanto, el intervalo en la escala :
tendrá extremos de la forma:
( )( )
( )( )2 2
2 2
0 01 1ˆ ˆ
0 0
ˆ ˆ ˆ ˆ,1 1
z z z zg g
a z z a z z
a a
a aff
f s ff s f- -é æ ö æ öù- +÷ ÷ç çê ú÷ ÷ç ç÷ ÷+ +ê ç ç ú÷ ÷ç ç÷ ÷ê ú- - - +ç ç÷ ÷÷ ÷ç çè ø è øê úë û
( ) ( )
( ) ( )
2
1
2
2
2
2
0* 10
0
0* 101
0
ˆ ˆ y1
ˆ ˆ1
z zG z
a z z
z zG z
a z z
a
a
a
a
a
a
q
q
-
--
æ æ öö- ÷÷ç ç ÷÷ç ç ÷÷= F +ç ç ÷÷ç ç ÷÷- - ÷÷ç çè è øø
æ æ öö+ ÷÷ç ç ÷÷ç ç ÷÷= F +ç ç ÷÷ç ç ÷÷- + ÷÷ç çè è øø
Intervalos de confianza percentil bootstrap
Estima de la corrección del sesgo z0
Falta determinar el valor del parámetro de corrección del sesgo, z0, y de la “constante de aceleración”, a
Estima de z0: – En efecto:
( ) { }{ } ( )
**
**
0 0 0* *
ˆ ˆ ˆ ˆˆ ˆ
ˆ ˆˆ1
G P
P P z z za
q q qff
fff
= £ì üï ï-ï ï= £ = + £ @Fí ýï ï+ï ïî þ
( )( )10
ˆ ˆˆ .z G q-= F
Intervalos de confianza percentil bootstrap
Estima de la constante de aceleración
Efron, para funcionales
– Ui es la función empírica de influencia asociada al dato i:
Alternativamente, aproximación jackknife:
{ }32
31
21
ˆ6
nii
nii
Ua
U=
=
=åå
( )( )( ) ( )
0
ˆ ˆ1ˆ, lim ii i
t F t FU U x F
e
e ed
e®
- + -= =
( ) ( )ˆ ˆ, :t F t Fq q= =
( ) ( )( )
( ) ( )( ){ }32
3
12
1
ˆ ˆˆ
ˆ ˆ6
nii
nii
aq q
q q
× -=
× -=
-=
-
åå
Intervalos de confianza percentil bootstrap
Resumen de intervalos percentil
IC percentil:– Validez: transformación normalizante, centrada y
estabilizadora de varianza (no necesario conocerla)– Definición:
IC percentil corregido para el sesgo, acelerado (BCa):– Validez: transformación normalizante (no necesario
conocerla)– Definición:
Si sesgo pero homoscedasticidad a = 0: intervalo “corregido para el sesgo”: BC
( ) ( )1 12 2
ˆ ˆ, 1G Ga a- -é ù-ë û
( ) ( )2 2
2 2
0 01 10 0
0 0
ˆ ˆˆ ˆˆ ˆ,
ˆ ˆ ˆ ˆ1 1
z z z zG z G z
a z z a z z
a a
a a
- -é æ æ öö æ æ ööù- +÷÷ ÷÷ç ç ç çê ú÷÷ ÷÷ç ç ç ç÷÷ ÷÷F + F +ê ç ç ç ç ú÷÷ ÷÷ç ç ç ç÷÷ ÷÷ê ú- - - +ç ç ç ç÷÷ ÷÷÷÷ ÷÷ç ç ç çè è øø è è øøê úë û