Introducción a la Inferencia Estadistica
description
Transcript of Introducción a la Inferencia Estadistica
Introducción a la Inferencia Estadistica
Dept. of Marine Science and Applied BiologyJose Jacobo Zubcoff
Intervalos de confianza
Intervalos de confianza: sirven para estimar el valor de un Parámetro de la población.
Un intervalo de confianza del 1-α% para un parámetro es un intervalo de valores calculado a partir de los datos de la muestra
Probabilidad 1-α de que contenga el verdadero valor del parámetro. El nivel de confianza suele ser 0,90 (90%), 0,95 (95%) ó 0,99 (99%).
Interpretación práctica
Introducción a la Inferencia Estadistica
Intervalo de confianza para la media poblacional, conocido
Introducción a la Inferencia Estadistica
Intervalo de confianza para la media poblacional, conocido
La media muestral y la desviación estándar son buenos estimadores
Estos estimadores son a la vez variables aleatorias. Tienen una determinada distribución, en el caso de la media es Normal.
Así pues podemos calcular un intervalo de valores [a,b] tales que
)( bXaP = C
Introducción a la Inferencia Estadistica
Intervalo de confianza para la media poblacional, conocido
Intervalo de confianza para la media poblacional, conocido
Supongamos que disponemos de una población en la que tenemos una v.a. con distribución N(,) con conocida.
Obtenemos una muestra de tamaño n y deseamos estimar la media de la población.
El estimador puntual de la misma es la media muestral cuya distribución muestral es conocida
),(n
x
n
xZ
tendrá distribución
normal estándarEl estadístico
Introducción a la Inferencia Estadistica
Sobre la distribución N(0 , 1) podremos seleccionar dos puntos simétricos -z/2 y z /2 , tales que
P(-z /2 Z z /2 ) = 1-
Intervalo de confianza para la media poblacional, conocido
Introducción a la Inferencia Estadistica
Sustituyendo Z
12/2/ z
n
xzP
Despejando nos queda el intervalo de confianza,
12/2/
nzx
nzxP
Intervalo de confianza para la media poblacional, conocido
Introducción a la Inferencia Estadistica
Gráficamente: para una normal tipificada, un intervalo de confianza del 95% se puede representar como:
95%
2.5%2.5%
La probabilidad de que una variable normal tipificada tome valores en el intervalo
[-1.96,1.96] es del 95%.
Introducción a la Inferencia Estadistica
Intervalo de confianza para la media poblacional, conocido
Intervalo de confianza para la media poblacional, conocido
Ejemplo,• Obtener un I. C. del 95% para el promedio de una poblacion de 500
novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que 2 es de 400 kg2.x
Introducción a la Inferencia Estadistica
Ejemplo,• Obtener un I. C. del 95% para el promedio de una poblacion de 500
novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que 2 es de 400 kg2.x
Introducción a la Inferencia Estadistica
12/2/
nzx
nzxP
Intervalo de confianza para la media poblacional, conocido
Ejemplo,• Obtener un I. C. del 95% para el promedio de una poblacion de 500
novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que 2 es de 400 kg2.x
25
2096.1390
25
2096.1390
84,39716,382
Introducción a la Inferencia Estadistica
12/2/
nzx
nzxP
Intervalo de confianza para la media poblacional, conocido
Si la varianza poblacional es desconocida y la variable es normal
(o se puede aproximar a la normal por el Teorema central del límite)• Se usa la t de Student, • Con n –1 grados de libertad • Desvíación típica muestral.
El intervalo de confianza resulta
1)1;2/()1;2/(
n
stx
n
stxP nn
Intervalo de confianza para la media poblacional, conocido
Introducción a la Inferencia Estadistica
Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr.
Estimar el intervalo de confianza al 95% para el verdadero aumento promedio
Intervalo de confianza para la media poblacional, conocido
Introducción a la Inferencia Estadistica
Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr.
Estimar el intervalo de confianza al 95% para el verdadero aumento promedio
9
04.3306.235
9
04.3306.235
Intervalo de confianza para la media poblacional, conocido
Introducción a la Inferencia Estadistica
Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr.
Estimar el intervalo de confianza al 95% para el verdadero aumento promedio
9
04.3306.235
9
04.3306.235
34.3766.32
Intervalo de confianza para la media poblacional, conocido
Introducción a la Inferencia Estadistica
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
Que es: hipótesis estadística es una afirmación respecto a alguna característica de una población.
Ho : Hipótesis nula H1 : Hipótesis alternativa
Errores que se pueden cometer
Pueden ser unilaterales o bilaterales
Conclusiones a partir de una muestra aleatoria y significativa, permite aceptar o rechazar la hipótesis nula
No rechazo H0
Reg. Crit.Reg. Crit.
=5%
=40
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
Ho : μ = μo
H1 : μ ≠ μo
Contraste bilateral
4020X
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable. Sin embargo ocurrió.
¿qué hace un científico cuando su teoría no coincide con sus predicciones?
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
4020X
... el resultado del experimento sería improbable. Sin embargo ocurrió.
Rechazo que H0 sea cierta.
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
Si supongo que H0 es cierta...
4038X
Si supongo que H0 es cierta...
... el resultado del experimento es coherente.
• No hay evidencia contra H0
• No se rechaza H0
• El experimento no es concluyente
• El contraste no es significativo
¿Si una teoría hace predicciones con éxito, queda probado que es cierta?
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
Región crítica• Es conocida antes de realizar el
experimento: resultados experimentales que refutarían H0
Nivel de significación: • Número pequeño: 1% , 5%• Fijado apriori por el investigador• Probabilidad de rechazar H0
cuando es cierta
No rechazo H0
Reg. Crit.Reg. Crit.
=5%
=40
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: <40 H1: >40
H1: 40
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
Significación: p-valor
H0: =40
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
43X
No se rechazaH0: =40
H0: =40
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
43X
No se rechazaH0: =40
Significacion. P-valorProbabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Probabilidad de obtener una muestra “más extraña” que la obtenida.P-valor es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>
P-valorP
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
50X
Se rechaza H0: =40
Se acepta H1: >40
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
P
P
50X
Se rechaza H0: =40
Se acepta H1: >40
El contraste es estadísticamente significativo cuando p<Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
• Sobre – Número pequeño,
elegido a priori antes de diseñar el experimento
– Conocido sabemos todo sobre la región crítica
• Sobre p– Es conocido tras realizar
el experimento
– Conocido p sabemos todo sobre el resultado del experimento
• Sobre el criterio de rechazo– Contraste significativo = p menor que
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
• Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos:
X = 18,5 S = 3,6
• Plantear Contraste• Estadístico• Zona de Rechazo• P-valor• Conclusiones
• β
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
t(35)0,05=1,69T=0,833No esta en Región CríticaNo es > 1,69P-valor para T=0,833, y para 35 g.l. es aproximadamente 0,20
NO Se rechaza H0: <=18
H1: >18
El contraste es estadísticamente significativo cuando p<Pero que pasa cuando NO Rechazo?
El error cometido es βPara calcularla se debe concretar H1
μ1= 20 (Cuidado: el criterio para este valor no es estadístico)
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
Cuando Acepto Ho:
El error β es
P(Z<zα) tomando μ1= 20
Calculamos el Z correspondiente
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
En este caso hemos calculado βpara un n dado y para una
μ1
Calculo del Tamaño MuestralSe obtiene a partir de L2
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
L2 μ1μo
Podemos fijar n y calcular β
Podemos fijar β y entoncesdebemos calcular n para cumplir con ese error
ó
Calculo del Tamaño MuestralSe obtiene a partir de L2
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
L2 μ1μo
n = (zα + zβ)2 (σ/δ)2
En este caso hemos fijadoβ y entonces debemos calcular el n para cumplir con ese error
δ
Comportamiento de β, δ y el tamaño muestral
Contrastes de Hipótesis
Introducción a la Inferencia Estadistica
L2 μ1μo μ1μo
n = (zα + zβ)2 (σ/δ)2
Si fijamos β
n DISMINUYE cuando aumento δ
δ
• Intervalo de Confianza para la Varianza
Intervalo de Confianza
Introducción a la Inferencia Estadistica
• Plantear Contraste
Estadístico
Contrastes de Hipótesis para Varianza
Introducción a la Inferencia Estadistica
Contrastes para dos Poblaciones
Introducción a la Inferencia Estadistica
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Varianzas Conocidas
Bilateral Unilateral
σx2 σy
2
( ) - ΔoZexpt =
P-valor = P(z > zexpt )P-valor = 2 P(z > |zexpt |)
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Varianzas Iguales Varianzas Distintas
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Intervalo de confianza para diferencia de mediasVarianzas Conocidas
xσy
2σx2
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Problema. Se quiere comprobar si los datos de número de resfriados durante el periodo de exámenes por estudiante influyen tomando vitamina C. Los sig. datos corresponden a muestras a las que se les ha suministrado placebo (x) y Acido Ascorbico (y).x = 2,2 y = 1,9Sx = 0,12 Sy= 0,10Nx= 155 Ny = 208
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Placebo (x) y Acido Ascorbico (y).x = 2,2 y = 1,9Sx = 0,12 Sy= 0,10Nx= 155 Ny = 208
σy2
σx2
FNnum – 1 , Nden – 1 , 0.025
Varianzas Iguales1,2 < 1,3637
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Placebo (x) y Acido Ascorbico (y).x = 2,2 y = 1,9Sx = 0,12 Sy= 0,10Nx= 155 Ny = 208
(pero iguales)
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Problema. 2 Los sig. datos corresponden a muestras de dos ciudades En las que se ha observado el nivel de contaminación de plomo en el agua corriente. Verificar si hay diferencias entre ambas ciudades.
x y
Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica
Contrastes para dos Poblaciones Dependientes
Introducción a la Inferencia Estadistica
1) Definimos la variable D como:D = {Antes - Despues} óD = {Despues - Antes} óD = { X - Y} óD = { Y - X}
2) Proponemos el contraste3) Calculamos el estadístico en función de la definición de D y del contraste propuesto, siendo D unavariable Normal 4) Obtenemos las conclusiones y aportamos el p-valor