Distribucion T de Student, Scrib
-
Upload
nidia-argueta -
Category
Documents
-
view
36.905 -
download
0
description
Transcript of Distribucion T de Student, Scrib
INDICE
INDICE 2
INTRODUCCION 3
DISTRIBUCIÓN “t” DE STUDENT 4
Ley de Student 5
Características de la distribución t de student 6
Propiedades de la ley de student 6
Grados de Libertad 7
Intervalos para muestras pequeñas 7
EJERCICIOS RESUELTOS 11
BIBLIOGRAFIA 16
ANEXO 17
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
INTRODUCCION
La distribución t de Student se utiliza cuando nos encontramos con la dificultad de
no conocer la desviación típica poblacional y nuestra muestra es menor de 30. Es
similar a la curva normal, pero la distribución t tiene mayor área a los extremos y
menos en el centro.
Esta fue descubierta por un especialista en estadística de una empresa irlandesa,
este señor cuyo nombre era William S. Gosset, hizo inferencias acerca de la
media cuando la desviación poblacional fuese desconocida; y ya que a los
empleados de dicha entidad no les era permitido publicar el trabajo de
investigación bajo sus propios nombres, Gosset adoptó el seudónimo de
“Student”.
Sus funciones se basan en establecer un intervalo de confianza, utilizando un nivel
de confianza y los grados de libertad, obteniendo valores de una tabla dada con
respecto a estas variables y aplicarla en la formula.
De gran utilidad, reduce tiempo, costo y esfuerzos. Se utiliza para probar hipótesis
y también para saber si dos muestras provienen de la misma población.
Distribución t de Student Página 2
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
DISTRIBUCIÓN “t” DE STUDENT
DISTRIBUCION t DE STUDENT
En muchas ocasiones no se conoce y el número de observaciones en la muestra
es menor de 30. En estos casos, se puede utilizar la desviación estándar de la
muestra s como una estimación de , pero no es posible usar la distribución Z
como estadístico de prueba. El estadístico de prueba adecuado es la distribución t.
A veces es necesario hacer análisis de muestras pequeñas por razones de tiempo
y reducción de costos, para ello fue descubierta la distribución t por William
Gosset, un especialista en estadística, que la publicó en 1908 con el seudónimo
de Distribución t Student.
Los usos para los cuales es idónea esta distribución son los siguientes:
1) Para determinar el intervalo de confianza dentro del cual se puede estimar
la media de una población a partir de muestras pequeña (n < 30)
2) Para probar hipótesis cuando una investigación se basa en muestreo
pequeño.
3) Para probar si dos muestras provienen de una misma población.
Sus aplicaciones en la inferencia estadística son para estimar y probar una media
y una diferencia de medias (independiente y pareada).
Cuando hicimos la estimación por intervalo, usando la distribución Z, con n ≥ 30,
establecimos el intervalo de confianza para estimar la media poblacional, así
x± zσ
√n dado que conocíamos la desviación típica de la población σ . Sin
embargo, si no la conocemos se puede sustituir por la desviación típica muestral S
quedando así x± zs
√n . Se sabe también que si X es una variable normalmente
distribuida con media µ y variancia σ2, y si una muestra de tamaño n se extrae,
Distribución t de Student Página 3
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
entonces x, la media de la muestra es normalmente distribuida con media µ y
variancia σ x2 = σ
2
n.
Asimismo: x – µσx
= z, es una variable aleatoria normal estandarizada, con media
igual a cero y variancia igual a uno. Si σ x se sustituye por
sx = √∑ ¿¿¿¿, para tener x−μsx
, esta nueva variable no es mas normalmente
distribuida, teniendo su propia distribución, llamada t de “Student”
La distribución estadística de prueba:
t = x−μ^sx
=> S=S
√n−1
Entonces la distribución t queda así:
t = x−μσ
√n−1
LEY DE STUDENT
Esta ley se aproxima mucho a la distribución normal cuando el tamaño de la
muestra es grande (por tanto, podemos usar indistintamente una u otra). Cuando
la muestra es pequeña t no se distribuye normalmente, y es imperativo utilizarla.
La expresión para calcular el intervalo de confianza es la misma, en lugar de
buscar z α2 se busca t( α
2,ν ). El elemento ν es un parámetro llamado grados de
libertad y se calcula mediante ν = n – 1.
μ=x ± t(α2, ν)
σ
√nCARACTERÍSTICAS DE LA DISTRIBUCIÓN T DE STUDENT
1. Al igual que la distribución Z, es una distribución continua
Distribución t de Student Página 4
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
2. La distribución t tiene una media de cero, es simétrica respecto de la media
y se extiende de - a + la varianza de t para > 2. Cuando los
grados de libertad son suficientemente grandes la varianza de la
distribución t tiende a 1.
3. Tiene forma acampanada y simétrica
4. No hay una distribución t, sino una "familia" de distribuciones t. todas con la
misma media cero, pero con su respectiva desviación estándar diferente de
acuerdo con el tamaño de la muestra n, identificada cada una por sus
respectivos grados de libertad. Existe una distribución t para una muestra
de 20, otra para una muestra de 22, y así sucesivamente.
5. La distribución t es más ancha y más plana en el centro que la distribución
normal estándar como resultado de ello se tiene una mayor variabilidad en
las medias de muestra calculadas a partir de muestras más pequeñas. Sin
embargo, a medida que aumenta el tamaño de la muestra, la
distribución t se aproxima a la distribución normal estándar.
PROPIEDADES DE LA LEY DE STUDENT
Fν(t) = A (1+ t2
v)−( v+1
2) es la función de la densidad de la ley. La constante A
hace que el área bajo el gráfico sea igual a la unidad, v=n-1 son los grados
de libertad.
Para cada valor v de grados de libertad, existe una particular distribución de
probabilidad de t, es el parámetro ν, grados de libertad, el que identifica a la
curva respectiva.
El dominio de la función son todos los números reales.
Su media es μ=0, y su varianza es σ 2 = vv−2
para v > 2.
Los valores t (α ,ν¿ se encuentran en tablas de la distribución de t.
GRADOS DE LIBERTAD
Distribución t de Student Página 5
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
En la mayoría de los casos, los parámetros de una población son cantidades
desconocidas y para estimarlos es necesario extraer una muestra de la población
y calcular los estadísticos correspondientes.
Existen varias distribuciones t. Cada una de ellas está asociada con los que se
denominan “Grados de libertad” (generalmente denotado por la letra griega nu, ν),
esté se define como el número de valores que podemos elegir libremente, ósea, el
número de observaciones menos uno, ν = n – 1.
A medida que los grados de libertad son más grandes hasta tender al infinito, las
formas de las curvas de t tienden a ser más próximas a la forma de la curva
normal.
Como cada curva de t esta relacionada a sus grados de libertad, no se pueden
usar valores estandarizados únicos, como se hizo en el caso de la normal, por lo
que es necesario, para calcular la probabilidad de un valor de t caiga en un
particular intervalo, computarlo según sean sus grados de libertad. Como es una
tarea difícil, se han elaborado tablas para varios valores de v. Generalmente las
tablas se han construido para pruebas de dos colas, variando v desde 1 hasta
infinito y alfa desde 0.5 hasta 0.001.1
INTERVALOS PARA MUESTRAS PEQUEÑAS
Cuando las observaciones de la muestra x1, x2,…, xn provienen de una ley normal,
el estadístico z = x−μσ
√n es exactamente normal estándar. Sin embargo cuando σ
no se conoce y se estima mediante s = √∑ ¿¿¿¿ , la distribución del estadístico t
= x−μσ
√n no es necesariamente normal.
Ejemplo:
1 Ver anexo
Distribución t de Student Página 6
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
Probabilidad de 0.90 de que t esté entre -1.76 y +1.76 ⟹ -0.76 ≤ t ≤ 1.76
Como t = x−μσ
√n−1 , la desigualdad se convierte en
-1.76 ≤ x−μσ
√n−1 ≤ 1.76
x - 1.76 S
√n−1 ≤ μ ≤ x + 1.76
Como determinar el Intervalo de Confianza para la estimación de la Media
Conceptos Previos:
a) Estimador Puntual: Valor que se calcula a partir de la información de la
muestra y que se usa para estimar el parámetro de la población. Ejemplo: la
media de la muestra x es un estimador puntual de la media de la población
μ.
b) Intervalo de Confianza: Es un rango de valores que se construye a partir
de datos de la muestra de modo que el parámetro ocurre dentro de dicho
rango con una probabilidad específica. La probabilidad específica se
conoce como nivel de confianza.
Nos interesa en nuestro caso particular poder establecer el intervalo de confianza
para estimar la media poblacional, para ello haremos uso de la siguiente fórmula:
μ=x ± t(α2, ν)
s
√nDonde: μ = media poblacional
x = media muestral
t( α2,ν ) = valor obtenido de la tabla de la distribución “t”
Distribución t de Student Página 7
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
s = desviación típica muestral
n = tamaño de la muestra
α = nivel de confianza
ν = grados de libertad
Para poder utilizar ésta formula es necesario explicar el significado de algunos
conceptos y la manera de cómo calcular su valor así como de conocer el uso de la
tabla “t” de Student. Lo cual haremos a continuación:
1) El nivel de confiabilidad utilizado es:
α = 100 %−Confiabilidad
100 %
La confiabilidad se refiere a la probabilidad específica de estimación del
parámetro, en este caso de la media poblacional.
2) Los grados de libertad: Concepto un tanto difícil de definir pero debe
entenderse como un indicador del grado de acercamiento que cada curva
de la distribución “t” presenta con respecto de la curva normal (obsérvese
que esto pone de manifiesto que la distribución t no es única y existen
tantas como los grados de libertad cumplan la condición ν < 30)
Su valor se obtiene de la formula:
ν = n – 1
3) Los valores de t( α2,ν ) se encuentran en la tabla de la distribución t Student.2
Determinando un intervalo de confianza
Para estimar la media poblacional μ en cualquier intervalo de confianza, utilizamos
x± ts
√n−1
2 Ver anexo
Distribución t de Student Página 8
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
Si el tamaño de la muestra fuese de n = 10, los grados de libertad serían 9 y para
un coeficiente de confianza del 80%, el intervalo de confianza para estimar la
media poblacional µ sería:
x±1.38( S
√n−1)
EJERCICIOS RESUELTOS
Los ejercicios se han resuelto en base a la tabla de Distribución t con distintos
grados de libertad.3
3 Ver anexo
Distribución t de Student Página 9
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
1. Se realizo un estudio sobre la utilización del agua en una pequeña ciudad.
Para ello se considero una muestra de 25 casa. El número de galones de
agua que utilizan por día (1 galón ≡ 0.0037854 m3) fue el siguiente:
175 185 186 118 158
150 190 178 137 175
180 200 189 200 180
172 145 192 191 181
183 169 172 178 210
Con base en esta información:
a) Hallar un intervalo de confianza del 90%
b) Si el recurso de agua en la ciudad permite una utilización media de 160
galones por día, ¿Podría pensarse que hay un problema de escasez de
agua en la ciudad?
x=175.76; n=25; s=20.79; α=0.1; ν=24; μ=160; t( α
2,ν )=1.711
μ : x± t(α2,ν)
s
√n
μ :175.76±1.71120.79
√25
I μ = [168.65, 182.87]
2. A partir de 860 cuentas, un analista financiero toma una muestra aleatoria
de 16 cuentas. Los saldos observados en la muestra son los siguientes:
165, 150, 300, 240, 250, 150, 300, 200, 140, 240, 260, 180, 190, 230, 350,
360.
Determinar un intervalo de confianza del 90% para estimar el saldo medio de
todas las cuentas.
x=231.56; n=16; s=69.61; α=0.1; ν=15; t( α2,ν )=1.753
Distribución t de Student Página 10
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
μ : x± t(α2,ν)
s
√n
μ :231.56±1.75369.61
√16
I μ = [201.05, 262.07]
3. Una muestra de edades de 36 asegurados a una compañía dio valores x =
39.5, y s = 7.77. Hallar los intervalos de confianza para µ del:
a) 90%; x=39.50; n=36; s=7.77; α=0.1; ν=35; t( α2,ν )=1.690
μ : x± t(α2,ν)
s
√n
μ :39.5±1.6907.77
√36
I μ = [37.31, 41.69]
b) 95%; x=39.50; n=36; s=7.77; α=0.05; ν=35; t( α2,ν )=2.030
μ : x± t(α2,ν)
s
√n
μ :39.5±2.0307.77
√36
I μ = [36.87, 42.13]
4. Una maquina se encarga de llenar botes de jalea con µ gramos, pero no
los llena con la cantidad exacta. Suponte que los pesos reales de contenido
siguen una ley normal N (µ, σ 2).
Si de una muestra de 16 botes obtenemos una media de 298g, investiga si un
intervalo de confianza para µ del 95%, contiene la media µ = 300.
Distribución t de Student Página 11
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
x=298; n=16; s=20.79; α=0.05; ν=15; μ=300; t( α
2,ν )=2.131
μ : x± t(α2,ν)
s
√n
μ :298±2.13120.79
√16
I μ = [286.92, 309.08]
R/ El intervalo si contiene a la media µ, por lo tanto el error en llenado no es
intencional.
5. Se selecciono una muestra aleatoria de 25 cuentas por cobrar de un
registro que contenía 96 cuentas. La muestra dio una media de x = 2.435
colones y una desviación típica de S = 335 colones. Obténgase un intervalo
de confianza del 90% para estimar la media de las 96 cuentas del registro.
x=2435; n=25; s=335; α=0.1; ν=24; t( α
2,ν )=1.711
μ : x± t(α2,ν)
s
√n
μ :2435±1.711335
√25
I μ = [2320.36, 2549.64]
6. El auditor de una empresa al examinar los registros de facturación mensual,
mediante el análisis de una muestra aleatoria irrestricta de 10 facturas no
pagadas encontró que la media aritmética fue de x = $9500 con una
desviación típica de s = $327. Construir un intervalo de confianza del 95%
para estimar el parámetro poblacional.
x=9500; n=10; s=327; α=0.05; ν=9; t( α2,ν )=2.262
Distribución t de Student Página 12
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
μ : x± t(α2,ν)
s
√n
μ :9500±2.262327
√10
I μ = [9266.09, 9733.91]
7. Una muestra aleatoria del proceso de producción de 17 bombillos, dio una
media de x = 128 horas, con una desviación típica s = 15 horas. Construir
un intervalo de confianza del 99% para estimar el promedio de vida útil de
todos los bombillos del proceso.
x=128; n=17; s=15; α=0.01; ν=16; t( α
2,ν )=2.921
μ : x± t(α2,ν)
s
√n
μ :128±2.92115
√17
I μ = [117.37, 138.63]
8. Una empresa constructora desea conocer el promedio de arrendamiento
mensual de casas en cierta ciudad (casas tipo clase media). Una muestra
aleatoria de 26 arrendamientos dio un promedio de x = $280 y una
desviación típica de s = $55. Estime el promedio verdadero con un intervalo
de confianza del 0.99.
x=280; n=26; s=55; α=0.01; ν=25; t( α
2,ν )=2.787
μ : x± t(α2,ν)
s
√n
μ :280±2.78755
√26
I μ = [249.94, 310.06]
Distribución t de Student Página 13
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
9. El propietario de una papelería desea estimar la media del valor al
menudeo de las tarjetas de felicitación que la tienda tiene en su inventario.
Una muestra aleatoria de 20 tarjetas de felicitación indica una media de
valor de $1.67 y una desviación estándar de $0.32. Suponiendo una
distribución normal, construya una estimación del intervalo de confianza del
95% para la media del valor de todas las tarjetas de felicitación en el
inventario de la tienda.
x=1.67; n=20; s=0.32; α=0.05; ν=19; t( α
2,ν )=2.093
μ : x± t(α2,ν)
s
√n
μ :1.67±2.0930.32
√20
I μ = [1.52, 1.82]
Distribución t de Student Página 14
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
BIBLIOGRAFIA
Libros
Elementos de probabilidad y estadística. José Hernández Salguero. 1ª
Edición, El Salvador. UCA-Editores 2002
Estadística II: Métodos prácticos de inferencia estadística. Gildaberto
Bonilla. 4ª Edición. El Salvador. UCA-Editores 1997
Estadística para administración. David M. Levine; Timothy C. Krehbiel; Mark
L. Berenson. 4ª Edición. México. Prentice Hall 2006
Introducción a la estadística. Wilfredo Caballero. 1ª Edición. Costa Rica.
IICA 1981
Apuntes de Clase de Estadística. El Salvador. ITCA-FEPADE. 2006
Internet
http://www.itchihuahuaii.edu.mx/academico/CB/MEG/documentos/1.8.htm
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudent.html
Distribución t de Student Página 15
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
ANEXO
Distribución t de Student Página 16