Post on 06-Jul-2018
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
1/56
TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL
ORIENTE DEL ESTADO DE MÉXICO
DIVISIÓN DE CONTADURÍA
ELABORACIÓN DE CUADERNILLO DE APUNTES:
ESTADÍSTICA ADMINISTRATIVA II
ELABORADO POR:
ING. MIRIAM MEDINA DELGADO
LOS REYES, LA PAZ, ESTADO DE MÉXICO AGOSTO 2010
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
2/56
INDICE
Unidad 1 Pruebas de la bondad del ajuste y análisis de varianza
1.1 Análisis Ji-Cuadrada . ............................................................................ 11.2 Prueba de independencia . .................................................................... 11.3 Prueba de la bondad del ajuste . ............................................................ 11.4 Tablas de contingencia . ........................................................................ 41.4.1 método para obtener el estadístico x2 de una tabla de contingencia
con dos renglones. ................................................................................. 41.4.2 método para obtener el estadístico x2 de una tabla de contingencia
con más de dos renglones. .................................................................... 61.5 Análisis de varianza . ............................................................................. 91.5.1 Aplicaciones de ANOVA . ................................................................... 9
1.5.2 Inferencia sobre una varianza de población (Anova). . ....................... 141.5.3 Inferencia sobre la varianza de dos poblaciones (Anova). . ................ 15
Unidad 2. Análisis de regresión, correlación lineal simple y múltiple
2.1 Estimación mediante la línea de regresión . ......................................... 162.1.1 Diagrama de dispersión. ................................................................... 162.1.2 Método de mínimos cuadrados. ........................................................ 172.1.3 Interpretación del error estándar de la estimación. ............................. 18
2.1.4 Intervalos de predicción aproximados................................................ 192.1.5 Análisis de correlación. ..................................................................... 222.1.6 Paquete computacional para la solución de problemas. ..................... 222.1.7 Regresión múltiple y análisis de correlación. ..................................... 222.1.8 Usos de variables ficticias. ................................................................ 252.1.9 Residuales y gráficas de residuales. ................................................. 25
Unidad 3. Números índice
3.1 Elaboración de índices simples. ........................................................... 273.2 Índices agregados de precio. ............................................................... 273.3 Relativos eslabonados . ....................................................................... 283.4 Cambio de periodo base. ..................................................................... 283.5 Fusión de dos series de números índice. ............................................. 293.6 Índice de precios al consumidor (IPC).. ................................................ 293.7 Deflación de los valores de series de tiempo. ....................................... 303.8 Índice de precios al productor (IPP).. ................................................... 313.9 Promedios de precios bursátiles de DowJones. .................................... 313.10 Indice de producción insustrial. .......................................................... 31
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
3/56
Unidad 4. Estadística no paramétrica
4.1 Escala de medición. ............................................................................ 334.2 Métodos estadísticos contra no paramétricos. ...................................... 334.3 Prueba de corridas para aleatoriedad. .................................................. 35
4.3.1 Concepto de aleatoriedad. ................................................................ 354.3.2 Teoría de corridas. ........................................................................... 354.3.2.1 Prueba de corridas de una sola muestra. ....................................... 364.3.2.2 Distribución de muestreo del estadístico r . ..................................... 364.4 Una muestra: prueba de signos. .......................................................... 384.5 Una muestra: prueba de Wilcoxon. ...................................................... 404.6 Dos muestras: prueba de Mann-Whitney. ............................................. 424.7 Observaciones apareadas: prueba de Wilcoxon. .................................. 454.8 Varias muestras independientes: prueba de Krauskal-Wallis. ............... 46
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
4/56
INTRODUCCIÓN
La estadística administrativa es una materia importante en contaduría ya quepermite recopilar, organizar, representar, analizar datos y tomar decisiones, así
mismo nos da las herramientas necesarias para utilizar el método adecuadoconforme a la situación que se está analizando y aplicarlo en el área contable.
Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiantedurante el curso de la materia, el cual consta de 4 unidades en donde seproponen algunas prácticas para la aplicación de los temas estudiados y estádesarrollado conforme al temario. Sin embargo es importante que el alumnoconsulte más fuentes de información con el objetivo de retroalimentar.
A continuación se hace una breve semblanza de los temas que se tratan en lasunidades.
Unidad 1. Pruebas de la bondad del ajuste y análisis de varianza. En estaunidad se analizan los siguientes temas: análisis ji-cuadrada, pruebas deindependencia, bondad de ajuste, tablas de contingencia y análisis devarianza para hacer inferencias a partir de una o dos poblaciones.
Unidad 2. Análisis de regresión correlación lineal simple y múltiple. Enesta unidad realiza el diagrama de dispersión, se aplica el método de mínimos
cuadrados para interpretar el error estándar y determinar los intervalos depredicción, así como la solución de ejercicios de análisis de correlación enExcel. Asimismo se recaban datos de una empresa para aplicar la regresiónlineal y hacer estimaciones futuras.
Unidad 3. Números índice. En esta unidad se realizan ejercicios para laelaboración de números índice: simple, precio agregado y precio alconsumidor. Asimismo se elaboran índices de precio y cantidad con datosrecabados en revistas y otras fuentes.
Unidad 4. Estadística no paramétrica. En esta unidad se contrasta laestadística paramétrica contra la no paramétrica, así mismo se analizan temasde prueba de corrida de aleatoriedad, de una o dos muestras y observacionesapareadas. También se recopilan datos para efectuar comparación y análisisentre la estadística y la estadística no paramétrica.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
5/56
Estadística Administrativa II 1
Unidad 1. Pruebas de la bondad del ajuste y análisis devarianza
1.1 Análisis Ji-Cuadrada
Las pruebas Ji-Cuadrada nos permite probar si más de dos proporciones depoblación pueden ser consideradas iguales.
Si clasificamos una población en diferentes categorías respecto a dos atributos(por ejemplo, edad y desempeño en el trabajo), entonces podemos utilizar unaprueba Ji-Cuadrada para los dos atributos son independientes entre sí.
1.2 Prueba de independencia
Los administradores necesitan saber si las diferencias que observan entrevarias proporciones de la muestra son significativas o sólo se deben al azar.
1.3 Prueba de la bondad del ajuste
La prueba ji- cuadrada puede utilizarse también para decidir si unadistribución de probabilidad en particular, como la binomial, la de Poisson o lanormal, es la apropiada. Esta es una habilidad importante, porque comotomadores de decisiones que utilizamos la estadística, necesitamos escogercierta distribución de probabilidad para representar la distribución de los datosque tengamos que analizar.
La prueba ji- cuadrada nos permite hacernos la pregunta de cuál distribuciónpodemos utilizar, y probar si existe una diferencia significativa entre unadistribución de frecuencias observadas y una distribución de frecuenciasteórica.
Cálculo de frecuencias observadas y esperadas
Ejemplo
La compañía “x” requiere que los estudiantes del último año de la universidadque buscan trabajo sean entrevistados por tres ejecutivos diferentes. Estopermite a la compañía obtener una evaluación por consenso de candidatos.Cada ejecutivo califica al candidato como positivo o negativo.
Con el propósito de planear la contratación, el director de selección delpersonal de la compañía piensa que el proceso de entrevistas puede seraproximado por una distribución binomial con p= 0.40, es decir del 40 % de deposibilidad de que cualquier candidato obtenga una calificación positiva encualquiera de las entrevistas.
Si el director desea probar una hipótesis a un nivel de significancia de 0.20.¿Cómo debe proceder?
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
6/56
Estadística Administrativa II 2
Ho: una distribución binomial con p= 0.40 Es una buena descripción delproceso de entrevista.
Hi: una distribución binomial con p= 0.40 No es una buena descripción delproceso de entrevista.
α= 0.20 nivel de significancia para probar la hipótesis
Calificaciones positivasposibles en las tres
entrevistas
Número decandidatos queobtienen cada
calificación
Resultadosde las entrevistasde 100 candidatos
0 181 472 243 11
100
Calificaciones positivasposibles en las tres
entrevistas
Probabilidadesbinomiales paraesos resultados
Posibilidad binomial 0 .21601 .43202 .28803 .0640
1.0000
Calificacionespositivas
posibles en las tresentrevistas
Frecuenciaobservada de
candidatos queobtienen estascalificaciones
Probabilidadesbinomiales de
resultadosposibles
Número decandidatos
entrevistados
Frecuenciaesperada decandidatos
que obtienenestas
calificaciones
Frecuenciasobservadas,Probabilidadesbinomialesadecuadas
y frecuenciasesperada
0 18 .2160 100 21.61 47 .4320 100 43.22 24 .2880 100 28.83 11 .0640 100 6.4
100 1.0000 100.0
Estadístico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
7/56
Estadística Administrativa II 3
Frecuenciaobservada
fo
Frecuencia
esperadafe
fo-fe (fo-fe) (fo-fe)
fe
Calculo delestadístico x
2
18 21.6 -3.6 12.96 0.6000
47 43.2 3.8 14.44 0.334324 28.8 -4.8 23.04 0.800011 6.4 4.6 21.16 3.3063
X =5.0406
Determinación de los grados de libertad
Antes de calcular el número adecuado de grados de libertad para una prueba ji-cuadrada de bondad de ajuste, es necesario contar el número de clases(denotado por K) para las que se compararon las frecuencias observadas yesperadas.
Grados de libertad = k-1
K= 0,1,2,3 k= 4 gl= 4-1 gl= 3
Rechazamos la hipótesis nula y llegamos a la conclusión de que la distribuciónbinomial con p=0.40 no proporciona una buena descripción de nuestras
frecuencias observadas
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.
Número Página
11-16 46611-17 466
11-18 466
Región de aceptación
5.0406
0.20 del área
Valor x2
Distribución x2
4.642
Valor de tabla
Región de rechazo
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
8/56
Estadística Administrativa II 4
1.4 Tablas de contingencia
Describimos las dimensiones de una tabla de contingencia estableciendoprimero el número de renglones y luego el número de columnas. La columna y
el renglón con el total no cuentan como parte de las dimensiones. Losrenglones corren de manera horizontal y las columnas de manera vertical.Tabla de contingencia de 2 x 4( 2 renglones, 4 columnas)
1.4.1 Método para obtener el estadístico x2
de una tabla decontingencia con 2 renglones.
Ejemplo
En cuatro regiones se muestrean las actitudes de los empleados respecto a la
evaluación del desempeño en el trabajo. Los trabajadores eligen entre elmétodo actual (dos evaluaciones al año) y un método propuesto (evaluacionestrimestrales). A continuación se presentan los datos.
Tabla de contingencia de 2x4
Noreste Sureste Central Costaoeste
Total
Respuesta dela muestraconcernientea los
programas deevaluación deempleados
Número de empleados queprefieren el método actual
68 75 57 79 279
Número de empleados queprefieren el método nuevo
32 45 33 31 141
Total de empleadosmuestreados en cadaregión
100 56 90 110 420
Planteamiento del problema
Hipótesis nulaHo: PN=PS=PC=PW
Hipótesis alternativaHi: PN, PS, PC, PW no son iguales
PN= proporción de empleados en el noreste que prefieren el plan actualPS= proporción de empleados en el sureste que prefieren el plan actualPC= proporción de empleados en la región central que prefieren el plan actualPW= proporción de empleados de la región de la costa que prefieren el planactual.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
9/56
Estadística Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costaoeste
Proporción de
empleadosmuestreadosen cadaregión que seesperaprefieren losdos métodosde evaluación
Número total muestreado 100 120 90 110
Proporción estimada queprefieren el método actual
x 0.6643 x 0.6643 x 0.6643 x 0.6643
Número que se esperaprefiera el método actual
66.43 79.72 59.79 73.07
Número total muestreado 100 120 90 110Proporción estimada queprefieren el método nuevo
x 0.3357 x 0.3357 x 0.3357 x 0.3357
Número que se esperaprefiera el método nuevo
33.57 40.28 30.21 36.93
Noreste Sureste Central Costaoeste
Comparaciónde lasfrecuenciasobservadas yesperadas detrabajadoresmuestreados
Frecuencia con queprefieren el método actual:
68 75 57 79
Frecuencia observada (real)Frecuencia esperada(teórica)
66.43 79.72 59.79 73.07
Frecuencia con queprefieren el método nuevo:
32 45 33 31
Frecuencia observada (real)Frecuencia esperada(teórica)
33.57 40.28 30.21 36.93
Estadístico ji- cuadrada
= ( − )
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3Calculo delestadísticox
2
fo fe fo-fe (fo-fe) (fo-fe)
fe
68 66.43 1.57 2.46 0.037075 79.72 -4.72 22.28 0.279557 59.79 -2.79 7.78 0.130179 73.07 5.93 35.16 0.481232 33.57 -1.57 2.46 0.073345 40.28 4.72 22.28 0.553133 30.21 2.79 7.78 0.257531 36.93 -5.93 35.16 0.9521
X = 2.7638
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
10/56
Estadística Administrativa II 6
Determinación de los grados de libertad
Número de
grados delibertad
Grados de libertad en una prueba ji- cuadrada
= (número de renglones -1 )(número de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de .10
Buscar en tablas x2 3 grados de libertad con un nivel de significancia de .10 ygraficar
Interpretación de los resultados y la gráfica.
1.4.2 Método para obtener el estadístico x2 de una tabla decontingencia con más de 2 renglones.
Estadístico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
Determinación de los grados de libertad de una tabla decontingencia de más de tres renglones
Número degrados delibertad de unatabla de más detres renglones
Grados de libertad en una prueba ji- cuadrada
= (número de renglones -1 )(número de columnas -1)
Región de aceptación
2.764
0.10 del área
Valor x2
Distribución x2
con 3 grados de
libertad
6.251
Valor de tabla
Región de rechazo
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
11/56
Estadística Administrativa II 7
Tabla de contingencia Número derenglones
Número decolumnas
r-1 c-1 Grados delibertad(r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6B 5 7 5-1=4 7-1=6 (4)(6)=24C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compañía de seguros de salud, se opone al seguronacional. Argumenta que su implementación sería muy costosa, en particular,debido a que la existencia de este sistema tendería a fomentar permanenciashospitalarias más prolongadas, además de otros efectos. El presidente piensaque el tiempo de hospitalización depende del tipo de seguro de salud quetengan las personas.
Los siguientes datos se obtuvieron de una muestra aleatoria de 660hospitalizaciones.
Días en el hospital
10 Total
Datos dehospitalizacionesCalificados segúnel tipo decobertura delseguro y el tiempo
de estancia
Fracción de costoscubiertos por el seguro
50% 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipótesis nulaHo: el tiempo de estancia y tipo de seguro son independientes
Hipótesis alternativaHi: el tiempo de estancia depende del tipo de seguro
α= 0.01 nivel de significancia para probar la hipótesis
Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT
n
fe= frecuencia esperada en una celda dadaRT= total por renglón para el renglón que contiene esa celdaCT= total por columna para la columna que contiene esa celda.n= número total de observaciones
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
12/56
Estadística Administrativa II 8
Estadístico ji- cuadrada
fo= frecuencia observada fe
= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Renglón Columna fo fe = RT X CTn
fo-fe (fo-fe) (fo-fe)
fe
Calculode las
frecuenciasesperadasy ji-cuadrada
1 1 40 30 180 X 110660
10 100 3.333
1 2 75 60 180 X 220660
15 225 3.750
1 3 65 90 180 X 330660
-25 625 6.944
2 1 30 25 150 X 110660
5 25 1.000
2 2 45 50 150 X 220660
-5 25 0.500
2 3 75 75 150 X 330660
0 0 0.000
3 1 40 55 330 X 110660
-15 225 4.091
3 2 100 110 330 X 220660
-10 100 0.909
3 3 190 165 330 X 330660
25 625 3.788
X =24.315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de .10 ygraficar
Interpretación de resultados
Región de aceptación
x2=
24.315
0.10 del área
Distribución x2
13.277
Valor de tabla
Región de rechazo
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
13/56
Estadística Administrativa II 9
Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.
Número Página
11-1 45911-2 46011-7 46011-8 46011-9 460
11-10 46011-11 46111-12 46111-13 461
1.5 Análisis de varianza
El análisis de varianza nos permite probar si más de dos medias de poblaciónpueden considerarse iguales. A menudo se abrevia ANOVA: analysis ofvariance.
ANOVA Es un método de prueba de igualdad de tres o más mediaspoblacionales.1
Hipótesis nula típica
HO= μ1= μ2= μ3
El método ANOVA nos sirve para evitar el error tipo I (rechazar una hipótesisnula verdadera,), si utilizamos una prueba de igualdad de varias medias.
1.5.1 Aplicaciones de ANOVA
Se utiliza cuando:
Se asevera que los supermercados colocan los cereales con alto contenido deazúcar en estantes que están a la altura De los ojos de los niños, de maneraque eso nos permite probar la aseveración de que los cereales en los estantestienen el mismo contenido de azúcar.
1 Mario F. Triola, Estadística, Pearson, México,2006
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
14/56
Estadística Administrativa II 10
También en casos como: la comparación del kilometraje logrado por cincoclases diferentes de gasolina, la prueba de cuál de cuatro métodos decapacitación produce el aprendizaje más rápido, etc.
Los métodos de ANOVA requieren de la distribución F.
Propiedades de la distribución F:
1. Es no simétrica; se sesga hacia la derecha2. Los valores F son 0 o positivo, pero no negativos3. Hay una distribución F para cada par de grados de libertad para el
numerador y el denominador.
Figura 1. Fuente: (Triola, 2006:605)
Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipótesis
Ho: μ1= μ2= μ3
H1: μ1, μ2 y μ3 no son todas iguales
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
15/56
Estadística Administrativa II 11
Cálculo de la media
Método 1 Método 2 Método 3
Producción diaria 15 22 18
18 27 24
19 18 19
22 21 16
11 17 22
15
85 105 114 Sumatoria÷5 ÷5 ÷6 Tamaño de
la muestra17 21 19 Media
muestral
n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Cálculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 1916
Cálculo de la varianza entre columnas
σ2b = Σn j ( - )2 =
k-1
n - ( - )2 n( - )
Cálculo de lavarianzaentre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20
5 21 19 21-19=2 (2)2=4 5x4=20
6 19 19 19-19=0 (0)2=0 6x0 = 0
Σn j( - )2
=40
σ2b = Σn j ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
16/56
Estadística Administrativa II 12
Estimación de la varianza dentro de columnas
Método de capacitación 1
Media muestral =17
Estimaciónde la varianzadentro de columnas
- ( - )2
15-17=-2 (-2)2=4
18-17=1 (1)2=1
19-17=2 (2)2=4
22-17=5 (5)2=25
11-17=-6 (-6)2=36
Σ( - )2 =70
s21= Σ( - )2 = 70 = 17.5 varianza de la muestra
n-1 5-1
Método de capacitación 2
Media muestral =21
Estimaciónde la varianzadentro de columnas
- ( - )2
22-21=1 (1)2=1
27-21=6 (6)2=36
18-21=-3 (-3)2=9
21-21=0 (0)2=0
17-21=-4 (-4)2=16
Σ( - )2 =62
s22= Σ( - )2 = 62 = 15.5 varianza de la muestra
n-1 5-1
Método de capacitación 3
Media muestral =19
Estimaciónde la varianzadentro de columnas
- ( - )2
18-19=-1 (-1)2=1
24-19=5 (5)2=25
19-19=0 (0)2=0
16-19=-3 (-3)2=9
22-19=3
(-3
2
=9
15-19=-4 (-4)2=16
Σ( - )2 =60
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
17/56
Estadística Administrativa II 13
s23= Σ( - )2 = 60 = 12.0 varianza de la muestra
n-1 6-1
σ2w = Σ n j - 1 s2 j = (4/13)(17.5) + (4/13)(15.5) + (5/13)(12.0) = 193 = 14.769
nt - k 13
Estadístico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1.354 cociente F14.769
Determinación de los grados de libertad
Grados de libertad del numerador
Número de grados de libertad en el
numerador del cociente F
= (número de muestras-1)
Grados de libertad del denominador
Número de grados de libertad en el
denominador del cociente F
= Σ (n j-1)= nt-k
Gráfica
Se acepta la hipótesis nula.
Región de aceptación
F= 1.354
0.05 del área
Distribución f
3.81
Valor de tabla
Región de rechazo
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
18/56
Estadística Administrativa II 14
Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.
Número Página
11-5 47911-6 47911-26 48011-27 480 11-28 480 11-29 480
11-30 480
1.5.2 Inferencia sobre una varianza de población (Anova).
Estadístico ji- cuadrada para inferencias sobre una
varianza
X =(n-1)s
σ2
Intervalo de confianza para σ
Límite inferior de confianza σ2L=(n-1)s
2
X
2U
Límite superior de confianza σ2U=(n-1)s2
X2
L
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
19/56
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
20/56
Estadística Administrativa II 16
Unidad 2. Análisis de regresión, correlación lineal simple y
múltiple
2.1 Estimación mediante la línea de regresión
El análisis de regresión y correlación permiten determinar tanto la naturalezacomo la fuerza de una relación entre dos variables.
En el análisis de regresión se desarrollará una ecuación de estimación, a travésde una fórmula matemática que relaciona las variables conocidas con lavariable desconocida.
La variable conocida.- variable independiente X
La variable que tratamos de predecir se llama variable dependiente Y
Figura 2. Fuente: (Levin, 2004:511)
2.1.1 Diagrama de dispersión
El primer paso para determinar si existe una relación entre dos variables es
examinar la gráfica de datos observados. A esta gráfica se le llama diagramade dispersión.
Un diagrama de dispersión se puede identificar visualmente patrones queindique si las variables están relacionadas.
X
Y
Gastos contra la contaminación
Emisor
de
contaminación
Pendiente negativa
b) Relación directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relación directa
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
21/56
Estadística Administrativa II 17
Figura 3. Fuente: (Levin, 2004:503)
2.1.2 Método de mínimos cuadrados
Línea de estimación
Y= a+bx
Y= variable dependientea=variable ordenada yb=pendiente de la recta
x=variable independiente
Pendiente de la recta de regresión de mejor ajuste
b = Σ XY - n X Y
Σ X2 - n X
2
b=pendiente de la línea de estimación de mejor ajusteX= valores de la variable independiente Y= variable valores de la variable dependiente
X= media de los valores de la variable independiente Y= media de los valores de la variable dependienten= número de puntos
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
22/56
Estadística Administrativa II 18
Línea de estimación
a = Y - bX
a= ordenada Y b= pendiente de la ecuación X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estándar de la estimación
Se= Σ(Y-Y)2
n-2
Y= valores de la variable dependiente Y=valores estimados con la ecuación de estimación que corresponden a cadavalor de Yn= número de puntos utilizados para ajustar la línea de regresión
Para medir la confiabilidad de la ecuación de estimación, los especialistas enestadística han desarrollado el error estándar de estimación. Este errorestándar se simboliza por Se y es similar a la desviación estándar, en cuanto aque ambas son medidas de dispersión.
El error estándar de la estimación, por otra parte, mide la variabilidad, o
dispersión de los valores observados alrededor de la recta de regresión.
2.1.3 Interpretación del error estándar de la estimación
Como ocurriría en el caso de la desviación estándar, mientras más grande seael error estándar de la estimación, mayor será la dispersión de los puntosalrededor de la línea de regresión. De manera inversa, si Se= 0, esperamos quela ecuación de estimación sea un estimador “perfecto” de la variabledependiente. En este caso, todos los puntos caerían directamente sobre la
línea de regresión y no habría puntos dispersos alrededor.
Usaremos el error estándar de la estimación como una herramienta, de lamisma forma que podemos usar la desviación estándar. Esto es, suponiendoque los puntos observados siguen una distribución normal alrededor de la rectade regresión, podemos esperar encontrar el 68% de los puntos dentro de ±1Se,el 95.5 % de los puntos dentro de ±2Se, y el 99.7 % de los puntos dentro de±3Se.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
23/56
Estadística Administrativa II 19
Figura 4. Fuente: (Levin, 2004:529)
Debemos observar que el error estándar de la estimación se mide a lo largo deleje Y, y no perpendicularmente desde la recta de regresión.
2.1.4 Intervalos de predicción aproximados
Podemos concebir al error estándar de la estimación como una herramientaestadística que podemos usar para hacer afirmaciones de probabilidad acerca
del intervalo alrededor del valor estimado de Y, dentro del cual cae el valor realde Y.
EjemploY= 3.75 + 0.75 X
Sustituyendo 4 en X
Y= 3.75 + 0.75 (4)= 3.75 + 3.00
= 6.75
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
24/56
Estadística Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y ±1 Se. Y ±2 Se. Y ±3 Se.
En donde Se = 86.60
Sustitución
Ejemplo
A menudo quienes hacen la contabilidad de costos estiman los gastosgenerales con base en el nivel de producción. Se ha reunido informaciónacerca de los gastos generales y las unidades producidas en diferentesplantas, y ahora desean estimar una ecuación de regresión para predecir losgastos generales futuros.
Gastos generales 191 170 272 155 280 173 234 116 153 178
Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independienteb) Desarrolle una ecuación de regresión para contabilidad de costosc) Pronostique los gastos generales cuando se producen 50 unidadesd) Calcule el error estándar de estimación
Y +1 Se =
675 + (1) (86.60) = 761.40
Límite superior del intervalo depredicción
Y +2 Se =
675 + (2) (86.60) = 848.20
Límite superior del intervalo depredicción
Y -1 Se =
675 - (1) (86.60) = 588.40
Límite inferior del intervalo de
predicción
Y - 2 Se =
675 - (2) (86.60) = 501.80
Límite inferior del intervalo de
predicción
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
25/56
Estadística Administrativa II 21
X Y XY X Y
40 191 7640 1600 3648142 170 7140 1764 2890053 272 14416 2809 7398435 155 5425 1225 24025
56 280 15680 3136 7840039 173 6747 1521 2992948 234 11232 2304 5475630 116 3480 900 1345637 153 5661 1369 2340940 178 7120 1600 31684
ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX = 18228 Σ Y = 395024
b = Σ XY - n X Y = 84541 - 10(42)(192.2) = 6.4915
Σ X2 - n X
2 18228 - 10(42)
2
a = Y – bX = 192.2 – 6.4915 (42) = - 80.4430
Y= a+bx = -80.4430 + 6.4915 (50) = 244.1320
Se= ΣY2 –aΣY – b ΣXY =
n-2
Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.
Número Página
12-2 53112-3 531 12-13 531 12-14 531 12-15 531
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
26/56
Estadística Administrativa II 22
2.1.5 Análisis de correlación
El análisis de correlación es la herramienta estadística que podemos usar para
describir el grado en el que una variable está linealmente relacionada con otra.
El coeficiente de determinación es la principal forma en que podemos medir elgrado, o fuerza, de la asociación que existe entre dos variables, X y Y. debido aque usamos una muestra de puntos para desarrollar rectas de regresión.
Coeficiente de determinación de la muestra
r2= aΣY+bΣXY-nY
2
ΣY2 – n Y2
Coeficiente de correlación de la muestra
r= r2
Ejercicio
Con los datos de los ejercicios anteriores obtén el coeficiente de determinacióny el coeficiente de correlación.
2.1.6 Paquete computacional para la solución de problemas
Resolver ejercicios en excel
2.1.7 Regresión múltiple y análisis de correlación
Podemos utilizar más de una variable independiente para estimar la variabledependiente e intentar, aumentar la precisión de la estimación. Este proceso seconoce como análisis de regresión múltiple y correlación.
La principal ventaja de la regresión múltiple es que nos permite utilizar másinformación disponible para estimar la variable dependiente. En algunasocasiones la correlación entre dos variables puede resultar insuficiente paradeterminar una ecuación de estimación confiable; sin embargo, si agregamoslos datos de más variables independientes, podemos determinar una ecuación
de estimación que describa la relación con mayor precisión.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
27/56
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
28/56
Estadística Administrativa II 24
1 b1 -.099 b2 = .884
1 b1 -.099 (.059) = .884
-.006 .8841b1 = .884 +.006
b1 = .890
1a +17.5b1 +14.167b2 = 19
1a +17.5(.890) +14.167 (.059) = 19
1a +16.411 = 19
1a = 19-16.411
a = 2.589
Y= a + b1 X1 + b2 X2
y=2.589+.890(28)+.059(10)=28.099
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
29/56
Estadística Administrativa II 25
2.1.8 Usos de variables ficticias
La regresión múltiple nos permitirá también ajustar tanto curvas como rectas.Usando las técnicas de variables ficticias, podemos incluir factores cualitativosen la regresión múltiple. Las variables ficticias y las curvas de ajuste sonsolamente dos de las muchas técnicas de modelado que se pueden utilizar enla regresión múltiple para aumentar la precisión de las ecuaciones deestimación.
2.1.9 Residuales y gráficas de residuales
Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y, es
decir (Y - Y’)
Cuando los residuos permanecen constantes para todos los valores de Y’, esta
condición se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresión
lineal general y está dentro de sus supuestos clásicos básicos.
Se dice que existe homocedasticidad cuando la varianza de los erroresestocásticos de la regresión es la misma para cada observación i (de 1 a n observaciones), es decir:
donde es un escalar constante para todo i. Lo que significaría que habríauna distribución de probabilidad de idéntica amplitud para cada variable
aleatoria.
Esta cualidad es necesaria, según el Teorema de Gauss-Márkov, para que enun modelo los coeficientes estimados sean los mejores o eficientes, lineales einsesgados.
Cuando no se cumple esta situación, decimos que existe heterocedasticidad,que es cuando la varianza de cada termino de perturbación (ui) no es un
número constante .
Este fenómeno suele ser muy común en datos de Corte Transversal y tambiénse presenta, menos frecuentemente, en series de tiempo.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
30/56
Estadística Administrativa II 26
Figura 5. Distribución Homocedástica.
Figura 6. Distribución Heterocedástica.
Práctica 1
Con los datos históricos de ventas de una empresa, aplicará la regresiónlineal, para hacer estimaciones futuras.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
31/56
Estadística Administrativa II 27
Unidad 3. Números índice
Un número índice mide cuánto ha cambiado una variable con el tiempo. Se
calcula encontrando el cociente del valor actual entre el valor base, luego se
multiplica el número resultante por cien, por lo tanto se expresa en porcentaje.
Tipos de números índice
Existen tres tipos principales de números índice: índice de precios, índice de
cantidad e índice de valor.
Índ ice de p rec io s
Compara niveles de precio de un periodo a otro. El índice deprecios al consumidor (IPC) clasificado por los gobiernos de lospaíses, mide los cambios globales de precios de un conjuntode bienes y servicios al consumidor, y se usa para definir elcosto de vida.
Índ ice de c ant idad Mide cuánto cambia el número o la cantidad de una variablecon el tiempo.
Índ ic e de valo r Mide los cambios del valor monetario total, es decir, mide elcambio del valor en dinero de una variable.
El índice de valor combina los cambios de precio y cantidad para presentar un
índice con más información.
Los números índice, como el IPC, a menudo se citan en informes noticiosos
como indicadores generales de la condición económica de un país.
Factores que pueden distorsionar los números índice.• Número limitado de datos o dificultad para encontrar datos adecuados.
• Falta de comparación de índices.
• Ponderación no apropiada de los factores.
• Selección de una base no apropiada.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
32/56
Estadística Administrativa II 28
3.1 Elaboración de índices simples
3.2 Índices agregados de precio
El índice de agregados no ponderados es un índice compuesto. No ponderadosignifica que todos los valores considerados tienen la misma importancia deagregados quiere decir que sumamos todos los valores.
Índice de cantidad de agregados no ponderados
ΣQ i x 100
ΣQ o
Qi=cantidad de cada elemento del compuesto en el año para el que se deseael índice.Qo= cantidad de cada elemento del compuesto en el año base.
Ejemplo
El vicepresidente de ventas de la empresa “X” está examinando la tasa decomisión para lños empleados durante los últimos 3 años. En la siguiente tablase muestran las ganancias por comisiones de los cinco mejores vendedores
de la compañía.
1993 1994 1995
Empleado A 48,500 55,100 63,800Empleado B 41,900 46,200 60,150Empleado C 38,750 43,500 46,700Empleado D 36,300 45,400 39,900Empleado E 33,850 38,300 50,200
Considerando a 1993 como el periodo base, exprese las ganancias porcomisiones de 1994 y 1995 en términos de un índice de agregado noponderado.
1993
Qo
1994
Q1
1995
Q2
Empleado A 48,500 55,100 63,800Empleado B 41,900 46,200 60,150Empleado C 38,750 43,500 46,700Empleado D 36,300 45,400 39,900Empleado E 33,850 38,300 50,200
199,300 228,500 260,750
19,930,000 22,850,000 26,075,000
199,300 199,300 199,300
=100% =114.7% =130.8%
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
33/56
Estadística Administrativa II 29
Índice de agregados ponderado
Cuando se calcula un índice se tiene que asignar una importancia mayor a loscambios en algunas variables que en otras. Esta ponderación permite mejorar
la precisión de la estimación del nivel general de precios basado en unamuestra.
Índice de precios de agregados ponderados
ΣPi Q x 100
ΣPoQ
Pi=precio de cada elemento del compuesto en del año actualPo= precio de cada elemento del compuesto en del año actual año base.Q= factor de ponderación de cantidad seleccionado
3.3 Relativos eslabonados
"Son índices cuya base es siempre periodo anterior. En consecuencia, respectode un conjunto de relativos eslabonados de valores anuales de ventas, cadanumero índice representa una comparación porcentual con el año anterior.Estos relativos son útiles para destacar comparaciones entre un año y otro,pero resultan inconvenientes como base de comparaciones a largo plazo"
3.4 Cambio de periodo base
"La base de una serie establecida de números índices suele cambiarse a unaño más reciente para que las comparaciones actuales sean más significativas.Partiendo del supuesto de que no se dispone de las cantidades originales enlas que se apoya la serie de números índices, el periodo base de un numero
índice puede cambiarse dividiendo cada índice (original) entre el índice del añobase recién determinado y multiplicando el resultado por 100:"
Cambio de periodo base
I nuevo = Índice antiguo x100
Índice antiguo de la nueva base
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
34/56
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
35/56
Estadística Administrativa II 31
Por otra parte, debido a los cambios en los patrones de consumo de lapoblación de referencia existe la necesidad de revisar, y modificar si fueranecesario, la canasta de consumo, así como la población de referencia y losnegocios informantes, para que el índice se mantenga actualizado, searepresentativo y útil en la práctica.
3.7 Deflación de los valores de series de tiempo
Situación opuesta a la inflación en la que aumenta el valor de la unidadmonetaria como resultante de la baja de los precios. Se produce deflacióncuando la masa monetaria crece a un ritmo menor que la oferta total de bienesy servicios.
En la práctica esto casi nunca sucede, pues los gobiernos aumentan la ofertamonetaria a un ritmo suficiente como para compensar ese crecimiento: de nohacerlo podrían darse bajas en los salarios nominales, con el consiguientemalestar social que esto produciría.
La deflación de series monetarias consiste en eliminar el efecto que loscambios en los precios de los bienes tienen sobre las series de valores.
Cuando queremos conocer la evolución de una serie de valores a lo largo deltiempo, por ejemplo, beneficios de una empresa, producción de una industria,salarios de los empleados de una empresa, ingresos de los hogares, etc., nosencontramos habitualmente con los valores están en unidades monetarias decada periodo, esto es, los valores se refieren a unidades monetarias corrientes.Esto va a hacer que los valores no sean directamente comparables puesto quelas alteraciones de los precios de un periodo a otro confieren distinto poderadquisitivo a las unidades monetarias. En otras palabras, el efecto de lainflación (o deflación) modifica la capacidad de compra del dinero.
Para conocer los cambios reales experimentados por la serie a lo largo delperiodo de interés tendremos que expresar todos los valores de dicha serie en
unidades monetarias de un mismo periodo, es decir, en unidades monetariasconstantes.
Los valores expresados en unidades monetarias corrientes se conocen comovalores nominales.
Los valores expresados en unidades monetarias constantes se conocen comovalores reales.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
36/56
Estadística Administrativa II 32
3.8 Índice de precios al productor (IPP).
"Incluye tres índices diferentes: de materias primas, materias intermedias ybienes terminados. Se le considera un importante indicador líder de la tasa de
inflación, debido a la probabilidad de que incrementos en los precios de losbienes terminados den origen a subsecuentes incrementos en precios alconsumidor."
Es el producto resultante de una investigación estadística de carácterestratégico, que permite medir la variación porcentual promedio de los preciosal por menor de un conjunto de bienes y servicios. Para entender mejor lanaturaleza del IPP, se debe pensar en el índice como una medida delporcentaje de cambio, a través del tiempo, del costo promedio de una grancanasta de bienes y servicios comprados por los hogares de Colombia,
manteniendo constante la calidad y la cantidad de los bienes. La diferencia conel IPC radica en las agrupaciones en las que está dividido el índice. El IPPtiene en cuenta las siguientes agrupaciones Alimentos y animales vivos,bebidas y tabaco, materias primas no combustibles y lubricantes, aceites ygrasas vegetales y animales, productos químicos, artículos manufacturados,maquinaria y equipo de transporte, artículos manufacturados diversos.
3.9 Promedios de precios bursátiles de DowJones
"Los promedios de precios bursátiles de Dow Jones, muestra los promedios delas acciones en el ramo de la industria, el transporte y de servicios públicos,toma como muestra 30 mercados. Se trata de un promedio ponderado cuyasponderaciones ha sido revisadas varias veces a causa de cambios en el valornominal de las acciones y modificaciones en las compañías incluidas en elíndice."
Este índice es representativo de las 30 mayores compañías industriales deEstados Unidos y se compila sumando los precios de sus acciones y luego
dividiéndolos por una constante. El divisor del Dow Jones se ajustaperiódicamente a fin de reflejar el fraccionamiento o división de las acciones(ver Split). Este promedio empezó a compilarse en 1896 con los títulos de 12firmas, entre ellas las entonces American Tobaco, Tennessee Coal and Iron,Chicago Gas, American Sugar, y la única sobreviviente hoy: General Electric.En 1916 ya eran 20. Y a partir de 1928 pasaron a ser 30, sin que hasta ahorahaya variado esa cantidad.
A continuación las compañías comprendidas en el Dow Jones y los símbolosbajos los cuales se cotizan en la Bolsa de Nueva York (NYSE):
http://www.monografias.com/trabajos15/liderazgo/liderazgo.shtmlhttp://www.monografias.com/trabajos54/resumen-estadistica/resumen-estadistica.shtmlhttp://www.monografias.com/trabajos54/resumen-estadistica/resumen-estadistica.shtmlhttp://www.monografias.com/trabajos15/liderazgo/liderazgo.shtml
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
37/56
Estadística Administrativa II 33
Símbolo Nombre de la
compañía
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP
Hewlett-Packard
IBM International Business
Machines
IP International Paper
JNJ Johnson & Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5. Compañías comprendidas en el Dow Jones
3.10 Índice de producción industrial
"Es un índice agregado de cantidad… y es una medida de la producción defábricas, minas y plantas eléctricas y gaseras del país. Por lo tanto, es unindicador importante del estado de la economía. Se trata de un promedioponderado de relativos de cantidad."
El Índice de Producción Industrial (IPI) es un indicador coyuntural que mide laevolución mensual de la actividad productiva de las ramas industriales, excluidala construcción, contenidas en la Clasificación Nacional de ActividadesEconómicas 2009 (CNAE-2009). Mide, por tanto, la evolución conjunta de la
cantidad y de la calidad, eliminando la influencia de los precios.Para su obtención se realiza una encuesta continua de periodicidad mensualque investiga todos los meses más de 13.200 establecimientos.
Práctica 2
Con datos investigados en revistas al consumidor o del Banco de México,
elaborará los índices simples de precio y cantidad, así como agregado
de precios.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
38/56
Estadística Administrativa II 34
Unidad 4. Estadística no paramétrica
4.1 Escala de medición
Las escalas de medición son una sucesión de medidas que permiten organizardatos en orden jerárquico. Las escalas de medición, pueden ser clasificadas deacuerdo a una degradación de las características de las variables. Estasescalas son: nominales, ordinales o racionales. Según pasa de una escala aotra el atributo o la cualidad aumenta. Las escalas de medición ofreceninformación sobre la clasificación de variables discretas o continuas. Toda vezque dicha clasificación determina la selección de la gráfica adecuada.
En la estadística descriptiva y con el fin de realizar pruebas de significancia, lasvariables se clasifican de la siguiente manera de acuerdo con su nivel demedida:
• Nominal (también categórica o discreta)• Ordinal• De intervalo (continua)• De razón o racional (continua)
4.2 Métodos estadísticos contra no paramétricos
Las técnicas estadísticas de estimación de parámetros, intervalos de confianzay prueba de hipótesis son, en conjunto, denominadas estadística paramétrica y
son aplicadas básicamente a variables contínuas. Estas técnicas se basan enespecificar una forma de distribución de la variable aleatoria y de losestadísticos derivados de los datos.
En estadística paramétrica se asume que la población de la cual la muestra esextraída es normal o aproximadamente normal . Esta propiedad es necesariapara que la prueba de hipótesis sea válida.
Sin embargo, en un gran número de casos no se puede determinar ladistribución original ni la distribución de los estadísticos por lo que en realidadno tenemos parámetros a estimar. Tenemos solo distribuciones que comparar.
Esto se llama estadística no-paramétrica.
Las hipótesis de una prueba no paramétrica se refiere a algo distinto del valorde un parámetro de la población.
Las principales pruebas no paramétricas son las siguientes:
• Prueba χ² de Pearson • Prueba binomial• Prueba de Anderson-Darling• Prueba de Cochran• Prueba de Cohen kappa• Prueba de Fisher
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
39/56
Estadística Administrativa II 35
• Prueba de Friedman• Prueba de Kendall• Prueba de Kolmogórov-Smirnov• Prueba de Kruskal-Wallis• Prueba de Kuiper• Prueba de Mann-Whitney o prueba de Wilcoxon• Prueba de McNemar• Prueba de la mediana• Prueba de Siegel-Tukey• Coeficiente de correlación de Spearman• Tablas de contingencia• Prueba de Wald-Wolfowitz• Prueba de los signos de Wilcoxon
Características de algunas pruebas no paramétricas.
1. Prueba de signo para datos pares: los signos positivo o negativosustituyen a valores cuantitativos.
2. Prueba de suma de rangos: también llamada prueba U de Mann-Whitney, que puede usarse para determinar si dos muestrasindependientes de sacaron de la misma población.
3. Prueba de suma de rangos Kruskal – Wallis: generaliza el análisis devarianza para poder prescindir de la suposición de que las poblacionestienen distribución normal.
4. Prueba de corridas de una sola muestra: es un método paradeterminar la aleatoriedad con la que se han seleccionado los elementos
muestreados.5. Correlación de rango: método para hacer el análisis de correlación
cuando no se dispone de los datos para usar la forma numérica, perocuando la información es suficiente para clasificar los datos comoprimero, segundo, tercero, etc.
6. Prueba de Kolmogorov: método para determinar la bondad de ajusteentre una muestra observada y una distribución de probabilidad teórica.
Prueba Característica
Mann- Whitney. 2 muestras independientes.
Wilcoxon. 2 muestras asociadas.
Kruskal-Wallis. + de 2 muestras independientes
Friedman. + de 2 muestras asociadas.
Tabla1. Características de pruebas no paramétricas.
http://es.wikipedia.org/w/index.php?title=Prueba_de_Wilcoxon&action=edit&redlink=1http://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearmanhttp://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearmanhttp://es.wikipedia.org/w/index.php?title=Prueba_de_Wilcoxon&action=edit&redlink=1
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
40/56
Estadística Administrativa II 36
Las pruebas no paramétricas, no requieren asumir normalidad de la población yla mayoría se basan en el ordenamiento de los datos. El parámetro que se usapara hacer las pruebas estadísticas es la Mediana y Media.
Ventajas y desventajas de los métodos paramétricos
Desventajas Ventajas
• Ignoran cierta cantidad deinformación.
• No requieren la suposición de queuna población está distribuida enforma de curva normal u otra forma
específica.
• A menudo no son tan eficientes o
claras como las pruebasparamétricas.
• Generalmente es más sencillo
realizarlas y entenderlas.
• Algunas veces no se requiere unordenamiento o clasificación formal.
Tabla1. Ventajas y desventajas de los métodos no paramétricas.
4.3 Prueba de corridas para aleatoriedad
4.3.1 Concepto de aleatoriedad.
Aleatorio se asocia a todo proceso cuyo resultado no es previsible más que enrazón de la intervención del azar. El término aleatoriedad se usa a menudocomo sinónimo con un número de propiedades estadísticas medibles, tales
como la carencia de tendencias o correlación.
El resultado de todo suceso aleatorio no puede determinarse en ningún casoantes de que este se produzca. El estudio de los fenómenos aleatorios quedadentro del ámbito de la teoría de la probabilidad y, en un marco más amplio, enel de la estadística.
4.3.2 Teoría de corridas.
Una corrida es una secuencia de ocurrencias idénticas precedidas y seguidasde ocurrencias diferentes.
Ejemplo
M,H,H,H,H,M,
1ra. 2ra. 3ra.
http://es.wikipedia.org/wiki/Azarhttp://es.wikipedia.org/wiki/Azar
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
41/56
Estadística Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientessímbolos:
n1= número de ocurrencias del tipo 1
n2= número de ocurrencias del tipo 2
r = número de corridas
4.3.2.1 Prueba de corridas de una sola muestra
Un fabricante de cereal para el desayuno usa una máquina para introduciraleatoriamente uno de los dos tipos de muñecos en cada caja. La compañíadesea una aleatoriedad tal que no todos los niños de un vecindario terminencon el mismo muñeco. Los probadores eligen muestras de 60 cajas sucesivaspara ver si la máquina está mezclando adecuadamente los dos tipos demuñecos. Usado los símbolos A y B para representar los dos tipos demuñecos, un probador reportó que uno de estos lotes se presentó como sigue:
B,A,B,B,B,A,A,A,B,B,A,B,B,B,B,A,A,A,A,B,A,B,A,A,B,B,B,A,A,B,A,A,A,A,B,B,A,
B,B,A,A,A,A,B,B,A,B,B,B,B,A,A,B,B,A,B,A,A,B,B
Valores de la prueba:
n1= 29
n2= 31
r= 29
4.3.2.2 Distribución de muestreo del estadístico r
El número de corridas r es un estadístico con su propia distribución demuestreo especial y su propia prueba.
Una prueba de corridas de una sola muestra, está basada en la idea de quemuy pocas o demasiadas corridas muestran que los elementos no fueronelegidos aleatoriamente.
Media de la distribución muestral del estadístico r
μr=2n1n2 +1
n1+n2
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
42/56
Estadística Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1
60 μr = 29.97 +1
μr = 30.97
Error estándar del estadístico r
σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31)(29+31)
2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 14.71
σr= 3.84
Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.
Número Página
14-24 64314-25 643 14-26 643 14-27 644 14-28 644
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
43/56
Estadística Administrativa II 39
4.4 Una muestra: prueba de signos
Una de las pruebas no paramétricas más fáciles es la de prueba de signos. Sunombre se debe a que está basada en la dirección (o signo de más o menos)
de un par de observaciones y no en su magnitud numérica.
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evalúa la efectividadde dos tipos de clases. Conferencias grandes de profesores de tiempocompleto sesiones pequeñas con ayudantes de posgrado.
Miembro del panel Calificación
para
conferencias
grandes
Calificación
para
sesiones
pequeñas.
Signo de la
calificación
Evaluación de los
dos tipos de
clases
1 2 3 -
2 1 2 -
3 4 2 +
4 4 3 +
5 3 4 -
6 3 2 +7 4 2 +8 2 1 +
9 4 3 +10 1 1 0
11 3 2 +12 3 3 0
13 4 4 014 4 4 0
15 4 3 +16 1 2 -
17 1 3 -
18 2 2 0
19 2 3 -20 4 3 +
La calificación 4 es excelente y la 1 es mala. El signo + significa que elestudiante prefiere las conferencias grandes, un signo menos indica unapreferencia por sesiones pequeñas un 0 representa un empate (sin preferencia)
Número de signos + 9
Número de signos - 6
Número de ceros 5
Tamaño total de la muestra 20
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
44/56
Estadística Administrativa II 40
Establecimiento de las hipótesis
Ho: p = 0.5
H1: p ≠ 0.5 Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho: = 0.5
q H0: = 0.5
n= 15
p= 0.600 (9/15)
q= 0.400 (6/15)
Prueba de hipótesis de que no hay diferencia.
Error estándar del la proporción
σp= pq
n
σp= (0.5)(0.5)15
σp= 0.129
0.025
0
0.475 del área
Valor crítico
Z=-1.96
Región de aceptación
0.025
0.475 del área
Valor crítico
Z=1.96
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
45/56
Estadística Administrativa II 41
4.5 Una muestra: prueba de Wilcoxon
Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza másinformación que la prueba de signos, tiende a proporcionar conclusiones que
reflejan mejor la verdadera naturaleza de los datos.
La prueba de rangos con signo de Wilcoxon es una prueba no paramétrica queutiliza rangos ordenaos de datos maestrales consistentes en datos apareados.Se usa para probar las diferencias en las distribuciones poblacionales, por loque la hipótesis nula y alternativa son las siguientes:
Ho: las dos muestras provienen de poblaciones con la misma distribución.
H1: las dos muestras provienen de poblaciones con la misma distribución.
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1. Para cada par de datos, calcule la diferencia d restando, el segundo
valor del primero. Guarde los signos, pero descarte cualquier par para el que
d=0
Paso 2. Ignore los signos de las diferencias, luego acomode las diferencias de
la más baja a la más alta y remplace las diferencias por el valor del rango
correspondiente. Cuando las diferencias tengan el mismo valor numérico,
asígneles la media de los rangos implicados en el empate.
Paso 3. Adjunte a cada rango el si el signo de la diferencia de la que provino.
Esto es, inserte aquellos signos que se ignoraron e el paso dos.
Paso 4. Calcule la suma de los valores absolutos de los rangos negativos.
También la suma de los rangos positivos.
Paso 5. Permita que T sea la más pequeña de las dos sumas que se calcularon
en el paso 4. Es posible utilizar cualquier suma, aunque para simplificar el
procedimiento seleccionamos arbitrariamente la más pequeña de las dos
sumas.
Paso 6. Permita que n sea el número de pares de datos para los que la
diferencia d no es 0.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
46/56
Estadística Administrativa II 42
Paso 7. Determine el estadístico de prueba y los valores críticos con base en el
tamaño muestral.
Paso 8. Cundo Plantee la conclusión rechace la hipótesis nula si los datos
muestrales le llevan a un estadístico de prueba que está en la región crítica,
esto es, cuando el estadístico de prueba es menor que o igual al valor crítico.
Supuestos
1. Los datos consisten en datos apareados que se seleccionaron aleatoriamente.
2. La población de las diferencias (calculadas de los pares de datos) tiene una
distribución que es aproximadamente simétrica, lo que quiere decir que la mitad
izquierda de su histograma es aproximadamente una imagen de espejo de la mitad
derecha.
Notación
T= la más pequeña de las siguientes dos sumas:
1. La suma de los valores absolutos de los rangos negativos de las diferencias d queno sean 0.
La suma de los rangos positivos de las diferencias d que no sean 0.
Estadístico de prueba
Si n < o igual a 30, el estadístico de prueba es T.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
47/56
Estadística Administrativa II 43
4.6 Dos muestras: prueba de Mann-Whitney
A esta prueba se le llama suma de rangos porque depende de los rangos oclasificaciones de las observaciones de muestra.
La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones.
El uso de esta prueba permite determinar si las muestras independientes seobtuvieron de la misma población.
Simbología
n1= número de elementos de la muestra 1
n2= número de elementos de la muestra 2
R1= suma de los rangos de los elementos de la muestra 1
R2= suma de los rangos de los elementos de la muestra 2
Rango Calificación Plantel
1 500 S
2 550 S
3 600 A
4 650 S5 725 S
6 750 A
7 775 A8 800 A
9 830 S10 850 A
11 890 S12 900 S13 920 S
14 925 S
15 950 A16 1000 A17 1050 A
18 1100 A19 1120 S
20 1140 S21 1150 A
22 1200 A23 1240 S
24 1250 A25 1300 A
26 1360 S
27 1400 A28 1500 A
29 1550 S
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
48/56
Estadística Administrativa II 44
30 1600 S
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
49/56
Estadística Administrativa II 45
Nota: no necesariamente el número de muestras debe ser igual.
Ejemplo
La junta directiva de una gran universidad desea probar la hipótesis de que lascalificaciones promedio de una prueba de dos planteles de la universidad soniguales.
Se deben clasificar las calificaciones en orden ascendente, indicando junto acada una el símbolo del plantel.
Plantel
A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775
B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15
n2= 15
R1= 247
R2= 218
Estadístico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247
2
U= 225+120-247
U= 98
Media de la distribución muestral U
μu = n1n22
μu = (15)(15) 2
μu =112.5
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
50/56
Estadística Administrativa II 46
Estadístico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975
12
σU = 581.25
σU = 24.1
Prueba de hipótesis
La distribución muestral del estadístico U puede aproximarse por la distribuciónnormal cuando tanto n1 como n2 son mayores que 10, por lo tanto se usará latabla de la distribución normal estándar para hacer la prueba.
La junta de directores desea probar al nivel de significancia de .15 la hipótesisde que estas muestras fueron extraídas de poblaciones idénticas.
H0: μ1= μ2
H1: μ1≠ μ2
α= 0.15
Estandarización del estadístico U
z = U-μu σU
z = 98 - 112.5 24.1
z = -0.602
1.44-1.44 0-0.602
Valor
estandarizado de
la muestra U
Región de aceptación
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
51/56
Estadística Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no paramétrica paracomparar la mediana de dos muestras relacionadas y determinar si existendiferencias entre ellas. Se utiliza como alternativa a la prueba t de Studentcuando no se puede suponer la normalidad de dichas muestras.
Debe su nombre a Frank Wilcoxon, que la publicó en 1945. Asimismo se utilizacuando la variable subyacente es continua pero presupone ningún tipo dedistribución particular.
Prueba de Wilcoxon de los rangos con signo
Llamemos M 0 a la mediana frente a la que vamos a contrastar nuestros datos,y sea X1, X2 .. Xn los valores observados. Se calcula las diferencias X1-M 0 , X2-M 0 , ..., Xn-M 0 . Si la hipótesis nula fuera cierta estas diferencias sedistribuirían de forma simétrica en torno a cero.
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M 0 | yse ordenan de menor a mayor, asignándoles su rango (número de orden). Sihubiera dos o más diferencias con igual valor (empates), se les asigna el rangomedio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asignael valor 2.5 a ambas). Ahora calculamos R+ la suma de todos los rangos de las
diferencias positivas, aquellas en las que Xi es mayor que M 0 y R- la suma detodos los rangos correspondientes a las diferencias negativas. Si la hipótesisnula es cierta ambos estadísticos deberán ser parecidos, mientras que sinuestros datos tienen a ser más altos que la mediana M 0 , se reflejará en unvalor mayor de R+, y al contrario si son más bajos. Se trata de contrastar si lamenor de las sumas de rangos es excesivamente pequeña para ser atribuida alazar, o, lo que es equivalente, si la mayor de las dos sumas de rangos esexcesivamente grande.
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra deparejas de valores, por ejemplo antes y después del tratamiento, que podemosdenominar (X1,Y1), (X2,Y2), ... ,(Xn,Yn). De la misma forma, ahoracalcularemos las diferencias X1-Y1, X2-Y2, ... , Xn-Yn y las ordenaremos envalor absoluto, asignándoles el rango correspondiente. Calculamos R+ la sumade rangos positivos (cuando Xi es mayor que Yi ), y la suma de rangosnegativos R-. Ahora la hipótesis nula es que esas diferencias proceden de unadistribución simétrica en torno a cero y si fuera cierta los valores de R+ y R- serán parecidos.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
52/56
Estadística Administrativa II 48
4.9 Varias muestras independientes: prueba de Krauskal-Wallis
La prueba de Krauskal-Wallis es una extensión de la prueba Mann-Whitneypara casos en que están involucradas más de dos poblaciones. Esta pruebatambién depende de los rangos de las observaciones de la muestra.
Ejemplo
Rango calificaciones Método de
capacitación
Calificaciones
del examen
escrito
1 50 S
2 55 VC
3 57 AC4 65 AC
5 68 S
6 70 VC7 74 VC
8 77 S9 78 A C
10 80 AC11 81 S
12 82 VC13 83 S
14 84 S15 88 VC
16 89 AC
17 91 S
18 92 S19 93 VC
20 94 S
Estadístico KK = 12 R
2 j -3 (n+1)
n(n+1) nj
K= 12 (61)2
+ (42)2
+ (107)
2-3(20+1)
20(20+1) 6 5 9
K = 1.143
Σ
[ ]
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
53/56
Estadística Administrativa II 49
Prueba de hipótesis
La distribución muestral del estadístico K puede aproximarse por unadistribución ji-cuadrada cuando los tamaños de todas las muestras son almenos 5.
Grados de libertad k-1 (3-1)= 2
H0: μ1= μ2= μ3
H1: μ1, μ2, μ3 no todas son iguales
α= 0.10
Ejercicios
Realizar los siguientes ejercicios del libro:
1) Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.
Número Página
14-14 63714-55 637 14-16 637 14-17 637
14-18 637
4.605
0.10 de área
Región de aceptación
Valor de la muestra
K= 1.143
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
54/56
Estadística Administrativa II 50
Práctica 3 Recopilar datos económicos, de diversas fuentes, para efectuar
comparación y análisis entre la estadística y la estadístico noparamétrica, efectuando además una prueba de hipótesis.
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
55/56
BIBLIOGRAFIA
• Levin, Richard I. y Rubin, David S. (2004). Estadística para administración y
economía (7a.ed.). México: 2004
• Levin, Richard I. y Rubin, David S. (2004). Ji-cuadrada y análisis de varianza.
En estadística para administración y economía (pp. 447-508). México: Pearson
educación.
• Triola, Mario F. (2004). Estadística. México: Pearson educación
• Mongomery, Douglas C. (2007). Probabilidad y estadística aplicadas a la
ingeniería. México: Limusa Wiley.
Referencias de internet.
http:// math.uprm edu ~edgar uprm/edu/
http://es.wikipedia.org/wiki/Nivel_de_medida#Escalas_de_medici.C3.B3n
http://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9trica
http://www.estadisticafacil.com/
http://es.wikipedia.org/wiki/Nivel_de_medida#Escalas_de_medici.C3.B3nhttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Nivel_de_medida#Escalas_de_medici.C3.B3n
8/17/2019 Cuadernillo Apuntes de ESTADISTICA II
56/56
StAta