Laboratorio 1

21
LABORATORIO 1. I PARA HALLAR INTERVALOS DE CONFIANZA 1. Ingrese los datos en una columna (coloque nombre a la variable) 2. Seleccione estadísticas> estadísticas básicas>1_sample Z ( ó 1_sample t) Cuando aparezca el cuadro de dialogo Coloque los valores de C1 en el cuadro samples im column ingresar la desviación estándar en el cuadro estándar deviation ingresar el nivel de confianza (pasar al paso 4) sino ir a **(si el nivel de confianza es diferente de 95%) Seleccionar options cuando aparezca el cuadro de diálogo 1 sample Z ingresar el nuevo nivel de confianza en el cuadro Confidence level 4. Damos aceptar en gráficos y seleccionamos Las tres opciones 5. Colocamos ok a todo II PARA SELECCIONAR UNA MUESTRA ALEATORIA SIMPLE 1. Seleccionar Calc 2. Elegir ramdon data >sample from columns 3. Cuando aparezca el cuadro de dialogo >sample from columns 4. Ingresar n en el cuadro sample 5. Ingresar C1 C2 en el cuadro que se encuentra debajo 6. Ingresar C3 C4 en el cuadro 7. Ok. EJERCICIOS 1. Suponga que la siguiente data corresponde a los ingresos salariales de 50 trabajadores durante una semana en el cual se sabe que el ingreso promedio es de 680 soles con una desviación estándar de 36 soles. 658 670 679 731 710 631 663 654 657 642 688 694 665 600 721 704 617 729 654 615 747 623 710 669 635 641 689 689 710 617 721 689 741 720 670 625 683 700 638 670 702 687 706 725 692 648 674 678 678 678 Obtenga un intervalo de confianza del 95% para la media de los ingresos salariales y sustente una breve interpretación mediante algunos gráficos de interés. 2. En el análisis del tamaño de partículas de oro se tomó una muestra aleatoria de 50 gramos de arenilla de este metal. Las longitudes (en milímetros) se muestran a continuación 1. 9 1. 2 2. 4 3. 7 3. 6 4. 5 0. 8 1. 9 3. 4 1. 3 1. 6 1. 0 0. 9 1. 4 1. 5 0. 8 1. 7 1. 8 2. 2 1. 8 1. 8 3. 8 2. 0 1. 7 5. 0 3. 1 6. 0 1. 6 4. 4 1. 1 2. 7 3. 1 4. 9 2. 0 1. 7 2. 8 1. 8 2. 9 1. 5 1

Transcript of Laboratorio 1

Page 1: Laboratorio 1

LABORATORIO 1.

I PARA HALLAR INTERVALOS DE CONFIANZA

1. Ingrese los datos en una columna (coloque nombre a la variable)2. Seleccione estadísticas> estadísticas básicas>1_sample Z ( ó 1_sample t)

Cuando aparezca el cuadro de dialogo Coloque los valores de C1 en el cuadro samples im columningresar la desviación estándar en el cuadro estándar deviation

ingresar el nivel de confianza (pasar al paso 4) sino ir a**(si el nivel de confianza es diferente de 95%)

Seleccionar optionscuando aparezca el cuadro de diálogo 1 sample Z

ingresar el nuevo nivel de confianza en el cuadro Confidence level4. Damos aceptar en gráficos y seleccionamos Las tres opciones

5. Colocamos ok a todo

II PARA SELECCIONAR UNA MUESTRA ALEATORIA SIMPLE1. Seleccionar Calc

2. Elegir ramdon data >sample from columns3. Cuando aparezca el cuadro de dialogo >sample from columns

4. Ingresar n en el cuadro sample5. Ingresar C1 C2 en el cuadro que se encuentra debajo

6. Ingresar C3 C4 en el cuadro7. Ok.

EJERCICIOS

1. Suponga que la siguiente data corresponde a los ingresos salariales de 50 trabajadores durante una semana en el cual se sabe que el ingreso promedio es de 680 soles con una desviación estándar de 36 soles.

658 670 679 731 710 631 663 654 657 642

688 694 665 600 721 704 617 729 654 615

747 623 710 669 635 641 689 689 710 617

721 689 741 720 670 625 683 700 638 670

702 687 706 725 692 648 674 678 678 678

Obtenga un intervalo de confianza del 95% para la media de los ingresos salariales y sustente una breve interpretación mediante algunos gráficos de interés.

2. En el análisis del tamaño de partículas de oro se tomó una muestra aleatoria de 50 gramos de arenilla de este metal. Las longitudes (en milímetros) se muestran a continuación

1.9

1.2

2.4

3.7

3.6

4.5

0.8

1.9

3.4

1.3

1.6

1.0

0.9

1.4

1.5

0.8

1.7

1.8

2.2

1.8

1.8

3.8

2.0

1.7

5.0

3.1

6.0

1.6

4.4

1.1

2.7

3.1

4.9

2.0

1.7

2.8

1.8

2.9

1.5

1.1

1.8

2.1

2.1

1.8

5.5

1.0

1.5

1.8

2.0

1.1

a. Hallar un muestreo aleatorio simple de 17 partículas de orob. Hallar un intervalo de confianza del tamaño promedio de partículas de oro con un nivel de confianza del 90% 3. Suponga que los datos que se presentan a continuación representan los precios de un artículo WW (nuevos soles) en 40 establecimientos elegidos al azar en el distrito de Lince

5.2

10.2

7.0

7.1

10.2

8.3

9.4

9.2

5.4

8.1

6.5 7.1

6.6

7.5

1

Page 2: Laboratorio 1

7.8

6.8 7.2

8.4

9.6 8.7

7.3

8.5

5.7

6.4

10.1

8.2

9.0

7.8

8.2 7.8

6.6

5.3 6.2

9.1

8.6

7.0

7.7

8.3 7.5

9.8

Hallar un intervalo de confianza del precio promedio del artículo WW con un nivel de confianza del 90%

4. Un contratista piensa comprar una gran cantidad de radios a cierto fabricante. Este asegura al contratista que la duración promedio de los radios es de 3600 días con una desviación estándar de 40 días. El contratista decide comprar los radios sólo si una muestra aleatoria de 64 de éstos da como resultado una vida promedio de por lo menos 3600 días. ¿Cuál es la probabilidad de que el contratista adquiera los radios?

5. La tabla muestra los saldos en las tarjetas de crédito de una muestra de 70 familias. Use un nivel de confianza del 95%

a. Estimar el intervalo de confianza para la media del adeudo en las tarjetas de crédito en la población de familiasb. Suponga que se pretende seleccionar una muestra aleatoria simple de 30 familias para hacer un estudio del adeudo del saldo de sus tarjetas de crédito.

6. Se realizó una encuesta sobre ingresos mensuales de jóvenes adultos (entre 21 y 35 años) Para algunos, se podría tratar del público objetivo soñado: “su consumo está en ascenso. No tienen hijos, viven con sus padres y portan mucho en los gastos del hogar, además d adquirir su propios productos. Cada vez están más bancarizados. Su nivel de sofisticación se eleva con la edad” afirma una investigadora de merados. Los datos se registran a continuación.

2117

2214

1882

2458

167 1851

1989

2156

2287

2042

2312

1927

1667

2302

1950

2189

2427

2297

2024

2223

2069

2983

2429

2204

2204

2164

2210

2112

2022

2287

2418

2189

2019

2179

2379

2273

2258

2153

2022

1844

2165

2140

2315

2452

1895

2024

2347

2281

2201

2341

2002

2088

2394

2004

2216

1908

a. Estimar el intervalo de confianza para la media del adeudo en las tarjetas de crédito en la población de familiasb. Suponga que se pretende seleccionar una muestra aleatoria simple de 30 familias para hacer un estudio del adeudo del saldo de sus tarjetas de crédito.

2

Saldos en las tarjetas de crédito de una muestra de 70 familias9430753540785604517944161037616271011265671362718719

1466112195105441365970616245130219719220010746127445742

7159813794671259579171134612806497211357117946519263

90713603168051347914044681768451049361513627125576232

969111448827956491129843533467619112851533783727445

1103265255239619512584154151591712591974310324

Page 3: Laboratorio 1

7. El instituto de investigación de educación superior de la UCLA cuenta con estadísticas sobre las áreas que son más elegidas por los estudiantes de nuevo ingreso. Las cinco más elegidas son arte y Humanidades(A), administración de Negocios (B), política (P) y ciencias sociales (S).(fuente: The New York Times Almanac)Otras áreas (O) entre las que se encuentra biología, física, ciencias de la computación y educación se agruparon todas en una sola categoría.las siguientes fueron las áreas elegidas por 64 estudiantes de recién ingreso de una muestra.

S P P O B E E A B O BO E P O O B S S O O OO O O A O E E B O B PE B S O B O A E B E BA O E O E O A A P OB P B A S O O E O B

Hallar un muestreo aleatorio simple de 17 áreas elegidas al azar por los alumnos

8. Suponga que estamos interesados en estimar la rapidez de lectura promedio (número de palabras por minuto) de estudiantes egresados de cuarto medio y calcular esto con un 95% de nivel de confianza. Para ello tomamos una muestra al azar de 6 graduados y obtuvimos que sus rapideces fueron: 200, 240, 300, 410, 600, y 450

9. Un cuestionario fue aplicado entre 20 trabajadores de una empresa distribuidora de materiales de construcción obteniendo las siguientes respuestas

trabajador

Nivel de estudios edad

Salario(soles)

Años de la empresa

1234567891011121314151617181920

Superior universitariaSuperior universitariaSecundariaSecundariaSecundariaSecundariaSecundariaSecundariaSecundariaSuperior técnicaSuperior técnicaSecundariaSecundariaSecundariaSecundariaSecundariaSecundariaSuperior técnicaSuperior técnicaSuperior universitaria

3443313724252722212624262521222824232730

110014507507506006006006009609605405405405405406006008608601100

58683252331111122334

a. Hallar un muestreo aleatorio simple de 13 trabajadores con las variables nivel de estudios y salario

b. Hallar un intervalo de confianza de años promedio de trabajo en la empresa con un nivel de confianza del 99%

10. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día) de los establecimientos comerciales en un distrito de Lima Para ello se eligieron al azar 36 establecimientos encontrándose los siguientes resultados.

11.7

5.7

10.1

8.5

6.4 4.7

2.1 5.8

4.6 8.7

9.1 5.2

3.7 5. 7.8 4. 9.8 4.

3

Page 4: Laboratorio 1

3 4 615.4

2.5

4.6 7.4

12.1

6.7

5.4 7.4

3.2 1.5

4.5 7.7

7.2 6.7

8.4 6.1

5.7 8.4

a. Hallar un intervalo de confianza de los volúmenes de venta de todos los establecimientos comerciales con un nivel de confianza del 90% 11. Un fabricante produce anillos para los pistones de un motor de automóvil. Se sabe que el diámetro del anillo está distribuido aproximadamente de manera normal, y que tiene una desviación estándar de 0,001 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de X = 74,036 mm.a) Construya un IC bilateral del 99% para el diámetro promedio del anillo.b) Construya un límite inferior de confianza del 95% para el diámetro promedio del anillo

12. Se utilizan dos máquinas para llenar botellas de plástico con detergente para máquinas lavaplatos. Se sabe que las desviaciones estándar del volumen de llenado son s1 = 0,10 onzas de líquido y s2 = 0,15 onzas de líquido para las dos máquinas, respectivamente. Se toman dos muestras aleatorias, n1 = 12 botellas de la máquina 1 y n2 = 10 botellas de la máquina 2. Los volúmenes promedio de llenado

son x1= 30,87 onzas de líquido y x2 = 30,68 onzas de líquido.a) Construya un IC bilateral del 90% para la diferencia entre las medias del volumen de llenado.b) Construya un IC bilateral del 95% para la diferencia entre las medias del volumen de llenado.Compare el ancho de este intervalo con el ancho del cálculo en el inciso a).c) Construya un IC superior del 95% para la diferencia de medias del volumen del llenado

PARA HACER UNA PRUEBA DE HIPÓTESIS

Prueba de hipótesis

Supongamos que queremos probar

caso 1 H0 : μ=295 contra H1 : μ≠295 /

Prueba de hipótesis para la media poblacional (desviación estándar conocida)1. Ingrese los datos en una columna (coloque nombre a la variable)

2. Seleccione estadísticas> estadísticas básicas>1_sample Z ( ó 1_sample t)3. Cuando aparezca el cuadro de dialogo Coloque los valores de C1 en el cuadro samples in column

4. ingresar la desviación estándar en el cuadro estándar deviationIngresar 295 en el cuadro Test mean

Seleccionar optionsCuando aparezca el cuadro de diálogo 1_sample Z options

Ingresar 95 en el cuadro confidence levelSeleccionar not equal (para el caso 1 )

Okok

Prueba de hipótesis para la media poblacional (desviación estándar desconocida)

caso 2 H0 : μ≤7 contra H1 : μ>7

1. Ingrese los datos en una columna (coloque nombre a la variable)2. Seleccione estadísticas> estadísticas básicas> ( 1_sample t)

3. Cuando aparezca el cuadro de dialogo 1_sample tColoque los valores de C1 en el cuadro samples in column

Ingresar 7 en el cuadro Test meanSeleccionar options

Cuando aparezca el cuadro de diálogo 1_sample t optionsIngresar 95 en el cuadro confidence level

Seleccionar greater than en el cuadro alternativeOk

4

Page 5: Laboratorio 1

ok

Para hallar el estadístico de la prueba z

1. Seleccionar el menú cal2. Elegir Probability distributions> normal

3. Cuando aparezca el cuadro de dialogo normal distribution:. Seleccionar Cumulative probability

Ingresar 0 en el cuadro MeanIngresar 1 en el cuadro Standard deviation

Seleccionar Input ConstantIngresar el valor del estadístico de la prueba (por ejemplo -2.67)) en el cuadro input cosntant

>ok

Minitab devuelve la probabilidad acumulada 0.0038 que es el valor p de la prueba para la cola inferior.Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-0.0038=0.9962 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p correspondientes a las colas inferior y superior es decir el valor correspondiente a z= -2.37 es 2(0.0038)=0.0076

Para hallar el valor P a partir del estadístico de la prueba t1. Seleccionar el menú cal

2. . Elegir Probability distributions> t3. Cuando aparezca el cuadro de dialogo t distribution:

. Seleccionar Cumulative probabilityIngresar (grados de libertad por ejemplo 59) en el cuadro Degrees of freedom

Seleccionar Input Constant >Ingresar el valor del estadístico de la prueba (por ejemplo -2.67)) en el cuadro input cosntant ok

Minitab devuelve la probabilidad acumulada 0.9646 que es el valor p de la prueba para la cola inferior.Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-9646=0.0354 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p de 0.9646 y 0.0354 para obtener el valor p es 2(0.0354)=0.0708

Para hallar el estadístico de la prueba F

Vamos a suponer que el estadístico de la prueba es F=2.40 con 25 y 15 grados de libertad.

1. Seleccionar el menú Cal2. Elegir Probability distributions> F

3. Cuando aparezca el cuadro de dialogo F distribution:. Seleccionar Cumulative probability

Ingresar (grados de libertad1) en el cuadro Numerator Degrees of freedomIngresar (grados de libertad 2) en el cuadro Denominator Degrees of freedom

Seleccionar Input ConstantIngresar (valor de la F calculada) en el cuadro Input Constant > ok

Minitab devuelve la probabilidad acumulada 0.9594 que es el valor p de la prueba para la cola inferior.Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-9594=0.0406 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p de 0.9594 y 0.0406 para obtener el valor p es 2(0.0406)=0.0812

Para hallar el estadístico de la prueba X 2 Vamos a suponer que el estadístico de la prueba es X2 =28.18 con 23 grados de libertad.

1. Seleccionar el menú Cal2. Elegir Probability distributions> X2

3. Cuando aparezca el cuadro de dialogo Chi -square distribution:. Seleccionar Cumulative probability

Ingresar (grados de libertad) en el cuadro Degrees of freedomSeleccionar Input Constant

5

Page 6: Laboratorio 1

Ingresar (valor de la X2 calculada) en el cuadro Input Constant > ok

Minitab devuelve la probabilidad acumulada 0.7909 que es el valor p de la prueba para la cola inferior.Para una prueba de cola superior se hace valor p = 1- probabilidad acumulada=1-0.7909 =0.2091 y para una prueba de hipótesis bilateral es el doble del mínimo de los valores p de 0.7909 y 0.2091 para obtener el valor p es 2(0.2091) = 0.4181

PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE MEDIAS

caso 3 H0 : μ1−μ2=0 contra H1 :μ1−μ2≠0

1. Ingrese los datos C1 y C2 (coloque nombres a las variables)2. Seleccione estadísticas> estadísticas básicas> ( 2_sample t)

3. Cuando aparezca el cuadro de diálogo 2-sample t (test and confidence interval)Seleccionar Samples en different columnsColoque los valores de C1 en el cuadro first

Ingresar C2 en el cuadro secondSeleccionar options

4.Cuando aparezca el cuadro de diálogo 2_sample t -optionsIngresar 95 en el cuadro confidence level

Seleccionar 0 en el cuadro Test differenceSeleccionar not equal en el cuadro alternative

OkOk

PRUEBA DE HIPÓTESIS PARA DOS VARIANZAS POBLACIONALES

caso 4 H0 : σ11

2 =σ122 contra H 1: σ

112 ¿ σ

122

1. Ingrese los datos C1 y C2 (coloque nombres a las variables)2. Seleccione estadísticas> estadísticas básicas> ( 2_variances)

3. Cuando aparezca el cuadro de diálogo 2-variancesSeleccionar Samples en different columnsColoque los valores de C1 en el cuadro first

Ingresar C2 en el cuadro secondOk

1. Un fabricante afirma que el consumo promedio de gasolina de su motor es menos de 4 galones por tarea

fija.

Pero los usuarios contradicen al fabricante.

Si a usted le piden su opinión estadística aplicando la siguiente muestra al Azar de los consumos (en

galones) por tarea de 15 unidades de motor 4.25

3.45

4.05

3.8

3.5

4 3.75

2.5 6.1

2.5

2.5 3.4 3.2 2.8

5

a. ¿Cree usted que los consumidores tienen la razón? Asuma supuestos del método y use la

probabilidad de error tipo I igual a 0.05

2. El volumen de negociaciones en la bolsa de Nueva York es más intenso en la primera media hora (en la mañana temprano) y la última media hora (al final de la tarde) de un día de trabajo. A continuación se presentan los volúmenes (en millones de acciones) de 13 días de enero y febrero:

214

163

265

194

180

6

Page 7: Laboratorio 1

202

298

212

201

174

171

211

211

La distribución de probabilidad de los volúmenes de negociaciones es aproximadamente normal.

3.Los siguientes datos corresponden a la longitud medida en centímetros de 18 pedazos de cable sobrantes en cada rollo utilizado:

9 3.41

6.13

1.99

6.92

3.24

3.12

7.86

2.01

5.98

4.15

5.05

6.87

1.97

4.01

3.56

8.04

7.37

Basados en estos datos ¿podemos decir que la longitud media de los pedazos de cable es mayor de 4 cm? Suponga población normal y tome el nivel de significancia 0,05. La proposición cuya validez o invalidez queremos probar es "la longitud promedio de los pedazos de cable es como mucho 4 cm."

4. Un agrónomo mide el contenido promedio de humedad en cierta variedad de trigo que fue secado especialmente en una muestra de 16 toneladas:

7.2

7 7.3

7.3

7.5

6.8

6.9

7.3

7.4

7.2

7.3

7.6

7.1

7.4

6.7

7.4

Si el promedio de humedad excede de 7,1 el secado debe continuar. ¿Debería continuarse con el proceso de secado, de acuerdo con esta evidencia? Tome un nivel de significancia del 5%.

5. En el pasado una máquina ha producido arandelas con un grosos de 0.050 pulgadas. Para determinar si la máquina sigue en buenas condiciones de producción, se toma una muestra de 10 arandelas, que resulta tener un grosor medio de 0.053 pulgadas y una desviación típica de 0.03 pulgadas. a. Ensayar la hipótesis de que la máquina esté en buenas condiciones de producción al nivel de significación del 0.05b. Hallar el valor p de la prueba c. Qué tipo de error se comete? Hallarlo

6. Un artículo en la revista Consumer Reports, de noviembre de 1983, comparo varios tipos de baterías. Los promedios de duración de baterías AA alcalinas marca Duracell, Eveready Energizer fueron 4, 1 y 4, 5 horas, respectivamente. Suponga que estos son los promedios de duración poblacionales.

a) Sea X la duración promedio muestral de 100 baterías Duracell, e Y la duración promedio muestral

de 100 baterías Eveready. ¿Cuál es el valor medio de X -Y (es decir, donde está centrada a

distribución de X -Y ¿De qué manera incluyen los tamaños muestrales especificados en su respuesta?b) Suponga que las desviaciones estándar poblacionales de duración son 1,8 horas para baterías Duracell y 2,0 horas para baterías Eveready. Con los tamaños muestrales dados en el inciso

a) ¿Cuál es la varianza del estadístico X -Y , y cuál es su desviación estándar?c) Para los tamaños muestrales dados en el inciso a), trace una figura de la curva aproximada de la

distribución de X -Y (incluya una escala de medida en el eje horizontal). ¿La forma de la curva sería necesariamente la misma para tamaños muestrales de 10 baterías de cada tipo? Explique.

7. ¿Los estudiantes universitarios hombres se aburren más fácilmente que sus compañeras mujeres? Esta pregunta se examinó en el artículo “Boredom in Young Adults—Gender and Cultural Comparisons”

7

Page 8: Laboratorio 1

Los autores aplicaron la Escala de propensión al aburrimiento a 97 estudiantes hombres y 148 mujeres de universidades de Estados Unidos. ¿La siguiente información apoya la hipótesis de investigación de que la tasa de aburrimiento es más alta para hombres que para mujeres? Pruebe las hipótesis apropiadas usando un nivel de significancia de 0,05.

género Tamaño muestral

Media muestral

Desviación estándar muestral

Hombres

97 10.40 4.83

mujeres 148 9.26 4.68

8. Se realizó un experimento para comparar la resistencia a la fractura del acero con níquel maragizado, con el acero de pureza comercial del mismo tipo .Para n1 = 32 especímenes, la resistencia promedio muestral fue de x1 = 65,6 para el acero de alta pureza, muestras que x2 = 59,8 para n2 = 38 especímenes del acero comercial. Debido a que el acero de alta pureza es más costoso, su uso para ciertas aplicaciones puede justificarse sólo si su resistencia a la fractura excede la del acero de pureza comercial en más de 5. Suponga que ambas distribuciones de resistencia son normales.a) Si se supone que S1 = 1,2 y S2 = 1,1, pruebe las hipótesis pertinente usando α = 0,001.

b) Calcule β para la prueba del inciso a) cuando μ1 − μ2 = 6.

9. Se encontró que la desviación estándar muestral de concentración de sodio en sangre entera para n1 = 20 anguilas marinas fue s1 = 40,5, mientras que la desviación estándar muestral de concentración para n2 = 20 anguilas de agua dulce fue s2 = 32,1. Si se supone normalidad de las dos distribuciones, pruebe al nivel 0,10 para ver si la información sugiere cualquier diferencia entre varianzas de concentración para los dos tipos de anguilas.

10. Se cree que la portada y la naturaleza de la primera pregunta de encuestas por correo influyen en la tasa de respuesta. Se probó esta teoría al experimentar con diferentes diseños de portadas. Una portada era sencilla, y la otra utilizó la figura de un paracaidista. Los investigadores especularon que la tasa de devolución sería menor para la portada sencilla.

Portada Número de envíos

Número de devoluciones

Sencilla 207 104paracaidista

213 109

¿Esta información apoya la hipótesis de los investigadores? Pruebe las hipótesis pertinentes usandoUn nivel de significancia de 0,10, calculando primero un valor P.

11. Una planta industrial utiliza un procedimiento tradicional T de producción. Se propone un procedimiento de producción moderno M. La planta cambiará el procedimiento M sólo si éste resulta más rápido. A fin de tomar la decisión se escogieron dos muestras aleatorias independientes, una de 9 tiempos del proceso T y otra de 10 tiempos del proceso del proceso M resultando los siguientes tiempos en segundos

Muestra T: 06 14 08 11 10 18 15 20 13Muestra M: 12 11 12 10 14 15 10 13 14 12Al nivel de significación 0.05 ¿Cuál será la decisión a tomar? Asuma los requerimientos del método

PRUEBA PARA BONDAD DE AJUSTE

Se ingresan las frecuencias observadas y las frecuencias esperadas

1. Seleccionar el menú Cal2. Elegir calculator

3. Cuando aparezca el cuadro de diálogo calculatorIngresar Chi.square en el cuadro store result in variable

Ingresar sum (C1-C2)**2/C2 en el cuadro ExpressionOk

4. Seleccionar el menú calc

8

Page 9: Laboratorio 1

5. Elegir probabiliy distribution:6. Elegir Chi square

7. Cuando aparezca el cuadro de dialogo Chi-square distribution:8. Seleccionar cumulative probability

9. Ingresar 2 en el cuadro Degree of Freedom10.Seleccionar input column e ingresar Chi square en el cuadro

11.Ok

Prueba de independenciaSe ingresan los datos en las columnas 1, 2, 3…

1. Selecionar el menú Stat2. Seleccionar Tables

3. Elegir Chi square Test (Table in worksheet)4. Cuando aparezca el cuadro de diálogo Chi-square Test

Ingresar C1_C3… en el cuadro Columns containing the tableok

1. EJEMPLO 1

Histogramas de frecuencia: Para realizar un histograma de frecuencia se sigue la siguiente

secuencia: graph > histogram >options >frecuency >cutpoint ># intervals 10. Para

mostrar las frecuencias en la gráfica, ingresar a <Annotation> <Data labels> y activar

<show data labels> Ademas en < <Annotation> ingresar a <Title..> para colocar un título.

De este modo se obtiene la siguiente gráfica.

9

Page 10: Laboratorio 1

EJEMPLO 2 Considere que la demanda semanal de un producto tiene una distribución normal. Haga una prueba de bondad de ajuste con los siguientes datos, para probar esta hipótesis.Use alpha= 0.10.

18

20

22

27

22

25

22

27

25

24

26

23

20

24

26

27

25

19

21

25

26

25

31

29

25

25

28

26

28

24

SoluciónDebemos probar:H0: La demanda semanal del producto tiene una distribución normalH1: La demanda semanal del producto no tiene una distribución normal

Usando Minitab:Usemos este programa de la siguiente manera:

Vamos a clasificarlas a las 30 observaciones en un conjunto de k categorías, de manera que podamos tener O1, O2, ...., Ok observaciones; es decir, vamos a construir una tabla de frecuencias, donde las frecuencias absolutas será los Oi, las pi será las probabilidades de que un valor Xi esté en un determinado intervalo; es decir, pi = P(LimSup) – P(LimInf). Estas probabilidades las hallaremos usando la distribución normal en el cual hemos estimado dos parámetros: la media con el promedio de la muestra y la varianza con la varianza de la muestra s². De esta forma, al buscar los grados de libertad, debemos usar k-1-2 por ser dos los parámetros que se estimaron.

Procedimiento:Para ello usaremos datos agrupados de manera que k representará el número de intervalos. Puesto que tenemos 30 observaciones, hagamos que k = 8.

Los siguientes pasos nos permitirán la tabla anteriorPaso 1: Ingresamos los datos en la columna C1.

Paso 2: Obtención de Estadísticas Descriptiva de los datos observados:<Stat> -<Basic statistics> - <Display Descriptive statistics> - C1 -<Ok>Los resultados son los siguientes:

Descriptive Statistics: Demanda

10

Page 11: Laboratorio 1

TotalVariable Count Mean StDev Variance Minimum Maximum RangeDemanda 30 24.500 3.014 9.086 18.000 31.000 13.000Media = 24.5Desviación estándar = 3.014Valor mínimo = 18Valor máximo = 31Ancho o Amplitud de intervalo = 13/8 = 1.625

Paso 3: Obtención de las marcas de clase (Xi) (columna C5) que constituyen las observaciones en datos agrupados: Oi : Tabulamos, simplemente. En todo caso, use el procedimiento dado al final del capítulo II, siga paso a paso y con cuidado.Al editar la escala X debe ingresar según se indica en la siguiente figura de la izquierda:

Usando el botón derecho sobre una barra agregue etiquetas. El resto es sencillo para obtener la tabla de frecuencias.La imagen de la derecha muestra lo que se debe obtener:

Paso 4: Obtención de las probabilidades para las columnas Lim. Inf. (C3) y Lim. Sup.(C4). Para ello usamos:i) <Calc>- <Probability distributions> - <Normal> - <Cumulative Probability > - <Mean> 24.5 -

<Std.Desviation> 3.014 -<Input column > C3 - <Storage > C6 - <Ok>ii) <Calc>- <Probability distributions> - <Normal> - <Cumulative Probability > - <Mean> 24.5 -

<Std.Desviation> 3.014 -<Input column > C4 - <Storage > C7 - <Ok>

Paso 5: Obtención de la columna C8 (P(X = xi):< Calc> - <Calculator> - <Store result in variable> C8 -<Expressions> C7 – C6

Paso 6: La columna C9 es una copia de la columna C5 que son los Oi.

Paso 7: Obtención de la columna C10 (Ei):Usamos la calculadora para ingresar la expresión Sum(C9)*C8

Paso 9: Obtención de la columna C11: (Oi-Ei)²/Ei:Usamos la calculadora para ingresar la expresión (Oi-ei)**2/ei

Paso 10: Suma de estos valores: Sum(C11) = 6.5307

Paso 11: El valor de Chi – Cuadrado con 7 grados de libertad y 10% de nivel: 9.23636

11

Page 12: Laboratorio 1

Puesto que < (5) ; es decir, 6.5307 < 9.23636 (no es mayor que el valor teórico) concluimos que hay suficiente evidencia para afirmar que la demanda semanal de dicho producto tiene una distribución normal (no se rechaza la hipótesis nula).

A continuación mostramos la tabla obtenida:

C3 C4 C5

C6 C7 C8 C9

C10 C11

LINF LSUP XI P(LIMINF) P(LIMSUP) P(x=XI)

OI EI (OI-EI)2/EI

18.00019.62521.25022.87524.50026.12527.75029.375

19.62521.25022.87524.50026.12527.75029.37531.000

233411331

0.0160.0530.1400.2950.5000.7050.8600.947

0.0530.1400.2950.5000.7050.8600.9470.984

0.0370.0880.1540.2050.2050.1540.0880.037

233411331

1.1212.6274.6336.1536.1534.6332.6271.121

0.06890.0530.5760.7543.8180.5760.0530.013

La siguiente gráfica prueba la afirmación planteada como hipótesis nula. Y como bien, concluimos: Hay evidencia.

EJERCICIOS

1. (Bondad de ajuste a una Binomial) Un estudiante el cual había lanzado en 359 ocasiones cinco monedas iguales al aire (lo que hace un total de 17,950 lanzamientos) obteniendo 464 más caras que cruces. ¿Es este resultado estadísticamente significativo?.En la siguiente tabla se muestran los resultados obtenidos por el estudiante.

Número de caras en los cinco lanzamientos

Frecuencia observada

0 1001 5242 10803 1126

12

Page 13: Laboratorio 1

4 6555 105Total de lanzamientos de 5 monedas

3590

2. (Prueba de independencia) Un estudio se realizó con 81 personas referente a la relación entre la cantidad de violencia vista en la televisión y la edad del televidente, produjo los siguientes datos

16-34

34-35

55 o más

Poca violencia 8 12 21Mucha violencia

18 15 7

¿Indican los datos que ver violencia n la televisión depende de la edad del televidente a un nivel de significación del 5%?3. Estamos interesados en estudiar la relación entre cierta enfermedad y la adicción al tabaco. Para realizar esto seleccionamos una muestra de 150 individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla muestra las frecuencias de enfermedad en cada grupo

Padecen la enfermedad

No padecen la enfermedad

Fumadores 12 88No fumadores

25 25

Realizar un contraste de hipótesis y obtener las conclusiones sobre la relación entre las variables

4.Dada la siguiente tabla

X

Y

A favor

En contra

indecisos

Total

Menos de 100

3 2 2 7

Entre 100 y 300

9 6 7 22

Más de 300 7 7 2 21total 19 15 16 50

Aceptaría el partido político que el sueldo medio de los electores explicase el grado de aceptacióndel programa electoral a un nivel de confianza del 95%.x:columnas y:filas

4. Una compañía de venta de libros quiere saber si el volumen de ventas, V, de sus distribuidores es independiente del carácter C, de los mismos. Para ello, recoge los siguientes datos de una muestra de 250 vendedores:

VC

bajo

medio

alto

AntipáticosNormalessimpáticos

383032

294259

974

Realiza un test de independencia a nivel de significación de α =0,01

13

Page 14: Laboratorio 1

ANOVA UNA VÍADiseño completamente aleatorizado

1. Ingresar en diferentes columnas cada uno de los tratamientos2. Seleccionar el menú stat >ANOVA> one way (unstacked)

3. Cuando aparezca el cuadro de diálogo One –way Analysis of variance:4. Ingresar C1…Ck en el cuadro Responses (in separate columns)

5. ok

1. Una compañía textil utiliza diversos telares para la producción de telas. Aunque se desea que los telares sean homogéneos con el objeto de producir tela de resistencia uniforme, se supone que puede existir una variación significativa en la resistencia de la tela debida a la utilización de distintos telares. A su disposición tiene 5 tipos de telares con los que realiza determinaciones de la resistencia de la tela. Este experimento se realiza enorden aleatorio y los resultados se muestran en la tabla siguiente

TELARES RESISTENCIA1 5

149

50

49

51

50

2 56

60

56

56

57

3 48

50

53

44

45

4 47

48

49

44

5 43

43

46

47

45

46

En este experimento, se han considerado 5 tipos de telares y se han realizado 6, 5, 5, 4 y 6 determinaciones de la resistencia de tela manufacturada con cada uno, respectivamente.¥ La variable de interés o variable respuesta es la resistencia de la tela.¥ El factor: Los telares¥ Niveles del factor: 5¥ Modelo unifactorial de efectos fijos, no-equilibrado(los tamaños ni de la muestra son diferentes)

2. En una determinada fábrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la misma viscosidad en la masa. Para ello, produce durante un día 16 masas, 4 de cada tipo de harina, y mide suviscosidad. Los resultados obtenidos son:

PROVEEDORESA B C D98

97

99

96

91

90

93

92

96

95

97

95

95

96

99

98

Variable respuesta: viscosidad Factor: Proveedor Tratamientos: 4 Modelo unifactorial de efectos fijos equilibrado

3. Una fábrica de textiles dispone de un gran número de telares. En principio, se supone que cada uno de ellos debe producir la misma cantidad de tela por unidad de tiempo. Para investigar esta suposición se seleccionanal azar cinco telares, y se mide la cantidad de tela producida en cinco ocasiones diferentes. Se obtienen los datos de la tabla adjunta. ¿Del estudio se concluye que todos los telares tienen el mismo rendimiento?

14

Page 15: Laboratorio 1

TELARES PRODUCCIÓN1 14.0 14.1 14.2 14.0 14.12 13.9 13.8 13.9 14.0 14.03 14.1 14.2 14.1 14.0 13.94 13.6 13.8 14.0 13.9 13.75 13.8 13.6 13.9 13.8 14.0

Variable respuesta: cantidad de tela Factor: Telares Tratamientos: 5 Modelo unifactorial de efectos aleatorios equilibrado

4. Un partido político desea conocer si existe relación entre el grado de aceptación de su programa electoral(X) y el sueldo medio (Y) expresado en miles de ptas. Para ello selecciona al azar a 50 personas y obtiene los siguientes datos: Para estudiar el efecto de la temperatura en el rendimiento de un proceso químico se produjeron cinco lotes con cada uno de los tres tratamientos .Los resultados se presentan a continuación. Dé la tabla para el análisis de varianza. Use alfa=0.05 para probar si la temperatura afecta el rendimiento medio del proceso.

Temperatura50°C

60°C 70°C

34 30 2324 31 2836 34 2839 23 3032 27 31

5. En la publicidad de tres pinturas se tiene el mismo tiempo de secado. Para verificar esto, se prueban 5 muestras década una de la pinturas. Se registra el tiempo en minutos necesario para que el secado sea suficiente para la aplicación de una segunda mano. Los datos obtenidos son:

Pintura1 2 3 4128 144 133 150137 133 143 142135 142 137 135124 146 136 140141 130 131 153

Con alfa igual a 0.05 como nivel de significancia, realice una prueba para determinar si la media de los tiempos de secado es la misma en todas las pinturas.

6. La empresa Burger King opera 24 horas al día, cinco días a la semana. Los trabajadores cambian de turno cada semana. La gerencia está interesada en saber si hay alguna diferencia en el número de unidades producidas cuando los empleados laboran en diversos turnos. Se seleccionó una muestra de cinco obreros y se registró su producción en cada turno. Al nivel de significancia de 0.05 ¿Se puede concluir que hay una diferencia en la producción media por trabajador?

Unidades producidasEmpleado

Mañana

Tarde

Noche

Tina 31 25 35Angel 33 26 33Jordan 28 24 30Josue 30 29 28Miguel 28 26 27

15

Page 16: Laboratorio 1

7. Una médica que se especializa en el control de peso, recomienda tres dietas. Como un experimento seleccionó al azar a 15 pacientes y les asignó una dieta a cada 5 de ellos. Después de tres semanas e registraron las siguientes pérdidas de peso, en libras. Al nivel de significancia del 0.05 ¿Puede concluirse que existe alguna diferencia de pérdida de peso entre las tres dietas?

PlanA B C5 6 77 7 84 7 95 5 84 6 9

8. A continuación aparecen los pesos (en gramos) de una muestra de dulces clasificados de acuerdo a su color.Utilice minitab para determinar si hay una diferencia en los pesos medios de dulces e diferentes colores. Utilice el nivel de significancia de 0.05

Rojo Naranja Amarillo café Verde Canela

0.946 0.902 0.929 0.896 0.845 0.9351.107 0.943 0.960 0.888 0.909 0.9030.913 0.916 0.938 0.906 0.873 0.8650.904 0.910 0.933 0.941 0.902 0.8220.926 0.903 0.932 0.838 0.956 0.8710.926 0.901 0.899 0.892 0.959 0.9051.006 0.919 0.907 0.905 0.916 0.8520.914 0.901 0.906 0.824 0.822 0.9650.922 0.930 0.930 0.908 0.8981.052 0.883 0.952 0.833 0.9050.903 0.9390.895 0.940

0.8820.906

9. El proyecto académico de un ingeniero es el diseño de un experimento a fin de determinar el rendimiento de 4 variedades de papa sin tener en cuenta la influencia de la fertilidad de las tierras de cultivo. Las 20 parcelas de igual fertilidad que le fueron asignadas los dividió en cuatro grupos de 5 parcelas cada una .A cada grupo de parcelas le asignó una variedad distinta de papa escogida al azar, resultando un diseño completamente aleatorizado. Los rendimientos medidos en Kilogramos de las cinco variedades por parcela sedan en la tabla

a. Defina la variable dependiente, los niveles del factor, el modelo del diseño y los supuestos del modelo.b. Compare descriptivamente las medias de los rendimientos c. Estime el efecto que produce la variedad 3 en el valor medio global del rendimiento.d. Al nivel de significación del 5% ¿se puede inferir que existen diferencias significativas entre las producciones medias de las 4 variedades de papa?

10. Un organismo de investigación quiere comparar los rendimientos en millas por galón, de gasolina regular sin plomo, semi-grado y super Premium. Debido a la diferencia en el funcionamiento de los diferentes automóvile, se seleccionaron siete de ellos y se les trató como bloques. Por lo tanto cada clase de gasolina se probó con cada tipo de vehículo. Al nivel d significancia de 0.05 ¿existe una diferencia en las gasolinas y el los automóviles?

16

variedades de papaV1 V2 V3 V45553605253

5258506052

5355575154

5250514953

Page 17: Laboratorio 1

automóvil

Reglar Semi-grado Super premium

1 21 23 262 23 22 253 24 24 274 24 26 265 26 24 306 26 27 277 28 25 32

11. Los fabricantes de chips de silicio requieren el uso de los llamados “cuartos limpios” en los que el aire se filtra de manera especial para mantener el número de partículas de polvo al mínimo. La Outel Corporation desea asegurarse de que cada uno de sus cinco cuartos limpios tiene el mismo número de partículas de polvo. Se tomaron cinco muestras de aire en cada cuarto. Se midió el “nivel de polvo” en una escala de 1 (bajo) a 10 (alto) al nivel de significancia de 0.05 ¿los cuartos tienen el mismo nivel promedio de polvo?

Nivel de polvo (1 a 10)

Cuarto 1 5 6.5 4 7 6 Cuarto 2 3 6 4 4.5 3 Cuarto 3 1 1.5 3 2.5 4 Cuarto 4 8 9.5 7 6 7.5 Cuarto 5 1 2 3.5 1.5 3

12. En una ciudad, una cadena de comida rápida está adquiriendo una mala reputación debido a que tardan mucho en servirle a los clientes. Como la cadena tiene cuatro restaurantes en esa ciudad, se tiene la preocupación de si los cuatro restaurantes en esa ciudad, se tiene la preocupación de si los cuatro restaurantes tienen el mismo tiempo promedio de servicio. Uno de los dueños de la cadena ha decidido visitar cada uno de los locales y registrar el tiempo de servicio para cinco clientes escogidas al azar. En sus cuatro visitas vespertinas registró los siguientes tiempos de servicio en minutos Restaurante 1 3 4 5.5 3.5 4 Restaurante 2 3 3.5 4.5 4 5.5 Restaurante 3 2 3.5 5 6.5 6 Restaurante 4 3 4 5.5 2.5 3

17