tema2.1_problemas_regresion.pdf

5
ınimos cuadrados 1 Universidad Polit´ ecnica de Cartagena Dpto. Matem´ atica Aplicada y Estad´ ıstica Grado en Ingenier´ ıadeEdificaci´on Estad´ ıstica ınimos cuadrados Problema 1 I.1 Un ingeniero estudia la relaci´ on entre dos variables X e Y . Dispone de los valores de Y para 15 valores de X , y sabe que la media y la varianza de los valores de X valen x = 20, s 2 x =4. Decide ajustar una recta de regresi´on y encuentra la ecuaci´ on siguiente: y = 32 - x 1. ¿Cu´ al es el signo de la correlaci´on entre X e Y ? Justifica tu respuesta. 2. Calcular la covarianza de X e Y. 3. ¿Cu´ anto vale y? Problema 2 I.2 Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosi´ on. En un estudio se recocieron cinco espec´ ımenes de la aleaci´on a 700 0 cada uno durante un intervalo de tiempo distinto (x, en minutos). Despue´ es se midi´o el potencial de pasivaci´on (y, en mV)- una medida de resistividad de la aleaci´on cristalizada- para cada especimen. Los datos experimentales son los siguientes: x 10 20 45 90 120 y -408 -400 -392 -379 -385 1. Suponiendo que la mejor forma de describir la relaci´on entre las variables es lineal, ajustar una recta de regresi´ on a los datos. Calcular r 2 e interpretar el resultado. 2. ¿Cu´ al es el potencial de pasivaci´on cuando el tiempo de recocido es de 30 minutos?

Transcript of tema2.1_problemas_regresion.pdf

  • Mnimos cuadrados 1

    Universidad Politecnica de Cartagena

    Dpto. Matematica Aplicada y Estadstica

    Grado en Ingeniera de Edificacion

    Estadstica Mnimos cuadrados

    Problema 1

    I.1 Un ingeniero estudia la relacion entre dos variables X e Y . Dispone de los valores

    de Y para 15 valores de X, y sabe que la media y la varianza de los valores de X

    valen x = 20, s2x = 4. Decide ajustar una recta de regresion y encuentra la ecuacion

    siguiente:

    y = 32 x

    1. Cual es el signo de la correlacion entre X e Y ? Justifica tu respuesta.

    2. Calcular la covarianza de X e Y.

    3. Cuanto vale y?

    Problema 2

    I.2 Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la

    corrosion. En un estudio se recocieron cinco especmenes de la aleacion a 7000 cada

    uno durante un intervalo de tiempo distinto (x, en minutos). Despuees se midio

    el potencial de pasivacion (y, en mV)- una medida de resistividad de la aleacion

    cristalizada- para cada especimen. Los datos experimentales son los siguientes:

    x 10 20 45 90 120

    y -408 -400 -392 -379 -385

    1. Suponiendo que la mejor forma de describir la relacion entre las variables es

    lineal, ajustar una recta de regresion a los datos. Calcular r2 e interpretar el

    resultado.

    2. Cual es el potencial de pasivacion cuando el tiempo de recocido es de 30

    minutos?

  • 2 Mnimos cuadrados

    Problema 3

    I.1 En la direccion http://dataservice.eea.eu.int/dataservice/, se pueden encontrar los

    datos de emision de CO2 por fuentes fosiles para los distintos paises europeos entre

    los anos 1985 y 1997. Se indican a continuacion los datos de emision total de este

    contaminante para Espana entre los anos 1990 y 1997.

    Ano (X) 90 91 92 93 94 95 96 97

    Emision total (Y ) 203.8 215.5 225.1 211.5 222.8 237.5 226.6 242.8

    ( Megatoneladas)

    Se pueden utilizar las cantidades numericas siguientes:xi = 748;

    x2i = 69980;

    yi = 1785.6;

    y2i = 399722;

    xiyi = 167142

    1. Realizar el ajuste lineal de la emision total en funcion del ano. Calcular el

    valor de R2 y comentar la bondad del ajuste.

    2. Segun nuestro modelo, se esta produciendo un aumento o un descenso de la

    emision de CO2?

    3. Segun nuestro modelo, cual sera la cantidad de CO2 emitida en 1998 por

    Espana?

    Problema 4

    I.2. Los siguientes datos se refieren al crecimiento de una colonia de bacterias en un medio

    de cultivo:

    x 3 6 9 12 15 18

    y 115000 147000 239000 356000 579000 864000

    siendo x los das desde la inoculacion e y el numero de bacterias.

    1. Representar y en funcion de x para verificar que es razonable ajustar una curva

    exponencial.

    2. Ajustar una curva exponencial a los datos.

    3. Estimar, usando el modelo ajustado en el apartado anterior, el numero de

    bacterias al termino de 20 das.

  • Mnimos cuadrados 3

    Problema 6

    I.2- La comision de comercio federal americana midio el numero de miligramos de tar (X)

    y monoxido de carbono (C0) (Y ) por cigarrillo en las distintas marcas comerciales

    disponibles. Se tomo una muestra de 12 marcas, obteniendo para cada una:

    X 9 4 14 12 10 5 3 17 6 7 8 15

    Y 6 6 14 12 12 7 4 18 8 8 13 13

    a) Calcula el porcentaje de marcas con un nivel de C0 inferior a 8. Calcula los

    cuartiles de la distribucion de X.

    b) Ajusta una recta de regresion de Y sobre X y discute la bondad del ajuste.

    (Ayuda:

    x = 110;

    y = 121;

    xy = 1294

    x2 = 1234;

    y2 = 1411)

    Problema 5

    I.2.- En un estudio sobre la rapidez de combustion del grafito artificial en un flujo de aire

    humedo, se llevo a cabo un experimento para investigar la difusividad del Oxgeno

    a traves de una mezcla de vapor de agua. Para ello se prepararon muestras de

    Nitrogeno y Oxgeno con una fraccion molar de agua de 0.017 a 9 temperaturas

    distintas, midiendose la difusividad del Oxgeno en cada una, obteniendose:

    Temperatura 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8

    DifusividadO2 1.69 1.99 2.31 2.65 3.01 3.39 3.79 4.21 4.64

    (a) Realice el diagrama de dispersion correspondiente. Es posible el ajuste de

    un modelo de regresion lineal simple, que relacione la difusividad del O2 en

    funcion de la temperatura? Como debe salir el coeficiente de correlacion?

    (positivo, negativo, cerca de 0?).

    (b) En caso afirmativo, obtener la correspondiente recta de regresion utilizando la

    tecnica de los mnimos cuadrados.

    (c) Hallar el coeficiente de determinacion r2 e interpretar su valor.

    (d) Cual sera la prediccion sobre la difusividad del O2, para una temperatura de

    3o a partir del modelo construido?.

  • 4 Mnimos cuadrados

    I.3.- Con el fin de determinar si existe relacion entre la cantidad de polmeros de latex

    incluida durante el proceso de mezclado de cemento Portland y su resistencia adhe-

    siva a tension, una empresa encargada de realizar certificaciones de obras toma una

    muestra de tamano 10, obteniendo los siguientes resultados:

    Polmeros latex (mgr/kg) 13.5 11.0 13.0 11.2 12.0 13.2 12.0 13.5 11.2 13.0

    Resistencia (kgf/cm2) 17.5 16.6 17.2 16.6 17.0 17.3 16.9 17.3 16.8 17.1

    (a) Calcular la media y varianza asociada a cada una de las variables.

    (b) Calcular la covarianza existente entre ambas variables as como el coeficiente

    de correlacion.

    (c) Realizar un ajuste por mnimos cuadrados de la resistencia respeto a la cantidad

    de polmeros anadida en la mezcla.

    (d) Deducir, suponiendo que la relacion proporcionada por las rectas de regresion

    es valida el valor estimado para la resistencia si la cantidad de polmero agre-

    gado es de 11.5mgr/kg.

    Problema 6

    El rendimiento de una reaccion qumica depende de la concentracion del reactivo y de

    la temperatura de la operacion.

    Rendimiento Concentracion Temperatura

    81 1.00 150

    89 1.00 180

    83 2.00 150

    91 2.00 180

    79 1.00 150

    87 1.00 180

    84 2.00 150

    90 2.00 180

    En el modelo de regresion del rendimiento sobre la temperatura y la concentracion,

  • Mnimos cuadrados 5

    1. Cual es la matriz x de diseno?

    2. Cuantas dimensiones tiene el espacio en el que podemos representar los datos?

    3. Si la superficie ajustada tiene por ecuacion:

    Rendimiento = 39.75 + 3 concentracion + 0.25 temperatura,

    calcular los valores ajustados y los residuos.

    Problema 7

    Se tabulan los datos de un experimento obteniendo los resultados siguientes:

    Y X1 X2 X3

    3.81 1.00 2.50 15

    8.92 1.00 1.80 18

    8.33 2.00 1.50 15

    9.61 2.00 1.83 18

    Para cada uno de las formulas siguientes, dar la matriz de diseno asociada, determinar

    el numero de dimensiones necesarias para representar los datos y especificar que tipo de

    curva o superficie esta modelada por la formula:

    1. Y = a0 + a1X1 + a2X2 + a3X3

    2. Y = a0 + a1X2 + a3X3

    3. Y = a0 + a1X1 + a2X21 + a3X3

    4. Y = aX2 + b

    5. Y = a0 + a1X1 + a2X21

    6. Y = a1X1 + a3X3