2006.2 - Pauta (2)zsda

download 2006.2 - Pauta (2)zsda

of 9

Transcript of 2006.2 - Pauta (2)zsda

  • 8/18/2019 2006.2 - Pauta (2)zsda

    1/9

    ICN 312 - ECONOMETRÍASantiago / Certamen 1 / 01 septiembre 2006

    Prof. Pedro Fernández de la Reguera

    INDICACIONES

    1. Escriba su nombre en cada una de las hojas de respuesta, quese encuentran al final de este certamen

    2.  Use los papeles por ambos lados. Debe entregar todas las hojas, inclusolas preguntas y corcheteadas.

    3.  Puede usar una calculadora sencilla y tablas estadísticas de lasdistribuciones normal, t y F sin otra escritura que su nombre.

    4.  No puede usar teléfonos celulares, "palms", calculadoras gráficas o conprogramas estilo Excel. En general, nada capaz de guardar texto.

    5.  REVISE LA PRUEBA ANTES DE COMENZAR A RESPONDER.

    6.  La prueba consta de 13 preguntas. Todas valen 10 puntos c/u, excepto:P1 (20 puntos); P6 (20); P7 (40); P8 (20) y P9 (20).

    7.  Nota del certamen = (suma de puntos) * 100 / 160.

    8.  La prueba está pensada para una duración de 150 minutos. (Primeraparte, 100 minutos; segunda parte, 50 minutos).

  • 8/18/2019 2006.2 - Pauta (2)zsda

    2/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 2

    1.  (20 puntos). En un cierto mercado se supone que el precio unitario de las ventas

    de cierto artículo interactúa con los costos. Si V son las ventas en la fecha t, P el precio unitario del artículo y C el costo unitario de producción, interprete loscoeficientes del modelo

    (ln V)t  = βo + β1 (ln P) t  + β2 P*C t + β3 C t + ε t 

    βo es el intercepto; β1 es la elasticidad de las V respecto al P; β2 es lavariación relativa (por ej., %) de las ventas cuando la interacción entre Py Cvaría en 1 punto; β3 es la variación relativa (por ej., %) de las ventas cuandolos costos varían en 1 punto.

    2.  Griliches estudió la demanda de tractores agrícolas en USA, para los períodos1935 – 1941 y 1948 – 1957. Consideró un modelo log-log donde Y es el valoren $ del inventario nacional de tractores al 1 de enero de cada año; X1 es el

     precio pagado por los tractores el año anterior y X2 las tasas de interés para loscréditos agrícolas, también del año anterior. Considerando la falta de datosdurante el período de la segunda guerra mundial (1942-1947), formule elmodelo econométrico (muestral) correspondiente.

    Primera respuesta posible: Sea D una variable auxiliar

    discriminante, que toma el valor 1 si se trata del período 1935 – 1941 y cero encaso contrario. Entonces, el modelo es:

    (Log Y) t = βo + β1 (log X1) t-1 + β2 (log X2) t-1 + β3 D t + ε t 

    t = 1935(1)1941; 1948(1)1957

    Segunda respuesta posible: Sea D1 una variable auxiliardiscriminante para el primer período y D2 otra, para el segundo período.Ambas toman el valor 1 si se trata del período y cero en caso contrario.

    Entonces, el modelo es:

    (Log Y) t = β1 (log X1) t-1 + β2 (log X2) t-1 + β3 D1 t + β4 D2 t + ε t 

    t = 1935(1)1941; 1948(1)1957

    3.  Se tiene una variable Y y dos variables X, X1 y X2. Se toma una muestra devalores y se estiman las regresiones lineales simples Y = βo + β1 X1 e Y = αo +

  • 8/18/2019 2006.2 - Pauta (2)zsda

    3/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 3

    α1 X2. Para comparar las regresiones, ¿usaría los R 2 de las regresiones o los R 2 ajustados?, ¿por qué?.

    Cualquiera, pues los coeficientes de ajuste para los R 2 son los mismos (ambosmodelos tienen los mismos grados de libertad y la misma muestra)

    4.  Planteado el modelo muestral Yi = βo + β1X1i + β2X2i + β3X3i + εi , se lo estima por MCO obteniendo el modelo estimado Ŷ i  = bo + b1X1i  + b2X2i  + b3X3i.Dados valores X1 = -4, X2 = 0 y X3 = 6 se obtiene una Ŷ   = 123,45 ¿Quérepresenta este valor?

    Ŷ  representa una de dos cosas: Primero, el promedio poblacional estimado

    de Y dado el escenario (X1 = -4, X2 = 0, X3 = 6). Luego, el valor específico estimado de Y correspondiente al escenario (X1 = -4, X2 = 0, X3 = 6).

    5.  Elija un caso: Formule las hipótesis y desarrolle la dócima F parcialcorrespondiente, para un solo caso, si tiene los resultados de una muestra de 54objetos, en la tabla siguiente.

    Modelo SCR SCE SCT, c

    X1,X2  460.785,73 658.145,77 1.118.931,50X3 X4  689.519,62 429.411,88 1.118.931,50

    X1,X2,X3,X4  936.264,54 182.666,96 1.118.931,50

    Ho: β1 = β2 = 0 Ha: uno o ambos β difieren de cero α = 5%

    E = { [ SCR(1,2,3,4) – SCR(3,4) ] / 2 } / { CME(1,2,3,4)}= { [ 936.264,54 – 689.519,62 ] / 2 } / { 182.666,96 / 49}= 123.372,46 / 3.727,90 = 33,094

    F tablas = 3,187

    Como E > f, se rechaza Ho. para decidir que, o β1 ≠ 0; o β2 ≠ 0 o ambos, β1y β2 son distintos de cero.

  • 8/18/2019 2006.2 - Pauta (2)zsda

    4/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 4

    6.  Se trata de analizar la relación entre dos variables, X e Y, para lo que se

     proponen los siguientes dos modelos:Yt = α  + β Xt  + εt  (1)

    Xt = γ  + δ Yt  + ηt  (2)

    a)  Sabiendo que el coeficiente de determinación de la regresión (1) es 0,98,calcule el coeficiente de determinación en la regresión (2).

    Como R2 es el cuadrado de la correlación entre X e Y, el R2 del modelo (2)es el mismo del modelo (1); es decir, 0,98.

     b)  Demuestre que β = 1/δ sólo si R 2 = 1.

     β ̂  =∑

    ∑−

    −−

    i

    i

     x Xi

     yYi x Xi

    2)(

    ))((; δ ̂  =

    ∑∑

    −−

    i

    i

     yYi

     yYi x Xi

    2)(

    ))(( 

    R2 = [ Coor( Y, X ) ]2 = βδ 

    Entonces, β = 1/δ equivale a que βδ = 1 y esto, a su vez, equivale a que R2 =1.

    7.  (40 puntos) Una tabla ANOVA tiene estructura siguiente. Señale, indicando lasfórmulas, si procede hacerlo, cuatro indicadores que pueda obtener de la tabla.

    ANOVA gl SC CM F calculada valor-p de F

    Regresión P y´X(X´X)-1 X´y – nY  2 CMR CMR/CME α*

    Error n-p-1 Por diferencia CMETotal, c n-1 y´y – nY  2 

    Algunos indicadores pueden ser:

    a)  Dócima global de βs b)  R2c)  R2 ajustado

  • 8/18/2019 2006.2 - Pauta (2)zsda

    5/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 5

    d)  S2e)  Dócima para βo = 0 usando el factor de corrección nY  2 

    DATOS PARA LAS PREGUNTAS 8 y 9

    Se estudia la eficacia del control de infecciones nosocómicas (enfermedadesvenéreas) en los hospitales. Se quiere determinar si los programas de control y demonitoreo han reducido las tasas de esta infección, adquirida en los hospitales.Datos ficticios. Muestra aleatoria de 54 hospitales.

    Variables son:

    X1 = Puntaje que representa la estadía promedio de los pacientes en el hospitalX2 = Edad media de los pacientes, en añosX3 = Riesgo de infección. Probabilidad promedio estimada de adquirir la

    infección en el hospital (%)X4 = Razón (%) del número de cultivos realizados, con respecto al número de

     pacientes sin signos o síntomas de haber adquirido la infección en el hospital.

    Resultados de la estimación de modelos:

    Modelo SCR SCE CME Cp R2 R2 ajX1  155.274,29 963.657,21 18.531,87 208,5 0,1388 0,1222X2  343.388,20 775.543,30 14.914,29 158,04 0,3069 0,2936X3  376.725,09 742.206,41 14.273,20 149,1 0,3367 0,3239X4  583.808,87 535.122,63 10.290,82 93,55 0,5218 0,5126X1,X2  460.785,73 658.145,77 12.904,82 128,55 0,4118 0,3887X1,X3  618.222,28 500.709,22 9.817,83 86,31 0,5525 0,5350X1,X4  583.947,11 534.984,39 10.489,89 95,51 0,5219 0,5031X2,X3  737.504,60 381.426,90 7.478,96 54,32 0,6591 0,6457X2,X4  690.815,59 428.115,92 8.394,43 66,84 0,6174 0,6024

    X3 X4  689.519,62 429.411,88 8.419,84 67,19 0,6162 0,6012X1,X2,X3  931.546,04 187.385,46 3.747,71 4,27 0,8325 0,8225X1,X2,X4  693.406,79 425.524,72 8.510,49 68,15 0,6197 0,5969X1,X3,X4  721.932,02 396.999,48 7.939,99 60,49 0,6452 0,6239X2,X3,X4  853.000,73 265.930,78 5.318,62 25,34 0,7623 0,7481

    X1,X2,X3,X4  936.264,54 182.666,96 3.727,90 5 0,8367 0,8234

    Se le pide:

  • 8/18/2019 2006.2 - Pauta (2)zsda

    6/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 6

    8.  (20 puntos) Establecer el mejor modelo por el método de todas las regresiones posibles. Debe decidirse por un solo modelo y explicar sus fundamentos para

    elegir ese modelo.Modelo SCR SCE CME Cp R2 aj

    p* pequeño Grande Chico Chico Aprox p* alto

    Los mejores modelos son (1, 2, 3) y (1, 2, 3, 4). Se decide por el (1, 2, 3) por tenermenos variables.

    9.  (20 puntos) Desarrollar una iteración completa del método paso a paso mixto ostepwise, a partir de un modelo con dos variables en él.

    Partir con (X1, X4), por ejemplo.Candidatos a entrar: X2 y X3F de entrada:

    E2 = ( SCR(1,2,4) – SCR(1, 4) ) / CME(1,2,4)= (693.406,79 – 583.947,11) / 8.510,49 = 12,862 

    E3 = ( SCR(1,3,4) – SCR(1, 4) ) / CME(1,3,4)= (721932,02 – 396999,48) / 7939,99 = 40,935

     Ambos distribuyen F(1; 50). F(1; 50; 0,95) = 4,04 Se decide que X3 entra al modelo.

    Candidatos a salir: X1, X3 y X4F de salida:

    E1 = ( SCR(1,3,4) – SCR(3,4) ) / CME(1,3,4)= (721.932,02 – 689519,62) / 7.939,99 = 4,082

    E3 = ( SCR(1,3,4) – SCR(1,4) ) / CME(1,3,4)= (721.932,02 – 583.947,11) / 7.939,99 = 17,378

    E4 = ( SCR(1,3,4) – SCR(1,3) ) / CME(1,3,4)

    = (721.932,02 – 618.222,28) / 7.939,99 = 13,062Todos distribuyen F(1; 50). F(1; 50; 0,95) = 4,04 

    La peor variable es X1. Ésta puede o no ser sacada del modelo. La opción es delinvestigador (estudiante) en este caso. Según la decisión, el modelo final es Y =f(X3, X4) o bien Y = f(X1, X3, X4).

  • 8/18/2019 2006.2 - Pauta (2)zsda

    7/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 7

    DATOS PARA LAS PREGUNTAS 10, 11, 12 y 13

    Planteo:

    Y es la renta disponible per capita en los estados del este de los EE. UU., en milesde dólares, modelada en función del porcentaje de licenciados universitarios en la

     población de 25 años o más, X, en los diferentes estados, así como el efecto de laregión (Norte, Centro, Sur) en la renta disponible.

    Se propone el modelo E[Y | x  ] = βo + β1 X + β2 D1 + β3 D2 donde X e Y sedefinieron arriba y D1 y D2 son variables discriminantes definidas así:

    D1 = 1, si se trata de un estado del Norte; = 0 en caso contrario

    (hay seis estados nortinos)D2 = 1, si se trata de un estado del Centro; = 0 en caso contrario

    (hay tres estados del centro)

    La base son los estados del Sur, definidos por D1 = 0 = D2. que son ocho entotal.

    Resultados:

    Matriz X´X = 17,00 433,40 6,00 3,00433,40 11399,42 163,10 79,00

    6,00 163,10 6,00 0,003,00 79,00 0,00 3,00

    Matriz X´X inv = 1,9635 -0,0769 0,1265 0,0611  -0,0769 0,0032 -0,0105 -0,0078  0,1265 -0,0105 0,3261 0,1505  0,0611 -0,0078 0,1505 0,4772

     Nota: Filas y columnas corresponden a Xo y las tres variables exógenas

    Elementos diagonales de M = H = X(X´X)-1X´ :

     m(1, 1) = 0,3716 m( 7, 7) = 0,3340 m(13, 13) = 0,3113

     m(2, 2) = 0,1678 m( 8, 8) = 0,3789 m(14, 14) = 0,1262

     m(3, 3) = 0,1667 m( 9, 9) = 0,3910 m(15, 15) = 0,1469

     m(4, 4) = 0,2135 m(10, 10) = 0,1295 m(16, 16) = 0,1582

     m(5, 5) = 0,1679 m(11, 11) = 0,3250 m(17, 17) = 0,1314

     m(6, 6) = 0,2238 m(12, 12) = 0,2562 Notación: m(i, i) = m ii 

  • 8/18/2019 2006.2 - Pauta (2)zsda

    8/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 8

    Modelo estimado: iŶ = 8,1573 + 0,5597 Xi  + 0,8761 D1i  + 2,8252 D2i  

    Desv. típica/estándar de β^: 2,728 0,110 1,112 ¿?

     ANOVA g.l. SC CM F calc. Valor-p

    Regr esi ón 3 145, 06716 48, 3557 12, 755 0, 00036Resi duos 13 49, 284997 3, 7912

     Tot al 16 194, 35215

    Preguntas:

    10. Obtener la desviación estándar de β̂ 3.

    De la matriz (X´X)-1 dada, se obtiene (X´X)-144 = 0,4772De la tabla ANOVA, se obtiene S2 = 3,7912Var(b3) = 3,7912*0,4772 = 1,2363 = (1,34505)2 La desviación estándar de β̂ 3 = 1,34505.

    11. Construir la dócima individual habitual para β3  poblacional (hipótesis,desarrollo, conclusiones).

    Ho: β3 = 0, Ha: β3 0; α = 0,05; t* = t(13; 0,975) = 2,16Se tiene:

     bj = 2,825Sj = 1,345E = bj/Sj 2,100Signif = ¿?

    Se decide que el coeficiente de X3 puede o no ser considerado nulo. Es dudoso.

    Respecto al certamen, rechazar o aceptar la Ho también es respuesta válida.

    12. ¿ Hay alguna observación influyente ?; ¿por qué?

    Considerando los apalancamientos m(i,i) dados, valores cercanos a 1 indican unaobservación influyente. Considerando la tabla dada arriba, no hay observacionesinfluyentes.

  • 8/18/2019 2006.2 - Pauta (2)zsda

    9/9

    ICN 312 / Certamen 1 / Santiago / Diurno / 01 septiembre 2006 9

    13. Estime el ingreso promedio, per capita, en miles de dólares, para un estado delcentro que tiene x´ = ( 1, 30,1; 0; 1), usando un intervalo al 95 de confianza.

    Var( Ŷ 8) = S2*( x8´i (X´X)

    -1 x8i ) = 3,7912 *

    1  30,1 0 1 1,9635 -0,0769 0,1265 0,0611 1  -0,0769 0,0032 -0,0105 -0,0078 30,1

      0,1265 -0,0105 0,3261 0,1505 0

      0,0611 -0,0078 0,1505 0,4772 1

     Var( Ŷ 8) = 3,7912 * 0,363192 = 1,3769 = ( 1,1734 )

    2  t* = t(13, 0,975) = 2,16

    Intervalo al 95% de confianza para la media:

    E[ Y | x = (1; 30,1; 0; 1)´ ] = 27,8280 ± 2,16 * 1,1734 = 27,828 ± 2,535

    O sea, 25,293 Y  30,363