ESTADÍSTICA Y ECONOMETRÍA PARA AVALUADORES Por Jorge Iván Duque Botero Economista Avaluador -...
-
Upload
manuel-farias-villanueva -
Category
Documents
-
view
220 -
download
2
Transcript of ESTADÍSTICA Y ECONOMETRÍA PARA AVALUADORES Por Jorge Iván Duque Botero Economista Avaluador -...
ESTADÍSTICA Y ECONOMETRÍA
PARA AVALUADORESPor Jorge Iván Duque Botero
EconomistaAvaluador - Docente
ESTADÍSTICA
La estadística es la ciencia que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional.
FÓRMULAS ESTADÍSTICAS1. Media Aritmética (): O promedio; es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos. Es una de medida de centralización.
=Ejemplo: ¿Cual es el promedio de 8, 3, 5, 12 y 10?
=(8+3+5+12+10)/5= 7,6
2. Desviación estándar: Es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto al promedio (media). Es la raíz cuadrada de la varianza; ¿Qué es la varianza? Es la media o promedio de las diferencias con la media elevadas al cuadrado.
poblacional, muestralEjemplo: Calcular la media, la varianza y la desviación estándar. De los siguientes datos: 600, 470, 170, 430 y 300.
Diferencias: (600-394), (470-394), (170-394), (430-394), (300-394)= 206, 76, -224, 36, -94. Para calcular la varianza, tomar cada diferencia, elevarla al cuadrado, y hacer el promedio: S2= [(206)2+(76)2+(-224)2+(36)2+(94)2]/5 S2 =108520/5= 21704 S=√21704= 147,32
3. Coeficiente de variación: Es una medida dispersión que mide la variabilidad en porcentaje de un conjunto de datos. Se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa generalmente en términos porcentuales. Cuando el coeficiente de variación está entre + o – 7,5%, la media obtenida se podrá adoptar como el más probable valor asignable al bien. Cuando queramos separarnos del valor medio encontrado, se debe calcular el SESGO, para establecer hacia donde tiende a desplazarse la información, pero no podrá sobrepasar el porcentaje encontrado en las medidas de dispersión.
V*100Ejemplo: Tomando los datos del ejercicio anterior hallar la el coeficiente de variación:V= (147,32/ 394)*100= 37,39%
4. Coeficiente de asimetría o SESGO: ASIMETRÍA Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución.
= cuando no hay moda (Coef de Pearson)
En caso que el avaluador desee separarse del valor medio encontrado, deberá calcular el coeficiente de asimetría para establecer hacía donde tiende a desplazarse la información, pero no podrá sobrepasar el porcentaje encontrado en las medidas de dispersión.
Ejemplo:
Halla el coeficiente de simetría de los siguientes datos: 15, 21, 32, 59, 60, 60,61, 64, 71, 80.= (15+21+32+59+60+60+61+64+71+80)/10= 52,3
= =
S= 4276,1/10= 427,61= 20,67
A= (52,3 – 60)/20,67= -0,3725
Coeficiente de curtosis: El coeficiente de curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Miden la mayor o menor concentración de datos alrededor de la media. Fórmula para datos no agrupados :
Ejemplo: Calcular el coeficiente de curtosis de los siguientes datos:
K= = 4,6725 – 3,7692= 0,9033
Si k=0 la distribución es mesocúrtica o normalSi k›0 la distribución es leptocúrtica o apuntadaSi k‹0 la distribución es platicúrtica o achatada
1 2 3 4 5 6 7 8 9 10 11 12 13 14 154 5 5 6 6 6 7 7 7 7 8 8 8 9 11
K=
DISTRIBUCION DE PROBABILIDAD La asignación de probabilidades se puede hacer de dos maneras: En forma objetiva, cuyo método consiste en calcular la probabilidad mediante estadísticas, por ejemplo si el experimento consiste en lanzar al aire una moneda 10 veces y supongamos que al caer mostró cara 6 veces y en las otras 4 mostró sello, entonces la probabilidad de obtener una cara en el próximo lanzamiento será de 6/10 lo que equivale a decir que hay una probabilidad de obtener una cara en el próximo lanzamiento del 60%; y la segunda, en forma subjetiva, en el cual no hay estadísticas porque no se realizaron experimentos previos o porque el número de experimentos es insuficiente para elaborar una estadística, bajo estas circunstancias, se les solicita a varias personas que tengan un sano criterio y además sean expertas en la materia para que den su concepto sobre el posible resultado futuro de un determinado evento. Cuando vamos a tomar una decisión sobre inversión de dineros, vamos a pronosticar el futuro y este pronóstico puede hacerse en muchas formas por ejemplo tomando como base la economía del medio, en tales circunstancias, la estimación podría ser hecha en diferentes condiciones como depresión, recesión, normales, buenas y prosperas, también podría haberse hecho en una forma más sencilla tomando como base el criterio, el cual puede ser optimista, realista o pesimista.
La probabilidad de los ingresos futuros de un proyecto es posible asignarlos en forma objetiva cuando se trata de proyectos de inversión en activos financieros, aunque hay que tener en cuenta que las estadísticas fueron hechas con unas condiciones financieras y técnicas diferentes a las que se presentarán cuando se efectúe el nuevo experimento. Cuando se trata de proyectos de ingeniería en casi todos los casos la asignación de probabilidades debe hacerse en forma subjetiva por expertos en la materia, como puede ser el caso de los ingresos que se obtendrán en una máquina prototipo (única máquina en su género en el mundo).Cuando evaluamos un proyecto asignando probabilidades en forma objetiva decimos que hacemos la evaluación en condiciones de riesgo, pero si la asignación de probabilidades se realiza en forma subjetiva se dice que la evaluación se hace en condiciones de incertidumbre.
DESVIACION ESTANDAR RESPECTO A PROBABILIDAD
Cuando los expertos no coinciden en la predicción, debemos trabajar con el Valor Esperado (valor promedio probabilístico).Si la predicción de los expertos coincidiera o al menos sus variaciones fueran mínimas tendríamos confianza en el resultado de las predicciones, pero mientras más alejados están los resultados, tendremos menos confianza en éstas predicciones. En estas condiciones parece ser que la medida más adecuada de la confianza podría ser la desviación estándar.Según la estadística existe una probabilidad del 68.27% de encontrar un resultado que esté entre la media aritmética más una desviación estándar y el medio aritmético menos una desviación estándar, que existe una probabilidad del 95.44% de hallar un resultado dentro del margen comprendido entre la media aritmética y más o menos dos desviaciones estándar y que la probabilidad llega al 99.74% si se amplía el margen a tres desviaciones estándar a cada lado del medio aritmético como se puede apreciar en la gráfica:
Desviación media: es la media aritmética de los valores absolutos de las desviaciones respecto a la media;está íntimamente ligado al grado de simetría, se puede determinar en forma analítica, la simetría o no de la curva.
D=
Para que un "Diagrama de Dispersión", se le considere simétrico, debe cumplir que por lo menos el 57,5% de la data está comprendida debajo de la campana conformada por intervalo que comienza en -D y finaliza en +D, es decir |±D|≥ 57,5%
DESVIACION ESTANDAR RESPECTO A LA CURVA NORMAL: La Desviación Estándar, indica sí una distribución simétrica es normal o no.Esto es importante de conocer, porque si la distribución es "Normal", se podrán calcular cuales son los valores de la serie que se encuentran fuera de la campana.Los valores que se encuentran fuera de la campana (o debajo de las colas), se consideran "VALORES EXTREMOS" y se definirán como aquellos valores que afectan notablemente a la "Media Aritmética". Se define como "Valores Extremos", aquellos datos de la serie que se encuentran fuera del intervalo: |±S|≥68,27%
Para que un "Diagrama de Dispersión", sea considerado como una "Distribución Normal", se deben cumplir las siguientes condiciones:a) Simetría de los datos: |±D|≥ 57,5%
b) Que por lo menos el 68,27% de los datos esté incluida en el intervalo: |±S|≥68,27%Ejemplos:Para datos no agrupados: muestras ≤ 30• Se tienen las siguientes muestras: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
250 400 700 375 280 200 485 430 375 230 130 680 475 455 430 300 250 90 375
D=
D=
D= 124,2
a) |±D|≥ 57,5%
|363,68 ± 124,2|= Lim inf 240 Lim sup 488
n xi |xi-|1 250 113,68421052 400 36,315789473 700 336,31578954 375 11,315789475 280 83,684210536 200 163,68421057 485 121,31578958 430 66,315789479 375 11,3157894710 230 133,684210511 130 233,684210512 680 316,315789513 475 111,315789514 455 91,3157894715 430 66,3157894716 300 63,6842105317 250 113,684210518 90 273,684210519 375 11,31578947
∑= 2358,94
13/19=68%68%>57,5%
n xi1 902 1303 2004 2305 250 16 250 27 280 38 300 49 375 510 375 611 375 712 400 813 430 914 430 1015 455 1116 475 1217 485 1318 68019 700
b)|±S|≥ 68,27%|363,68±161,62|=Lim inf 202 Lim sup 52514/19=74%74%>68,27%
n xi
1 90
2 130
3 200
4 230 1
5 250 2
6 250 3
7 280 4
8 300 5
9 375 6
10 375 7
11 375 8
12 400 9
13 430 10
14 430 11
15 455 12
16 475 13
17 485 14
18 680
19 700
VALORES EXTREMOS
VALORES EXTREMOS
SERIE DEPURADA
1 230
2 2503 2504 2805 3006 3757 3758 3759 40010 43011 43012 45513 47514 485
HistogramasEs una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, ya sea en forma diferencial o acumulada. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o la muestra, respecto a una característica, cuantitativa y continua, de la misma y que es de interés para el observador.Diagramas de barras simplesRepresenta la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.Diagramas de barras compuestaSe usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.Diagramas de barras agrupadasSe usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.Polígono de frecuenciasEs un gráfico de líneas que de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.Ojiva porcentualEs un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
Ejemplo: hacer un histograma con los datos del ejercicio anterior. Para iniciar debemos hacer una tabla con la distribución de frecuencias:
Nos paramos en cualquier celda y le damos click a la pestaña insertar – columna – columna en 2D – columna agrupada.
xi fi4 15 26 37 48 39 110 011 1
Luego damos click contrario en el gráfico y le damos SELECCIONAR DATOS y nos aparece los casillas para seleccionar los datos a graficar.
Nombramos la serie: Frecuencia y seleccionamos los dato de la tabla.
Editamos la etiquetas del eje horizontal:
Damos click en cualquiera de las barras del gráfico y en opciones de serie llevamos ANCHO DEL INTERVALO a sin intervalo. Luego en la parte izquierda buscamos RELLENO y seleccionamos la casilla de VARIAR COLORES ENTRE LOS PUNTOS. Fin.
Nuestro histograma queda:
Ecuaciones para ajustes
1. Recta o función lineal:Forma funcional :
Y= a+bX ó Yi= +Xi
Desarrollo en Excel: Antes de empezar debemos configurar nuestra hoja de cálculo de la siguiente manera: Archivo – Opciones – Complementos – Ir – Seleccionar Herramientas para análisis – Aceptar.
Para realizar la regresión se utiliza el método de mínimo cuadrados ordinarios (MCO).Ejemplo: La siguiente tabla de datos contiene el consumo de tazas de café por día (Y) y el precio por taza en E.E.U.U de 1970 a 1980.
AÑO 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980
Y 2,57 2,5 2,35 2,3 2,25 2,2 2,11 1,94 1,97 2,06 2,02
X 0,77 0,74 0,72 0,73 0,76 0,75 1,08 1,81 1,39 1,2 1,17
Realizamos la siguiente secuencia en Excel:- Datos – Análisis de datos – Regresión – Aceptar.
Quedando entonces el modelo de la siguiente manera:
i= 2,6911 – 0,4795Xi
Interpretación: Si se incrementa el precio del café (en promedio), su
consumo disminuye (0,47 0,5) casi media taza al día.
2. Función cuadrática o parábola de segundo grado: Forma funcional:
Y= a+bX+cX2 ó i= 0+ 1Xi+ 2Xi2
Ejemplo: La siguiente tabla muestra la producción de un bien (X) y su costo total (Y) de producción total:
Y 3910 3680 2990 2070 2070 1380 1610 1380 1725 1495 2070 1840 2530 2990 4025
X 200 240 300 400 500 540 600 640 700 800 900 1000 1040 1100 1200
A diferencia de la función de primer grado o lineal en ésta tenemos un tercer término, que se encuentra elevado al cuadrado. Para su desarrollo en Excel debemos crear una nueva columna como lo indica su forma función para realizar la regresión a través de MCO.
Quedando entonces el modelo de la siguiente manera:
Yi= 6322,0234 – 13,9725Xi + 0,00995Xi2
Los costos caen hasta cierto (un mínimo) punto, cuando la producción aumenta, pero a partir de ese mínimo existe un incremento progresivo por cada unidad adicional.
3. Función potencial: Forma funcional:
Y=AXb ó i= 1Xi2
Lo primero que hay que hacer es linealizar el modelo aplicando las propiedades de los logaritmos naturales:
lni= ln1+lnXi
Ejemplo: La presión P y el volumen V de determinado tipo de gas están determinados por la ecuación: PV-b= a linealizando el modelo: ln(P)= ln(a)+bln(V)
Y X X^2 Y^2 X^2 X*Y Y (V) X (P) LNY LNX X2 LNY2 LNX2 LNY*LNX
1 0,5 1,65 -0,69314718 0,50077529 0,2507759 0,48045301 0,25077589 -0,347110982 1 1,03 0 0,0295588 0,0008737 0 0,00087372 03 1,5 0,74 0,40546511 -0,30110509 0,0906643 0,16440195 0,09066428 -0,122087614 2 0,61 0,69314718 -0,49429632 0,2443289 0,48045301 0,24432885 -0,34262015 2,5 0,53 0,91629073 -0,63487827 0,4030704 0,83958871 0,40307042 -0,581733086 3 0,45 1,09861229 -0,7985077 0,6376145 1,20694896 0,63761454 -0,87725037
SUMATORIAS 2,4204 -1,698 1,6273 3,1718 1,6273 -2,271
El modelo lineal queda de la siguiente forma:Yi= 0,0119 – 1,383Xi
Para ajustarlo a la forma funcional debemos de aplicar anti.ln al intercepto:
Quedando ahora: P= 1,01197*V-1,383
4. Función exponencial: Forma funcional:
Y=ABx ó Yi= e
Lo primero que hay que hacer es linealizar el modelo aplicando las propiedades de los logaritmos naturales:
lni= ln0+lnXi
Ejemplo: la siguiente tabla muestra los precios de venta (Y) de un modelo de automóviles usados durante (X) años: X 1 2 2 3 5 5
Y 6350 5695 5750 5395 4985 4895
Para desarrollar el modelo por MCO creamos una nueva columna con el ln(Y) posteriormente hacemos la regresión de ln(y) y X.
Ahora para llegar a la forma funcional tomamos la constante e= 2,71828182845904 elevado al intercepto hallado. β0=2,71828,7813= 6511,3815
Y= 6511,3815*e-0,05688*x