portafolio tercer corte
-
Upload
andres-vergara -
Category
Documents
-
view
13 -
download
1
description
Transcript of portafolio tercer corte
-
Ejercicio 1
Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen
a un lago, se toman medidas de la concentracin de nitrato en el agua. Para
monitorizar la variable se ha utilizado un antiguo mtodo manual. Se idea un
nuevo mtodo automtico. Si se pone de manifiesto una alta correlacin
positiva entre las medidas tomadas empleando los dos mtodos, entonces se
har uso habitual del mtodo automtico. Los datos obtenidos son los
siguientes:
Manual = X 25 40 120 75 150 300 270 400 450 57
5Automtico = Y 30 80 150 80 200 350 240 320 470 58
3
Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es
apropiado, hallar la recta de regresin de Y sobre X y utilizarla para predecir la
lectura que se obtendra empleando la tcnica automtica con una muestra de
agua cuya lectura manual es de 100. Realizar el ejercicio en R
SOLUCION
Manual = X Automtico =YX2 XY
25 30 625 75040 80 1600 3200
120 150 14400 1800075 80 5625 6000
150 200 22500 30000300 350 90000 105000270 240 72900 64800400 320 160000 128000450 470 202500 211500575 583 330625 3352252405 2503 900775 902475
-
> datos=read.table("agua.txt", header=T)> attach(datos)> datos
x y1 25 302 40 803 120 1504 75 805 150 2006 300 3507 270 2408 400 3209 450 47010 575 583
> regresion regresin
Call:lm(formula = y ~ x, data = datos)
Coefficients:(Intercept) x 26.1150 0.9322
> summary(regresion) Call:lm(formula = y ~ x, data = datos)
Residuals: Min 1Q Median 3Q Max -78.98 -18.57 14.31 23.53 44.24
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 26.11496 21.20188 1.232 0.253 x 0.93216 0.07064 13.195 1.04e-06 ***---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 40.11 on 8 degrees of freedomMultiple R-squared: 0.9561, Adjusted R-squared: 0.9506 F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e-06
Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso del modelo lineal para el problema
bnXmY
Y=0.9(100)+26.11=116.11
-
Ejercicio 2
Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados de
diversos tamaos.
a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?.
Represente esta variable mediante la letra N
b. Cunto mide el lado de cada cuadrado?. Represente esta variable
mediante la letra L
c. Coleccione su informacin en una tabla de datos.
d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.
Represente las parejas (L,N) en un plano cartesiano
e. Qu clase de curva obtiene?
Solucin
-
N L N2
NL
1 1 1 14 2 16 89 3 81 27
25 5 625 12536 6 1296 21675 17 2019 377
> cuadrititos=read.table("cuadras.txt",header=T)> attach(cuadrititos)> cuadrititos
N L1 1 12 4 23 9 34 25 55 36 6
> regresion summary(regresion)
Call:lm(formula = L ~ N, data = cuadrititos)
Residuals: 1 2 3 4 5 -0.4895 0.1011 0.4188 0.2353 -0.2658
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.35302 0.28808 4.697 0.01826 * N 0.13647 0.01434 9.519 0.00246 **---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.4287 on 3 degrees of freedomMultiple R-squared: 0.968, Adjusted R-squared: 0.9573 F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459
> plot(cuadrititos)> abline(lm(L~N))
Ejercicio 3
A partir de las siguientes observaciones para 5 aos de las variables X e Y,
ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:
-
Y: produccin nacional de un subsector industrial, en millones de toneladas.
X: tiempo
Ejercicio 4
Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34
kilogramos respectivamente, entonces una nia de 12 aos pesara
aproximadamente:
A. 45
B. 55
C. 15
D. 51
E. 61
Ejercicio 5
En el anlisis de Regresin lineal se puede afirmar todo lo siguiente excepto:
A. Ajusta los datos a una lnea recta
B. Predice valores de una variable si se conoce el valor de la otra
C. Establece una relacin cuantitativa entre dos variables relacionadas
D. El mtodo grfico para determinar la relacin entre dos variables es ms
concreto que el mtodo matemtico o de mnimos cuadrados
E. Una relacin lineal entre dos variables queda representada por una lnea
recta llamada ecuacin de regresin
Ao X Y1995
1996
1997
1998
1999
1
2
3
4
5
1,25
5
11,25
20
30,5
-
Ejercicio 6
Dado Los siguientes datos expuestos en la tabla
La frmula de regresin para los datos propuestos est dada por:
A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2
D. y = 14,4x + 47 E. y = 14x + 48,8
Ejercicio 7
El Grafico para los puntos dispersos est dado por:
Rta:
Ejercicio 8
El diagrama de dispersin para la regresin lineal esta dado por
A B
C
D
Edad 1 2 3 4 5 Estatura 60 80 100 110 112
-
Rta:
Ejercicio 9
Los siguientes datos corresponden a 100 salarios tomados en una encuesta
aplicada a 380 habitantes de Villavicencio. Determinar en R el grado de
asimetra de los datos. establecer una conclusin.
289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000
289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000
289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000
289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000
310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000
310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000
310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000
320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000
320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000
320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000
-
>salarios=c(289000,350000,886900,310000,650000,96120
0,320000,756000,1200000,345000,289000,350000,88900
0,320000,665500,965000,320000,756000,1300000,32000
0,289000,350000,890000,320000,689500,996000,320000
,759600,1700100,750000,289000,566700,896500,320000
,689500,999000,340000,759600,1700100,1120000,31000
0,566700,900000,320000,690000,1000000,340000,78900
0,1700100,345000,310000,566700,936200,320000,69000
0,1025000,340000,789000,1700100,863000,310000,6000
00,942500,320000,699000,1025000,340000,800000,1700
100,886000,320000,700000,1096000,320000,699000,106
3000,340000,800000,1700100,345000,320000,700000,11
16300,345000,859600,1777000,340000,800000,1700100,
850000,320000,750000,1120000,345000,862300,180000
0,345000,800000,1700100,1750000)
> par(mfrow=c(1,2))
> f=table(salarios)
> dd barplot(f)
> plot(dd,add=T)> summary(salarios) Min. 1st Qu. Median Mean 3rd Qu. Max.
289000 340000 700000 750900 947200 1800000
Esta es una asimetra positiva ya que x>Me
Ejercicio 10
En una distribucin asimtrica negativa:
A. La moda se encuentra entre la media y la medianaB. La moda est ubicada a la derecha de la mediaC. La media es menor que la desviacin tpicaD. La media es menor que la medianaE. La moda y la mediana son iguales
Ejercicio 11
-
Los momentos de segundo orden con respecto a la media de dos
distribuciones son 9 y 16, mientras que los momentos de tercer orden son 8.1 y
12. 8 respectivamente. La distribucin ms asimtrica es:
A. La primera porque tiene mayor grado de deformacin B. La primera porque tiene menor grado de deformacin C. La segunda porque tiene mayor grado de deformacin D. La segunda porque tiene menor grado de deformacin
Ejercicio 12Uno de los siguientes enunciados es verdadero
A. La media en una muestra de datos agrupados la divide en dos partes.B. Una distribucin de datos permite calcular todas las medidas de
tendencia centralC. La moda es un dato que permite analizar un resultado esperadoD. Una medida de dispersin est libre del clculo de la media.
Ejercicio 13
En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto
A. Ajusta todos los datos a una lnea rectaB. Predice el valor de una variable si se conoce el valor de la otraC. Establece una relacin cuantitativa entre dos variablesD. El mtodo grafico es ms concreto que el mtodo matemticoE. Una relacin lineal de datos queda representada por una recta.
Ejercicio 14
Dado que el grado de asimetra de una distribucin es de 2,27, la media es de
189,87 y la mediana 189,16, entonces la varianza toma un valor
correspondiente a:
-
A. 0.93B. 0.88C. 0.78D. 1.88E. 1.78
Ejercicio 15
Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo
que su media es igual a 3 y que la diferencia entre la media y la mediana es
igual a -2
A. 2.9B. 0.9C. 19D. 9E. 1/9
Ejercicio 16
En la siguiente distribucin de datos el coeficiente de asimetra segn el coeficiente de Pearson es:
Xi 1 2 3 4 5 6f 2 8 3 5 7 5
A. B. 2C. 1/3D. 3E. 1
Ejercicio 17
Retome los 100 datos y elabore una tabla en R para determinar el coeficiente
de Gini. Utilice la librera ineq, y compare los resultados. Establezca
conclusiones
289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000
289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000
289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000
289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000
310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000
-
310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000
310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000
320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000
320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000
320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000
> library(ineq)>salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,320000,665500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759600,1700100,750000,289000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,566700,900000,320000,690000,1000000,340000,789000,1700100,345000,310000,566700,936200,320000,690000,1025000,340000,789000,1700100,863000,310000,600000,942500,320000,699000,1025000,340000,800000,1700100,886000,320000,700000,1096000,320000,699000,1063000,340000,800000,1700100,345000,320000,700000,1116300,345000,859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,345000,862300,1800000,345000,800000,1700100,1750000)> g=ineq(salarios,type="Gini")> g
[1] 0.3122976
> plot(Lc(salarios),col="darkred",lwd=2)
AB
C D