INSTITUTO NACIONAL DE ECOLOGÍA DIRECCIÓN GENERAL DE INVESTIGACIÓN SOBRE LA CONTAMINACIÓN URBANA...
-
Upload
maria-soledad-luz-roldan-segura -
Category
Documents
-
view
215 -
download
0
Transcript of INSTITUTO NACIONAL DE ECOLOGÍA DIRECCIÓN GENERAL DE INVESTIGACIÓN SOBRE LA CONTAMINACIÓN URBANA...
INSTITUTO NACIONAL DE ECOLOGÍA
DIRECCIÓN GENERAL DE INVESTIGACIÓN SOBRE LA CONTAMINACIÓN
URBANA REGIONAL Y GLOBAL
DIRECCIÓN DE INVESTIGACIÓN SOBRE LA CALIDAD DE AIRE
Ma. Guadalupe Tzintzun [email protected]
IMECA
Fre
cuen
cia
0
20
40
60
80
100
120
140
160
180
-50 0 50 100 150 200 250 300
TALLER DE “CALIDAD DEL AIRE Y RED DE
MONITOREO AMBIENTAL”
Identificación e implementación de técnicas estadísticas para el análisis de la información de
calidad del aire y estimación de pronósticos
Bógota-Colombia
Métodos Estadísticos para el Análisis de Datos de
Calidad del Aire
Existe más de una técnica estadística para un determinado análisis de la información de Calidad del Aire y en cada técnica se hacen suposiciones que pueden o no ser apropiadas para las circunstancias especificas del problema a resolver.
Análisis exploratorio de los datos
Análisis gráfico de los datos
Características de los datos a través del uso de estadísticas descriptivas
El análisis exploratorio de los datos permite aparte de visualizar la estructuras, comportamientos y relaciones de las variables bajo estudio, verificar su calidad, cantidad y consistencia.
Análisis gráfico de los datos
Una excelente gráfica estadística es aquella que comunica ideas complejas con claridad, precisión y eficiencia. Al
desplegar una gráfica se quiere lo siguiente:
Mostrar los datos
Evitar distorsionar lo que los datos dicen
Presentar un conjunto de datos en un pequeño espacio
Hacer coherente un conjunto de datos grande
Los datos revelen niveles de detalle a simple vista
HistogramaEl histograma es el más común, para dibujarlo se parte de una tabla de frecuencias o distribución de frecuencias en la cual se organizan y distribuyen los posibles valores de una variable.
Frecuencia por hora de los máximos diarios de ozono que exceden 0.11, 0.15 , 0.2, 0.25 y 0.3 ppm
en la ZMVM , 1996-2000
Hora> 0.11 ppm
> 0.15 ppm
> 0.2 ppm> 0.25 ppm
> 0.3 ppm
11 2 0 0 0 012 25 12 1 0 013 124 76 28 4 014 335 280 140 34 215 383 325 172 40 616 264 227 120 21 117 121 103 56 19 118 14 12 8 0 019 1 1 0 0 0
Total 1269 1036 525 118 10
Histograma de los máximos diarios de ozono que exceden 0.11 ppm en la ZMVM
1996-2000
0
50
100
150
200
250
300
350
400
Fre
cu
en
cia
de
Má
xim
os
dia
rio
s >
0.1
1 p
pm
11 12 13 14 15 16 17 18 19
Hora
Gráficas en el tiempoCon este tipo de gráficas es posible visualizar el comportamiento (o patrón) del fenómeno de interés a lo largo del tiempo para determinar algún tipo de tendencia: cíclica, periodica, etc. Comportamiento de las PM10 del 1 al 5 de enero de
1998 en la ZMVM
0
50
100
150
200
250
300
350
µg
/m³
01/01/98 02/01/98 03/01/98 04/01/98 05/01/98
Gráficas de dos escalasSon otro tipo de gráficas en el tiempo, cuya característica principal es visualizar dos variables con diferentes unidades de medición, lo cual permite determinar posibles relaciones en el tiempo entre ellas.
0.000
0.040
0.080
0.120
0.160
0.200
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Hora
Co
nce
ntr
aci
on
es
(pp
m)
0
5
10
15
20
25
Gra
do
s C
en
tíg
rad
os
(°C
)
Ozono Temperatura
Comportamiento del Ozono y la Temperatura el 1 de enero de 1998 en la ZMVM
Gráficas de dispersiónEste tipo de gráficas son utiles para visualizar posibles asociaciones entre dos variables. Es necesario contar con información bivariada. Existen diferentes tipos de asociación, entre los principales se encuentran: asociación lineal directa, lineal inversa, curvilínea directa y curvilínea inversa. Asociación lineal.Este tipo de asociación gráficamente se representa por medio de una línea recta.Asociación curvilínea.Este tipo de asociación gráficamente se representa por medio de una línea curva.Asociación directa.A medida que una de las variables incrementa sus valores, la otra variable también.Asociación inversa.A medida que una de las variables incrementa sus valores, la otra variable decrementa los suyos.
Gráfica de dispersión de contaminantes criterio y variables meteorologicas del 1 de
enero de 1998 en la ZMVM
SO2
PM10
O3
NO2
TMP
RH
DV
CO
Gráficas de Caja
Comparación anual de la máximos diarios de Ozono en las principales ciudades de la República MexicanaZMVM
ZMG
Juárez
Mexicali
ZMM
Tijuana
ZMVT365365362365363365365N =
300
250
200
150
100
50
0
IME
CA
Comparación del máximo diario de Ozono en 1998 de las principales ciudades de la República Méxicana
Con este tipo de gráficas es posible determinar visualmente un resumén de los datos ya que proporciona el rango, el rango intercuantilico, la mediana y las estadísticas de orden de la variable de interés.
Mapas de datos
Con los mapas se despliega un conjunto de datos muy grande
en el espacio, la impresión visual de los datos se conjunta con
los límites geográficos de la zona a la que pertenecen.
Distribución Espacial de Ozono en la ZMVM el día 20 de
Mayo de 1998 hora a hora
Menor concentración de Ozono
01:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
02:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
03:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
04:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
05:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
06:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
07:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
08:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
09:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
10:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
11:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
12:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
13:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
14:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
15:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
16:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
17:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
18:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
19:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
20:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
21:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
22:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
23:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
24:00 hrs.
-20 -10 0 10 20
-20
-10
010
20
TLA
XAL
TACTACLAGLAG
MERMERCECE
NO NE
CUACUAPED
UIZUIZ
CESCESTAXTAX
SESOSO
TAHTPN
PLA
HAN
BJU
CHA
SAG
EACAZC
Estadísticas DescriptivasEn algunas investigaciones se obtienen numerosos datos que deben reducirse para lograr una interpretación adecuada. En estas situaciones la estadística descriptiva es utilizada como un valioso instrumento de análisis para describir y analizar las características de las observaciones y sobre las relaciones que existen con las características de otros conjuntos con los que se compare.
Las estadísticas descriptivas más comunes caen basicamente dentro de tres grupos:
Medidas de tendencia central o localización
Medidas de dispersión
Medidas de la forma de la distribución
Medidas de tendencia central o localización
Con estas medidas podemos ubicar en qué valor se centran las observaciones y las más usuales son:
media aritmética (promedio)
mediana
Moda
cuartiles, deciles, percentiles (cuantiles)
media geométrica
media armónica
Medidas de dispersión
Esta medida indica que tanto se alejan los datos de una medida central especifica, la más común es la media y las más usuales son:
Rango
Rango intercuantilico
Varianza
Desviación estándar
Coeficiente de correlación
Medidas de la forma de la distribución
Para estudiar la forma de la distribución de una variable se necesita disponer de un número de observaciones lo suficientemente grande como para poder deducir la regularidad o forma general del comportamiento de los valores observados. El histograma permite describir la forma de la distribución. De la visualización de este gráfico puede deducirse si los valores observados están o no muy concentrados en pocos valores de la variable, si la concentración se produce en el centro del recorrido de la variable o en uno de los extremos. Dos de estas medidas son:
sesgo
curtósis
Estadísticas descriptivas de las concentraciones (ppm) máximas diarias de ozono de cinco estaciones de
monitoreo* en la ZMVM
1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 20000.188 0.156 0.194 0.224 0.191 0.176 0.183 0.178 0.169 0.161 0.157 0.154 0.150
0.187 0.153 0.193 0.221 0.191 0.178 0.183 0.186 0.173 0.166 0.160 0.162 0.154
0.063 0.050 0.062 0.063 0.064 0.059 0.050 0.058 0.055 0.052 0.054 0.057 0.045
0.042 0.040 0.033 0.051 0.035 0.039 0.058 0.021 0.027 0.036 0.026 0.020 0.034
0.405 0.346 0.403 0.404 0.402 0.370 0.312 0.349 0.323 0.309 0.295 0.311 0.282
0.393 0.309 0.346 0.373 0.395 0.341 0.297 0.311 0.280 0.296 0.285 0.282 0.276
10 0.105 0.095 0.118 0.149 0.104 0.099 0.116 0.098 0.091 0.088 0.086 0.067 0.09
20 0.135 0.120 0.144 0.177 0.138 0.126 0.144 0.132 0.125 0.122 0.113 0.105 0.115
30 0.160 0.133 0.161 0.191 0.161 0.150 0.158 0.157 0.146 0.140 0.130 0.130 0.13
40 0.177 0.144 0.178 0.208 0.178 0.164 0.169 0.170 0.159 0.150 0.147 0.147 0.142
50 0.187 0.153 0.193 0.221 0.191 0.178 0.183 0.186 0.173 0.166 0.160 0.162 0.154
60 0.203 0.162 0.207 0.239 0.207 0.190 0.195 0.197 0.186 0.176 0.172 0.175 0.16270 0.215 0.178 0.221 0.254 0.221 0.206 0.211 0.209 0.200 0.189 0.183 0.188 0.17480 0.242 0.195 0.244 0.279 0.238 0.222 0.226 0.225 0.218 0.204 0.200 0.201 0.18890 0.259 0.217 0.273 0.306 0.268 0.249 0.248 0.246 0.234 0.227 0.230 0.222 0.20795 0.287 0.233 0.301 0.330 0.286 0.269 0.275 0.264 0.254 0.242 0.247 0.234 0.21898 0.333 0.270 0.318 0.349 0.346 0.317 0.282 0.290 0.276 0.262 0.264 0.253 0.237
360 363 364 351 365 365 365 365 366 365 365 365 366
2º Máximo
Percentil
Desviación estándar
Mínimo
Máximo
Año
Total de días con datos
Promedio
Mediana
*Máximo diario de Tlalnepantla (TLA), Xalostoc (XAL), Merced (MER), Pedregal (PED) y Cerro de la Estrella
Tendencia histórica de los máximos diarios de ozono de cinco estaciones de
monitoreo* en la ZMVM
*Máximo diario de Tlalnepantla (TLA), Xalostoc (XAL), Merced (MER), Pedregal (PED) y Cerro de la Estrella
0.000
0.100
0.200
0.300
0.400
0.500
1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Con
cent
raci
ones
(pp
m)
mínimo promedio2ºmáximo máximo
Funciones de distribución(Modelos de Probabilidad)
IMECA
Fre
cuen
cia
0
20
40
60
80
100
120
140
160
180
-50 0 50 100 150 200 250 300
El análisis gráfico y las estadísticas descriptivas muestran
diferentes comportamientos en la forma de la distribución de la
variable. Estas formas pueden lleva a asociaciones
preliminares de la distribución de la variable con algunos
modelos matemáticos, de los que se conocen propiedades
que permiten realizar un análisis más científico del
comportamiento de variable. A este tipo de modelos se les
conoce como funciones de distribución.
Funciones de distribución (Modelos de Probabilidad)
Las funciones de distribución se clasifican en discretas y
continuas, esta clasificación depende de que la variable sea
discreta o continua. Es discreta cuando sólo pueden tomar
algunos valores en un intervalo y no es posible que llegue a
tomar algún valor entre dos números y continua cuando puede
tomar cualquier valor dentro de un intervalo. Por lo que para
asociarle una función de distribución a una variable se debe
considerar el rango de valores que esta puede tomar.
Funciones de distribución discretas
Si x es una variable discreta que puede tomar distintos valores
la función denotada por fx (x) y definida como
j
jjx x xsi 0
n,....1,2,....,j para x xsi xxP(x)f
es llamada la función de densidad de x donde es la
probabilidad de que x tome el valor de . De la función de
densidad discreta de x se puede obtener la función de
distribución de x, como se muestra a continuación
jxxP
jx
xx
jxxj
)(xf(x)F
Funciones de distribución discretas
Una función de densidad discreta satisface los siguientes tres puntos:
a) b) c)
1,2,.....j para 0(x)fx
1,2,...j ,x xpara 0(x)f jx
1(x)fx Donde la suma es sobre todos los valores deLa variable x.
Funciones de distribución discretas
El valor esperado o media ( =E (x)), se define como
jjxjx xvalores los todos para )(xfxE(x)μ
La varianza, la cual es una medida de dispersión con respecto al valor esperado, se define como:
jjx2
xj2x xvalores los todos para )(xf)µ(xVar(x)σ
La desviación estándar, al igual que la varianza mide que tanto se alejan los valores de la variable de la media y se define como :
ijx2
xjx xde valores los todos para )(xf)µ(xσ
Distribución Bernoulli
Considérese un experimento donde el resultado sólo puede tener dos opciones "éxito" o "fracaso", esto es, la variable x puede tomar los valores
X= 1, si se tiene éxitoX = 0, si no se tiene éxito
Ahora bien, sea el experimento es modelado con la función de distribución Bernoulli, cuya expresión matemática esta dada por:
qp10xP y p 1xP
0,1 xpara p)(1-pp)(x;f(x)f x-1xxx
El valor esperado y la varianza para la distribución Bernoulli están dadas por µ = p y 2 = p(1-p)
Distribución Binomial
Cuando el experimento anterior se realiza n veces de manera
independiente, los valores de la variable pueden ser 0,1,2,.....,
n éxitos, esto es hay x resultados con éxito y n-x resultados en
los que no se tiene éxito, y se modela con la función de
distribución Binomial, cuya expresión matemática para la
densidad esta dada por,
n0,1,2,..., xpara p)(1-px
np)n,(x;f(x)f xn-x
xx
Su media y varianza están dadas por µ = np y 2 = np(1-p)
Distribución Poisson
En ciertas aplicaciones en las cuales se modela con la
distribución binomial con frecuencia, el valor de p es pequeño
y el de n grande (mayor que 50).
En estos casos la distribución binomial puede aproximarse con
la función de distribución Poisson cuya expresión matemática
esta dada por:
0>λ
0,1,2,...= xx!
λ)λexp(λ)f(x;f(x)
x
µ = y 2 =
Una aplicación de las distribuciones discretas anteriores a un problema de
Calidad del AireEl número de excedencias a la norma de un determinado contaminante digamos NO2, puede ser tratado como un
proceso Bernoulli, ya que cada valor máximo diario se compara con el valor de la norma para ver si este se rebasa o no, y por tanto se puede aplicar la distribución Binomial.
Para poder aplicar este modelo se supone que las excedencias de NO2 son eventos independientes, dado que al
considerarse los valores máximos diarios, se rompe la relación entre ellos, los 365 días del año pueden suponerse 365 eventos independientes Bernoulli.
Una aplicación de las distribuciones discretas anteriores a un problema de
Calidad del AirePara eventos históricos se sabe que el número de excedencias al año de NO2 es aproximadamente de 3, esto
es, en promedio el número de días que se excede la norma de NO2 es 3. Esto es, el número de excedencias al año se
modela con una distribución Binomial con n =365 y p =3/365, ya que por inferencia estadística es bien conocido que p se
estima con
Al aproximar utilizando la distribución Poisson considerando p pequeño y n grande se tiene que 3 y el modelo queda dado por
0,1,2,...= xx!
3)3exp(3)λ(x;f(x)f
x
xx
n
xp
n
1ii
ˆ
Una aplicación de las distribuciones discretas anteriores a un problema de
Calidad del AireUna vez que se tiene el modelo es válido preguntarnos por la probabilidad de 4 excedencias en el año. Lo anterior es muy fácil de calcular se puede hacer el calculo directo o bien recurrir a tablas.Utilizando notación matemática, la pregunta se traduce a
0.168 4!
3)3exp(3)λf(3;f(3)4xP
4
Esto es, la probabilidad de que haya 4 excedencias de NO2 en
un año es de 0.168. Si nos preguntamos por a lo más 4 excedencias, la probabilidad esta dada por
Una aplicación de las distribuciones discretas anteriores a un problema de
Calidad del Aire
0.815 x!
3)3exp(3)λf(x;F(4)4xP
4
0x
x4
0x
Funciones de distribución continuas
La función de densidad continua fx(x) se representa con una
curva continua tal que el área incluida bajo la curva es 1 esto
es
1(x)f(x)f xx
área =1
Funciones de distribución continuas La densidad fx(x) se obtiene para calcular áreas entre dos
valores.
Si fx(x) es la función de densidad de una variable continua, se
obtiene la función de distribución Fx(x) para un valor de la
variable x como: du(u)f(x)FxxPx
xx
De manera similar
du(u)fdu(u)f1(x)F1xxPx
x
x
xx
Para un rango particular de la variable x, digamos bxa
du(u)f(a)F-(b)FbxaPb
axxx
Funciones de distribución continuas
En el caso de una variable continua el valor esperado y la
varianza de x están dados por:
dx(x)f)μ(x)μ(xEVar(x)σ2x
dx(x)xfE(x)μ
-x
2x
2x
-xx
Distribución Uniforme Continua
Supongamos que x es una variable aleatoria continua que
toma los valores en el intervalo [a,b], donde ambos a y b son
finitos. Si la dese dice que x esta distribuida uniformemente en
el intervalo [a,b] . Si la densidad de x esta dada por
bxa a-b
1b)a,(x;f(x)f xx
se dice que x esta distribuida uniformemente en el intervalo
[a,b]
El valor esperado y la desviación estándar para una variable
que sigue una distribución uniforme están dados por
12a)(b
σ y 2
baμ
22
x
Simulación Monte Carlo
La distribución Uniforme es útil para generar variables
aleatorias continuas con una distribución especifica.
Supongase que X se distribuye bajo una función de
probabilidad conocida. Sabemos que , esto es
U = F(x) sigue una distribución Uniforme [0,1], por lo que la
transformación inversa de F(x), tendrá la
distribución deseada.
1F(x)0
(x)Fx 1
Si la expresión no se puede resolver
analíticamente, es posible obtener algoritmos en la
computadora que la aproxime
(x)Fx 1
Distribución Normal El modelo de distribución normal es el resultado de la suma de
muchas otras variables aleatorias continuas no relacionadas.
Considérese un modelo idealizado en el cual X1, X2, ..., Xn son
variables aleatorias independientes con una distribución
común con media o = 0 y varianza 2 = 1. Utilizando el
Teorema de Limite Central, la variable
nX...XX
Z n21
Z tiende a distribuirse como una normal en el límite cuando n
es grande. La distribución normal estandarizada tiene la
siguiente expresión matemática:
Distribución Normal
Esta función de densidad es simétrica con respecto del cero y
tiene forma acampanada. Su función de distribución
acumulativa esta dada por:
z
2z
exp2π1
(z)f2
z
a 2
z dz2z
exp2π1
(a)F
Esta integral no puede ser evaluada analíticamente, pero
existen tablas para su evaluación.
Distribución Normal
La expresión de la distribución normal no estandarizada alrededor de la media esta dada por la siguiente expresión matemática
μ 0;σ ;x
2σ
μxexp
2π
1(x)f
2
2
2x
Var(x)σ E(x),μ 2xx
Para diferentes valores del valor esperado y la desviación estándar, la curva de distribución normal asume formas distintas, pero siempre del mismo tipo de campana. Variando sólo la media, la curva se desplaza, conservando la misma forma a la derecha ó a la izquierda. Si se varia la desviación estándar la curva se baja aplastándose o se alza haciéndose angosta si se aumenta o disminuye respectivamente.
Distribución Normal
fx(x)fx(x)
Distribución Normal
fx(x)=0.5
=2
=1
fx(x)=0.5
=2
=1
Distribución Lognormal
Una distribución lognormal resulta del producto de muchas variables independientes multiplicadas juntas, es muy utilizada en el análisis de problemas ambientales con el objeto de representar datos positivos de magnitudes pequeñas. Hay tres formas comunes de parametrizar una variable lognormal:
a) promedio aritmético del logaritmo de variables descritas por una distribución normal.b) promedio geométrico de variables no transformadas.c) promedio aritmético de variables no transformadas.
Sus expresiones matemáticas están dadas por:
Lognormal de dos parámetros
μ 0;σ ;x0
2σ
μlog(x)exp
2πx
1)σμ,(x;f(x)f 2
2
2
2xx
Lognormal de tres parámetros
τ μ 0;σ τ;x
2σ
μτ)log(xexp
2ππτ)(x
1τ),σμ,(x;f(x)f 2
2
2
2xx
Distribución Weibull
Una distribución weibull es muy utilizada en el análisis de supervivencia y fallos en el tiempo. Sus expresiones matemáticas están dadas por:
Weibull con dos parámetros
0β 0,α
;x0 αxexpαβxβ)α,(x;f(x)f β1βxx
Weibull con tres parámetros
0α 0,β γ, x;γ
β
γxexp
βγx
βα
γ)β,α,(x;f(x)fα1α
xx
Distribución GammaUna distribución gamma es muy utilizada en los análisis de medio ambiente para caracterizar concentraciones de contaminantes, procesos meteorológicos y en la caracterización de la precipitación. Sus expresiones matemáticas están dadas por:
0α 0,β
;x0 βx-exp x(βαΓ
ββ)α,(x;f(x)f 1α
xx
Gamma con dos parámetros
Gamma con tres parámetros
0α para xexpxαΓ0
1α
0α 0,β γ, x;γ
β
γxexp
βγx
βΓ(α)1
γ)β,α,(x;f(x)f1α
xx
Otras técnicas estadísticas aplicadas en el análisis de datos ambientales
Estadística BayesianaPruebas de hipótesis parametricas y no parametricasSeries de tiempoBondad de ajuste
Técnicas Multivariadas
sprincipale sComponente
clusters de Análisis
enciacorrespond de Análisis
Bibliografía
Wayne R. Ott. Environmental Statistics and data Analisis. Lewis, 1995Edward A. McBean & Frank A. Rovers. Statistical Procedures for Analysis of Environmental Monitoring Data & Risk Assessment. Prentice Hall PTR, 1998A.T. Walden & P. Guttorp. Statistics in the Environmental & Earth Sciences. 1992Richard O. Gilbert. Statistical Methods for Environmental Pollution Monitoring. Van Nostrand Reinhold, 1987Mary Lou Thompson, Joel Reynolds, Lawrence H. Cox, Peter Guttorp, Paul D. Sampsin. A review of statistical methods for the meteorological adjusment of tropospheric ozone. Technical Report Series