Post on 04-Dec-2015
description
Unidad I. Conceptos Básicos y Estadística Descriptiva
ING. CLAUDIO CERRÓN LANDEO
Concepto de Estadística
Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas.
Tem
a 1
. Intro
ducció
n
Concepto de Estadística
Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.
Tem
a 1
. Intro
ducció
n
Esquemáticamente tenemos:
Estadística
RECOLECTARCLASIFICARPRESENTARANALIZAR INTERPRETAR
DATOS
Estos datos son transformados en información, lo que permite una toma más eficiente de decisiones.
PO
BL
CIO
N
A
En Estadística podemos
distinguir básicamente,dos partes:
Estadistica Descriptiva Estadistica Inferencial
División de la Estadística
Áreas que conforman a la Estadística
Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos.
Tem
a 1
. Intro
ducció
n
DESCRIBIRDESCRIBIR
Áreas que conforman a la Estadística
Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas.
Tem
a 1
. Intro
ducció
n
INFERIRINFERIR
Estadística Inferencial
Métodos usados para obtener conclusionesacerca de las caracteristicas de interesde una poblacion en estudio, sobre la base de informacion proveniente de una muestra aleatoria seleccionada de dicha poblacion.Muestra Población
Generalizamos alguna caracteristica de interes de la
poblacion
Áreas de Aplicación de la Estadística
El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee.
Los métodos estadísticos han encontrado aplicación en: Gobierno Negocios Ciencias Sociales Ingeniería Ciencias Física y Naturales Control de Calidad Procesos de Manufactura Muchos otros campos de la actividad intelectual.
Tem
a 1
. Intro
ducció
n
Áreas de Aplicación de la Estadística
Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades de datos numéricos, debido al uso de …
Tem
a 1
. Intro
ducció
n
Conceptos de Población y Muestra
Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.
Tem
a 1
. Intro
ducció
n
Conceptos de Población y Muestra
Se clasifica en dos categorías: Finita: es aquella que incluye una
cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población.
Tem
a 1
. Intro
ducció
n
Conceptos de Población y Muestra
Infinita: es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar.
Tem
a 1
. Intro
ducció
n
Conceptos de Población y Muestra
Muestra: es un conjunto de mediciones u
observaciones tomadas a partir de una población.
es un subconjunto de la población. Tem
a 1
. Intro
ducció
n
Conceptos de Población y Muestra
Muestra aleatoria: se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado. T
em
a 1
. Intro
ducció
n
Es un conjunto mayor de personas, objetos o cosas, cuyo estudio nos interesa o acerca de los cuales se desea información. ¿De qué estamos hablando?
Es el elemento indivisible de la poblacion el cual será analizado y del cual se obtendran los datos.
Es el elemento indivisible de la poblacion el cual será analizado y del cual se obtendranlos datos. ¿De qué estamos hablando?
Subconjunto finito de unidades de análisis (de tamaño “n”) seleccionados de la población en estudio. La muestra debe ser representativa, es decir debe tener, en lo posible, características similares a las de su población.
Subconjunto finito de unidades de análisis (de tamaño “n”) seleccionados de la población en estudio. Debe ser representativa, es decir debe tener, en lo posible, características similares a las de su población. ¿De qué estamos hablando?
Parámetro
Es un número o una medida de resumen que Es un número o una medida de resumen que describe alguna característica de describe alguna característica de toda la toda la poblaciónpoblación y para determinar su valor y para determinar su valor numérico es necesario utilizar la información numérico es necesario utilizar la información de toda la población, y por lo tanto las de toda la población, y por lo tanto las decisiones se toman con certidumbre total.decisiones se toman con certidumbre total.
Los principales parámetros son:Los principales parámetros son:
Media Poblacional Media Poblacional (Notación: (Notación: ) Varianza Poblacional Varianza Poblacional (Notación: (Notación: 2 2 ))
Proporción Poblacional (Notación: P ó ) )
Estadígrafo
Es un número o medida de resumen, Es un número o medida de resumen, que describe alguna carácterística de que describe alguna carácterística de la muestra y para determinar su valor la muestra y para determinar su valor numérico se utiliza solo la información numérico se utiliza solo la información de la muestra, y la toma de decisiones de la muestra, y la toma de decisiones contiene un grado de incertidumbre.contiene un grado de incertidumbre.
Los principales estadígrafos son:Los principales estadígrafos son:
Media muestral Media muestral (notación: ) (notación: ) Varianza muestral Varianza muestral (notación: S(notación: S22 ) ) Proporción muestral Proporción muestral (notación: p ) (notación: p )
•
__
x
Tipos de datos y escalas de medida
Variables: son las características o lo que se
estudia de cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...
Datos: son los valores que toma la variable en
cada caso.
Tem
a 1
. Intro
ducció
n
Estudios observacionales
Experimentación
EncuestasSondeos
Internet, revistas, publicaciones, etc
Fuentes de datos
¿Para qué necesitamos datos?
Para levantar informaciones sobre un estudio de mercado
Para evaluar el desempeño de los trabajadores de una empresa
Para evaluar la calidad de un servicio Para evaluar el grado de satisfacción de los clientes Para evaluar la variabilidad de un proceso
Para evaluar la conformidad de un producto de acuerdo a los estándares establecidos
Para rediseñar un producto Para lanzar un nuevo producto al mercado Para proponer estrategias alternativas en un
proceso de toma de decisiones Para establecer procedimientos de mejora
continua Para optimizar sistemas.
¿Para qué necesitamos datos?
Variables Estadísticas
Ejemplo:En un grupo de estudiantes que asisten a la universidad nos interesan las siguientes características: Talla, peso, edad, el tipo de movilidad que utiliza para trasladarse a la Universidad, facultad y el número de cursos en el cual se ha matriculado el presente periodo académico.
Talla Peso Edad Tipo de
Movilidad
Facultad Número
de cursos
1.68 54.8 18 AUTO PROPIO
CEMPRESA 5
1.70 55 20 MICRO ING 5
1.75 58.7 21 AMIGOS ING 6
1.62 60 19 COLECTIVO CSALUD 4
Variables
Datos
Clasificación de las Variables
Estadísticas
N O M IN A L O R D IN A L
V A R IA B L EC U A L IT A T IV A
D IS C R E T A C O N T IN U A
V A R IA B L EC U A N T IT A T IV A
V A R IA B L EE S T A D IS T IC A
Tipos de Variables
Cualitativos: son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Ej: Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,…
Tem
a 1
. Intro
ducció
n
Variable Cualitativa Nominal:Variable Cualitativa Nominal: Son aquellas que surgen cuando se
definen categorías que no son susceptibles de un ordenamiento. ((Color de los ojos, género, profesión, Color de los ojos, género, profesión, marca de gaseosa que prefieremarca de gaseosa que prefiere))
Variable Cualitativa Ordinal:Variable Cualitativa Ordinal: Son aquellas que surgen cuando se
definen categorías que pueden ser ordenadas de acuerdo a una jerarquía o prioridad. ((Nivel de instrucción Nivel de instrucción alcanzado, jerarquía en las alcanzado, jerarquía en las instituciones armadas o policiales, instituciones armadas o policiales, Nivel Socioeconómico) Nivel Socioeconómico)
Tipos de Variable cualitativaTipos de Variable cualitativa
Tipos de Variables
Cuantitativos: provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente. Ejemplos: Peso Edad Estatura Presión Humedad Intensidad de un sismo Cantidad de hermanos
Tem
a 1
. Intro
ducció
n
Tipos de Variables
Tipos de variables cuantitativas: Discretas: es aquella que solo puede
tomar un número finito o infinito numerable de valores. Ejemplo: cantidad de hermanos.
Continuas: es la variable que puede tomar cualquier valor en una escala continua. Ejemplo: cantidad de líquido contenido en un recipiente.
Tem
a 1
. Intro
ducció
n
Escalas de medida
Escala Nominal. Escala Ordinal. Escala de Intervalos. Escala de Razón o Proporción. Escala Absoluta.
Variables Cualitativas
VariablesCuantitativas Te
ma 1
. Intro
ducció
n
Escalas de medida
Escala nominal: los datos se pueden agrupar en categorías que no mantienen una relación de orden entre si, por lo tanto no están definidas las operaciones lógicas (>, <, , ) sino solo las de igualdad o diferencia.
Ejemplos: color de ojos, sexo, profesión, estado civil, religión.
Tem
a 1
. Intro
ducció
n
Escalas de medida
Escala ordinal: existe un cierto orden o jerarquía entre las categorías (>, <, , ).
Ejemplos: grados militares, organigrama de una empresa, escalafón de los profesores universitarios, grados de disnea, estadiaje de un tumor.
Tem
a 1
. Intro
ducció
n
Escalas de medida
Escala de Intervalos: valores numéricos de las variables y además de las relaciones de orden (>, <, , ), se pueden establecer distancias, es decir, tienen sentido las operaciones de suma y resta. Tiene dos propiedades: Existe una unidad de medida que se mantiene
constante para todos los valores que toma la variable.
Existe un valor patrón u origen relativo que no significa la ausencia de valor en la variable.
Tem
a 1
. Intro
ducció
n
Escalas de medida
Ejemplo: temperatura, nivel de ruido, movimientos sísmicos.
Tem
a 1
. Intro
ducció
n
Escalas de medida
Escala de razón o proporción: es la más completa y general de todas las escalas. Se caracteriza porque los valores de la variable son números entre los cuales, además de las relaciones de orden (>, <, , ) y distancia (+,-), se pueden establecer múltiplos y proporciones.
Ejemplos: peso, altura, volumen…
Tem
a 1
. Intro
ducció
n
Escalas de medida
Escala Absoluta: se caracteriza porque los valores que toma la variable son el resultado de contar y por lo tanto, está constituida por los enteros positivos y el cero.
Ejemplos: número de hermanos, cantidad de autos vendidos, cantidad de accidentes en una intersección, cantidad de hijos,…
Tem
a 1
. Intro
ducció
n
Datos Univariantes y Multivariantes
Univariantes o unidimensionales: sólo recogen información sobre una característica (Ej: edad de los alumnos de una clase).
Bivariantes o bidimensionales: recogen información sobre dos características de la población. (Ej: edad y estatura de los alumnos de una clase).
Tem
a 1
. Intro
ducció
n
Datos Univariantes y Multivariantes
Multivariantes o pluridimensionales: recogen información sobre tres ó más características. (Ej: edad, estatura y peso de los alumnos de una clase). T
em
a 1
. Intro
ducció
n
Abusos que se pueden cometer con la Estadística
Conclusiones erróneas debido a que los datos son numéricamente insuficientes.
Representaciones gráficas engañosas (escalas).
Datos muestrales no representativos: Muestra que no incluye a elementos de toda la
población. Ciertas categorías de personas no responden
correctamente. Respuestas voluntarias (sesgadas).
Tem
a 1
. Intro
ducció
n
TEMA 2. ESTADÍSTICA DESCRIPTIVA
Organización de los datos
Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.
Tem
a 2
. Esta
dística
Descrip
tiva
Organización de los datos
Formas de organizar los datos: Un arreglo: es la forma más sencilla de
organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.
Poco práctica cuando se tiene una gran cantidad de datos.
Tem
a 2
. Esta
dística
Descrip
tiva
Organización de los datos
Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.
Clase Pto.Medio
fi Fi fri FRi
Tem
a 2
. Esta
dística
Descrip
tiva
Organización de los datos
La Distribución de Frecuencias: Se recomienda su uso cuando se tienen
grandes cantidades de datos (n). Su construcción requiere, en primer
lugar, la selección de los límites de los intervalos de clase.
Para definir la cantidad de intervalos de clase (k), se puede usar:
La regla de Sturges: k = 1 + 3.3log(n) k = n
Tem
a 2
. Esta
dística
Descrip
tiva
Organización de los datos
La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.
La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.
Los límites de las clases deben tener una cifra significativa más que los datos en bruto.
Tem
a 2
. Esta
dística
Descrip
tiva
Organización de los datos
Determinar: Punto medio = (Li+Ls)/2. Frecuencia absoluta de la clase (fi).
Frecuencia acumulada de la clase (Fi).
Frecuencia relativa de la clase (fri): fri = fi/n
Frecuencia relativa acumulada de la clase (FRi).
Tem
a 2
. Esta
dística
Descrip
tiva
A continuación se presentan las calificaciones de 60 estudiantes que presentaron la PINA en el año 2009:
Tem
a 2
. Esta
dística
Descrip
tiva
Ejemplos de Distribución de Frecuencias
23 60 79 32 57 74 52 70 82 3680 77 81 95 41 65 92 85 55 7652 10 64 75 78 25 80 98 81 6741 71 83 54 64 72 88 62 74 4360 78 89 76 84 48 84 90 15 7934 67 17 82 69 74 63 80 85 61
a) Construya una distribución de frecuencias.b) Qué puede concluir de estos datos.
Ejemplos de Distribución de Frecuencias
Representación gráfica de los datos
Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.
Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos: Histogramas. Polígono de frecuencias. Ojiva o Polígono de frecuencias acumuladas.
Tem
a 2
. Esta
dística
Descrip
tiva
Representación gráfica de los datos
Histograma
Representación gráfica de los datos
Tem
a 2
. Esta
dística
Descrip
tiva
Histograma y Polígono de Frecuencias
Ojiva
Representación gráfica de los datos
Tem
a 2
. Esta
dística
Descrip
tiva
Representación gráfica de los datos
Para datos cualitativos se usan: Curvas Barras Sectores
Tem
a 2
. Esta
dística
Descrip
tiva
Barras
Representación gráfica de los datos
Barras
Representación gráfica de los datos
Curvas
Representación gráfica de los datos
Sectores, torta o circular
Tem
a 2
. Esta
dística
Descrip
tiva
Diagrama de dispersión
Correlación lineal de Pearson entre Escrupulosidad y Lid. Transformacional r = 0.453
Diagrama de ParetoEs un gráfico de barras verticales ordenadas de la mayor a la menor frecuencia observada.Proporciona una visión simple y rápida de la importancia relativa de los problemas.Ayuda a concentrarse en las causas que tendrán mayor impacto en el caso de ser resueltas.
Permite discriminar las causas mas importantes de un problema (“las pocas vitales”) de las menos importantes (“las muchas triviales”).
Diagrama de ParetoCausas de no conformidad en el control de calidad de los embalajes de cereales de una industria de alimentos
32%
56%
74%82%
88%93%
97% 99% 100%
0%
20%
40%
60%
80%
100%
0%
5%
10%
15%
20%
25%
30%
35%
Tapa superior sin sello
Etiqueta ilegible
Cartón sucio Cartón abultado
Cartón roto Cartón agrietado
Peso de empaque
inadecuado
Agujeros en el cartón
Error de impresión
Causa de no conformidad
Diagrama de caja o Box Plot
Otro modo habitual y muy útil de resumir una variable de tipo numérico es utilizando el concepto de cuartiles, mediante diagramas de cajas.
La caja central indica el rango en el que se concentra el 50% central de los datos. Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribución. La línea central en la caja es la mediana. De este modo, si la variable es simétrica, dicha línea se encontrará en el centro de la caja.
Diagrama de caja Precios de pollo eviscerado en 36 puestos de venta en Lima
Pre
cio
(sol
es)
Fuente: Elaboración propia
Diagrama de líneas
De: http://www1.inei.gob.pe/perucifrasHTM/inf-eco/cuadro.asp?cod=8544&name=comex09&ext=gif
Diagrama de líneas superpuestas
De: http://www1.inei.gob.pe/perucifrasHTM/inf-eco/cuadro.asp?cod=8538&name=comex03&ext=gif
Gráficos multivariados: Diagrama de araña
Perfil sensorial del jugo de maracuyá según el tipo de azúcar
(a los 180 días refrigerado)
0
1
2
3
4
5
6
7
Aroma a f ruta f resca
Aroma a f ruta muy madura
Aroma de maracuyá
Aroma enlatado
Sabor a f ruta f resca
Sabor a f ruta enlatada
Sabor a maracuyá
Sabor dulce
Sabor residual dulce
Sabor residual dulzura artifi cial
Sacarosa Aspartame
Perfil sensorial del jugo de maracuyá según el tipo de azúcar
(a los 180 días sin refrigeración)
0
1
2
3
4
5
6
7
Aroma a f ruta f resca
Aroma a f ruta muy madura
Aroma de maracuyá
Aroma enlatado
Sabor a f ruta f resca
Sabor a f ruta enlatada
Sabor a maracuyá
Sabor dulce
Sabor residual dulce
Sabor residual dulzura artifi cial
Gráficos interactivos(Hans Rosling)
www.bit.ly/cApMnI
www.bit.ly/angl9S
Errores frecuentes en los gráficos
Evolución del precio mínimo de cierto producto
1970: $1.00
1980: $1.60
1990: $3.10
2000: $3.80
Buena presentaciónMala presentación
Evolución del precio mínimo (en US$)
0.0
1.0
2.0
3.0
4.0
1970 1980 1990 2000
Año
US
$
Ventas mensuales
(miles de soles)
0
S/.
38
42
46
50
E F M A M J
S/.
Gráficos de las ventas de los seis primeros meses del año
Errores frecuentes en los gráficos
Buena presentaciónMala presentación
Ventas mensuales
(miles de soles)
38
42
46
50
E F M A M J
Errores frecuentes en los gráficos
Distribución de productos defectuosos por máquina
70
160
86
240
0
50
100
150
200
250
300
M1 M2 M3 M4
Máquina
Frec
uenc
ia
Distribución de productos defectuosos por máquina
2.0% 2.1%1.9% 2.0%
0.0%
0.5%
1.0%
1.5%
2.0%
2.5%
M1 M2 M3 M4
Máquina
Por
cent
aje
Buena presentaciónMala presentación
Máquina
No de Defectuoso
s
Total producido
M1 70 3500
M2 160 7619
M3 86 4526
M4 240 12000
Buena presentaciónGastos trimestrales (en miles de soles)
Gastos trimestrales (en miles de soles)
Mala presentación
0
25
50
T1 T2 T3 T4
S/.
0
100
200
T1 T2 T3 T4
S/.
Errores frecuentes en los gráficos
Observaciones
Es difícil precisar cuando es más apropiado utilizar un gráfico o una tabla. Podemos considerarlos como dos maneras distintas pero complementarias de visualizar los mismos resultados ya que cuando los datos son presentados a través de tablas, su presentación gráfica ayudará a visualizarlo de una manera mas eficiente, clara y simple.
Observaciones Hoy en día, la creciente utilización de
softwares estadísticos torna especialmente simple la obtención de las mas variadas formas de representación gráfica.
Los buenos gráficos revelan lo que los datos trasmiten. Infelizmente muchos gráficos que se presentan en periódicos, revistas y publicaciones en general, son incorrectas, engañosas o innecesariamente complicadas.
Medidas de tendencia central o posición
Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.
Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de tendencia central o posición
Las medidas de tendencia central más importantes son: Media: Aritmética y Aritmética
ponderada. Mediana. Moda.
Tem
a 2
. Esta
dística
Descrip
tiva
Media Aritmética
Es la suma de todas las observaciones dividida entre el número total de observaciones.
Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación. (wikipedia)
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia)
Tem
a 2
. Esta
dística
Descrip
tiva
Cálculo de la media aritmética
Para datos no agrupados:
n
xX
n
ii
1
Para datos agrupados:
n
fmX
k
iii
1
Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i
k: cantidad de clases
Tem
a 2
. Esta
dística
Descrip
tiva
Mediana
Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.
Divide al conjunto de datos en dos partes iguales.
Tem
a 2
. Esta
dística
Descrip
tiva
Cálculo de la mediana
Para datos no agrupados: Si n es impar: posición donde se ubica
la mediana es igual a (n+1)/2. Si n es par: (n+1)/2 no es entero, por lo
tanto la mediana será igual al promedio de las dos posiciones centrales.
Tem
a 2
. Esta
dística
Descrip
tiva
Cálculo de la mediana
Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2.
Cmxf
xFn
LmMdm
m
)(
)(21
1
Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.
Tem
a 2
. Esta
dística
Descrip
tiva
Moda
Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal, bimodal o multimodal.
Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.
Tem
a 2
. Esta
dística
Descrip
tiva
Cálculo de la moda
Para datos no agrupados: es simplemente la observación que más se repite.
Para datos agrupados:
CmLimMo21
1
Donde: Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).
Tem
a 2
. Esta
dística
Descrip
tiva
Relación entre la media, la mediana y la moda
Tem
a 2
. Esta
dística
Descrip
tiva
Cuando los datos son sesgados es mejor emplear la Md
Propiedades, ventajas y desventajas de la media
Propiedades: La suma de las diferencias entre las
media muestral y el valor de cada observación es cero.
La media de una constante es la constante.
Si todas las observaciones xi se multiplican por una constante a, la X también se debe multiplicar por ese mismo valor constante.
Tem
a 2
. Esta
dística
Descrip
tiva
Propiedades, ventajas y desventajas de la media
Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la media aritmética de dicha variable X varía en la misma proporción.
La media de la suma de dos variables es igual a la suma de sus medias.
Tem
a 2
. Esta
dística
Descrip
tiva
Propiedades, ventajas y desventajas de la media
Ventajas: Emplea en su cálculo toda la
información disponible. Se expresa en las mismas unidades
que la variable en estudio. Es el centro de gravedad de toda la
distribución, representando a todos los valores observados.
Es una valor único.
Tem
a 2
. Esta
dística
Descrip
tiva
Propiedades, ventajas y desventajas de la media
Se trata de un concepto familiar para la mayoría de las personas.
Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.
Tem
a 2
. Esta
dística
Descrip
tiva
Propiedades, ventajas y desventajas de la media
Desventajas: Se ve adversamente afectada por valores
extremos, perdiendo representatividad. Si el conjunto de datos es muy grande
puede ser tedioso su cálculo manual. No se puede calcular para datos
cualitativos. No se puede calcular para datos que
tengan clases de extremo abierto, tanto superior como inferior.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y desventajas de la mediana
Ventajas: Fácil de calcular si el número de
observaciones no es muy grande. No se ve influenciada por valores
extremos, ya que solo influyen los valores centrales.
Fácil de entender.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y desventajas de la mediana
Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto.
Es la medida de tendencia central más representativa en el caso de variables que solo admiten la escala ordinal.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y desventajas de la mediana
Desventajas: No utiliza en su “cálculo” toda la
información disponible. No pondera cada valor por el
número de veces que se ha repetido.
Hay que ordenar los datos antes de determinarla.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y desventajas de la moda
Ventajas: No requiere cálculos. Puede usarse para datos tanto
cuantitativos como cualitativos. Fácil de interpretar. No se ve influenciada por valores
extremos. Se puede calcular en clases de
extremo abierto.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y desventajas de la moda
Desventajas: Para conjuntos pequeños de datos su
valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos.
No utiliza toda la información disponible.
No siempre existe, si los datos no se repiten.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y desventajas de la moda
En ocasiones, el azar hace que una sola observación se no representativa se el valor más frecuente del conjunto de datos.
Difícil de interpretar si los datos tiene 3 o más modas.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión, variación o variabilidad.
Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión, variación o variabilidad.
Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión, variación o variabilidad.
Rango. Varianza. Desviación Típica. Coeficiente de variación.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión: Rango
Rango (amplitud o recorrido): Está determinado por los dos
valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.
Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión: Rango
Casi no se emplea debido a que depende únicamente de dos valores.
No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.
Notación: R
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión: Varianza
Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.
Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.
Notación: s2, 2, var(X)
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión: Varianza
Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.
21
2
2
1
2
2
xn
xs
n
xxs
n
ii
n
ii
Tem
a 2
. Esta
dística
Descrip
tiva
Para datos NOagrupados:
Para datos agrupados en una distribución de frecuencias:
Medidas de dispersión: Varianza
21
2
2
1
2
2
xn
fms
n
fxms
k
iii
k
iii
Medidas de dispersión: Desviación Típica
Es la raíz cuadrada de la varianza. Notación: s, .
2ss
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de dispersión: Coeficiente de Variación
Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.
No tiene dimensiones. Notación: CV
%100x
sCV
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y Desventajas del Rango
Ventajas: Útil cuando se quiere conocer la
extensión de las variaciones extremas (valor máximo de la dispersión).
Fácil de calcular.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y Desventajas del Rango
Desventajas: No es una MD con respecto al
centro de la distribución. Solo emplea dos valores en su
cálculo. No se puede calcular en
distribuciones de límite de clase abierto.
Tem
a 2
. Esta
dística
Descrip
tiva
Propiedades, Ventajas y Desventajas de la Varianza
Propiedades:1. Siempre es mayor o igual a cero y
menor que infinito.2. La varianza de una constante es
cero.3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y será Var(Y) = b2Var(X)
Tem
a 2
. Esta
dística
Descrip
tiva
Propiedades, Ventajas y Desventajas de la Varianza
Ventajas: Es útil cuando se compara la variabilidad
de dos o más conjuntos de datos. Utiliza toda la información disponible.Desventajas: No proporciona ayuda inmediata cuando
se estudia la dispersión de un solo conjunto de datos.
Difícil de interpretar por tener sus unidades elevadas al cuadrado.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y Desventajas de la Desviación Típica
Ventajas: Esta expresada en las mismas
unidades que la variable en estudio. Utiliza todas las observaciones en
su cálculo. Fácil de interpretar.Desventajas: No tiene.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y Desventajas del Coeficiente de Variación
Ventajas: Es la única MD que permite
comparar el nivel de dispersión de dos muestras de variables diferentes.
Emplea toda la información disponible en su cálculo.
Fácil de calcular.
Tem
a 2
. Esta
dística
Descrip
tiva
Ventajas y Desventajas del Coeficiente de Variación
Desventaja: No es una MD con respecto al
centro de la distribución de los datos.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de Forma
Son medidas numéricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran.
Medidasde forma
-Asimetría
-Kurtosis o apuntamiento
Coeficiente de PearsonCoeficiente de Fisher
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de Forma: Asimetría
Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos. T
em
a 2
. Esta
dística
Descrip
tiva
Medidas de Forma: Asimetría
Coeficiente de Asimetría de Pearson: Fácil de calcular e interpretar. Cálculo:
s
MdXASP
3
o Interpretación:
ASP
= 0, X=Md Simétrica
> 0, X>Md Asimétrica Positiva
< 0, X<Md Asimétrica Negativa
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de Forma: Asimetría
Coeficiente de Asimetría de Fisher: No es de fácil cálculo, pero si su
interpretación. Tem
a 2
. Esta
dística
Descrip
tiva
3
1
3
31
3
ns
fxMASF
ns
XxASF
k
iii
n
ii
Datos NO agrupados
Datos Agrupados
Medidas de Forma: Asimetría
o Interpretación:
ASF
= 0, Simétrica
> 0, Asimétrica Positiva
< 0, Asimétrica Negativa
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de Forma: Kurtosis
Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución).
Se definen tres tipos de distribución según su grado de Kurtosis:
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de Forma: Kurtosis
Mesocúrtica: grado de concentración medio alrededor de los valores centrales de la variable.
Leptocúrtica: grado de concentración elevado.
Platicúrtica: grado de concentración reducido.
Tem
a 2
. Esta
dística
Descrip
tiva
Medidas de Forma: Kurtosis
3
3
41
4
41
4
ns
fXMCK
ns
XxCK
k
iii
n
ii
Datos No Agrupados
Datos Agrupados
Interpretación:
CK
=0 Mesocúrtica
>0 Leptocúrtica
<0 Platicúrtica
Tem
a 2
. Esta
dística
Descrip
tiva
Referencias:
Wikipedia(http://es.wikipedia.org/wiki/Wikipedia:Portada)
Walpole y Myers. Probabilidad y Estadística. Mc Graw-Hill.
Triola, Mario F. Estadística. Pearson.