Post on 24-Jan-2015
11
DIRECCIÓN DE ESTADÍSTICAS DE LA DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIAPROVINCIA
INTRODUCCIÓN A LA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Lazarte Víctor Fabio y Naidicz Paula LorenaLazarte Víctor Fabio y Naidicz Paula Lorena
22
OBJETIVOS:OBJETIVOS:
LaLa capacitación en la interpretación y el uso de capacitación en la interpretación y el uso de
herramientas estadísticas básicas, mostrando algunas de herramientas estadísticas básicas, mostrando algunas de
sus propiedades más relevantes.sus propiedades más relevantes.
Debido a que está orientado a personas de diferentes Debido a que está orientado a personas de diferentes
ocupaciones, en esta primera etapa, se intentará abarcar ocupaciones, en esta primera etapa, se intentará abarcar
la mayor cantidad de casos posibles.la mayor cantidad de casos posibles.
En una segunda etapa, profundizar en algún tema En una segunda etapa, profundizar en algún tema
específico según la demanda.específico según la demanda.
Fomentar la producción de estadísticas dentro de las Fomentar la producción de estadísticas dentro de las
oficinas de las diferentes instituciones del gobierno.oficinas de las diferentes instituciones del gobierno.
33
ComentariosComentarios
LaLa ciencia estadística tiene la particularidad de necesitar el uso ciencia estadística tiene la particularidad de necesitar el uso
de herramientas matemáticas en general muy complejas.de herramientas matemáticas en general muy complejas.
Por suerte el avance de la computación nos libera de realizar Por suerte el avance de la computación nos libera de realizar
tediosos cálculos y nos permite dedicarnos a los contenidos tediosos cálculos y nos permite dedicarnos a los contenidos
conceptuales.conceptuales.
En esta presentación, los ejemplos numéricos son muy En esta presentación, los ejemplos numéricos son muy
sencillos pues sólo pretenden mostrar las ideas conceptuales.sencillos pues sólo pretenden mostrar las ideas conceptuales.
IMPORANTE: El hecho de que existan métodos computacionales IMPORANTE: El hecho de que existan métodos computacionales
para realizar los cálculos no significa que los estadísticos sean para realizar los cálculos no significa que los estadísticos sean
prescindidles.prescindidles.
La estadística no sólo requiere de hacer bien los cálculos si no La estadística no sólo requiere de hacer bien los cálculos si no
que necesita de utilizar el criterio del expertoque necesita de utilizar el criterio del experto
44
INTRODUCCIÓN A LA ESTADÍSTICA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVADESCRIPTIVA
Etapas de un estudio estadísticoEtapas de un estudio estadístico
El proceso de analizar estadísticamente un fenómeno consta de El proceso de analizar estadísticamente un fenómeno consta de
tres etapas, que se pueden describir brevemente de la siguiente tres etapas, que se pueden describir brevemente de la siguiente
manera:manera:
1) Recolección de datos.1) Recolección de datos.
2) Estadística Descriptiva.2) Estadística Descriptiva.
3) Inferencia Estadística.3) Inferencia Estadística.
55
1) Recolección de datos1) Recolección de datos..
Los datos que serán la base del estudio estadístico deben ser Los datos que serán la base del estudio estadístico deben ser
recolectados adecuadamente, pues de ello depende la validez y el recolectados adecuadamente, pues de ello depende la validez y el
alcance de los resultados y conclusiones.alcance de los resultados y conclusiones.
Ejemplos de formas de recolección de datos que no brindan Ejemplos de formas de recolección de datos que no brindan
información confiable son las encuestas telefónicas y las información confiable son las encuestas telefónicas y las
encuestas callejeras.encuestas callejeras.
66
2) La Estadística Descriptiva2) La Estadística Descriptiva
Se ocupa de resumir los datos para ser presentados en forma óptima Se ocupa de resumir los datos para ser presentados en forma óptima
mediante: mediante:
Tablas de frecuencias.Tablas de frecuencias.
Realización de gráficos y diagramas.Realización de gráficos y diagramas.
Cálculo de medidas de posición y de dispersión.Cálculo de medidas de posición y de dispersión.
3) La Inferencia Estadística3) La Inferencia Estadística
Se ocupa de la interpretación y generalización de la información Se ocupa de la interpretación y generalización de la información
obtenida a partir de los datos.obtenida a partir de los datos.
Permite realizar estimaciones y predicciones.Permite realizar estimaciones y predicciones.
Permite tomar decisiones con un cierto nivel de riesgo.Permite tomar decisiones con un cierto nivel de riesgo.
77
El trabajo de la estadística comienza desde el mismo planteo del El trabajo de la estadística comienza desde el mismo planteo del
problema, es decir lo que quiero estudiar o probar.problema, es decir lo que quiero estudiar o probar.
A partir de allí se definen las variables relevantes. A partir de allí se definen las variables relevantes.
Ejemplo:Ejemplo: Se desea estudiar el nivel de seguridad en una planta Se desea estudiar el nivel de seguridad en una planta
industrial.industrial.
¿Qué variables se deben medir u observar?¿Qué variables se deben medir u observar?
X = Cantidad de accidentes por mes.X = Cantidad de accidentes por mes.
Y = Causa del accidente.Y = Causa del accidente.
Z = Zona del daño.Z = Zona del daño.
T = Gravedad del accidente.T = Gravedad del accidente.
Existen diferentes Existen diferentes tipos de variablestipos de variables y por lo tanto diferentes y por lo tanto diferentes
tratamientos estadísticos para los diferentes casos.tratamientos estadísticos para los diferentes casos.
88
TIPOS DE VARIABLESTIPOS DE VARIABLES
Variables CualitativasVariables Cualitativas o Categóricaso Categóricas: :
Son aquellas variables que describen cualidades o atributos, pero Son aquellas variables que describen cualidades o atributos, pero
no toman valores numéricos.no toman valores numéricos.
Ejemplos: Ejemplos:
a)a) “Nivel de educación de un ciudadano” “Nivel de educación de un ciudadano”
Categorías: {Categorías: {Sin instrucción, Prim. incompleta, Prim. completa, Sec. Sin instrucción, Prim. incompleta, Prim. completa, Sec.
incompleta, Sec. completa, Univ. o superior incompleta, Univ. o superior incompleta, Sec. completa, Univ. o superior incompleta, Univ. o superior
completacompleta}}
b)b) “Situación laboral de un ciudadano” “Situación laboral de un ciudadano”
Categorías: {Categorías: {Empleado, Desempleado, InactivoEmpleado, Desempleado, Inactivo}}
99
Variables CualitativasVariables Cualitativas o Categóricaso Categóricas: :
c)c) “Departamento de residencia de un ciudadano de Tucumán” “Departamento de residencia de un ciudadano de Tucumán”
Categorías: {Burruyacu, Capital, Chicligasta, Cruz Alta, ... }Categorías: {Burruyacu, Capital, Chicligasta, Cruz Alta, ... }
d)d) ”Tipos de medios de transporte según distancia que recorren” ”Tipos de medios de transporte según distancia que recorren”
Categorías: {corta distancia, media distancia, larga distancia}Categorías: {corta distancia, media distancia, larga distancia}
En los ejemplos a) y d) las categorías tienen un orden natural, en En los ejemplos a) y d) las categorías tienen un orden natural, en
este caso se dice que la variable tiene este caso se dice que la variable tiene Escala OrdinalEscala Ordinal..
Si las categorías no tienen ningún orden, como en el ejemplo b) y Si las categorías no tienen ningún orden, como en el ejemplo b) y
c), se dice que la variable tiene c), se dice que la variable tiene Escala NominalEscala Nominal..
1010
Variables Cuantitativas o numéricasVariables Cuantitativas o numéricas: :
Son aquellas variables que toman valores numéricos. Son aquellas variables que toman valores numéricos.
Ejemplos:Ejemplos:
a) a) “Cantidad de artículos fabricados en un día por una empresa” “Cantidad de artículos fabricados en un día por una empresa”
Valores que puede tomar: {0, 1, 2, …, n} Valores que puede tomar: {0, 1, 2, …, n}
b) b) “Peso, en gramos, de un recién nacido”“Peso, en gramos, de un recién nacido”
Valores que puede tomar: ( 0, 6000 )Valores que puede tomar: ( 0, 6000 )
Se llama Se llama Variable Cuantitativa Discreta Variable Cuantitativa Discreta a las variables que sólo a las variables que sólo
toman valores enteros. Ejemplo a).toman valores enteros. Ejemplo a).
Se llama Se llama Variable Cuantitativa ContinuaVariable Cuantitativa Continua a las variables que a las variables que
pueden tomar cualquier valor numérico. Ejemplo b).pueden tomar cualquier valor numérico. Ejemplo b).
1111
DISTRIBUCIONES DE FRECUENCIAS Y DISTRIBUCIONES DE FRECUENCIAS Y REPRESENTACIÓN GRÁFICAREPRESENTACIÓN GRÁFICA
Primer caso:Primer caso: Supongamos que se cuenta con datos de una Supongamos que se cuenta con datos de una
variable Cualitativa.variable Cualitativa.
En este caso sólo se necesita agrupar los datos en sus En este caso sólo se necesita agrupar los datos en sus
categorías.categorías.
Ejemplo:Ejemplo:
Se quiere estudiar el nivel de educación de las madres de recién Se quiere estudiar el nivel de educación de las madres de recién
nacidos en una ciudad, para ello se toma una muestra al azar de nacidos en una ciudad, para ello se toma una muestra al azar de
80 madres y se les pregunta el nivel de instrucción alcanzado.80 madres y se les pregunta el nivel de instrucción alcanzado.
1212
Por razones de simplicidad los datos se codifican de la siguiente Por razones de simplicidad los datos se codifican de la siguiente
manera: manera:
1 = Sin instrucción1 = Sin instrucción
2 = Primaria incompleta2 = Primaria incompleta
3 = Primaria completa3 = Primaria completa
4 = Secundaria incompleta4 = Secundaria incompleta
5 = Secundaria completa5 = Secundaria completa
6 = Univ. o superior incompleta6 = Univ. o superior incompleta
7 = Univ. o superior completa7 = Univ. o superior completa
1313
Tabla 1: Tabla 1: Nivel de instrucción de 80 madres encuestadas.Nivel de instrucción de 80 madres encuestadas.
3 5 3 1 4 3 7 5
5 3 4 3 3 6 2 5
1 4 4 4 4 5 4 4
3 2 3 3 3 4 6 5
3 2 2 3 4 3 3 7
3 3 3 5 4 5 6 4
2 6 4 5 3 5 3 4
3 4 3 2 4 5 4 4
3 7 4 4 3 5 5 6
2 5 2 2 5 7 5 5
1414
Tabla 2: Tabla 2: Distribución de frecuencias del nivel de educación de la Distribución de frecuencias del nivel de educación de la
madre.madre.
Nivel de educación de la madre
Cantidad de madres
Porcentajes Porcentajes acumulados
Sin instrucción 2 2,5 % 2,5 %
Primaria incompleta 9 11,3 % 13,8 %
Primaria completa 23 28,8 % 42,6 %
Secundaria incompleta 20 25,0 % 67,6 %
Secundaria completa 17 21,3 % 88,9 %
Sup. o universitaria incompleta 5 6,3 % 95,2 %
Sup. o universitaria completa 4 5,0 % 100 %
Total 80 100 %
1515
Figura 1:Figura 1: Distribución de frecuencias del nivel de educación de la Distribución de frecuencias del nivel de educación de la
madremadre
0
5
10
15
20
25
Sin
inst
rucc
ión
Prim
aria
inco
mpl
eta
Prim
aria
com
plet
a
Sec
unda
riain
com
plet
a
Sec
unda
riaco
mpl
eta
Sup
. oun
iver
sita
riain
com
plet
a
Sup
. oun
iver
sita
riaco
mpl
eta
Nivel de educación
Can
tidad
de
mad
res
1616
Figura 1:Figura 1: Distribución de frecuencias del nivel de educación de la Distribución de frecuencias del nivel de educación de la
madremadre
0%
5%
10%
15%
20%
25%
30%
35%
Sin
inst
rucc
ión
Prim
aria
inco
mpl
eta
Prim
aria
com
plet
a
Sec
unda
riain
com
plet
a
Sec
unda
riaco
mpl
eta
Sup
. oun
iver
sita
riain
com
plet
a
Sup
. oun
iver
sita
riaco
mpl
eta
Nivel de educación
1717
Figura 2:Figura 2: Distribución de frecuencias del nivel de educación de la Distribución de frecuencias del nivel de educación de la
madremadre
2,5%11,3%
28,7%
25,0%
21,3%
6,3%5,0%
Sin instrucción
Primaria incompleta
Primaria completa
Secundaria incompleta
Secundaria completa
Sup. o universitariaincompleta
Sup. o universitariacompleta
1818
Segundo caso:Segundo caso: Datos provenientes de una variable Cuantitativa Datos provenientes de una variable Cuantitativa
discreta con pocos valores.discreta con pocos valores.
En este caso, similar a lo anterior, sólo se necesita agrupar los En este caso, similar a lo anterior, sólo se necesita agrupar los
datos iguales.datos iguales.
Ejemplo:Ejemplo:
Se desea estudiar la distribución de la cantidad de miembros de Se desea estudiar la distribución de la cantidad de miembros de
una familia de cierta zona. Se toma una muestra al azar de 80 una familia de cierta zona. Se toma una muestra al azar de 80
familias y se registra el número de miembros.familias y se registra el número de miembros.
1919
Tabla 3: Tabla 3: Cantidad de miembros de las familias seleccionadas.Cantidad de miembros de las familias seleccionadas.
6 5 6 4 8 4 4 4
4 6 4 2 8 2 5 5
8 5 2 4 3 5 6 6
5 7 5 7 5 5 3 5
1 2 7 5 7 4 4 5
4 6 6 5 4 5 4 4
7 3 2 3 6 5 3 3
5 5 3 3 4 4 4 4
4 4 5 5 5 7 6 6
1 3 10 4 10 4 4 6
2020
Tabla 4:Tabla 4: Distribución de frecuencias de la cantidad de miembros Distribución de frecuencias de la cantidad de miembros
de las familias de cierta zona.de las familias de cierta zona.
Cantidad de miembrosCantidad de
familiasPorcentajes % acumulado
1 2 2,5 % 2,5 %
2 5 6,3 % 8,8 %
3 9 11,3 % 20,0 %
4 22 27,5 % 47,5 %
5 20 25,0 % 72,5 %
6 11 13,8 % 86,3 %
7 6 7,5 % 93,8 %
8 3 3,8 % 97,5 %
10 2 2,5 % 100,0 %
Total 80 100,0 %
2121
Figura 3:Figura 3: Distribución de frecuencias de las cantidad de Distribución de frecuencias de las cantidad de
miembros de las familias de cierta zonamiembros de las familias de cierta zona
0%
5%
10%
15%
20%
25%
30%
1 2 3 4 5 6 7 8 10
Cantidad de miembros de una familia
2222
Figura 3:Figura 3: Distribución de frecuencias de la cantidad de miembros Distribución de frecuencias de la cantidad de miembros
de las familias de cierta zonade las familias de cierta zona
Cantidad de miembrosCantidad de miembros
Can
tidad
de
fam
ilias
Can
tidad
de
fam
ilias
2323
Tercer Caso:Tercer Caso: Observaciones de una variable Cuantitativa Observaciones de una variable Cuantitativa
Continua (o Discreta con muchos valores)Continua (o Discreta con muchos valores)
[ )[ )[ )[ )[ )[ )[ )[ )[ )[ )
Por lo tanto existe la necesidad de construir las clasesPor lo tanto existe la necesidad de construir las clases
2424
Regla prácticaRegla práctica
Selección del número de clases Selección del número de clases donde n es la donde n es la
cantidad de datos.cantidad de datos.
Selección de la amplitud de clase.Selección de la amplitud de clase.
Elegir intervalos semiabiertos y disjuntos que cubran Elegir intervalos semiabiertos y disjuntos que cubran
todo el rango de datos.todo el rango de datos.
Elegir los límites de los intervalos como números Elegir los límites de los intervalos como números
sencillos, es decir, fáciles de leer y de recordar.sencillos, es decir, fáciles de leer y de recordar.
Regla prácticaRegla práctica
Selección del número de clases Selección del número de clases donde n es la donde n es la
cantidad de datos.cantidad de datos.
Selección de la amplitud de clase.Selección de la amplitud de clase.
Elegir intervalos semiabiertos y disjuntos que cubran Elegir intervalos semiabiertos y disjuntos que cubran
todo el rango de datos.todo el rango de datos.
Elegir los límites de los intervalos como números Elegir los límites de los intervalos como números
sencillos, es decir, fáciles de leer y de recordar.sencillos, es decir, fáciles de leer y de recordar.
2525
Ejemplo:Ejemplo: Se desea estudiar el peso de los recién nacidos en un cierto Se desea estudiar el peso de los recién nacidos en un cierto
periodo en una ciudad. Se toma una muestra al azar de 80 recién nacidos periodo en una ciudad. Se toma una muestra al azar de 80 recién nacidos
y se registra su peso al nacer.y se registra su peso al nacer.
Tabla 5:Tabla 5: Pesos de los recién nacidos muestreados. Pesos de los recién nacidos muestreados.
3300 3220 3060 2600 3150 3400 3200 2830
3200 3450 3150 2250 4600 3300 3000 3200
2975 3500 3480 3700 3000 3150 2600 3400
2650 4170 3650 2780 3665 4000 3550 3050
2800 3100 3140 2800 3800 2900 2900 2300
3900 3000 2900 3100 2500 3800 2270 3400
2570 3250 2570 3300 3000 2650 3440 3950
2900 3800 3200 1390 1920 3150 3100 3800
3900 3410 3300 2415 3800 3550 2900 3670
3900 3250 3500 3400 3420 2750 3400 3450
2626
Tabla 6:Tabla 6: Distribución de frecuencias del peso de los recién Distribución de frecuencias del peso de los recién
nacidosnacidos
Clase Frecuencias Porcentajes % Acumulados
1301 a 1700 1 1,3 % 1,3 %
1701 a 2100 1 1,3 % 2,5 %
2101 a 2500 5 6,3 % 8,8 %
2501 a 2900 16 20,0 % 28,8 %
2901 a 3300 26 32,5 % 61,3 %
3301 a 3700 19 23,8 % 85,0 %
3701 a 4100 10 12,5 % 97,5 %
4101 a 4500 1 1,3 % 98,8 %
4501 a 4900 1 1,3 % 100 %
Total80 100 %
2727
Figura 4:Figura 4: Distribución de frecuencias del peso de los recién Distribución de frecuencias del peso de los recién
nacidos.nacidos.
0
5
10
15
20
25
30
13
00
17
00
21
00
25
00
29
00
33
00
37
00
41
00
45
00
49
00
y m
ayo
r...
Peso del recien nacido
Fre
cuen
cias