Post on 25-Jun-2022
082021
Apropiación social del conocimientoGeneración de contenidos impresos
N.° 8, septiembre de 2021doi: https://doi.org/10.16925/gcgp.32
GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA
PARA ESTADÍSTICA DESCRIPTIVA
Jorge Alejandro Obando-BastidasUniversidad Cooperativa de Colombia
Sede Villavicencio
María Teresa Castellanos SánchezUniversidad de los Llanos
Acerca de los autores
Jorge Alejandro Obando-Bastidas, doctor en Docencia e
Investigación, profesor tiempo completo de Contaduría
Pública, Universidad Cooperativa de Colombia, sede Vi-
llavicencio.
Correo electrónico: jorge.obandob@campusucc.edu.co
Cvlac:https://scienti.minciencias.gov.co/cvlac/visualiza-
dor/generarCurriculoCv.do?cod_rh=0001281569
Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/
visualiza/visualizagr.jsp?nro=00000000009298
orcid: https://orcid.org/0000-0002-4283-2871
Google Scholar: https://scholar.google.es/cita-
tions?hl=es&user=WHrpjDwAAAAJ
María Teresa Castellanos Sánchez, doctora en Educa-
tion Mathematica, profesora titular de Licenciatura en
matemáticas, Universidad de los Llanos.
Correo electrónico: mcastellanos@unillanos.edu.co
Cvlac:http://scienti.colciencias.gov.co:8081/cvlac/visua-
lizador/generarCurriculoCv.do?cod_rh=0000609455
Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/
visualiza/visualizagr.jsp?nro=00000000007746
orcid: https://orcid.org/0000-0001-7850-3183
Google Scholar: https://scholar.google.es/citations?u-
ser=yn9pkUYAAAAJ&hl=es&oi=ao
Cómo citar este documento
Obando Bastidas, J. A. y Castellanos Sánchez, M. T. (2021).
Gráficos estadísticos: guía práctica para estadística descripti-
va (Generación de contenidos impresos N° 08). Ediciones
Universidad Cooperativa de Colombia. doi: https://doi.
org/10.16925/gcgp.32
NOTA LEGALEl presente documento de trabajo ha sido incluido dentro de nuestro repositorio institucional como Apropiación social de conocimiento por solicitud del autor, con fines informativos, educativos o académicos. Asimismo, los argumentos, datos y análisis incluidos en el texto son responsabilidad absoluta del autor y no representan la opinión del Fondo Editorial o de la Universidad.
DISCLAIMERThis coursework paper has been uploaded to our institutional repository as Social Appropriation of Knowledge due to the request of the author. This document should be used for informational, educational or academic purposes only. Arguments, data and analysis included in this document represent authors’ opinion not the Press or the University.
Este documento puede ser consultado, descargado o reproducido desde nuestro repositorio institucional (http://repository.ucc.edu.co/handle/20.500.12494/7369) para uso de sus contenidos, bajo la licencia de Creative Commons Reconocimien-to-NoComercial-SinObraDerivada 4.0 Internacional. http://creativecommons.org/licenses/by-nc-nd/4.0/
TABLA DE CONTENIDO
Resumen 7
Introducción 8
Propósito 8
Unidad de competencias 8
Elemento de competencia del saber 8
Marcos teóricos 8
Campo de acción 9
División 9
Población 9
Muestra 10
Variables 10
Variables enteras o discretas 10
Variables reales o continuas 10
Variables cualitativas 10
Clasificación de las variables según su naturaleza 10
Tablas de frecuencia 11
Gráficos estadísticos 12
Gráficos para datos categóricos 12
Gráfico de barras 13
Gráfico de sectores 13
Gráfico de arañas 15
Gráfico de anillos o sectores 15
Gráficos para datos numéricos enteros 15
Diagrama de barras para variables numéricas enteras 17
Gráfico de diagramas integrales 18
Tabla de frecuencias para datos continuos a través de intervalos 19
Ejemplo de aplicación 19
Gráficos para datos continuos organizados en intervalos de clase 20
Histograma 21
Diagrama de Tortas 21
Ojivas 22
Polígonos de frecuencia 23
Otras graficas 23
Boxplot 23
Diagrama de Pareto 25
Ejercicios de aplicación 27
Referentes 32
ÍNDICE DE TABLAS Y FIGURAS
Tabla 1. Clasificación y tipos de variables 11
Tabla 2. Estructura de una tabla de frecuencias 12
Tabla 3. Tabla de frecuencias para la variable motivos de visita al departamento del Meta 13
Tabla 4. Tabla de frecuencias del número de fallecidos por la covid-19 en Colombia discriminado por estratos sociales 17
Tabla 5. Edades de cien personas que se recuperan de la covid-19 20
Tabla 6. Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital 20
Tabla 7. Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital 21
Tabla 8. Tabla de Pareto de personas con la covid-19 que se recuperan en el hospital 25
Figura 1. Asesinatos de líderes sociales (2016-2019). 9
Figura 2. Gráfico de barras para la variable motivos para visitar los Llanos orientales (1) 14
Figura 3. Gráfico de barras para la variable motivos para visitar los Llanos orientales (2) 14
Figura 4. Gráfico de torta para la variable motivos para visitar los Llanos orientales 15
Figura 5. Gráfico de araña o radar para la variable motivos para visitar los Llanos orientales 16
Figura 6. Gráfico anillos para la variable motivos para visitar los Llanos orientales 16
Figura 7. Porcentaje de muertes por la covid-19 en Colombia por estratos sociales 17
Figura 8. Número de muertes por covid-19 en Colombia por estratos sociales 18
Figura 9. Diagrama integral para el número de muertes por covid-19 18
Figura 10. Histograma de personas con la covid-19 que se han hospitalizado. 21
Figura 11. Diagrama de tortas de personas con la covid-19 que se han hospitalizado 22
Figura 12. Ojiva de personas con covid-19 que se han hospitalizado 22
Figura 13. Polígono de frecuencias de personas con covid-19 que se han hospitalizado 23
Figura 14. Boxplot por género de personas con la covid-19 que se han hospitalizado 24
Figura 15. Pirámide poblacional por género de personas con la covid-19 en Colombia 25
Figura 16. Diagrama de Pareto de personas con la covid-19 que se recuperan en el hospital 26
Figura 17. Radiografía de la deforestación en el Amazonas brasileño (junio del 2019). 29
Figura 18. Emisiones gei de Colombia en el 2012 30
ResumenLos gráficos estadísticos son objetos de la estadís-tica con los que se pretende establecer un grado de comunicación, breve, sencillo y didáctico. El propósito general que motiva el desarrollo de este documento es la apropiación de las características de los gráficos construidos en las tablas de frecuen-cias y en los datos no agrupados que provienen de bases de datos reales. La importancia de adquirir la habilidad de diseñar un gráfico radica principal-mente en la necesidad de comunicar datos de una manera visual, de manera que sea comprendido ampliamente por muchos grupos. Generalmente, los gráficos están en todos los medios de comu-nicación visuales y transmiten la realidad de los acontecimientos; el presente documento contiene, desde la definición de variables hasta la construc-ción de gráficos, estableciendo diferencias entre las variables de tipo numérico y las variables de tipo categórico. Los gráficos que aquí se muestran par-ten de la construcción de una tabla de frecuencias y son datos agrupados; sin embargo, gráficos como los Boxplot, no necesitan agrupación de los datos, puesto que, por su característica, estos gráficos sa-len de las bases de datos y proponen una informa-ción más precisa, ya que provienen de la fuente tal y como se conciben. Finalmente, en el trabajo se proponen algunos ejercicios de bases de datos rea-les y como propósito de evaluación se entrega un cuestionario de diez preguntas, diseñado con base en los lineamientos y los requerimientos de la ta-xonomía solo.
Palabras clave: datos agrupados, datos no agrupados, frecuencias, variables categóricas, variables numéricas.
GRÁFICOS ESTADÍSTICOS:GUÍA PRÁCTICA PARA ESTADÍSTICA DESCRIPTIVA
Jorge Alejandro Obando-Bastidas
María Teresa Castellanos Sánchez
08
8 · Generación de contenidos impresos
Unidad de competenciasConstruir información para que apoye la toma de decisiones en el entorno organizacional me-diante organización, sistematización y lectura de datos.
Elemento de competencia del saberClasificar las herramientas estadísticas para la sistematización de la información.
Marcos teóricosLa abundancia de datos y fuentes de informa-ción en la era de internet y de las redes sociales genera complejidad en los procesos de comuni-cación, lo cual también genera dificultad para aquellas personas y entidades que toman de-cisiones a partir de ellos. Desde esta posición, Ross (2018) propone que la estadística es un arte que propicia el aprendizaje usando datos como insumo de la información, ya que ayuda en su descripción, organización y análisis, lo que lleva a tomar conclusiones y decisiones.
Por otro lado, la estadística no solo evidencia un proceso para organizar los datos y tomar decisiones a partir de ellos, también permite evidenciar la realidad, contemplar el contex-to a partir de una problemática real y una po-sición visual (Castellanos y Obando, 2013). Por ejemplo, en forma gráfica, la figura 1 informa sobre el fenómeno social de los asesinatos de líderes en Colombia, cruda realidad que se puede abordar en el estudio de la estadística. Con el análisis de la realidad se trata de fo-mentar el razonamiento estadístico, más que el aprendizaje rutinario y descontextualiza-do de conceptos y propiedades, puesto que la tecnología, hoy en día, permite aplicar la es-tadística con gran facilidad, por consiguiente, cobran mayor importancia las actividades in-terpretativas que el cálculo rutinario (Batane-ro y Díaz, 2011).
INTRODUCCIÓNLos gráficos estadísticos se visualizan en dife-rentes contextos, por ejemplo, en periódicos, revistas, libros, textos, entre otros. Su presen-cia masiva en todos los espacios y el poder de comunicación de ellos proponen un grado de importancia. Teniendo en cuenta la presen-cia de los gráficos estadísticos en las estructu-ras curriculares, esta guía se diseña teniendo en cuenta dos circunstancias: por un lado, se busca que los estudiantes que cursan progra-mas relacionados con las Ciencias Económi-cas, Administrativas y Contables desarrollen competencias en la lectura de gráficos y, por ende, alcanzar una mejor comprensión de este tipo de representación de los datos estadísti-cos; por otro lado, se pretende que esta guía se convierta en un material de apoyo para aque-llos estudiantes que ingresan a la universidad con escasa formación en estadística y que, por lo tanto, requieren un proceso de fortaleci-miento que estructure en ellos el aprendiza-je inicial de esta ciencia. El desarrollo de esta guía parte de una definición de estadística, su campo de acción, el reconocimiento de con-ceptos relacionados, con la muestra, pobla-ción, tipo de variables, construcción de tablas de frecuencia y sus respectivos gráficos. Se hace una distinción entre gráficos para datos discretos y datos continuos, además en la guía se analizan otro tipo de gráficos como el del Boxplot, las pirámides poblaciones, la impor-tancia de la regla de Pareto. Todos los ejercicios relacionados con la presente guía se desarro-llarán completamente en Excel.
PropósitoEstablecer diferencias entre los diferentes tipos de gráficos construidos a partir de tablas de frecuencias en datos agrupados y desde la propuesta de los datos dispuestos en bases de datos reales, como los bases del coronavirus y las bases de datos de las pruebas saber en Colombia.
Gráficos estadísticos: guía práctica para estadística descriptiva· 9
• Estadística descriptiva: se encarga de la recolección, la clasificación y la descrip-ción de datos muéstrales o poblacionales, para su interpretación y análisis.
• Estadística inferencial: desarrolla modelos teóricos que se ajusten a una determinada realidad con cierto grado de confianza.
Población Se define como un conjunto de individuos o de objetos que poseen una o varias característi-cas comunes. El total de las unidades posibles de observar hace referencia también a una de-finición de población. La población no hace re-ferencia únicamente a los seres vivos; una po-blación puede estar constituida por los peces de un estanque, por animales de una determi-nada raza.
Poblaciones finitasEn este tipo de población, el número de uni-dades observables es contable, es decir, un número conocido de elementos del conjunto llamado población. De la misma manera, se considera finita a una población, si se conoce
Campo de acciónLa aplicación de la estadística en la dirección de procesos enfatiza la toma de decisiones. La necesidad de resolver problemas pone de ma-nifiesto la aplicabilidad de la estadística. La aplicabilidad se extiende a todo el universo social, biológico, físico, ingeniería, educacional, médico, de negocios y leyes, en fin, a casi todas las fases de la vida.
El campo de la estadística es una disciplina dirigida a lograr un mejor entendimiento del mundo que nos rodea, con el objetivo final que todos tengamos una vida más completa y con un mayor entendimiento de esta. No hay parte de nuestro ambiente que no sea una fuente de datos (nosotros mismos, otros individuos, la familia, sociedades, culturas, ciudades, países, planetas, escuelas, colegios religiones, etcéte-ra), en pocas palabras cada aspecto de nuestra existencia, incluso el comportamiento de la covid-19 en Colombia y en el mundo.
DivisiónLa estadística se divide en dos grandes ramas de estudio:
120
100
80
60
40
20
0
1ero
de
ene
- 201
66
de a
go -
2016
7 de
ago
- 20
169
de ju
l - 2
017
10 d
e ju
l - 2
017
6 de
ago
- 20
17
10 d
e ju
l - 2
018
6 de
ago
- 20
18
7 de
ago
- 20
179
de ju
l - 2
018
7 de
ago
- 20
189
de ju
l - 2
019
32
69
5
105
10
68
FIGURA 1. Asesinatos de líderes sociales (2016-2019). Tomado de la Consejería Presidencial de los Derechos Humanos (2019).
10 · Generación de contenidos impresos
ejemplo, tamaño, edad, precios, rendimiento académico o indicadores económicos.
VARIABLES ENTERAS O DISCRETASEn este conjunto de variables, los valores que se representan se visualizan como número entero. Por ejemplo, número de estudiantes en la universidad, número de personas diarios que se contagian con el virus sars-CoV-2.
VARIABLES REALES O CONTINUAS
Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores, ella se mide uniformemente. Dentro de la escala de los conjuntos numéricos, re-presentan a los números reales. Por ejemplo, estatura de los estudiantes de una universi-dad, salarios devengados por los docentes de un núcleo educativo, temperaturas a ciertas horas del día, edad de una persona.
VARIABLES CUALITATIVAS
Representan características propias de las cualidades de los objetos que conforman la muestra o la población. Por ejemplo, sexo, origen o color de piel.
Las variables cualitativas se dejan expresar en niveles de categoría. Por ejemplo, sexo: mascu-lino o femenino; origen: colombiano, venezola-no o panameño; color de piel: blanco, negro o amarillo.
CLASIFICACIÓN DE LAS VARIABLES SEGÚN SU NATURALEZA
Las variables sean enteras o continuas por su naturaleza se las puede clasificar como cate-góricas y numéricas; a la vez, esta clasificación responde a ciertos criterios de diferenciación.
Variables categóricas: establecen categorías de los datos. Producen muchas informaciones.
la fuente de donde provienen los datos. Por
ejemplo, la población de estudiantes de una
universidad es finita, ya que se sabe que en los
programas existe una base de datos en los que
están inscritos todos los estudiantes de dicha
universidad.
Poblaciones infinitasEn este tipo de población, el conteo de uni-dades observables se hace un poco difícil. El término de infinito en estadística no se ajusta a una definición semántica, puede hacer rela-ción a un grupo de objetos, personas, cosas, en las que se desconoce la fuente de donde pro-vienen. Ejemplo: como el número de vendedo-res informales, que dado la crisis de la pande-mia de covid-19, se ha incrementado en todas las ciudades de Colombia y estos no se regis-tran en una base de datos, se puede considerar una población infinita.
MuestraSe define como la mejor representación de la población. La muestra es un subconjunto de la población a la cual se le efectúa la medi-ción con el fin de estudiar las propiedades del conjunto del cual es obtenida. El tamaño de la muestra, la disponibilidad de recursos, la ho-mogeneidad de los elementos y de los datos que la conforman le da la importancia su-ficiente al uso adecuado de la muestra; un buen conocimiento de la población permite encontrar una buena muestra representativa. Existen muestras tomadas al azar y sin seguir ningún modelo de muestreo que llevan a con-clusiones inadecuadas y, por lo tanto, a tomar decisiones que no corresponden a la solución de un problema planteado dentro de conjunto.
Variables Es el conjunto de características de las entida-des que se interesan en una investigación; por
Gráficos estadísticos: guía práctica para estadística descriptiva· 11
de las de intervalo y tienen un origen. Por ejemplo, el peso de una persona.
En la tabla 1 se resume la clasificación de estas variables.
Tablas de frecuenciaMuchas veces se presenta una muestra con muchos datos, por lo que se hace necesario organizarlos en una tabla de frecuencias o en una distribución de frecuencias. Este tipo de tabla está formada por las distintas catego-rías (valores o intervalos) del carácter X y por las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.
A manera de definición, se puede decir que una tabla de frecuencias es un método para presentar la información en forma resumida, muestra los datos tal como aparecen en la dis-tribución, organizados en diferentes formas de conteo de los elementos de una variable, a lo que se denomina “frecuencia”. A continuación, se muestran los tipos de frecuencias que se presentan para organizar los datos.
Frecuencias absolutas (f) Se llama frecuencia absoluta (f) de la variable o categoría al número de datos que se presen-tan en el conteo directo de los datos que se repiten en una distribución. La suma de todas las frecuencias absolutas es el tamaño de la muestra, como se aprecia en la ecuación 1.
Por ejemplo: las categorías de bajos, medios,
altos superiores es una escala categórica de
estudiantes evaluados en una universidad.
Nominal: no establecen ningún orden. Corres-
ponde a variables categóricas; por ejemplo,
estado civil, soltero, casado, viudo, unión libre.
Ordinales: indican un orden. Por ejemplo,
grado académico (primaria, bachillerato, uni-
versidad, especialización y maestría).
Variables numéricas: a diferencia de las an-
teriores, producen más información y mejores
procedimientos estadísticos. A toda variable
numérica se la puede categorizar, pero pierde
información y detalles de esta. Por ejemplo, las
edades, siendo numérica producen informa-
ción relacionada con medias, medianas, modas,
entre otras. Se pueden categorizar como: niños,
jóvenes, adultos y tercera edad; en estas cate-
gorías ya no se puede obtener la información
que se obtuvo en el caso numérico.
Para tal efecto, las variables pueden ser:
Intervalo: se pueden asociar en intervalos
de clase y corresponden a variables de tipo
continuo. Preservan de las variables ordina-
les el orden y se acomodan las distancias. Por
ejemplo, salarios, edades, notas estudiantiles.
Razón: son variables que conservan más infor-
mación y detalles de las demás variables. Con-
servan el orden de las ordinales, la distancia
TABLA 1
Clasificación y tipos de variables
Tipo de variable Se dividen en Pueden ser Ejemplos
NuméricasContinuas
Intervalos Temperatura
Razón Salarios, notas obtenidas en un curso, estatura de una persona
Enteras Número de estudiantes en un salón, números de personas recuperadas de la covid-19.
CategóricasNominales Género, estado civil de una persona.
Ordinales Grados militares, formación académica.
Nota. Elaboración propia.
12 · Generación de contenidos impresos
Finalmente, una tabla de frecuencias propone una estructura determinada, la cual se muestra en la tabla 2.
TABLA 2
Estructura de una tabla de frecuencias
Variable f h F H
X1 f1 h1 F1 H1
X2 f2 h2 F2 H2
X3 f3 h3 F3 H3
. . . . .
. . . . .
Xn fn hn n 1
Total n 1
Nota. Elaboración propia.
Gráficos estadísticosLos gráficos estadísticos son recursos visuales
que permiten comunicar la información, se
constituye en un instrumento estadístico para
analizar los datos en forma eficiente y desde
diferentes niveles de lectura (Castellanos y
Obando, 2013). Existen gráficos para los datos
numéricos y para los datos categóricos.
Gráficos para datos categóricosDe acuerdo con el tipo de frecuencias, se pueden
encontrar gráficos, tipo barra, torta, arañas,
barras acumuladas, pictogramas, anillos, entre
otros. A continuación, se propone una situa-
ción problemas y se construye en Excel la tabla
de frecuencias con sus respectivos gráficos. Por
ejemplo, en un estudio realizado en el Meta y
que está relacionado con el turismo, una de las
preguntas de la encuesta aplicada tenía el si-
guiente contenido: ¿cuál es el principal motivo
por el que usted visita al departamento del
Meta? Señale solo una opción:
∑ fi = n
f = f1 + f2 + f3 + ... + fn = n (1)
En la ecuación 1, n es el tamaño de la muestra.
Frecuencia absoluta relativa (h)Se llama frecuencia relativa de la variable X al cociente entre la frecuencia absoluta de cada dato y el total de elementos que conforman la muestra, como se aprecia en la ecuación 2.
hi = (2)
La suma de todas las frecuencias relativas re-presenta al 100 % de la población y equivale a 1 (uno), como se aprecia en la ecuación 3.
(3)
Frecuencias acumuladas (F)Esta frecuencia se obtiene de la acumula-ción sucesiva de las frecuencias absolutas. El último dato acumulado es el tamaño de la muestra, como se aprecia en la ecuación 4.
(4)
Frecuencias relativas acumuladas (H) Estas se obtienen de la acumulación sucesi-va de las frecuencias relativas. El último dato acumulado es el 100 % de la muestra, como se aprecia en la ecuación 5.
(5)
fn
f1
n
H
F1 = f1 + f2 + f3 + ... . fn = fi
f2
n
F2
nF1
n
f3
n
F3
n
n
n
n
i=1
i=1
i=1
fn
n
fn
n
hi
n
Fi
n
∑
∑
∑
+
+
+
+
+ ... +
+ ... +
=
==
= 100%
= 100%
Gráficos estadísticos: guía práctica para estadística descriptiva· 13
TABLA 3
Tabla de frecuencias para la variable motivos de visita al departamento del Meta
Motivos f h F H
Paisaje 15 0,15 15 0,15
Gastronomía 15 0,15 30 0,3
Diversión 25 0,25 55 0,55
Calor Humano 19 0,19 74 0,74
Clima 14 0,14 88 0,88
Descanso 12 0,12 100 1
Total 100 1
Nota. Elaboración propia, haciendo uso del Excel.
Gráfico de barrasEs una figura que permite representar los elementos de la variable de estudio con los valores obtenidos en la frecuencia absoluta o también se pueden representar los valores de la frecuencia relativa. En el ordenado siempre estarán los elementos que constituyen la va-riable y en el eje de las abscisas el valor de las frecuencias. La figura 2 se elaboró en Excel.
Obsérvese que, en la figura 2, se describen ex-clusivamente los valores de la frecuencia ab-soluta; cada barra evidencia el valor de la fre-cuencia absoluta, propuesto en la tabla 3.
En Excel se pueden generar diferentes formas para representar esta información; en la figura 3, se observa la misma gráfica, con la informa-ción sobre las barras y con una tabla de deno-minación de las unidades de variables. Queda a gusto del diseñador la forma como represen-ta la información.
Gráfico de sectoresDenominado también “tartas” (pie), consiste en un círculo dividido en tantas partes o por-ciones como valores de frecuencia relativa existan, a cada valor de frecuencias relativa le corresponde en forma proporcional un arco de círculo (figura 4).
1. Paisaje.
2. Gastronomía.
3. Diversión.
4. Calor humano.
5. Clima.
6. Descanso.
Se realizó la pregunta a 100 turistas y se obtu-vieron los siguientes resultados:
1 4 4 2 5 3 3
2 4 5 1 6 2 3
2 6 1 1 6 3 4
2 6 2 1 6 3 2
3 6 2 1 3 4 1
3 6 2 1 3 6 2
3 6 3 4 3 6 3
5 3 3 4 5 6 3
5 3 3 4 5 5 3
5 3 4 4 5 5 6
1 3 4 4 4 4
1 3 1 4 4 4
1 2 1 5 4 3
1 2 1 5 3 2
4 2 5 5 3 2
Siguiendo un proceso de organización en columna de los datos y en orden ascendente, Excel es una de las mejores herramientas para construir una tabla de frecuencias, ya que fa-cilita su conteo y su proceso de construcción, puesto que el uso de las fórmulas creadas en este permite con rapidez replicarla en otras celdas y obtener los demás resultados de una manera rápida y sencilla. La tabla de frecuen-cias construida a partir de los datos anteriores se puede observar en la tabla 3.
14 · Generación de contenidos impresos
Figura 2. Gráfico de barras para la variable motivos para visitar los Llanos orientales (1). Elaboración propia haciendo uso de Excel como herramienta.
Figura 3. Gráfico de barras para la variable motivos para visitar los Llanos orientales (2). Elaboración propia haciendo uso de Excel como herramienta.
24
22
20
18
16
14
12
10
8
6
4
2
0Paisaje Gastronomía Diversión Calor
HumanoClima Descanso
15 15
25
19
14
12
Paisaje Gastronomía Diversión CalorHumano
Clima Descanso
Gráficos estadísticos: guía práctica para estadística descriptiva· 15
constituyen los anillos o los sectores. Son pe-queños sectores en forma de un aro o anillo, divido en forma proporcional de acuerdo con el valor de dicha frecuencia (figura 6).
Los diagramas para las frecuencias absolutas acumuladas, denominados “diagramas integra-les”, no tienen sentido en el contexto de las va-riables categóricas, se observarán en el contexto de las variables numéricas, enteras y continuas.
Gráficos para datos numéricos enterosAlgunos de los gráficos para datos enteros son los mismos que para los datos categóricos, sin embargo, en los datos numéricos enteros ya se pueden realizar gráficos para las frecuen-cias acumuladas. Para revisar el tipo de gráfi-cos, se propone una situación real que ocurre en Colombia en el margen de la aparición de la pandemia de covid-19. Se propone entonces la siguiente situación: en marzo del 2020, se registraron los primeros casos del virus, hasta el 3 de enero del 2021. El total de decesos por covid-19 era de 51 397. El Departamento Ad-ministrativo Nacional de Estadística (dane), con respecto al número de muertos por la covid-19, emitió la siguiente información que se resume en la figura 7.
La lectura de estos gráficos es directa, se lo hace teniendo en cuenta el valor del porcentaje pro-puesto en cada unidad de variable. Por ejemplo, el 25 % de los turistas visitan el Meta, porque aquí encuentran diversión. Una interpretación más general estará amarrada al objetivo de la investigación que generó la pregunta.
Gráfico de arañasUna gráfica de radar, también conocida como
un “diagrama de araña”, es una herramienta
muy útil para mostrar visualmente los valores
de una frecuencia relativa o absoluta. Su
nombre se hereda porque propone la visuali-
zación en la forma de una tela de araña. Pro-
porciona la misma información de un diagra-
ma de barras o de una torta (ver figura 5).
El gráfico de la figura 5 puede ser una exce-
lente alternativa para representar la informa-
ción de los datos propuestos en las frecuencias
relativas, brinda la misma información, pero
desde otra visualización.
Gráfico de anillos o sectoresOtra de las formas de representar las fre-cuencias relativas en variables categorías lo
Paisaje15%
Calor Humano19%
Gastronomía15%
Descanso12%
Clima14%
Diversión25%
Figura 4. Gráfico de torta para la variable motivos para visitar los Llanos orientales. Elaboración propia haciendo uso de Excel como herramienta.
16 · Generación de contenidos impresos
Figura 5. Gráfico de araña o radar para la variable motivos para visitar los Llanos orientales. Elabora-ción propia haciendo uso de Excel como herramienta.
Paisaje
15%
15%
19%Calor Humano
GastronomíaDescanso
12%
Clima
14%
Diversión25%
Figura 6. Gráfico anillos para la variable motivos para visitar los Llanos orientales. Elaboración propia haciendo uso de Excel como herramienta.
Paisaje15%
15%
Calor Humano19%
Gastronomía
Descanso12%
Clima14%
Diversión25%
Gráficos estadísticos: guía práctica para estadística descriptiva· 17
por covid-19 en Colombia por estratos socia-les. Por ejemplo, en el estrato 1, a la fecha en las que se tomaron los datos de las bases de datos del ministerio de salud pública de Co-lombia, se observaban 16 910 personas en el estrato 1. La figura 8 permite comparar resul-tados; se observa, por ejemplo, que en los es-tratos 1, 2, y 3 es donde más se han presenta-do casos de mortalidad por la covid-19. Estos gráficos sencillos son ligeros de interpretación, son muy utilizados, ya que proponen la infor-mación de manera directa.
TABLA 4
Tabla de frecuencias del número de fallecidos por la COVID-19 en Colombia discriminado por estratos sociales
Estratos f h F H
Estrato 1 16 910 32,9 % 16 910 32,9 %
Estrato 2 18 863 36,7 % 35 773 69,6 %
Estrato 3 12 078 24 % 47 851 93,1 %
Estrato 4 2364 4,6 % 50 215 97,7 %
Estrato 5 771 1,5 % 50 986 99,2 %
Estrato 6 411 0,80 % 51 397 100,0 %
Total 51 397 100,0 %
Nota. Información suministrada por el dane (16 de octubre de 2020).
La triste realidad reflejada en la figura 7 (que corresponde a una torta con frecuencias rela-tivas) evidencia que la mayoría de las muertes en Colombia son de personas que carecen de recursos económicos. Corresponde aquí rea-lizar otro tipo de gráficos que permitan evi-denciar la información desde otro punto de vista. Para ello, lo recomendable es reconstruir la tabla de frecuencias y proceder a la cons-trucción de otras representaciones; de esta manera, se presenta la tabla 4, correspondien-te a la tabla de frecuencias para la variable que relaciona el número de personas falleci-das en Colombia y discriminadas por estrato social (ver tabla 4).
Diagrama de barras para variables numéricas enterasUn gráfico de barras o gráfico de columnas es una forma de representar gráficamente un conjunto de datos o valores mediante barras rectangulares de longitud proporcional a los valores representados; los valores represen-tados pueden ser frecuencias relativas o fre-cuencia absolutas. Su lectura es directa. En la figura 8, se evidencia el número de fallecidos
Figura 7. Porcentaje de muertes por la covid-19 en Colombia por estratos sociales. Tomada de dane (16 de octubre de 2020).
Estrato 4: 4,6%
Estrato 5: 1,5%
Estrato 6: 0,80%
Estrato 1: 32,9%
Estrato 2: 36,7%
Estrato 3: 24%
18 · Generación de contenidos impresos
Figura 8. Número de muertes por covid-19 en Colombia por estratos sociales. Tomado de dane (16 de octubre de 2020).
Figura 9. Diagrama integral para el número de muertes por covid-19. Tomado de dane (16 de octubre de 2020).
16910
18863
12078
2364
771 411
Estrato 1
Estrato 2
Estrato 3
Estrato 4
Estrato 5
Estrato 6
16910
35773
4785150215 50986 51397
Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6
Gráfico de diagramas integralesSe realizan con las frecuencias acumuladas y solo para variables numéricas, ya sean de tipo entero o de tipo continuo. Siguiendo el ejemplo anterior en la figura 9, se representa el diagra-ma integral para muertes por la covid-19 en Colombia determinado por estratos sociales.
Las frecuencias acumuladas indican el número de muertes que se suman por estratos, por ejemplo, la lectura de estas figuras propone que el número de muertes acumulado hasta el estrato 3 que es de 47 851. En el proceso de registros de casos de contagio en Colombia, es este tipo de gráficos los que expresan la canti-dad de contagios que se registran en un periodo determinado.
Gráficos estadísticos: guía práctica para estadística descriptiva· 19
tener a C constante a lo largo de toda la distri-bución de frecuencias, se calcula mediante la fórmula.
C = (10)
Si esta división es exacta, se procede, con la
construcción de los intervalos y la tabla de
frecuencias, en caso contrario se rediseña un
nuevo rango; para ello, es necesario examinar
si el producto de C*m excede al rango original
y en cuánto excede. Esta diferencia propone la
construcción del nuevo rango. El procedimiento
es el siguiente y se muestra en la ecuación 11.
1. Si RNuevo = C*m > Rango
2. Se realiza la diferencia D = RNuevo – Rango
3. Ahora se construyen los límites del nuevo
rango
Xmin = Min – 1/D
Xmax = Max + 1/D (11)
Intervalos aparentemente nominales
Son los intervalos utilizados en la clase que utilizamos, tal como resulta en el cálculo de la amplitud C.
Ejemplo de aplicación
En el informe diario de contagios por covid-
19 en Colombia, se registran a los pacientes
que se recuperan en casa, en el hospital, en
la uci o que fallecieron. A continuación, se
propone la tabla 5 la cual contiene los datos
con las edades de cien personas que se recu-
peran de la enfermedad en los diferentes hos-
pitales de Colombia.
Tabla de frecuencias para datos continuos a través de intervalosPara determinar las frecuencias en datos con-tinuos, se deben seguir los siguientes pasos que involucran cálculos matemáticos y la uti-lización de algunas fórmulas de aproximación, como la del rango, número de intervalos me-diante la fórmula de Sturges y la amplitud de intervalo.
Rango Es el dato calculado mediante la diferen-cia entre el dato máximo y mínimo, como se muestra en la ecuación 6.
R = Xmax – Xmin (6)
Número de intervalosRepresentado por la letra m y se define me-diante la fórmula denominada formula de Sturges, como se muestra en la ecuación 7.
m = 1 + 3,3*log(n) (7)
Donde n es el tamaño de la muestra. El número de intervalos no puede ser inferior a 5 ni supe-rior a 16, como se muestra en la ecuación 8.
5 ≤ m ≤ 16 (8)
Algunos, sin embargo, utilizan la ecuación 9.
m = (9)
La aproximación de m se puede hacer por defecto o por exceso.
Amplitud del intervaloLa amplitud del intervalo determina la distan-cia que existe entre un dato y otro, se simboli-za por C; depende del criterio establecido para presentar la información, puede variar la am-plitud en cada intervalo, pero se recomienda
√n
Rangom
20 · Generación de contenidos impresos
D = 70 – 68 = 2; esta diferencia propone la exis-tencia de un nuevo rango que tendrá como límites (ver ecuación 15).
R- Nuevo
Mínimo = Min – 1 = 24 – 1 = 23
Máximo = Max + 1 = 92 + 1 = 93
(15)
El valor de la unidad que se ha restado al mínimo y sumado en el máximo está determi-nado por la diferencia de 2, el cual se reparte en forma equitativa sobre estos valores ex-tremos. Estos resultados indican que el nuevo rango empieza en 23 y termina en 93. De esta manera, se construirá la tabla de frecuencias con 7 intervalos, una longitud de 10 inicia en 23 y termina en 93 años. La tabla 6 de frecuencia, realizada en Excel, tiene el siguiente aspecto.
TABLA 6
Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital
Edades f h F H
23-33 13 13 % 13 13 %
33-43 10 10 % 23 23 %
43-53 11 11 % 34 34 %
53-63 25 25 % 59 59 %
63-73 13 13 % 72 72 %
73-83 21 21 % 93 93 %
83-93 7 7 % 100 100 %
100 1
Nota. Datos tomados del Ministerio de Salud de Colombia (2020).
Gráficos para datos continuos organizados en intervalos de claseLa tabla 7 corresponde a los cien pacientes con la covid-19 que se recuperan en algún hospi-tal de Colombia. A esta tabla se le ha agrega-do una nueva columna que corresponde a la
TABLA 5
Edades de cien personas que se recuperan de la COVID-19
80 27 29 74 80 65 37 42 66 60
54 45 75 58 85 90 60 68 86 49
79 59 57 79 68 79 41 26 42 75
77 60 56 82 57 72 80 51 29 72
60 90 51 80 38 34 67 76 62 58
87 55 37 62 76 46 54 31 28 63
32 80 58 85 57 92 32 31 44 61
27 77 65 60 48 46 44 35 75 55
79 67 55 49 77 34 71 24 68 59
38 64 28 29 78 49 56 58 74 69
Nota. Elaboración propia.
Se pide construir una tabla de frecuencia para estos datos, organizando intervalos. Para ello, el procedimiento es el siguiente:
1. Se calcula el rango, como se muestra en la ecuación 12.
Rango = Xmax – Xmin = 92 – 24 = 68 (12)
El rango indica que una persona de 92 años es la de mayor edad que se encuentra hospita-lizada y que la persona de menor edad en el hospital tiene 24 años.
2. Número de intervalos (ver ecuación 13)
m = 1 + 3,3 * log(100) = 7,6 (13)
Aquí, se pueden escoger 7 intervalos que co-rresponde a un redondeo por defecto o 8, si el redondeo es por exceso. Sin ajustarse a ninguna regla se escogerá el redondeo por defecto, entonces se tienen 7 intervalos.
3. Longitud del intervalo (ver ecuación 14)
C = = = 9,71 ≈ 10 (14)
En este caso, la aproximación se recomienda por exceso, por ejemplo, se la puede aproximar a 10.
El producto C*m = 10 * 7 = 70 excede al Rango = 68
R 68
m 7
Gráficos estadísticos: guía práctica para estadística descriptiva· 21
HistogramaEl histograma es una figura propia de las va-riables continuas, cuya tabla se ha organizado en intervalos de clase. Sobre el eje horizontal se observan los intervalos de clase y sobre el eje vertical el valor de las frecuencias absolu-tas (figura 10).
La lectura sobre el histograma es directa, cada caja representa el valor absoluto de las fre-cuencias, por ejemplo, para este caso 13 per-sonas entre 23 y 33 años, se encuentran re-cuperándose de la covid-19 en el hospital. El histograma es exclusivo de los datos numéri-cos continuos.
Diagrama de tortasEl diagrama de tortas es una de las gráficas que se usa para representar las frecuencias re-lativas, es común a todo tipo de variables, ya sean numéricas o categóricas. Al igual que en los datos enteros o categóricos, expresan el valor de la frecuencia relativa para cada uno de los elementos de la variable de estudio, en
marca de clase de los intervalos. El concep-to de marca de clase corresponde a la ubica-ción del centro de cada uno de los intervalos de clase.
TABLA 7
Tabla de frecuencias de personas con la COVID-19 que se recuperan en el hospital
Edades f h F H Xi
23-33 13 13 % 13 13 % 28
33-43 10 10 % 23 23 % 38
43-53 11 11 % 34 34 % 48
53-63 25 25 % 59 59 % 58
63-73 13 13 % 72 72 % 68
73-83 21 21 % 93 93 % 78
83-93 7 7 % 100 100 % 88
100 1
Nota. Datos tomados del Ministerio de Salud de Colombia (2020).
Teniendo en cuenta la información registrada en la tabla 7, se construyen los siguientes tipos de graficas: histogramas, tortas, ojivas, y polí-gonos de frecuencias.
13
23___33 33___43 43___53 53___63 63___73 73___83 83___93
1011
25
13
21
7
Figura 10. Histograma de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).
22 · Generación de contenidos impresos
Figura 11. Diagrama de tortas de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).
83 ___ 937%
73 ___ 8321%
23 ___ 3313%
33 ___ 4310%
43 ___ 5311%
53 ___ 6325%
63 ___ 7313%
Figura 12. Ojiva de personas con covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).
este caso representa las categorías o los inter-valos de clase, formadas con la variable edad, de las personas que se han hospitalizado a causa del contagio por covid-19 en Colombia (ver figura 11).
Ojivas Las ojivas son gráficos exclusivos de los datos
numéricos continuos que permiten visualizar
el valor de las frecuencias acumuladas tanto
absolutas como acumuladas. Para este gráfico, en el eje horizontal, se ubican los intervalos de clase; en el eje vertical, se leen las frecuencias absolutas acumuladas (figura 12).
Como el salto de intervalo implica continuidad en sus valores, su lectura se hace con base en el valor acumulado de la frecuencia tomando como final el extremo superior del interva-lo. Por ejemplo, existen 34 personas con la covid19 que están recuperándose en el hospi-tal por debajo de los 53 años.
13
23___33 33___43 43___53 53___63 63___73 73___83 83___93
23
34
59
72
93
100
Gráficos estadísticos: guía práctica para estadística descriptiva· 23
ellos podemos nombrar a los boxplot, las pirá-mides poblacionales, los diagramas de Pareto y otros que no se abordarán en este documento.
BOXPLOTPara Walker et al. (2018), el diagrama de caja es una herramienta eficaz de visualización de datos y útil en diversas aplicaciones y disci-plinas. Aunque existen métodos gráficos más sofisticados, el diagrama de caja sigue siendo relevante debido a su simplicidad, interpreta-bilidad y utilidad, incluso en la era del big data. Los boxplot se constituyen en gráficos para datos numéricos, generalmente, si agrupan tablas de frecuencias.
Uno de los aspectos importantes que es posible visualizar en los boxplots son los datos atípicos (puntos outlaiers), los cuales suponen una es-pecial atención en el análisis de datos, ya que suponen limitaciones inherentes al tratar con datos de distribuciones sesgadas. Por ejemplo, en la figura 14, para el grupo de mujeres existen cuatro puntos outlaiers, que llaman la atención ya que corresponden a edades de niños que se encuentran hospitalizados por la covid-19
Polígonos de frecuenciaEl polígono de frecuencia es el gráfico estadísti-co creado partir de un histograma de frecuen-cia y las marcas de clase. Estos histogramas emplean columnas verticales para reflejar fre-cuencias: el polígono de frecuencia es realiza-do uniendo los puntos que reflejan las marcas de clase del intervalo y la frecuencia absoluta (ver figura 13).
Visualmente, este gráfico identifica los puntos más altos y bajos de la distribución. Por ejemplo, en la figura 13, se puede evidenciar que las per-sonas entre 53 y 63 años representan el mayor número de hospitalizados por la covid-19. Asi-mismo, se puede determinar cómo el número de personas que tienen edades ente 83 y 93 es el grupo más pequeño en condiciones de hos-pitalización.
Otras gráficasExisten otro tipo de gráficas que tienen que ver con los datos categóricos o con datos numéri-cos y que proponen mucha información, entre
Figura 13. Polígono de frecuencias de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).
13
23___33 33___43 43___53 53___63 63___73 73___83 83___93
1011
25
13
21
7
24 · Generación de contenidos impresos
PIRÁMIDES POBLACIONALES
Las pirámides poblacionales han venido siendo usadas para representar la distribución de la población en diferentes eventos. En tiempos de la covid-19 se han vuelto muy comunes y han sido usadas para representar y comparar el número de contagios por sexo y por grupos etarios. Pacheco y Rosselli (2018) proponen el uso de estas figuras para hacer proyecciones demográficas, por ejemplo, la transición de-mográfica, y comparar la composición de la población en una región determinada.
La figura 15 se refiere a la pirámide población por grupo etario y género de los contagios por la covid-19 en Colombia. Lo que propone la pi-rámide es una comparación de la forma como se contagian hombres y mujeres; en la mayoría de los intervalos de clase etaria, el problema del contagio es similar, en otros se observa un aumento ligero en los hombres, en síntesis, permite observar el equilibrio o desequilibrio que existe en la población femenina y masculi-na que se ha contagiado con la covid-19.
Otros de los aspectos que permite visualizar
los boxplots es la comparación de grupos; por
ejemplo, en la figura 14 se observa cómo están
los grupos por género de aquellas personas
que se han contagiado por la covid-19 y que
se encuentran hospitalizados. Por la construc-
ción de las cajas, el grupo de hombres es más
grande que el de mujeres; asimismo, se ob-
servan que en el grupo de hombres existe un
nutrido grupo de personas jóvenes que están
en situación de hospitalización. Todas estas
observaciones y otras son posibles a la luz de
la construcción de estas figuras.
Finalmente, estos gráficos permiten obser-
var el valor de las medidas de tendencia
central, de posición, de dispersión e, incluso,
es posible analizar la asimetría y la normali-
dad de los datos, asimismo, observar, valores
mínimos máximos, rangos, entre otros. Todos
estos elementos de información que propo-
nen los boxplots suponen importancia esta-
dística para el análisis de datos números o de
pequeños grupos.
Figura 14. Boxplot por género de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).
101
81
61
41
21
1
Mujeres
Hombres
Gráficos estadísticos: guía práctica para estadística descriptiva· 25
TABLA 8
Tabla de Pareto de personas con la COVID-19 que se recuperan en el hospital
Edades f h F H
53-63 25 25 % 59 25 %
73-83 21 21 % 93 46 %
23-33 13 13 % 13 59 %
63-73 13 13 % 72 72 %
43-53 11 11 % 34 83 %
33-43 10 10 % 23 93 %
83-93 7 7 % 100 100 %
100 1
Nota. Datos tomados del Ministerio de Salud de Colombia.
En la tabla 7, se han preparado los datos para la realización de la gráfica de Pareto. Los inter-valos están dispuestos de acuerdo con el orden descendente de las frecuencias absolutas. La preparación de los datos supone la división de los grupos determinados en grupos críticos y poco críticos, lo cual se observa en la figura 16.
Si da clic en el enlace, puede encontrar un
video titulado “Pirámide poblacional en Excel
| Tips y trucos en Excel”, que le servirá de guía
para la construcción de una pirámide pobla-
cional en Excel.
DIAGRAMA DE PARETO
Un diagrama de Pareto es una técnica gráfica
simple para ordenar elementos, desde el más
frecuente hasta el menos frecuente (en forma
descendente), basándose en el principio de
Pareto. En el caso que aquí se expone (ver
tabla 8), se trata de observar el grupo etario
de mayores casos de contagio por edades, a los
que se los puede dividir en dos grupos: críti-
cos y poco críticos. La proporción de los grupos
críticos para Pareto resulta ser de aproxima-
damente un 20 % para los “pocos críticos” de
un 80 %. Este 20 % serán los grupos etarios res-
ponsables de la mayor parte del efecto que
se produce en casos de hospitalización por la
covid-19 en Colombia.
Figura 15. Pirámide poblacional por género de personas con la COVID-19 en Colombia. Adaptado del Boletín Epidemiológico COVID-19, por la Subred Integrada de Servicios de Salud. (2020).
> 90
80 __ 89
70 __ 79
60 __ 69
50 __ 59
40 __ 49
30 __ 39
20 __ 29
10 __ 19
0 __ 9
6546
32713
69566
7049
30379
64592
134421 124829
211638 196535
249174 231393
341887 317490
322530 299514
103220 95355
49408 45882
400000 4000000300000 300000200000 200000100000 100000
Hombres
Mujeres
26 · Generación de contenidos impresos
lleguen al hospital producto del contagio por la covid-19.
Una lectura de la figura nos propone que el 72 % está generado por cuatro causas princi-pales, determinados por los grupos etarios de 53-63; 73-83; 23-83; 63-73. Una recomendación a la luz de estos resultados propondría hacer una revisión sobre estos grupos etarios, ya que aquí se concentra la mayoría de las personas con la covid-19 en el hospital.
Si da clic en el siguiente enlace, podrá encontrar un video titulado “¿Cómo hacer un diagrama de Pareto en Excel 2016?”, que le servirá de guía para la construcción de los diagramas de Pareto.
Para obtener la figura 16, los datos tienen que estar ordenados de mayor a menor. Las causas en el eje x, sobre el eje y izquierdo, se dispo-nen los valores de la frecuencia absoluta acu-mulada; sobre el lado derecho, se observan los valores de la frecuencia relativa acumulada.
De acuerdo con lo dispuesto por Pareto, el 80 % de las consecuencias es producto del 20 % de las causas. El grafico identifica el 80 %; como este valor se observa sobre las frecuencias acumuladas, para el caso que se observa el valor cercano corresponde al 72 %, en el cual se concentrará el esfuerzo de grupo etario por disminuir el número de personas que
Figura 16. Diagrama de Pareto de personas con la covid-19 que se recuperan en el hospital. Datos tomados del Ministerio de Salud de Colombia.
100
90
80
70
60
50
40
30
20
10
0
Pers
onas
con
COV
ID-1
9 qu
e se
recu
pera
n en
el h
ospi
tal
Rango de edades de personas con COVID-19 que se recuperan en el hospital
53 __63 73 __83 23 __33 63 __73 43 __53 33 __43 83 __93
Porc
enta
je A
cum
ulad
o
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
25%
46%
59%
72%
83%
93%
100%
25 2113 13 11 10 7
Gráficos estadísticos: guía práctica para estadística descriptiva· 27
Aquí:
1. Primaria
2. Secundaria
3. Técnica
4. Universidad
5. Posgrado
Elabore para datos categóricos, la tabla de fre-
cuencias y los respectivos gráficos, acordes
con este tipo de variables. Haga uso de Excel
para la construcción de las tablas y de sus res-
pectivos gráficos.
Ejercicio n.° 2Cuestionario, por niveles taxonómicos de solo,
con lectura de gráficos estadísticos.
Con el propósito de fortalecer la lectura y la
comprensión de los gráficos estadísticos se
hace uso de la taxonomía solo en sus cuatro
niveles. Con respecto a esta taxonomía Biggs
y Collis (1982) observaron que, “en la progre-
sión desde la incompetencia hasta la maes-
tría, los estudiantes muestran una secuencia
consistente, o ciclo de aprendizaje, que es ge-
neralizable a una gran variedad de tareas y
en particular a las tareas escolares”. Esta se-
cuencia se refiere a un progreso jerárquico en
la complejidad estructural de sus respuestas,
cualquiera que sea el modo de funcionar o
modo de representación, en el que se exprese
el aprendizaje. Lo anterior supone que el
proceso de indagar partirá de posiciones sen-
cillas para llegar a propuestas complejas en
las que se evidencia el grado de aprendizaje
en los estudiantes (Biggs y Collis, 1991). En las
siguientes preguntas.
Según la figura 1 que muestra los asesinatos
ocurridos a líderes sociales, responda:
EJERCICIOS DE APLICACIÓN
Ejercicio n.° 1En una encuesta aplicada a microempresarios de la ciudad de Villavicencio se desea indagar sobre su formación. Se realizó la encuesta con 150 microempresarios. Los resultados fueron los siguientes:
4 3 2 4 4
2 2 4 2 4
4 4 3 2 4
3 2 4 3 4
2 3 4 4 4
2 1 3 3 3
2 4 2 3 4
3 4 3 4 4
2 4 4 4 4
4 3 3 3 4
3 3 3 4 4
4 4 2 3 3
4 3 3 3 4
3 5 4 4 4
4 2 3 4 4
4 3 3 3 3
2 2 3 4 4
4 3 4 2 4
1 3 3 4 3
4 5 4 3 4
4 4 4 4 3
4 3 3 4 4
4 3 3 3 4
4 4 4 2 3
4 5 2 4 4
3 4 3 4 4
4 3 2 3 2
4 4 2 4 4
4 4 4 4 2
4 3 4 3 3
28 · Generación de contenidos impresos
desconfianza de pueblo en torno al se-guimiento y la aplicación de la justicia.
C. La excesiva manifestaciòn de asesina-tos ocurridos a lo largo de un año (2017 y 2018) implica que hubo un mayor de-sarrollo de estrategias en contra la de-lincuencia, lo que provoca disminución de los casos refejados en año siguiente (2018-2019).
D. El registro y analisis de asesinatos en un periodo de un año y el aumento de los pro-blemas de la delincuencia dilatan la apli-cación de estrategias para su prevención.
De acuerdo con la información evidenciada en la figura 17, responda las siguientes preguntas:
De acuerdo con la gráfica del comparativo del mes de junio, responda:
5. La deforestación por km2 para el 2017 es
A. 600.
B. 1000.
C. 200.
D. 6000.
6. Para el 2016 y 2019 la deforestación por km2 está entre
A. 200 y 400.
B. 200 y 1000.
C. 800 y 1000.
D. 400 y 600.
7. Al analizar la deforestación comparati-va por años de agosto a junio por km2 se puede afirmar que
A. Durante el gobierno de Bolsonaro hubo más de 3000 km2 reportados en defores-tación y degradación.
1. Entre el 7 de agosto del 2016 y el 9 de julio del 2017 ocurrieron:
A. 69 asesinatos.
B. 80 asesinatos.
C. 105 asesinatos.
D. 10 asesinatos.
2. Fueron asesinados 105 lideres sociales entre
A. El de 10 de julio del 2017 y el 6 de agosto del 2017.
B. El 7 de agosto del 2017 y el 9 de julio del 2018.
C. El 10 de julio del 2018 y el 6 de agosto del 2018.
D. El 1 de agosto del 2016 y el 9 de julio del 2019.
3. El mayor aumento de asesinatos es
A. 37 correspondiente a la diferencia de ase-sinatos ocurridos entre el 7 de agosto del 2016 y el 9 de julio del 2018.
B. 1 representa el aumento de asesinatos entre el 7 de agosto del 2016 y el 9 de julio del 2019.
C. 5 son los asesinatos ocurridos entre el 10 de julio del 2018 y el 6 de agosto del 2018.
D. 100 corresponde a los asesinatos entre el 6 de agosto del 2017 al 9 de agosto del 2018.
4. Según los asesinatos ocurridos a líderes so-ciales ocurridos entre enero del 2016 y julio del 2019 se infiere que:
A. La disminución de los asesinatos durante julio y agosto del 2017 obedece al aumento de los casos ocurridos en el año imediata-mente anterior.
B. El aumento de asesinatos ocurridos entre agosto del 2017 y julio del 2018 provocan
Gráficos estadísticos: guía práctica para estadística descriptiva· 29
Figura 17. Radiografía de la deforestación en el Amazonas brasileño (junio del 2019). Tomado de Pasquali (2020), a partir de efe, cifras de deter e inpe y adaptación infográfica etc.
Deforestación
Comparativo mes de junioREPUNTA LA DEFORESTACIÓN Comparativo por años
(agosto a junio. Km2)Gobierno
Bolsonaro3.000 km2
4.638,7
4.181,5 3.975,5
4.574,9
446,56
193,28
153,55
1.025,58
577,25
228,44
Deforestación y degradación
Top 3 por estados Top 3 por estados
Pará
Amazonas
Mato grosso
km2
1.000
800
600
400
200
02016 2017 2018 2019 2016 2017 2018 2019
Mato grosso
Pará
Amazonas
920,21 km2 2.072 km2
B. Para el 2019 la deforestación disminuyó notablemente.
C. Para el 2019 se presentó la cifra más alta en deforestación y degradación.
D. Año tras años la cifra de deforestación y degradación disminuye gradualmente.
8. La deforestación y la degradación de la amazonia brasilera determina:
A. Una alta deforestación en los años 2016 y 2019 producto de la falta de compro-miso del Gobierno con el medio ambien-te, falta de control de los incendios arti-ficiales y la consistente demanda de las empresas productoras de madera.
B. Un decrecimiento mínimo en la defores-tación para el 2019 con respecto al 2016
lo que sugiere una falta de compromi-
so del Gobierno actual por controlar las
causas de este.
C. La deforestación para el 2018 representa
la más baja deforestación lo cual implica
que hubo un mayor control en las políti-
cas de reserva ambiental.
D. Los altibajos en deforestación por kiló-
metro cuadrado en comparación con
junio, en el cual el 2016 y 2019 ocupan el
primer lugar y el 2017 y 2018 el segundo
con más bajos índices de deforestación.
En el 2012, las emisiones totales de Colom-
bia ascienden a 178 000 Gg CO², la distribución
sectorial de emisiones de Gases Efecto de In-
vernadero se representa en la figura 18.
30 · Generación de contenidos impresos
C. i y iv solamente.
D. y iii solamente.
10. Sabiendo que la producción total de emisión
de gei en Colombia ascienden a 178 000 Gg
CO², cuantos miles de Gg CO² debe dismi-
nuir el sector agricultura, silvicultura y
otros usos de la tierra (afolu) para que su
porcentaje descienda a un 40 %:
A. 14 000,24 Gg CO²
B. 71 000,2 Gg CO²
C. 76 000,54 Gg CO²
D. 5000,34 mil Gg CO²
Teniendo en cuenta la información dada en la figura 18, ¿cuál de las siguientes afirmaciones son verdaderas?
A. El sector que genera mayor contamina-ción es el sector energético.
B. El sector agricultura, silvicultura y otros usos de la tierra (afolu) generan más del 50 % de las emisiones de gei del país.
C. Los sectores energía y procesos indus-triales y uso de productos generan más del 50 % de las emisiones de gei del país.
9. Los sectores energía y residuos generan más del 50 % de las emisiones de gei del país:
A. solamente.
B. solamente.
Figura 18. Emisiones GEI de Colombia en el 2012. Tomado de Inventario Nacional de Gases de Efecto Invernadero (2012).
Residuos
8%
44%43%
5%
Energía
Agricultura,silvicultura y otrosusos de la tierra(AFOLU)
Procesos industrialesy usos de productos
Gráficos estadísticos: guía práctica para estadística descriptiva· 31
Inte
rval
os
L-Cr
itica
Mat
emát
icas
C-Na
tura
les
C-Ci
udad
anas
26-34,5
34,5-43
43-51,5
51,5-60
60-68,5
68,5-77
Total
Ejercicio n.° 4Para los datos no organizados de la prueba saber, construya los Boxplot y establezca com-paraciones entre las asignaturas que se pre-sentan en la tabla.
Ejercicio n.° 5Para los valores obtenidos en las asignaturas de L-Critica y Matemáticas, elabore una pirá-mide de resultados y establezca algunas com-paraciones.
Ejercicio n.° 6Al parecer, los resultados de la prueba de lectura crítica están relacionados con la canti-dad de libros leídos por un estudiante. A partir de los datos obtenidos en la siguiente tabla, dibuje un diagrama de Pareto. Concluya con respecto a las variables de lectura.
Variables de lectura Intervalos Promedios
No leen 0 50
Leen poco 0-10 51
Lectura mediana 11-25 56
Bastante lectura 26-100 56,2
Mucha lectura >10 58
Ejercicio n.° 3A continuación, se proponen algunos datos obtenidos en las pruebas saber-2019.
L-Critica Matemáticas C-Naturales C-Ciudadanas
47 48 37 30
60 65 54 59
66 57 41 74
62 54 61 73
63 57 55 57
49 29 41 41
76 70 70 68
57 65 63 66
62 62 66 39
68 66 63 77
42 40 28 39
38 31 41 26
64 56 59 60
52 66 54 52
54 49 40 33
52 55 61 50
63 68 54 69
48 54 58 50
52 55 49 32
61 38 44 45
55 64 57 57
57 51 45 38
58 57 49 42
34 39 38 28
48 71 61 55
75 73 59 75
53 56 54 55
53 48 43 46
40 43 39 39
69 57 63 61
49 55 31 31
59 51 51 45
65 64 54 62
55 55 50 45
56 51 49 51
Para los datos propuestos, obtenga el valor de las frecuencias absolutas, relativas y acu-muladas, propuestas desde la siguiente tabla. Elabore histogramas para matemáticas y L-Crítica, Ojivas para C-naturales y diagramas circulares para C-ciudadanas. Realice lecturas para algunas graficas.
32 · Generación de contenidos impresos
REFERENCIASBatanero, C. y Díaz, C. (2011). Estadística con proyectos. Universidad de Granada.
Castellanos. M. T. y Obando J. (2013). Análisis y sistemas de datos poderoso escenario de aprendizaje cultural.
Revista Científica, 2(54), 504-508.
Contreras, A., Cárdenas, C., González, J., Toloza, S., Zambrano, L. y Pulido-Rojan, A. (2019). Herramientas estadísti-
cas para la mejora del control de inventarios: un caso de estudio. Investigación y Desarrollo en tic, 10(1), 13-24.
Consejería Presidencial de los Derechos Humanos. (2019). Informe sobre el balance de las acciones y estrategias ade-
lantadas en el marco de la protección de los líderes, lideresas sociales y defensores de derechos humanos. Consejería
Presidencial de los Derechos Humanos. http://www.derechoshumanos.gov.co/Prensa/2019/Documents/
INFORME%20LDDH%20ACTUALIZADO%2017%20DE%20JULIO_V2.pdf
Departamento Administrativo Nacional de Estadística. (dane). (2020). Boletín técnico. Estadísticas vitales – eevv.
Defunciones por covid-19. 2 de marzo al 4 de octubre de 2020pr. dane. https://www.dane.gov.co/files/investiga-
ciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf
Ingeniería Industrial Easy. (2017, 11 de marzo). Cómo hacer un diagrama de Pareto en Excel 2016. [Video de You-
Tube]. https://bit.ly/38TKbou
Instituto Nacional de Salud. (ins). (2020). covid-19 en Colombia. Instituto Nacional de Salud. https://www.ins.
gov.co/Noticias/Paginas/coronavirus-casos.aspx
Inventario Nacional de Gases de Efecto Invernadero. (gei). (2012). Tercera Comunicación Nacional de Cambio Cli-
mático. Programa de las Naciones Unidas para el Desarrollo (pnud). http://documentacion.ideam.gov.co/
openbiblio/bvirtual/023421/cartilla_INGEI.pdf
Microsoft Excel a Todo Nivel. (2016, 1 de agosto). Pirámide poblacional en Excel | Tips y trucos en Excel. [Video de
YouTube]. https://bit.ly/3nf0Nzh
Pasquali, M. (2020). La deforestación en la Amazonia brasileña alcanza su nivel más alto en una década. Sta-
tista. https://es.statista.com/grafico/16328/deforestacion-estimada-en-la-amazonia-brasilena/
Polanía, M. J., Pacheco, B. y Rosselli, D. (2018). El uso de pirámides poblacionales como representación gráfica
del sistema de salud colombiano. Archivos de Medicina (Manizales), 18(1), 127-133.
Ross, S. M. (2018). Introducción a la estadística. Reverté.
Subred Integrada de Servicios de Salud. (2020, 26 de agosto). Boletín Epidemiológico covid-19. Datos Abiertos Bogo-
tá. https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf-
6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf
Walker, M. L., Dovoedo, Y. H., Chakraborti, S. y Hilton, C. W. (2018). Un diagrama de caja mejorado para datos
univariados. The American Statistician, 72(4), 348-353.