UNIVERSIDAD DE GUAYAQUIL -...
Transcript of UNIVERSIDAD DE GUAYAQUIL -...
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES
IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD
VEHICULAR EN EL CANTÓN DE LA LIBERTAD.
PROYECTO DE TITULACIÓN
Previa a la obtención del Título de:
INGENIERO EN SISTEMAS COMPUTACIONALES
AUTORES:
ESTEFANÍA ROCHA TAMAYO
CARLOS VILLARREAL VÁSQUEZ
TUTOR:
ING. JIMMY SORNOZA MOREIRA M. SC.
GUAYAQUIL – ECUADOR
2018
REPOSITORIO NACIONAL EN CIENCIA Y TECNOLOGÍA
FICHA DE REGISTRO DE TESIS
TÍTULO: “IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD
VEHICULAR EN EL CANTÓN LA LIBERTAD”
AUTOR/ES:
Estefanía Rocha Tamayo
Carlos Villarreal Vásquez
REVISORES:
Ing. Lorenzo Cevallos Torres M. Sc.
Ing. Karla Abad Sacoto M. Sc
INSTITUCIÓN: Universidad de
Guayaquil
FACULTAD: Ciencias Matemáticas y Físicas
CARRERA: Ingeniería en Sistemas Computacionales
FECHA DE PUBLICACIÓN: N. DE PAGS: 162
AREAS TEMATICAS: Big Data
PALABRAS CLAVES: Control de Tránsito vehicular, Big Data , Toma de decisiones
RESUMEN: El tráfico vehicular es un mal común en casi cualquier ciudad o país del mundo, lo
cual afecta considerablemente a la población en general, el propósito de esta investigación se
centra en analizar datos e información por medio de una herramienta, la cual permitirá
visualizar el impacto del uso de Big Data enfocada a la movilidad vehicular del cantón de La
Libertad en Ecuador. El sistema está basado en un gran conjunto de datos que manejados con
la tecnología Big Data servirían de gran ayuda para la toma de decisiones en la organización y
planeación de una ciudad inteligente y automatizada
N. DE REGISTRO(en base de
datos):
N. DE CLASIFICACIÓN
DIRECCION URL(tesis en la web):
ADJUNTO PDF: SI
NO
CONTACTO CON AUTOR/ES:
Estefanía Rocha Tamayo
Carlos Villarreal Vásquez
Teléfono:
0939908443
0969580727
E-mail:
CONTACTO EN LA
INSTITUCIÓN:
Carrera de Ingeniería en
Sistemas Computacionales
Nombre: Ab. Juan Chávez Atocha
Teléfono:2307729
E-mail: [email protected]
X
II
APROBACIÓN DEL TUTOR
En mi calidad de Tutor del trabajo de investigación, “IMPACTO DEL USO DE
BIG DATA EN LA GESTIÓN DE MOVILIDAD VEHICULAR EN EL CANTÓN DE
LA LIBERTAD” elaborado por la Srta. Estefanía Priscila Rocha Tamayo y el Sr.
Carlos Alfredo Villarreal Vásquez, Alumnos no titulados de la Carrera de
Ingeniería en Sistemas Computacionales, Facultad de Ciencias Matemáticas y
Físicas de la Universidad de Guayaquil, previo a la obtención del Título de
Ingeniero en Sistemas Computacionales, me permito declarar que luego de
haber orientado, estudiado y revisado, la Apruebo en todas sus partes.
Atentamente
Ing. Jimmy Sornoza Moreira M.Sc.
TUTOR
III
DEDICATORIA
Este trabajo está dedicado a mi
familia quienes fueron el pilar
fundamental a lo largo de mis
estudios, llegando a culminar la
carrera profesional.
A mi madre quien siempre
estuvo en los buenos y malos
momentos y que gracias a su
sabiduría y amor supo guiarme
por buen camino y a no
desviarme de mis objetivos. A mi
padre quien siempre estuvo
dándome fuerzas para seguir
adelante. A mis hermanas y
sobrinos quienes siempre
confiaron en mí y me daban
ánimos para cumplir mis metas,
brindándome su ayuda
incondicionalmente.
Estefanía Rocha Tamayo
IV
AGRADECIMIENTO
Agradezco a Dios por darme
fortaleza necesaria para
culminar los estudios
universitarios.
A mis padres por estar en los
buenos y difíciles momentos de
mi carrera universitaria, a mis
hermanas, sobrinos por siempre
apoyarme y darme ánimos
incondicionalmente, a mi tutor
por guiarme en este proyecto. A
mi compañero de tesis porque
fue una parte fundamental para
realizar este trabajo debido a
que se trabajó en equipo para
cumplir la meta deseada. A mi
tutor y revisor por ser los guías
que ayudaron a culminar este
objetivo.
Estefanía Rocha Tamayo
V
DEDICATORIA
Este proyecto se lo dedico
primordialmente a Dios y a mis
padres por confiar en mí y por
haberme enseñado que la vida
siempre se la tiene que ganar a
base de esfuerzo y lucha
A mis hermanos por su apoyo en
todo momento. A mis
compañeros y amigos que me
acompañaron a lo largo de mi
vida como estudiante
universitario, me llevaré gratos
recuerdos de lo vivido en esta
universidad.
Carlos Villarreal Vásquez
VI
AGRADECIMIENTO
Agradezco primeramente a Dios
por darme sabiduría en todo el
transcurso del estudio y poder
lograr mis objetivos.
Agradezco a mis padres,
familiares cercanos que me
brindaron su apoyo
incondicionalmente, al tutor y
revisor por haber brindado su
conocimiento en este trabajo de
titulación y por darme las
indicaciones necesarias para
culminar este proyecto y a mi
compañera de tesis por
acompañarme en este arduo
proceso
Carlos Villarreal Vásquez
VII
TRIBUNAL PROYECTO DE TITULACIÓN
Ing. Eduardo Santos Baquerizo, M.Sc
DECANO DE LA FACULTAD
CIENCIAS MATEMÁTICAS Y
FÍSICAS
Ing. Abel Alarcón Salvatierra, Mgs.
DIRECTOR DE LA CARRERA DE
INGENIERÍA EN SISTEMAS
COMPUTACIONALES
Ing. Lorenzo Cevallos Torres M.Sc.
PROFESOR REVISOR DEL ÁREA
TRIBUNAL
Ing. Karla Abad Sacoto M.Sc.
PROFESOR REVISOR DEL ÁREA
TRIBUNAL
Ing. Jimmy Sornoza Moreira M.Sc.
PROFESOR TUTOR DEL PROYECTO
DE TITULACIÓN
Ab. Juan Chávez Atocha, Esp.
SECRETARIO
VIII
DECLARACIÓN EXPRESA
“La responsabilidad del contenido del proyecto
de titulación “IMPACTO DEL USO DE BIG
DATA EN LA GESTIÓN DE MOVILIDAD
VEHICULAR EN EL CANTÓN DE LA
LIBERTAD“, me corresponden
exclusivamente; y el patrimonio intelectual
de la misma a la UNIVERSIDAD DE
GUAYAQUIL”
ESTEFANÍA ROCHA TAMAYO CARLOS VILLARREAL VÁSQUEZ
IX
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES
IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD
VEHICULAR EN EL CANTÓN DE LA LIBERTAD.
Proyecto de Titulación que se presenta como requisito para optar por el título
de INGENIERO EN SISTEMAS COMPUTACIONALES
Autora: Estefanía Priscila Rocha Tamayo
C.I: 0927256693
Autora: Carlos Villarreal Vásquez
C.I: 0931225056
X
CERTIFICADO DE ACEPTACIÓN DEL TUTOR
En mi calidad de Tutor del proyecto de titulación, nombrado por el Consejo
Directivo de la Facultad de Ciencias Matemáticas y Físicas de la Universidad
de Guayaquil.
CERTIFICO:
Que he analizado el Proyecto de Titulación presentado por el/la
estudiante CARLOS VILLARREAL VÁSQUEZ y ESTEFANÍA ROCHA
TAMAYO, como requisito previo para optar por el título de Ingeniero en
Sistemas Computacionales cuyo problema es:
“IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD
VEHICULAR EN EL CANTÓN DE LA LIBERTAD“.
Considero aprobado el trabajo en su totalidad.
Presentado por:
ESTEFANÍA ROCHA TAMAYO CARLOS VILLARREAL VÁSQUEZ
C.I: 0927256693 C.I: 0931225056
Tutor: Ing. Jimmy Sornoza Moreira M.Sc.
Guayaquil, marzo de 2018
XI
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES
Autorización para Publicación de Proyecto de Titulación en Formato
Digital
1. Identificación del Proyecto de Titulación
Nombre Alumno: Estefanía Priscila Rocha Tamayo
Carlos Alfredo Villarreal Vásquez
Dirección: 31 entre Oriente y Amazonas
Miguel H. Alcívar y Plaza Dañín
Teléfono: 0939908443
0969580727
E-mail: [email protected]
Facultad: Ciencias Matemáticas y Físicas
Carrera: Ingeniería en Sistemas Computacionales
Proyecto de titulación al que opta: Ingeniero en Sistemas
Computacionales
Profesor guía: Ing. Jimmy Sornoza Moreira M. Sc.
XII
Título del Proyecto de titulación: “Impacto del uso de Big Data en la
gestión de movilidad vehicular en el cantón de La Libertad”
Tema del Proyecto de Titulación: datos, análisis, movilidad vehicular,
tránsito.
2. Autorización de Publicación de Versión Electrónica del Proyecto de
Titulación
A través de este medio autorizo a la Biblioteca de la Universidad de
Guayaquil y a la Facultad de Ciencias Matemáticas y Físicas a publicar la
versión electrónica de este Proyecto de titulación.
Publicación electrónica:
Inmediata x Después de 1 año
ESTEFANÍA ROCHA TAMAYO CARLOS VILLARREAL VÁSQUEZ
C.I: 0927256693 C.I: 0931225056
XIII
3. Forma de envío:
El texto del proyecto de titulación debe ser enviado en formato Word, como
archivo .Doc. O .RTF y .Puf para PC. Las imágenes que la acompañen
pueden ser: .gif, .jpg o .TIFF.
DVDROM CDROM x
XIV
INDICE GENERAL
INDICE GENERAL .................................................................................. XIV
ÍNDICE DE CUADROS .......................................................................... XVII
ÍNDICE DE FIGURAS ............................................................................. XIX
ÍNDICE DE GRÁFICOS........................................................................... XXI
RESUMEN ............................................................................................ XXIII
ABSTRACT .......................................................................................... XXIV
INTRODUCCIÓN ........................................................................................... 1
CAPITULO I .................................................................................................. 3
PLANTEAMIENTO DEL PROBLEMA ............................................................ 3
Ubicación del problema en un contexto ................................................... 3
Situación Conflicto Nudos Críticos .......................................................... 4
Delimitación del Problema ....................................................................... 5
Evaluación del problema ......................................................................... 5
OBJETIVOS DE LA INVESTIGACIÓN ........................................................ 6
Objetivo General ..................................................................................... 6
Objetivos Específicos .............................................................................. 6
ALCANCES DEL PROBLEMA .................................................................... 7
JUSTIFICACIÓN E IMPORTANCIA ............................................................ 7
CAPITULO II ................................................................................................. 9
MARCO TEÓRICO ...................................................................................... 9
ANTECEDENTES DEL ESTUDIO. .............................................................. 9
XV
FUNDAMENTACIÓN TEÓRICA ................................................................ 10
Big Data ................................................................................................ 10
Arquitectura de Big Data ....................................................................... 12
Componentes de arquitecturas de Big Data. ......................................... 12
Advanced Analytics ............................................................................... 14
Big Data Analytics ................................................................................. 14
Beneficios de Big Data Analytics ........................................................... 15
Minería de datos ................................................................................... 15
Las 5 V de Big Data. ............................................................................. 17
Cubos de Información ........................................................................... 19
Google Cloud Platform .......................................................................... 20
Cloud Datalab ....................................................................................... 21
IBM Cognos TM1 .................................................................................. 21
IBM Cognos TM1 Performance Modeler ............................................... 22
Gestión de la movilidad vehicular .......................................................... 25
Movilidad urbana y siniestralidad vial .................................................... 26
Antecedentes y estado de la técnica ..................................................... 27
Lógica difusa ......................................................................................... 27
Mapas Cognitivos Difusos ..................................................................... 28
FUNDAMENTACIÓN LEGAL .................................................................... 33
Artículos de la Constitución de la República del Ecuador. ..................... 33
Artículos de la Ley Orgánica de Transporte Terrestre Tránsito y
Seguridad Vial. ...................................................................................... 33
XVI
DEFINICIONES CONCEPTUALES ........................................................... 34
CAPITULO III .............................................................................................. 37
METODOLOGÍA DE LA INVESTIGACIÓN .................................................. 37
DISEÑO DE LA INVESTIGACIÓN ............................................................ 37
Meta-análisis ............................................................................................. 46
Codificación y descripción de variables ................................................. 47
Interpretación y análisis de los resultados: Análisis Univariado de los
datos ..................................................................................................... 51
Uso de herramienta de Big Data ........................................................... 69
Uso de Mapas Cognitivos Difusos ......................................................... 86
CAPITULO IV .............................................................................................. 96
RESULTADOS .......................................................................................... 96
CONCLUSIONES.................................................................................... 109
RECOMENDACIONES ........................................................................... 110
REFERENCIAS ..........................................................................................111
XVII
ÍNDICE DE CUADROS
Cuadro N 1 Causas y consecuencias del problema.................................. 4
Cuadro N 2 Delimitación del problema ..................................................... 5
Cuadro N 3 Íconos de Semáforo............................................................... 24
Cuadro N 4 Íconos de Tendencia ............................................................. 25
Cuadro N 5 Representación de una matriz de adyacencia ..................... 30
Cuadro N 6 . Caso de Estudio: Expertos de gestión vehicular ............... 38
Cuadro N 7 Pregunta 1 Expertos .............................................................. 39
Cuadro N 8 Pregunta 6 Expertos .............................................................. 40
Cuadro N 9 Pregunta 3 Expertos .............................................................. 41
Cuadro N 10 Pregunta 4 Expertos ............................................................ 42
Cuadro N 11 Pregunta 5 Expertos ............................................................ 43
Cuadro N 12 Pregunta 6 Expertos ............................................................ 44
Cuadro N 13 Portal Bibliográfico .............................................................. 47
Cuadro N 14 Género del Primer Autor ..................................................... 48
Cuadro N 15 Tipo de Journal .................................................................... 48
Cuadro N 16 Tipo de Investigación .......................................................... 49
Cuadro N 17 Tipo de Investigación .......................................................... 49
Cuadro N 18 Portal Bibliográfico .............................................................. 51
Cuadro N 19 Género del Primer Autor ..................................................... 53
Cuadro N 20 Tipo de Journal .................................................................... 53
Cuadro N 21 Tipo de Investigación .......................................................... 55
Cuadro N 22 Criterio de Inclusión y Exclusión ........................................ 55
Cuadro N 23 Tabla de Frecuencia de la variable Big Data ...................... 56
Cuadro N 24 Tabla para el análisis de la variable Big Data .................... 57
Cuadro N 25 Tabla de frecuencia de la variable traffic_vehicular .......... 59
Cuadro N 26 Tabla para el análisis de la variable traffic_vehicular ....... 59
XVIII
Cuadro N 27 Tabla de frecuencia de la variable Lógica Difusa .............. 60
Cuadro N 28 Tabla para el análisis de la variable Lógica Difusa ........... 61
Cuadro N 29 Tabla de frecuencia de la variable Mapa Cognitivo Difuso 63
Cuadro N 30 Tabla para el análisis de la variable Mapa Cognitivo Difuso
.................................................................................................................... 63
Cuadro N 31 Tabla para el análisis de la variable Conjunto Difuso ....... 65
Cuadro N 32 Tabla para el análisis de la variable Conjunto Difuso ....... 65
Cuadro N 33 Tabla de Frecuencia de la variable Variables Lingüística . 67
Cuadro N 34 Tabla para el análisis de la variable Variables Lingüística 67
Cuadro N 35 Dimensión factores.............................................................. 80
Cuadro N 36 Nodos de Mapa Cognitivo Difuso ....................................... 87
Cuadro N 37 Etiqueta Lingüística ............................................................. 89
Cuadro N 38 . Caso de Estudio: Representación de matriz de adyacencia
.................................................................................................................... 90
Cuadro N 39 . Matriz adyacencia del MCD ............................................... 90
Cuadro N 40 . Multiplicación de vector de entrada con matriz adyacencia
.................................................................................................................... 91
Cuadro N 41 . Resultado de la Centralidad de los nodos ......................103
Cuadro N 42 . Iteraciones del MCD ..........................................................103
XIX
ÍNDICE DE FIGURAS
Figura 1. Componentes de la Arquitectura Big Data ............................... 13
Figura 2. Cubo de métricas ....................................................................... 23
Figura 3. Relación entre dos conceptos .................................................. 29
Figura 4. Variables metaanálisis............................................................... 46
Figura 5. Google Cloud Platform Creación de proyecto ......................... 69
Figura 6. Google Cloud Platform Nombre de proyecto ........................... 69
Figura 7. Google Cloud Platform .............................................................. 70
Figura 8. Compute Engine ........................................................................ 71
Figura 9. Recursos de Compute Engine .................................................. 71
Figura 10. BigQuery Carga de datos ........................................................ 72
Figura 11. BigQuery Esquema .................................................................. 73
Figura 12. BigQuery Detalles de tabla ...................................................... 73
Figura 13. BigQuery Preview .................................................................... 74
Figura 14. BigQuery Consulta .................................................................. 75
Figura 15. Google Cloud Platform Shell ................................................... 76
Figura 16. Instalación Datalab .................................................................. 76
Figura 17. Iniciar datalab ........................................................................... 77
Figura 18. Datalab Notebooks .................................................................. 77
Figura 19. Datalab Consulta ...................................................................... 78
Figura 20. Dimensión factores .................................................................. 80
Figura 21. Dimensión indicador................................................................ 81
Figura 22. Dimensión mes_continuo ....................................................... 81
Figura 23. Dimensión zona ....................................................................... 82
Figura 24. Dimensión horas ...................................................................... 82
Figura 25. Cubo Transit ............................................................................. 83
Figura 26. Cruce Cubo Transit .................................................................. 84
XX
Figura 27. Cruce Cubo Transit: Accidentes ............................................. 84
Figura 28. Diagram en TM1 ....................................................................... 85
Figura 29. Mapa Cognitivo Difuso del Tránsito Vehicular ...................... 88
Figura 30. Mental Modeler: Mapa Cognitivo Difuso ................................ 93
Figura 31. Mental Modeler: Matriz de adyacencia ................................... 93
Figura 32. Mental Modeler: Centralidad de los nodos ............................ 94
Figura 33. Mental Modeler: Vector de entrada ......................................... 95
Figura 34.Resultado del análisis de la información de tránsito en
Datalab ....................................................................................................... 97
Figura 35. Resultado Cubo Transit ........................................................... 98
Figura 36. Resultado accidentes Cubo Transit ....................................... 98
Figura 37. Visualización Diagrama Transit .............................................. 99
Figura 38. Visualización Diagram Transit 6-9 am ...................................100
Figura 39. Visualización Diagrama Accidentes ......................................101
Figura 40. Mental Modeler: Resultado de análisis .................................104
XXI
ÍNDICE DE GRÁFICOS
Gráfico 1. Pregunta número uno realizada a los expertos ..................... 39
Gráfico 2. Pregunta número dos realizada a los expertos...................... 40
Gráfico 3. Pregunta número tres realizada a los expertos ..................... 41
Gráfico 4. Pregunta número cuatro realizada a los expertos ................. 42
Gráfico 5. Pregunta número cinco realizada a los expertos................... 43
Gráfico 6. Pregunta número uno a los expertos ..................................... 45
Gráfico 7. Diagrama de la Variables Portal Bibliográfico........................ 52
Gráfico 8. Diagrama de la Variables Género del Autor ........................... 53
Gráfico 9. Diagrama de la Variables Tipo Journal ................................... 54
Gráfico 10. Diagrama de la Variables Tipo de Investigación .................. 55
Gráfico 11. Diagrama de la Variables Criterio Inclusión y Exclusión .... 56
Gráfico 12. Diagrama de la Variables Big Data ........................................ 57
Gráfico 13. Diagrama de la Variables Traffic Vehicular .......................... 59
Gráfico 14. Diagrama de la Variables Lógica Difusa ............................... 61
Gráfico 15. Diagrama de la Variables Mapa Cognitivo Difuso ................ 64
Gráfico 16. Diagrama de la Variables Conjunto Difuso ........................... 66
Gráfico 17. Diagrama de la Variable Lingüística ..................................... 68
XXII
ABREVIATURAS
TI Tecnología de la información INEC Instituto Nacional de Estadística y Censo IBM International Business Machines CTIC Centro de Tecnologías de la Información y la Comunicación. CTE Comisión de Tránsito del Ecuador SQL Structured Query Language API Application Programming Interface MCD Mapas Cognitivos Difusos
XXIII
UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD VEHICULAR EN EL
CANTÓN DE LA LIBERTAD.
Proyecto de Titulación que se presenta como requisito para optar por el título de INGENIERO EN SISTEMAS COMPUTACIONALES
Autor/a: ESTEFANÍA ROCHA TAMAYO
Autor/a: CARLOS VILLARREAL VÁSQUEZ Tutor: ING. JIMMY SORNOZA M. Sc.
RESUMEN
El tráfico vehicular es un mal común en casi cualquier ciudad o país del mundo, lo cual afecta considerablemente a la población en general, el propósito de esta investigación se centra en analizar datos e información por medio de una herramienta, la cual permitirá visualizar el impacto del uso de Big Data enfocada a la movilidad vehicular del cantón de La Libertad en Ecuador. El sistema está basado en un gran conjunto de datos que manejados con la tecnología Big Data servirían de gran ayuda para la toma de decisiones y planeación de una ciudad inteligente y automatizada. El problema radica en la congestión de vehículos que son generados por la falta de vías alternas, conjuntamente con la ligereza de los habitantes de la localidad en cuanto al incumplimiento de las leyes y normativas vigentes del tránsito y la seguridad vial. El análisis de la información permite examinar una cantidad considerable de datos, por medio de la asistencia del software destinado para los fines de captura, procesamiento y extracción de datos, se pudo realizar el impacto que alcanza la ejecución del mismo, así como también determinar la factibilidad, eficacia y eficiencia de la información que se obtiene como producto final, lo cual conduce al aporte de mejoras significativas de los servicios de transporte y seguridad vial.
Palabras clave: Control de Tránsito vehicular, Big Data, Análisis de datos, Toma de Decisiones
XXIV
UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES
IMPACT OF THE USE OF BIG DATA IN THE MANAGEMENT OF VEHICULAR MOBILITY IN THE CANTON OF LIBERTAD.
Proyecto de Titulación que se presenta como requisito para optar por el título de
INGENIERO EN SISTEMAS COMPUTACIONALES
Autor/a: ESTEFANIA ROCHA TAMAYO Autor/a: CARLOS VILLARREAL VÁSQUEZ
Tutor: ING. JIMMY SORNOZA M. Sc.
ABSTRACT
Vehicular traffic is a common evil in any country in the world, which affects the population in general, the purpose of this research is focused on the analysis of data and information by means of a tool of the use of Big Data focused on the vehicular mobility of the canton of La Libertad in Ecuador. The system is based on a large data set that manages with the technology. Big Data is a great help for making decisions and planning a smarter and more automated city. The problem lies in the congestion of vehicles that are generated by the lack of alternative roads, with the lightness of the local populations in terms of non-compliance with the laws and regulations in force for traffic and road safety. The analysis of the information allows us to examine a considerable amount of data, through the assistance of the software for the purposes of capture, processing and extraction of data, the impact that allows the execution of the same could be made, as well as determining the feasibility, efficiency and efficiency of the information that was achieved as a final product led us to increase the significant costs of transport services and road safety.
Keywords: Vehicle Transit Control, Big Data, Data analysis, Decision making
1
INTRODUCCIÓN
A lo largo del tiempo en las ciudades urbanas del mundo, la fluidez
vehicular ha aumentado considerablemente, esto se debe a varios
factores culturales, económicos y sociales. La forma de desplazarse de un
lugar a otro no solo afecta al conductor del automóvil sino también a los
peatones, aunque existe avances en las infraestructuras de carreteras en
las ciudades no han logrado resolver este problema (Pedraza, Hernández,
& López, 2012) Es importante realizar este estudio para conocer las
inconformidades de la población debido al congestionamiento vehicular y
analizar los patrones que afectan al tránsito vehicular para poder
encontrar una solución efectiva a esta problemática.
El mal diseño de las infraestructuras viales y la utilización de los
controladores de tráfico que ya son obsoletos y su falta de mantenimiento,
son las causas principales que ocasionan que en varias ciudades en el
mundo tengan muchos problemas de transporte, por lo que cada vez se
dan a conocer estrategias que ayuden a solventar este problema que
afecta a muchas personas alrededor del mundo. (Espinoza, Gordillo,
Jiménez, & Avilés, 2013)
Este documento está constituido por cuatro capítulos, que se describen a
continuación:
Capítulo I: En este capítulo se detalla el problema de la investigación,
describir las causas y consecuencias, determinar los objetivos general y
específicos y la justificación del proyecto.
Capítulo II: En este capítulo se detalla el marco teórico que radica en dar
a conocer las definiciones de las herramientas que se usaron para llevar a
cabo la investigación.
2
Capitulo III: En este capítulo se detalla la metodología del proyecto, los
procedimientos para realizar la simulación de nuestro estudio.
Capítulo IV: En este capítulo se detalla las conclusiones y
recomendaciones del proyecto.
3
CAPITULO I
PLANTEAMIENTO DEL PROBLEMA
Ubicación del problema en un contexto
La Libertad, es una ciudad que se encuentra en la provincia de Santa Elena,
Está ubicada en el litoral ecuatoriano, al occidente del país. Forma parte del
conglomerado urbano de la puntilla de Santa Elena, junto con Salinas, Santa
Elena y Ballenita, es un cantón habitada por 95.942 pobladores otro aspecto que
se destaca en la última década, son las mejoras en las vías de accesos que se
han efectuado en el cantón, con la finalidad de seguir promoviendo las
actividades turísticas del mismo.
El inminente crecimiento de las ciudades en la actualidad y la sobrepoblación
son factores que inciden directamente en el pleno desarrollo de las actividades
de la misma. El tráfico vehicular es un elemento que no escapa de esta
situación, en el cantón La Libertad, el congestionamiento en las principales vías
de comunicación terrestres cada vez se encuentra comprometido por el gran
volumen de vehículos que transitan por las calles de esta urbe generando
inconformidades en sus habitantes. (INEC, 2016 )
Ahora bien, en vista del volumen de datos que se mencionan anteriormente, las
herramientas tecnológicas representan una solución viable ante el manejo y
producción de los mismos. Los análisis de Big Data personifican la apertura de
posibles mejoras en el sector del transporte y el control de las masas. Por lo
antes expuesto se propone una investigación que analice el impacto que genera
el uso de Big Data en cuanto a la planificación, gestión y control de la movilidad
vehicular.
4
Situación Conflicto Nudos Críticos
Uno de los graves problemas que enfrentan los habitantes del cantón de la
Libertad es el fuerte congestionamiento de tránsito vehicular en las principales
avenidas y calles, generado por la falta de vías alternas, sobre todo en los
feriados e inviernos, conjuntamente con la ligereza de los habitantes de la
localidad en cuanto al incumplimiento de las leyes y normativas vigentes del
tránsito y la seguridad vial.
La falta de herramientas que apoyen las actividades que realizan las
instituciones inherentes al control vehicular, aportando mejoras en las
estrategias que permitan optimizar la situación actual del cantón en cuanto el
tránsito de vehículos matriculados.
Causas y Consecuencias del Problema
Cuadro N 1 Causas y consecuencias del problema
Causas Consecuencias
Accidentes Los accidentes provocan tráfico vehicular, porque
es posible que se cierre las vías hasta que se
recogen a los heridos.
Vías en mal estado
Fuerte congestionamiento debido al gran volumen
de vehículos que transitan en la localidad y que
no pueden usar esas vías debido al estado en
que se encuentran
Lluvias Las fuertes lluvias producen congestionamiento,
debido a que producen inundación de calles y no
pueden transitar los carros con normalidad.
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
5
Delimitación del Problema
Cuadro N 2 Delimitación del problema
Delimitación del Problema
Campo Soberanía, derechos y tecnologías en el ordenamiento
territorial y ambiente de la construcción.
Área Base de datos y Big Data
Aspecto Investigación de los aportes que se generan mediante la
aplicación el uso de Big Data para el análisis y
procesamiento de los datos vinculados a la temática de la
movilidad vehicular en el cantón de la Libertad.
Tema Impacto del uso de Big Data en la gestión de movilidad
vehicular en el cantón de la Libertad.
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Formulación del Problema
¿Cuál es la situación actual que se presenta en el cantón La Libertad con
respecto al congestionamiento y movilidad vehicular y cómo el uso de Big Data
puede aportar a la toma decisiones en la gestión vehicular?
Evaluación del problema
Delimitado: Se ha determinado el problema de la movilidad vehicular en el
cantón La Libertad.
Claro: Se detalla los puntos a tomar en cuenta en el problema como el
congestionamiento vehicular del cantón La Libertad.
6
Evidente: Por medio de entrevistas a expertos de la gestión de movilidad
vehicular y sus conocimientos y experiencias, se determinó que efectivamente
existe un gran problema en cuanto a la movilidad vehicular en el cantón.
Concreto: Se efectuará con la finalidad de realizar un aporte investigativo a la
sociedad del cantón La Libertad.
Relevante: Información obtenida por parte de los encargados de la gestión
vehicular y departamento de TI de la Comisión de Tránsito de La Libertad
ayudaron a determinar hacia donde llegar y obtener un resultado eficaz.
Factible: Una vez obtenida la información, es factible realizar el análisis, gracias
a la evolución de la tecnología se facilita la viabilidad de realizar una simulación
que ayude en el entorno de movilidad vehicular.
OBJETIVOS DE LA INVESTIGACIÓN
Objetivo General
Analizar el impacto que ejerce Big Data por medio de la información producida
de movilidad vehicular para examinar el flujo y accidentes vehiculares del cantón
de La Libertad.
Objetivos Específicos
1. Identificar la situación actual que atraviesa el cantón en cuanto a la
gestión de movilidad vehicular, por medio de indicadores que facilitarán
conocer el comportamiento y ayudar al análisis de la información.
2. Realizar un modelo de análisis de datos para determinar si se cuenta con
información de calidad que ayude a la toma de decisiones a los
encargados de la gestión de movilidad vehicular
3. Visualizar los datos de manera ágil y simplificada, para entender los
grandes volúmenes de datos rápidamente.
7
ALCANCES DEL PROBLEMA
Por medio de los scorcarding, se conocerá el estado de los indicadores
de la gestión de movilidad vehicular lo cual ayudara de manera
significativa a obtener resultados reales.
Por medio de la información vehicular del cantón La Libertad se realizará
un análisis descriptivo que permitirá analizar información histórica y así
un modelo óptimo que aporte a la toma de decisiones en el futuro no
muy lejano.
Por medio de gráficos y diagramas se podrá visualizar los datos
rápidamente para su mayor comprensión.
JUSTIFICACIÓN E IMPORTANCIA
Cuando las personas desean ir a un determinado lugar, toman las rutas de corta
distancia, y como consecuencia siempre toman la misma ruta creando un flujo
de tráfico mayor. Ahora ¿Será qué las rutas utilizadas son normalmente óptimas
o existirán otras alternativas adicionales? ¿Acaso las autoridades conoce las
rutas alternativas en su totalidad y podrían mejorar las rutas alternas? Existe
diversidad de información que generan grandes cantidades de datos del tráfico
que conlleva a resultados donde la calidad y precisión de la información generan
una alternativa de supervivencia en la carrera de la excelencia en el servicio que
se presta.
Lo antes mencionado guarda significativa relación con Big Data, la cual
representa un nuevo concepto en la innovación debido a que su principal función
es predecir el comportamiento del sector analizado a fin de apoyar la toma de
decisiones de manera oportuna, permitiendo mejoras considerables en la
planificación y control de actividades que beneficien a la población. La
importancia de este proyecto radica en generar un aporte significativo que
permita crear soluciones prácticas para la mejora de la situación que se presenta
en el cantón en cuanto a la movilidad vehicular.
8
Este proyecto ayudará a futuras investigaciones, su diseño serviría como guía
para el uso de su estructura en otras áreas de control de tránsito o
investigaciones con iguales características. Científicamente esta investigación
permitirá generar aplicaciones que ayudarán a monitorear en tiempo real las
condiciones del tránsito permitiendo a las instituciones poner en práctica las
últimas tendencias de la tecnología referenciadas a la ingeniería de la
computación a través del empleo de sistemas electrónicos inteligentes y
aplicativos móviles.
9
CAPITULO II
MARCO TEÓRICO
ANTECEDENTES DEL ESTUDIO.
En pro de evidenciar la veracidad de este trabajo se presentan a continuación
una serie de investigaciones realizadas en Ecuador que aportan conocimientos
previamente constituidos.
La primera investigación corresponde a Cedeño Solórzano Leandra Noelia Y
Pesantes García Daniel Adrián, 2017 quienes realizaron el trabajo: Análisis de
Estudio de Big Data Orientados a los Grandes Volúmenes de Datos y los
Principales Usos de Información Recolectada. En este trabajo se presentó la
gran importancia que tiene para las organizaciones el uso de Big Data. El
objetivo general del tema es el de realizar un análisis para explicar en que radica
Big Data detallando ciertas herramientas que permiten el manejo de grandes
volúmenes de datos, el beneficio es el de aportar grandes beneficios debido a
que se logra mejorar la toma de decisiones. (Pesantes Solórzano & Pesantes
García, 2017)
La segunda investigación corresponde a Cañarte Manrique y Milton Iván, 2016
quien presentó el trabajo: Análisis del uso de Big Data en las empresas
guayaquileñas sobre la base de plataformas basadas en TICS en el año 2014. El
objetivo general es determinar si existen estrategias de grandes datos en las
empresas guayaquileñas y el beneficio es saber qué tipo de datos son los
relevantes y son los usados para la toma de decisiones. (Cañarte Manrique,
2015)
El tercer trabajo corresponde a Guama Morales y Sonia Carolina, 2015 titulado:
Estudio Comparativo de Métodos Existentes para Integrar la Información
Estructurada y no Estructurada de una Industria Enfocado en la Generación de
Conocimiento, Desde la Perspectiva de una Solución Integral de Big Data, el
10
cual tiene como objetivo general identificar una técnica para integrar la
información de una industria que permita construir una base de conocimiento
ordenada desde la perspectiva de Big Data, y el beneficio de mantener el
equilibrio en los procesos de análisis de datos y generación de conocimiento en
la industria. (Guama Morales, 2015)
A diferencia de las investigaciones antes señaladas, en la cual analizan
información de las empresas comerciales para obtener información relevante
que mejore sus ventas, este proyecto va a examinar la información de la
movilidad vehicular del cantón La Libertad para realizar un modelo que permitirá
realizar un análisis de la información de tránsito vehicular para aportar de
manera relevante al análisis de esta información.
FUNDAMENTACIÓN TEÓRICA
En el presente capitulo se refiere a la revisión de la literatura y científica
relacionada con el tema objeto de investigación, haciendo referencia a: Teorías,
enfoques, modelos y proyectos relevantes las cuales detallan y analizan temas
vinculados directa o indirectamente al problema planteado.
Big Data
En la actualidad las grandes cantidades de datos pueden tener diferentes
características y tipos, que afectan su particularidad. Según la revista
(UNIVERSIDAD POLITÉCNICA DE MADRID, 2015). “No existe una definición
estándar, pero podemos decir que el término Big Data surge porque la
diversidad, complejidad y volumen de los datos que se están generando,
almacenando y analizando actualmente, requieren de nuevas arquitecturas,
algoritmos y técnicas de análisis para gestionarlos y extraer el conocimiento que
estos datos “esconden”. Esta complejidad se expresa en cinco dimensiones, las
denominadas “cinco „v‟ del Big Data”: el Volumen o cantidad de datos que se
están generando; la Velocidad con la que los datos se generan, transmiten y
analizan; la Variedad en los tipos de datos (texto, imagen, video, etc); la
Veracidad, que consiste en el intento de eliminar o minimizar la incertidumbre
11
que se tiene sobre los datos para no generar un conocimiento sesgado, y el
Valor, es decir si aportan significativamente a la empresa para la toma de
decisiones”
Como cualquier objeto, las características de Big Data pueden variar en muchas
dimensiones por lo tanto, dependiendo de su origen, procesamiento de datos
tecnologías y técnicas utilizadas para la recopilación de datos y descubrimientos
científicos, los grandes datos pueden tener más o menos calidad de información
y características especiales que necesitan la menor intervención del humano-
computadora en las interacciones para descubrimientos científicos para producir
viables soluciones gracias a la inteligencia artificial. Big Data no tiene valor a
menos que pueda ser utilizada efectiva y de forma correcta; Big Data depende
de reconocer los coeficientes de inteligencia y patrones no relacionados a datos
específicos, que ayudan a reducir los errores de inferencia y mejorar la precisión
de las ideas generadas. Estas características incluyen contenido y expresión
inherentes incertidumbre, que puede socavar la veracidad de los grandes datos.
(Lukoianova, 2014)
En la última década se han visto desarrollos considerables con los algoritmos de
Big Data, pero aún quedan desafíos importantes para el apuntalamiento teórico
del área. Estas plataformas permiten recopilar, indexar, visualizar y correlacionar
grandes cantidades de datos. La capacidad de recopilar y acumular tiene un
impacto significativo sobre la velocidad, la eficiencia y la forma rentable en que
se pueden llevar a cabo las investigaciones así como también la producción de
información.
En cuanto a Big Data permite capturar, procesar, almacenar y analizar sus
datos en una sola plataforma, puede concentrarse en buscar información en
lugar de administrar su infraestructura y puede combinar servicios nativos de la
nube con herramientas de código abierto, según sea necesario, tanto en modo
por lotes como en modo de flujo continuo (google, 2016)
12
Arquitectura de Big Data
Una arquitectura de Big Data está diseñada para manejar el procesamiento y el
análisis de la información que son demasiado grandes o complejos para los
sistemas de bases de datos tradicionales. (IBM, 2013)
Las soluciones de Big Data generalmente implican uno o más de los siguientes
tipos de carga de trabajo:
Procesamiento por lotes de grandes fuentes de datos en reposo.
Procesamiento en tiempo real de Big Data en movimiento.
Exploración interactiva de Big Data.
Análisis y aprendizaje automático.
Componentes de arquitecturas de Big Data.
Fuentes de datos: Todas las soluciones de Big Data comienzan con una o más
fuentes de datos. Ejemplos incluyen:
Almacenes de datos de aplicaciones, como bases de datos relacionales.
Archivos estáticos producidos por aplicaciones, como archivos de registro
del servidor web.
Fuentes de datos en tiempo real.
Almacenamiento de datos: Los datos para las operaciones de procesamiento
por lotes normalmente se guardan en un almacén de archivos distribuido que
puede contener grandes volúmenes de archivos grandes en varios formatos.
Procesamiento por lotes: Debido a que los conjuntos de información son muy
grandes, a menudo una solución de Big Data debe procesar archivos mediante
trabajos por lotes de larga ejecución para filtrar, agregar y preparar los datos
para el análisis.
13
Ingestión de mensajes en tiempo real: Si la solución incluye fuentes en tiempo
real, la arquitectura debe incluir una forma de capturar y almacenar mensajes en
tiempo real para el procesamiento de flujo. Esto podría ser un simple almacén de
datos, donde los mensajes entrantes se dejan caer en una carpeta para su
procesamiento.
Procesamiento de flujo: Después de capturar mensajes en tiempo real, la
solución debe procesarlos mediante el filtrado, la agregación y la preparación de
los datos para el análisis.
Almacén de datos analíticos: Muchas soluciones de Big Data preparan los
datos para el análisis y luego los mismos son procesados en un formato
estructurado que se puede consultar utilizando herramientas analíticas.
Análisis e informes: El objetivo de la mayoría de las soluciones de Big Data, es
proporcionar información sobre los datos mediante análisis e informes.
Figura 1. Componentes de la Arquitectura Big Data
Elaborado por (Martín, 2016)
Fuente: ctic.uni
14
Advanced Analytics
Mediante el análisis avanzado, se puede obtener una amplia categoría de
investigación que se puede utilizar para impulsar cambios y mejoras en las
prácticas comerciales o no comerciales. Mientras que las herramientas analíticas
tradicionales que comprenden inteligencia comercial básica (BI) examinan datos
históricos, las herramientas para análisis avanzados se enfocan en pronosticar
eventos y comportamientos futuros, permitiendo a las empresas realizar análisis
hipotéticos para predecir los efectos de los posibles cambios en las estrategias
comerciales. El análisis, la extracción de datos, el análisis de Big Data y la
inteligencia de ubicación son solo algunas de las categorías analíticas que se
incluyen en el análisis avanzado. Estas tecnologías se utilizan ampliamente en
industrias que incluyen marketing, atención médica, gestión de riesgos y
economía. (Kalický, 2013)
Aunque realizar análisis tan complejos generalmente requiere equipos de
estadísticos experimentados, las nuevas herramientas y las tecnologías de
visualización de datos han hecho que el modelado sea accesible para el usuario
comercial promedio.
Big Data Analytics
Big Data Analytics es el proceso de examinar grandes y variados conjuntos de
datos, es decir, Big Data, para descubrir patrones ocultos, correlaciones
desconocidas, tendencias del mercado, preferencias del cliente y otra
información útil que puede ayudar a las organizaciones a tomar decisiones
comerciales informadas.
Big Data Analytics evidencia desafíos de los datos que son muy amplios y
rápidos para ser controlados por métodos tradicionales. La recopilación de
información considerable de grandes cantidades de datos cada vez se vuelve
importante y escencial en muchos aspectos. Big Data Analytics permite mejorar
el rendimiento para la toma de decisiones. (Zakir, Seymoir, & Berg, 2015)
15
Beneficios de Big Data Analytics
Impulsado por sistemas analíticos especializados y software, el análisis de Big
Data puede señalar el camino hacia diversos beneficios comerciales, que
incluyen nuevas oportunidades de ingresos, marketing efectivo, mejor servicio al
cliente, mejor eficiencia operativa y ventajas competitivas sobre sus rivales.
Las aplicaciones de análisis de datos grandes permiten a los científicos de
datos, modeladores estadísticos y otros profesionales analíticos analizar
volúmenes crecientes de datos de transacciones estructuradas, además de otras
formas de datos que a menudo quedan sin explotar en los programas de
inteligencia de negocios (BI) y análisis convencionales. Esto incluye una mezcla
de datos semiestructurados y no estructurados, por ejemplo, registros de
servidor web, contenido de redes sociales, mensajes de correo electrónico de
clientes y respuestas de encuestas, registros detallados de llamadas de
teléfonos móviles y datos de máquinas capturados por sensores conectados a
internet de las cosas.
A gran escala, las tecnologías y técnicas de análisis de datos proporcionan un
medio para analizar conjuntos de datos y sacar conclusiones sobre ellos para
ayudar a las organizaciones a tomar decisiones comerciales informadas. Las
consultas de BI responden preguntas básicas sobre las operaciones comerciales
y el rendimiento. El análisis de datos grandes es una forma de análisis
avanzado, que involucra aplicaciones complejas con elementos tales como
modelos de datos, algoritmos estadísticos y análisis hipotéticos basados en
sistemas de análisis de alto rendimiento.
Minería de datos
La minería de datos es el proceso de descubrir información procesable de
grandes conjuntos de los mismos. La extracción de los antes mencionados,
utiliza análisis matemáticos para derivar patrones y tendencias. Normalmente,
estos patrones no pueden descubrirse mediante una exploración tradicional
16
porque las relaciones son demasiado complejas o porque existe un volumen
considerable.
En la minería de datos, la data es almacenada electrónicamente y su búsqueda
es automatizada, como el mundo crece en complejidad, a medida que el mundo
crece en complejidad, abrumando con los datos que genera, la minería de datos
se convierte en nuestra única esperanza para elucidar los patrones ocultos.
(Witten, Frank, Hall, & Pal, 2016)
Estos patrones y tendencias se pueden recopilar y definir como un modelo de
minería de datos. Los modelos de minería se pueden aplicar a escenarios
específicos, tales como:
Pronóstico: Estimación de números o escenarios, predicción de cargas del
servidor o tiempo de inactividad del servidor
Riesgo y probabilidad: Elegir los mejores resultados para envíos dirigidos,
determinar el punto de equilibrio probable para escenarios de riesgo, asignar
probabilidades a diagnósticos u otros resultados
Recomendaciones: Determinar qué sería lo satisfactorio para la empresa
generando recomendaciones.
Encontrar secuencias: Predecir los próximos eventos probables
Agrupación: Separación de eventos o elementos en un conjunto de elementos
relacionados, análisis y predicción de afinidades
La construcción de un modelo de minería, es parte de un proceso amplio que
incluye todo, desde hacer preguntas sobre los datos y crear un modelo para
responder esas preguntas, hasta implementar el modelo en un entorno de
trabajo. Este proceso puede definirse usando los siguientes seis pasos básicos:
1. Definiendo el problema
17
2. Preparación de datos
3. Explorando datos
4. La construcción de modelos
5. Explorando y Validando Modelos
6. Implementación y actualización de modelos
Las 5 V de Big Data.
Como bien se conoce, desde la aparición de Internet y los sistemas informáticos,
en su conjunto, la importancia y el crecimiento del Big Data no han disminuido.
Y, probablemente tampoco en el futuro. Para darle sentido a este concepto
definiendo lo que realmente significa, se desglosan las cinco V: velocidad,
volumen, valor, variedad y veracidad.
Velocidad
La velocidad se refiere a la rapidez a la que se generan, recopilan y analizan
nuevos datos en un momento dado. La cantidad de correos electrónicos,
publicaciones en redes sociales, videoclips o incluso texto nuevo agregado por
día supera los varios miles de millones de entradas. Además, esto continúa
aumentando a la velocidad debido a que las tabletas y los dispositivos móviles
brindan acceso para agregar contenido en línea. A medida que se agregan
nuevos datos, es importante que se analicen en tiempo real. La tecnología de
datos grandes de hoy le brinda la capacidad de analizar instantáneamente los
datos a medida que se generan.
Volumen
El volumen se refiere a la cantidad de datos producidos cada segundo en todos
los canales en línea, incluidos las plataformas de redes sociales, dispositivos
móviles, transacciones en línea, etc. Con los datos creciendo a pasos
agigantados cada minuto de cada día, ya no se pueden almacenar y analizar
utilizando tecnología tradicional. En cambio, las organizaciones deben pasar a
utilizar sistemas distribuidos, donde partes de los mismos se almacenan y se
unen mediante software para su análisis.
18
Ignorar Big Data ya no es una opción, estos datos pueden proporcionar una gran
visión de las tendencias emergentes, las preferencias del consumidor y la
competencia del mercado. La recopilación de esta información, tal como se
producen, en tiempo real, sin abrumar las infraestructuras de TI existentes, será
una prioridad constante para las organizaciones en 2017 y en adelante.
Valor
El valor se refiere al valor de los datos que se extraen. De hecho, tener
cantidades interminables de estos no siempre se traduce a que sean de alto
valor. Al tratar de descifrar datos grandes, es fundamental comprender
completamente los costos y beneficios de recopilar y analizarlos.
El análisis de datos puede dar a las empresas una idea de su mercado y
permitirles tomar decisiones comerciales informadas. Por ejemplo, agregar
información de redes sociales puede ayudar a una organización a ubicar
personas influyentes sociales para impulsar la conciencia del mercado. Así
mismo, también se pueden usar para realizar análisis de clusters y data mining
para mejorar las estrategias de marketing, ventas y crecimiento del negocio. La
clave es garantizar que la información que está recopilando se pueda convertir
en valor para su organización, de manera rápida y rentable posible.
Variedad
La variedad se define como los diferentes tipos de datos que se pueden usar. A
medida que Internet y la tecnología evolucionan, estos pueden volverse
obsoletos rápidamente. A menudo, con los datos de hoy en día, no se puede
categorizar fácilmente en tablas o etiquetas.
A medida que el uso de las redes sociales aumenta, gran cantidad de datos se
agruparán en la categoría de contenido para compartir en redes sociales. Sin
embargo, esta categoría en sí misma es muy amplia y podría incluir
publicaciones de blogs, redes sociales, perfiles de redes sociales, imágenes,
videos, archivos de audio, etc. Con innovadoras tecnologías de Big Data, su
19
organización puede ahora crear una estructura dentro de Big Data para recopilar
mejor, almacenar y analizar para generar valor.
Veracidad
La veracidad a menudo se define como la calidad o confiabilidad de la
información que recopila. Teniendo en cuenta la precisión de esta, que recopila y
analiza es importante. En este sentido, cuando se trata de Big Data, siempre se
prefiere la calidad sobre la cantidad. Para enfocarse en la calidad, es importante
establecer métricas sobre qué tipo de datos puede recopilar y de qué fuentes.
Otra cosa a tener en cuenta es la frecuencia con la que puede necesitar nueva
información que también puede ser útiles para determinar los tipos de fuentes de
datos que se deben buscar.
A medida que las herramientas en línea se expanden y la cantidad de usuarios
en Internet crece cada día, aprovechar los grandes datos será fundamental para
impulsar la valoración de una organización. El análisis de Big Data puede ser
una herramienta eficiente para el crecimiento en muchas industrias comerciales.
Sin embargo, cómo aprovechar al máximo los grandes datos y analizarlos de
manera eficiente es el desafío nuevo y creciente que las organizaciones deben
considerar actualmente.
Cubos de Información
Se define como una tecnología de base de datos que manipula más de dos
dimensiones y permite ver desde otras visualizaciones los datos que se
encuentran almacenados, los datos se ordenan de manera jerárquica, creando
información de manera ordenada para poder realizar un análisis. (Dávila, 2014)
Los cubos de datos se usan en los sistemas de procesamiento analítico en línea
para brindar apoyo en la toma de decisiones OLAP, los usuarios pueden
navegar datos multidimensionales y jerárquicamente. (Fletes Gudiño & Farías
Mendoza, 2013). Estos cubos se puede considerar como una ampliación de las
dos dimensiones en hojas de Excel, lo cual permite agilizar las consultas
20
grandes cantidades de datos. (Feliciano Morales, Cuevas Valencia, & Martínez
Castro, 2016)
Análisis Descriptivo
El análisis descriptivo permite usar datos históricos, y de esta manera permite
identificar comportamiento y conocer que es lo que en realidad está pasando,
permite saber cómo en realidad está la situación de algo. (Alonso & Donoso,
2003)
Google Cloud Platform
Google Cloud Platform ofrece una solución de Big Data de extremo a extremo,
permite capturar, procesar, almacenar y analizar los datos en una sola
plataforma, el análisis de datos posee familiaridad con SQL, también permite
ejecutar cargas de trabajo, con el fin de obtener información sobre tu entorno
comercial y operativo. (Cloud Google, 2015)
Compute Engine
Compute Engine ofrece máquinas virtuales que se ejecutan en los centros de
datos de Google, estas MV se inician de manera rápida, y ofrecen
almacenamiento de disco persistente, además de proporcionar un rendimiento
uniforme. (Cloud Google, 2015)
BigQuery
Big Query es un almacén de grandes cantidades de datos, administrados y con
capacidad de realizar análisis petabytes de datos, debido a que no hay que
21
gestionar ninguna infraestructura, se puede concentrar en el análisis de datos
para conseguir información a través del SQL. Big Query es un potente servicio
que se centra en realizar análisis de Big Datas utilizada por cualquier tipo de
empresas.
Big Query escanea terabytes en tal solo segundos, se pueden cargar los datos
para poder analizarlos en tiempo real. (Cloud Google, 2015)
Cloud Datalab
Es una herramienta interactiva fácil de usar para la exploración, el análisis, la
visualización y el aprendizaje automático de datos.
Entre las características de es aplicación se contemplan que:
Potente exploración de datos
Fuente integrada y abierta
Escalable
Gestión y visualización de datos
Aprendizaje automático con soporte de ciclo de vida
Entre Cloud Datalab usa “Notebook” que son carpetas contienen espacios de
trabajos en la cual se puede agregar, eliminar y modificar archivo de código
SQL, esto incluyo gráficos interactivos para proporcionar un análisis de
información efectivo y adecuado. (Cloud Google, 2015)
IBM Cognos TM1
Otra herramienta que se usará para el análisis de grandes cantidades de datos
es la herramienta IBM Cognos TM1, esta es una plataforma permite el
procesamiento inteligente de grandes cantidades de datos y así adaptarse a las
necesidades de las empresas u organizaciones, permite el análisis y previsión
de los datos. (ibm, 2017)
22
IBM Cognos TM1 Performance Modeler
Performance Modeler es una herramienta de la plataforma de IBM Cognos TM1,
que permite construir dimensiones, cubos, y así desarrollar modelos los cuales
contienen los objetos que son necesarios, permite crear reglas, que son códigos
realizadas con palabras propias de la herramientas, la cual permite realizar
cálculos entre los elementos del modelo, estas indican el formato y la
presentación de los datos, y pueden manipularlos, permite realizar enlaces o
conexiones entre dos o más cubos, incluye vistas de los cubos los cuales
permiten ver la información desde diferentes visualizaciones. Si el usuario es
administrador puede actualizar objetos del modelo, así como también eliminar y
agregar objetos que son necesarios para complementar el modelo. (Ibm
Performance Modeler , 2017)
Scorecarding en Performance Modeler
Scorecarding es un grupo de medidas de rendimiento para visualizar los
objetivos estratégicos de alguna organización. Permite conocer que tanto se
están cumpliendo los objetivos al realizar una comparación con los datos reales,
por medio de indicadores como semáforo, y las tendencias el usuario puede
evaluar y realizar un análisis de manera rápida de la información.
Para realizar un cubo que muestres scorcarding, se debe incluir en el cubo una
dimensión de métrica, una dimensión de indicadores métrico, una dimensión de
tiempo y otras dimensiones para contexto, es decir que permitan al usuario filtrar
la información. (IBM, 2017)
Dimensión genérica.- Posee elementos generales, como listas de artículos,
vendedores, etc.
Dimensión métrica.- Contiene un grupo de medidas de indicadores para realizar
seguimiento de la organización.
23
Dimensión indicador de métrica.- Contiene elementos de indicadores que
permiten conocer el estado, la tendencia de los elemento para conocer su
comportamiento.
Diagrama de Scorecarding
Performance Modeler permite realizar un diagrama que contenga las
dimensiones qué se necesita visualizar para poder mostrarlo de manera gráfica
para interpretarlo rápidamente. En la figura 28 se puede ver un ejemplo.
Cubo de métricas
Este cubo muestra los semáforos y las tendencias en las celdas del cubo, es
diseñada por una dimensión de métrica, una dimensión de indicador métrico,
dimensión de tiempo y dimensiones de contexto opcionales. (IBM, 2017)
Figura 2. Cubo de métricas
24
Elaborado por: IBM, 2017
Fuente: IBM
Indicador de Semáforos
Permite conocer el estado de un indicador por medio del semáforo, el estado se
indica por el color y forma del icono
Cuadro N 3 Íconos de Semáforo
Ícono Descripción
Indica un estado satisfactorio
Indica precaución con el indicador asociado
Indica una advertencia del indicador asociado
Indica que no se puede calcular una puntuación, porque faltan valores
Elaborado por: Rocha & Villarreal, 2017
Fuente: IBM
Indicador de Tendencia
25
Muestra el valor de una columna en comparación con el valor de la columna
anterior, muestra si el valor es mayor o menor que el otro valor
Cuadro N 4 Íconos de Tendencia
Ícono Descripción
Indica que la tendencia es mayor que el período anterior.
Indica que la tendencia no ha variado
Indica que la tendencia es menor que el periodo anterior
Celda vacía Indica que la tendencia este incompleta
Elaborado por: Rocha & Villarreal, 2017
Fuente: IBM
Gestión de la movilidad vehicular
El agigantado crecimiento en la población y el sector productivo, demanda a los
gobiernos locales la indagación en relación a las soluciones eficientes para los
conflictos de movilidad intraurbana. En este orden de ideas, se presentan un
conjunto de estrategias para la gestión eficiente y eficaz del tránsito vehicular así
como también introducirse en el ámbito de la concientización urbana sobre la
seguridad vial.
Indiferentemente del tipo de ciudad que se habite, el automóvil particular y la
motocicleta constituyen los principales medios de transporte, donde se pueden
26
circular en mínimas distancias, a altas velocidades, enfrentándose a numerosos
factores tales como el deterioro de las vías, peatones y otros vehículos que
circulan al mismo tiempo. Es por esto que, se deben diseñar planificaciones y
efectuar la ejecución de políticas urbanas que abarquen estos sectores, a
continuación se mencionan diversos elementos que intervienen en la gestión de
la movilidad vehicular.
Movilidad urbana y siniestralidad vial
En cuanto a la siniestralidad se mancomunan el factor humano y el diseño de
las calles y avenidas. Ahora bien, por lo general en las carreteras, la tipología
común de siniestros en movilidad vehicular son las salidas de las vías, es decir,
volcamiento, embestidas contra árboles, postes o columnas, derivados por los
excesos de velocidad, alcohol e insomnio, en otros caso se incluyen los malos
diseños y conservación de las vías.
Por otra parte, la evolución de la tecnología ha contribuido como herramienta
ventajosa para la seguridad vial donde destacan el controlador de velocidades a
distancia, la comunicación en carreteras, los controles de pesos y cargas, la
semaforización por demanda, las sofisticadas defensas y materiales retro
reflectantes, entre otros, son innovadores sistemas de seguridad que importan
mejoras el seguimiento y control de la movilidad de personas y de cargas.
En conjunto con lo antes expuesto, se señala el incumplimiento de las leyes y
señales de tránsito que se ubican en diferentes partes de los urbanismos, debido
a este atenuante es necesario recalcar a la ciudadanía las sanciones que
corresponden a cada violación de las normativas de tránsito
Distancias y Velocidades
El tránsito y la vialidad es un sistema que se compone de números elementos
tales como los vehículos, transporte público, automóviles, motos, bicicletas y
peatones, los cuales hacen vida en el mismo espacio. La velocidad es una
27
vertiente de alta peligrosidad que ha generado un alza significativa en los
siniestros viales, así como también el entorpecimiento del flujo correcto de la
circulación.
Antecedentes y estado de la técnica
El análisis de los datos de movimiento se basa en la capacidad de almacenar y
manipular la información donde el espacio y el tiempo están estrechamente
interconectados. Típicamente, la indagación de movimiento hace referencia al
espacio y también hace referencia al tiempo. En las siguientes secciones, se
presentará algunas partes significativas de la tecnología de punta, trabajos útiles
para una mejor introducción del marco propuesto para esta tesis. En primer
lugar, se proporcionará una descripción de los tipos de datos utilizados y
disponible hoy, centrándose en algunas técnicas de integración de datos, tales
como correlación de mapas y trayectorias semánticas.
Además se ha contemplado usar Mapas Cognitivos Difusos con el fin de adquirir,
aprender, decodificar conocimiento para descubrir los factores de un problema,
aunque los MCD no maneje Big Data, pero aporta otra solución y ayudar a la
toma de decisiones
Lógica difusa
La lógica difusa reconoce no simples valores falsos y verdaderos, sino valores
con cierto grado de falsedad o veracidad, esta proporciona un mecanismo de
inferencia que ayuda a simular procesos de razonamiento humano en sistemas
basados en el conocimiento (Morcillo, 2013). La lógica difusa ayudará a realizar
aproximaciones matemáticas que ayuden a la resolución de un problema difícil
de resolver.
Las variables lingüísticas brindan un medio de caracterización a fenómenos que
son muy difíciles de darle una descripción cuantitativa, por ejemplo cuando se
habla de la verdad se dice que toma valores como muy verdadero, no muy
cierto, falso, entre otros. Las relaciones causales por lo general son granulares,
28
esto se representa por medio de variables lingüísticas. (Garcia-Cascales &
Lamata, 2010), es decir las variables lingüísticas permiten describir el estado de
un objeto o fenómeno. Para entenderlo mejor se describirá un ejemplo
Una variable numérica toma valores numéricos, Estatura = 2 (metros)
Una variable lingüística toma valores lingüísticos, Estatura es alta
Los valores lingüísticos forman un conjunto de etiquetas por ejemplo: muy alta,
medianamente alta, alta, baja, muy baja, medianamente baja y baja.
Los conjuntos difusos son aquellos conjuntos que se usan para representar de
manera matemática la indecisión en los distintos aspectos de la vida, brindando
herramientas para utilizarlos. (Rodríguez & Huertas, 2016). Estos se caracterizan
por una función que asigna a cada elemento un grado de pertenencia oscilando
entre menos uno y uno.
La función de pertenencia µA, por lo cual un conjunto difuso es definido de la
siguiente forma:
µCi(x) [0,1] x E X
Esto representa el grado de pertenencia de la variable x en el conjunto difuso Ci
puede variar desde 0 a +1, y para definir en su totalidad el conjunto difuso Ci, se
debe definir µCi(x) para todos los valores que pueda tomar x en el universo de X.
Mapas Cognitivos Difusos
En términos generales los conceptos de los mapas cognitivos difusos
demuestran los factores claves y las características del sistema complejo
modelado y representan: entradas, salidas, variables y tendencias de un sistema
de modelado complejo. (Groumpos, Fuzzy Cognitive Maps: Basic Theores and
Their Application to Complex System, 2010).
29
Entre las ventajas de construir un mapa cognitivo difuso están las siguientes: la
estructuración de un proceso, construir el orden de todas las alternativas
permitiendo dar un grado de causalidad, por medio de un vector de pesos.
(Leyva Vásquez, Peréz Teruel, Febles Estrada, & Gulín González, 2012)
La causalidad es la representación de causa y efecto, su importancia se basa en
que encuentra una explicación a los eventos del mundo real, los mapas
cognitivos difusos también son llamados mapas causales difusos, se realiza la
representación de la causalidad que hay entre los componentes que lo
conforman.
Estructura de Mapas Cognitivos difusos
Los mapas cognitivos difusos están compuestos de nodos también llamados
conceptos, los cuales representan variables. Los enlaces que hay entre estos
conceptos son asignado con el signo + o – para representar si la relación es
negativa o positiva entre los nodos, esto describe el grado de pertenencia que
tienen los nodos. Estos permiten crear y modelar sistemas enfocados en una
explicación causal de interrelaciones entre los conceptos. (Papageorgiou &
Stylios, 2008). Al realizar la relación entre los conceptos se pueden establecer
tres tipos de nodos: Conductores, los cuales son los nodos que no tienen nodos
entrantes, recibidores, aquellos nodos que tienen nodos entrantes y los
ordinarios, son los nodos que tienen nodos entrantes y salientes.
Las direcciones de las relaciones son representadas pos flechas, además
permite tener grados de causalidad entre un nodo al otro comprendido entre -1 a
+1.
Figura 3. Relación entre dos conceptos
Elaborado por: Rocha & Villarreal, 2017
30
Fuente: Propia
La forma correcta de representar la causalidad es por medio de la matriz de
adyacencia, en la cual se encuentra todas las relaciones que hay entre los
nodos, se podrá observar el peso que tiene un nodo sobre otro.
La matriz de adyacencia es una matriz cuadrada utilizada con el fin de
representar la conectividad que existen entre los nodos. (Salmeron, Vidal, &
Mena, 2012). En la celda Cij se coloca el peso que tiene cada uno de los nodos
con respecto a otro.
Cuadro N 5 Representación de una matriz de adyacencia
Ci Cj
Ci Wij
Cj Wji
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Las casillas que corresponden a la diagonal principal, siempre tienen un peso de
cero, debido a que no debería existir una relación entre sí mismo.
Hay tres tipos posibles relaciones causales entre nodos representados en la
matriz:
Wij > 0, representa una causalidad positiva entre los nodos Ci y Cj. El
incremento o la disminución en el valor de Ci conducen al incremento o
disminución en el valor de Cj
Wij = 0, representa que no hay ninguna relación entre Ci y Cj
31
Wij < 0, representa una causalidad negativa entre los nodos Ci y Cj. El
incremento o la disminución en el valor de Ci conducen al incremento o
disminución en el valor de Cj
Wij representa el peso de la relación que existe entre dos conceptos Ci y Cj
La simulación comienza por medio de la deducción del Mapa Cognitivo Difuso y
de la definición del vector de estímulo. Se ha estimado usar la función sigmoidal,
para que los cambios de estado se realicen de manera continua y conocer el
estado final en el que se encontrarán los nodos o conceptos que intervienen. La
función sigmoidal es la siguiente.
f(x) = (1 / (1+ e -x )
La centralidad del grado se usa para encontrar el nodo importante, este se
determina por medio de la suma del grado de entrada y del grado de salida,
como se muestra en la siguiente fórmula:
C(v) = id(v) + od(v)
La centralidad que existe en un nodo muestra que tanto está relacionado un
nodo con otro.
Mental Modeler
Es un software de modelamiento de datos que permite realizar análisis por
medio de escenarios, tanto a individuos o grupos de personas y les deja capturar
sus conocimientos de manera estándar. (Mental Modeler Org, 2015). Se basa en
Mapas Cognitivos Difuso, se pueden crear de manera sencilla y rápida modelos
de preocupaciones sociales, sistemas socio ecológicos o de medio ambiente.
Pasos para crear el modelamiento:
32
Definir componentes
Definir relaciones entre componentes
Ejecutar escenarios “Que pasa si” para saber la reacción del sistema
según los rangos establecidos
Modelo.- Es donde se define los conceptos que se desean analizar y a la vez se
coloca el grado de influencia entre un concepto a otro, realizando el mapa
cognitivo difuso
Matriz adyacente (Análisis estático)- Es una matriz de n x m, para indicar el
peso de la arista se coloca en la entrada del renglón i, columna j y reserva un
valor especial null cuando indicamos un arista ausente. Representación en
columnas y filas del conjunto de asignados a los conceptos de los mapas
cognitivos difusos (Peréz Teruel, 2014). En Mental Modeler la matriz adyacente
se llena automática con los pesos que se definen en los modelos.
Métricas.- Se encuentran los valores de grados de entradas, es la suma de
todos los pesos que ingresan a un conceptos, valores de grados de salidas, es la
suma de todos los pesos que salen de un nodo, y la centralidad que es la suma
de los grados de entrada y salida.
Escenarios (Análisis dinámico).- El fin del análisis dinámico es realizar
escenarios hipotéticos que ayuden a simular el sistema de diferentes
condiciones. (Stach, 2010) Mental Modeler permite realizar diferentes escenarios
que permiten analizar los conceptos desde diferentes perspectivas.
33
FUNDAMENTACIÓN LEGAL
Artículos de la Constitución de la República del Ecuador.
Según el Art. 394. La Constitución del Ecuador establece que: El Estado
garantizará la libertad de transporte terrestre, aéreo, marítimo y fluvial dentro del
territorio nacional, sin privilegios de ninguna naturaleza. La promoción del
transporte público masivo y la adopción de una política de tarifas diferenciadas
de transporte serán prioritarias. El Estado regulará el transporte terrestre, aéreo
y acuático y las actividades aeroportuarias y portuarias. (Constitución de la
Republica de Ecuador, 2008)
Según lo leído: este artículo se consideró relevante para la investigación debido
a que en su contenido expresa claramente que el Estado como entidad
gubernamental es responsable y garante del correcto funcionamiento del todos
los aspectos que son vinculantes al libre tránsito dentro del espacio territorial y
sus fronteras. (Constitución de la Republica de Ecuador, 2008)
Artículos de la Ley Orgánica de Transporte Terrestre Tránsito y Seguridad
Vial.
Según el Art. 7. De la Ley Orgánica de Transporte Terrestre Tránsito y
Seguridad Vial indica que: Las vías de circulación terrestre del país son bienes
nacionales de uso público, y quedan abiertas al tránsito nacional e internacional
de peatones y vehículos motorizados y no motorizados, de conformidad con la
Ley, sus reglamentos e instrumentos internacionales vigentes. En materia de
transporte terrestre y tránsito, el Estado garantiza la libre movilidad de personas,
vehículos y bienes, bajo normas y condiciones de seguridad vial y observancia
de las disposiciones de circulación vial. (ley organica de transporte terrestre
transito y seguridad vial, 2014)
Según el Art. 9. De la Ley Orgánica de Transporte Terrestre Tránsito y
Seguridad Vial señala que: Los peatones, conductores, pasajeros, automotores y
vehículos de tracción humana, animal o mecánica podrán circular en las
34
carreteras y vías públicas del país, sujetándose a las disposiciones de esta Ley,
su reglamento, resoluciones y regulaciones técnicas vigentes. (ley organica de
transporte terrestre transito y seguridad vial, 2014)
Según el Art. 11. De la Ley Orgánica de Transporte Terrestre Tránsito y
Seguridad Vial indica que: El Estado fomentará la participación ciudadana en el
establecimiento de políticas nacionales de transporte terrestre, tránsito y
seguridad vial que garanticen la interacción, sustentabilidad y permanencia de
los sectores público, privado y social. (ley organica de transporte terrestre
transito y seguridad vial, 2014)
Según el Art. 46. De la Ley Orgánica de Transporte Terrestre Tránsito y
Seguridad Vial expresa que: El transporte terrestre automotor es un servicio
público esencial y una actividad económica estratégica del Estado, que consiste
en la movilización libre y segura de personas o de bienes de un lugar a otro,
haciendo uso del sistema vial nacional, terminales terrestres y centros de
transferencia de pasajeros y carga en el territorio ecuatoriano. Su organización
es un elemento fundamental contra la informalidad, mejorar la competitividad y
lograr el desarrollo productivo, económico y social del país, interconectado con la
red vial internacional. (ley organica de transporte terrestre transito y seguridad
vial, 2014)
Según lo leído: bajo la interpretación de los artículos tomados en consideración
de la Ley Orgánica de Transporte Terrestre Tránsito y Seguridad Vial, se
concluye que, el gobierno de la Reubica define los servicios y actividades
derivadas de la promoción del transporte terrestre, así como también fomenta la
participación ciudadana en pro de concebir mejoras que optimicen los servicios
de transportes y la seguridad vial definiendo de esta manera las normativas
vigentes para la circulación de la ciudadanía. (ley organica de transporte
terrestre transito y seguridad vial, 2014)
DEFINICIONES CONCEPTUALES
Agregación: Un proceso de búsqueda, recopilación y presentación de datos
35
Inteligencia empresarial (BI): El término general utilizado para la identificación,
extracción y análisis de datos.
Cloud Virtual: Un sistema informático distribuido a través de una red utilizada
para almacenar datos fuera de las instalaciones
Análisis de agrupamiento: El proceso de identificar objetos que son similares
entre sí y agruparlos para comprender las diferencias, así como las similitudes
dentro de los datos.
Cloud: Un término amplio que hace referencia a cualquier aplicación o servicio
basado en Internet alojado de forma remota.
Agregación de datos: El acto de recopilar datos de múltiples fuentes con el
propósito de informar o analizar.
Limpieza de datos: El acto de revisar y revisar los datos para eliminar entradas
duplicadas, corregir errores ortográficos, agregar datos faltantes y proporcionar
consistencia.
Integridad de los datos: La medida de confianza que tiene una organización en
la precisión, integridad, puntualidad y validez de los datos.
Migración de datos: El proceso de mover datos entre diferentes tipos de
almacenamiento o formatos, o entre diferentes sistemas informáticos.
Ciencia de los datos: Un término reciente que tiene múltiples definiciones, pero
que generalmente se acepta como una disciplina que incorpora estadísticas,
visualización de datos, programación de computadoras, extracción de datos,
aprendizaje automático e ingeniería de bases de datos para resolver problemas
complejos.
Seguridad de datos: La práctica de proteger los datos contra la destrucción o el
acceso no autorizado.
36
Conjunto de datos: Una colección de datos, generalmente en forma de tabla.
Fuente de datos: Cualquier proveedor de datos, por ejemplo, una base de datos
o una secuencia de datos.
Estructura de datos: Una forma específica de almacenar y organizar datos.
Visualización de datos: Una abstracción visual de datos diseñada con el
propósito de derivar significado o comunicar información de manera efectiva.
Almacén de datos: Un lugar para almacenar datos con el propósito de informar
y analizar.
Datos públicos: Información pública o conjuntos de datos creados con fondos
públicos
Datos en tiempo real: Datos que se crean, procesan, almacenan, analizan y
visualizan en milisegundos
37
CAPITULO III
METODOLOGÍA DE LA INVESTIGACIÓN
DISEÑO DE LA INVESTIGACIÓN
Este capítulo se mostrará los métodos de ensayo, así como también las
herramientas de resultados que se obtuvieron en el análisis de investigación a
través de revistas científicas, artículos científicos e investigaciones publicadas
como Dialnet, Scielo, ResearchGet, entre otras. Se darán a conocer conceptos
estadísticos para mejor comprensión, también se describirá el meta-análisis y las
variables que lo conforman, se mostrará la codificación de las variable que se
usaron.
Según (Baena, 2014), El diseño de la investigación es “proporcionar un modelo
de verificación que acceda a contrastar hechos con teorías, y su forma es la de
una estrategia o plan general que determina las operaciones necesarias para
hacerlo” (p.44).
Metodología descriptiva
La metodología descriptiva trabaja sobre las realidades de hecho y por presentar
una interpretación correcta, esto puede contener entrevistas, o casos, permite
describir situaciones y como se manifiesta un determinado fenómeno, (Grajales
G., 2000), por lo cual se ha considerado como metodología para nuestro estudio
y se describe como se presentan los factores de nuestro problema
Población
38
La población se define como la suma completa de todos los elementos que
intervienen en el trabajo a desarrollar, los cuales son poseedores de una serie
de características propias que permiten su procesamiento, dando origen a los
datos de la investigación. Tal como lo señalan (Hernandéz, 2014):
“es el conjunto de todos los casos que concuerdan con
una serie de especificaciones” (p.174).
Población objetivo
Nuestra población objetiva son los 10 expertos en el área de la gestión de
movilidad vehicular, los cuales fueron considerados por sus años de
experiencia, su conocimiento en el área de gestión de movilidad vehicular, para
poder resolver de manera real el problema.
Cuadro N 6 . Caso de Estudio: Expertos de gestión vehicular
No Personal de gestión vehicular
Ocupación Actividades
1 Coronel William Ayala Planificador de Tránsito
Realiza inspecciones sobre conflictos viales
2 Coronel Jorge Luna Planificador de Tránsito
Realiza inspecciones sobre conflictos viales
3 Arq. Kelly Lara Analistas de semaforización y señalización
Analiza la información de tránsito vehicular
4 Coronel Jorge Rivera Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.
5 Coronel Luis Torres Planificador de Tránsito
Realiza inspecciones sobre conflictos viales
6 Capitán Andrés Jiménez Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.
7 Ing Pedro Chilán Analistas de semaforización y señalización
Analiza la información de tránsito vehicular
8 Arq. Luis Rocha Analistas de estudio de tránsito 2
Analiza la información del tránsito vehicular
9 Coronel Ángel Jaramillo Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.
10 Sargento Jaime Palacios Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
39
Entrevista
La entrevista es la técnica a través de la cual el investigador persigue la
obtención de información de forma oral e individualizada. Ahora bien, los datos
sustraídos exteriorizaran los acontecimientos que se ejecutaron así como
también opiniones subjetivas de los actores entrevistados en relación con la
situación indagada.
A continuación se muestra la entrevista realizada a los expertos en el tema.
1.- ¿Los resultados del análisis de los datos pueden mejorar la toma de
decisiones de las entidades de vialidad en el cantón de la Libertad?
Cuadro N 7 Pregunta 1 Expertos
Alternativa Frecuencia %
SI 7 70%
NO 3 30%
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Gráfico 1. Pregunta número uno realizada a los expertos
0%
10%
20%
30%
40%
50%
60%
70%
80%
SI NO
Expertos
40
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Conclusión:
Del total del personal entrevistado, se obtienen una sumatoria de 10 respuestas
vinculadas a la pregunta número uno (1), donde en el gráfico que se presenta se
visualizan el 70% de respuestas afirmativas y el 30% negativas, lo que indica
que al realizar análisis de datos se podrían obtener mejoras en la toma de
decisiones.
2.- ¿Piensa usted que la semáforos en buen estado que circulan en cantón
La Libertad disminuye el tráfico vehicular?
Cuadro N 8 Pregunta 6 Expertos
Alternativa Frecuencia %
SI 6 60%
NO 4 40%
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Gráfico 2. Pregunta número dos realizada a los expertos
0%
10%
20%
30%
40%
50%
60%
70%
SI NO
Expertos
41
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Conclusión:
Del total del personal entrevistado, se obtienen una sumatoria de 10 respuestas
vinculadas a la pregunta número dos (2), donde en el gráfico que se presenta se
visualizan el 60% de respuestas afirmativas y el 40% negativas, lo que indica
que se considera que, los semáforos en buen estado disminuye el tráfico
vehicular.
3.- ¿Afecta el tener las vías en mal estado a la movilidad vehicular?
Cuadro N 9 Pregunta 3 Expertos
Alternativa Frecuencia %
SI 8 80%
NO 2 20%
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Gráfico 3. Pregunta número tres realizada a los expertos
Elaborado por: Rocha & Villarreal, 2017.
0%
20%
40%
60%
80%
100%
SI NO
Expertos
42
Fuente: Propia
Conclusión:
Del total del personal entrevistado, se obtienen una sumatoria de 10 respuestas
vinculadas a la pregunta número tres (3), donde en el gráfico que se presenta se
visualizan el 80% de respuestas afirmativas y el 20% negativas, lo que indica
que se considera que si afecta el tener vías en mal estado en la movilidad
vehicular.
4.-. ¿Las lluvias permiten el buen funcionamiento del flujo vehicular?
Cuadro N 10 Pregunta 4 Expertos
Alternativa Frecuencia %
SI 1 10%
NO 9 90%
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Gráfico 4. Pregunta número cuatro realizada a los expertos
43
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Conclusión:
Del total del personal entrevistado, se obtienen una sumatoria de 10 respuestas
vinculadas a la pregunta número cuatro (4), donde en el gráfico que se presenta
se visualizan el 10% de respuestas afirmativas y el 90% negativas, lo que indica
que las lluvias si afectan al flujo vehicular
5.- ¿Cree usted que señalizaciones de tránsito en buen estado disminuyen
el congestionamiento vehicular?
Cuadro N 11 Pregunta 5 Expertos
Alternativa Frecuencia %
SI 7 70%
NO 3 30%
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Gráfico 5. Pregunta número cinco realizada a los expertos
0%
20%
40%
60%
80%
100%
SI NO
Expertos
44
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Conclusión:
Del total del personal entrevistado, se obtienen una sumatoria de 10 respuestas
vinculadas a la pregunta número cinco (5), donde en el gráfico que se presenta
se visualizan el 70% de respuestas afirmativas y el 30% negativas, lo que indica
el tener señales de tránsito en buen estado disminuyen el congestionamiento
vehicular.
6.- ¿Piensa usted que utilizando la tecnología bajarían los niveles de
tránsito en el cantón de La Libertad?
Cuadro N 12 Pregunta 6 Expertos
Alternativa Frecuencia %
SI 6 60%
NO 4 40%
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
0%
10%
20%
30%
40%
50%
60%
70%
80%
SI NO
Expertos
45
Gráfico 6. Pregunta número uno a los expertos
Elaborado por: Rocha & Villarreal, 2017.
Fuente: Propia
Conclusión:
Del total del personal entrevistado, se obtienen una sumatoria de 10 respuestas
vinculadas a la pregunta número seis (6), donde en el gráfico que se presenta se
visualizan el 60% de respuestas afirmativas y el 40% negativas, lo que indica
que si se usa la tecnología se puede solventar el problema del tráfico vehicular.
Marco Muestral
Es la lista de todos los componentes que se usó para el estudio de Big Data y
mapas cognitivos difusos. El marco muestral de esta investigación son los
artículos científicos que fueron extraídos en una base de datos, ingresados en
una matriz de metaanálisis, y de esta manera adquirir información relevante
acerca de investigaciones referente a nuestro tema. La población escogida son
los 50 papers de los cuales se obtuvieron a través de criterios de inclusión y
exclusión solo 30 cumplieron el criterio de inclusión, y son válidos en nuestra
investigación debido a que cumplían con la mayoría de palabras claves.
0%
10%
20%
30%
40%
50%
60%
70%
SI NO
Expertos
46
Meta-análisis
Es una investigación que tiene como objetivo la integración de manera
sistemática y objetiva los resultados de los estudios empíricos sobre algún
problema o tema de investigación específica. (Merca, 2010)
Diseño de la base de meta-análisis
La matriz de metaanálisis fue una herramienta eficiente que ha ayudado a
reducir información y conocer la información relevante. Para llevar a cabo la
meta-análisis de nuestro proyecto se realizó algunas investigaciones desde
diferentes fuentes, en la cuales se analizan que tienen en común los artículos,
así como también las variables de nuestra investigación. Las variables fueron
“Género de Primer autor”, “Tipo de revista”, “Tipo de journal”, “Tipo de
biblioteca”, “Tipo de investigación”.
Figura 4. Variables metaanálisis
47
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Codificación y descripción de variables
En la siguiente codificación de variables se pudo identificar e indicar sobre las
variables investigadas, por lo tanto es muy importante para cada variable su
análisis.
La codificación de acuerdo a los temas indicados, nombrados, permite saber el
análisis univariado, el manejo y definición de la estadística como una muestra
de resultados.
Descripción de las variables usadas para el análisis
Variable 1: Portal Bibliográfico
La variable 1 se refiere al portal bibliográfico en el cual se desarrolló el artículo
Cuadro N 13 Portal Bibliográfico
PORTALES BIBLIOGRÁFICO
REDALYC
1
SCIELO
2
SCIENCEDIRECT
3
DIALNET
4
48
RESEARCHGATE
5
GRÁFICOS Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Variable 2: Género del Primer Autor
La variable 2 se refiere al género de primer autor que se desarrolló el artículo
Cuadro N 14 Género del Primer Autor
GENERO DEL PRIMER AUTOR
MASCULINO
1
FEMENINO
2
GRÁFICOS
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Variable 3: Tipo de Journal La variable 3 se refiere al tipo de journal que se desarrolló el artículo.
Cuadro N 15 Tipo de Journal
TIPO DE JOURNAL
ARTICULOS CIENTIFICOS
1
49
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Variable 4: Tipo de Investigación
La variable 4 se refiere al tipo de investigación que se desarrolló el artículo.
Cuadro N 16 Tipo de Investigación
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Variable 5: Criterio Inclusión y Exclusión
La variable 5 se refiere al criterio de inclusión o exclusión del artículo
Cuadro N 17 Tipo de Investigación
TESIS 2
LIBROS
3
TIPO DE INVESTIGACIÓN
INVESTIGACIÓN
1
CAMPO
2
TEÓRICO
3
CRITERIO DE INCLUSIÓN Y EXCLUSIÓN
IINCLUSIÓN
1
50
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Variable 6: Número de veces que se repite la palabra “Big Data”
La variable numero 6 indica la cantidad de veces que aparece la palabra “Big
Data” hay en cada artículo.
Variable 7: Número de veces que se repite la palabra “Traffic_vehicular” en los
artículos.
El variable número 7 indica la cantidad de veces que se repite la palabra
“Traffic_vehicular” aparece en cada uno de los 50 artículos.
Variable 8: Número de veces que aparece la palabra “Lógica Difusa” en los
artículos.
La variable número 8 indica la cantidad de veces que aparece la palabra “Lógica
Difusa” aparece en cada uno de los 50 artículos.
Variable 9: Número de veces que se repite la palabra “Conjunto Difuso” en los
artículos.
La variable número 9 indica la cantidad de veces que aparece la palabra
“Conjunto Difuso” aparece en cada uno de los 50 artículos.
Variable 10: Número de veces que se repite la palabra “Mapa Cognitivo Difuso”
en los artículos.
La variable número 10 indica la cantidad de veces que aparece la palabra “Mapa
Cognitivo Difuso” aparece en cada uno de los 50 artículos.
EXCLUSIÓN
2
51
Variable 11: Número de veces que se repite la palabra “Variables Lingüística” en
los artículos.
La variable número 11 indica la cantidad de veces que aparece la palabra
“Variables Lingüística” aparece en cada uno de los 50 artículos.
Interpretación y análisis de los resultados: Análisis
Univariado de los datos
Para continuar con el metaanálisis estadístico, se han considerado algunas
variables respectivas para este estudio. Por lo tanto en este parte se mostrará
gráficos realizados que presenta la estabilidad de cada variable ya sea
cualitativa y cuantitativa se llevara a cabo de esta manera. Para analizar las
variables cuantitativas se procede a realizar medidas de tendencia central como
media, moda, mediana así como también la dispersión como la varianza y a
desviación estándar y para realizar el análisis cualitativo se realiza el cálculo
para interpretar las características de las variables.
Sección: Información general meta-análisis
Variable 1: Portal Bibliográfico
Cuadro N 18 Portal Bibliográfico
Frecuencia Porcentaje Porcentaje
válido Porcentaje acumulado
Válido Dialnet 8 16,0 16,0 16,0
52
Redalyc 13 26,0 26,0 42,0
Researchgate 5 10,0 10,0 52,0
Scielo 12 24,0 24,0 76,0
ScienceDirect 12 24,0 24,0 100,0
Total 50 100,0 100,0
RÁFICOS Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 7. Diagrama de la Variables Portal Bibliográfico
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: De acuerdo a los resultados de un total de 50 artículos, se puede
apreciar que la variable Redalyc es aquel que tuvo mayor frecuencia, con un
porcentaje de 26%, mientras que las variables Scielo y ScienceDirect obtuvieron
un porcentaje de 24, la variable Dialnet obtuvo un porcentaje de 16% y la
variable Researchgate obtuvo un porcentaje de 10%.
Variable 2: Género del Primer Autor
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido F 17 34,0 34,0 34,0
M 33 66,0 66,0 100,0
53
Cuadro N 19 Género del Primer Autor
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 8. Diagrama de la Variables Género del Autor
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: De acuerdo a los resultados de un total de 50 artículos, se puede
observar que el género masculino es aquel que cuenta con mayor frecuencia,
con un porcentaje de 34%, mientras que el género femenino tuvo un porcentaje
de 66%.
Variable 3: Tipo de Journal
Cuadro N 20 Tipo de Journal
Total 50 100,0 100,0
54
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido Artículo científico 43 86,0 86,0 86,0
Tesis 7 14,0 14,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 9. Diagrama de la Variables Tipo Journal
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Basados en este gráfico se obtuvo que el artículo científico fue aquel
que tuvo mayor frecuencia, con un porcentaje 86%; mientras la variable tesis
obtuve un porcentaje de 14%.
Variable 4: Tipo de Investigación
La variable 4 se refiere al Tipo de Investigación que se desarrolló en este artículo.
55
Cuadro N 21 Tipo de Investigación
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 10. Diagrama de la Variables Tipo de Investigación
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Se puede apreciar en base a este grafico que la variable investigación
fue aquella que tuvo mayor frecuencia, con un porcentaje de 48%; mientras que
la variable teórica obtuvo un porcentaje de 40% y variable campo obtuvo un
porcentaje de 12%.
Variable 5: Criterio de Inclusión y Exclusión
Cuadro N 22 Criterio de Inclusión y Exclusión
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido Campo 6 12,0 12,0 12,0
Investigación 24 48,0 48,0 60,0
Teórica 20 40,0 40,0 100,0
Total 50 100,0 100,0
56
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido Exclusión 20 40,0 40,0 40,0
Inclusión 30 60,0 60,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 11. Diagrama de la Variables Criterio Inclusión y Exclusión
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: En base a este gráfico se puede observar que hubo más artículos
científicos aceptados obteniendo un porcentaje de 60% mientras que aquellos
que fueron excluidos obtuvieron un porcentaje de 40%.
Variable 6: Número de veces que se repite la palabra “Big Data”
Cuadro N 23 Tabla de Frecuencia de la variable Big Data
57
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido <= 0 4 8,0 8,0 8,0
1 - 43 36 72,0 72,0 80,0
44 - 86 7 14,0 14,0 94,0
87 - 129 2 4,0 4,0 98,0
130+ 1 2,0 2,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Cuadro N 24 Tabla para el análisis de la variable Big Data
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 12. Diagrama de la Variables Big Data
Estadísticos
Big_Data (agrupado)
N Válido 50
Perdidos 0
Media 2,20
Mediana 2,00
Moda 2
Desviación estándar ,728
Varianza ,531
Asimetría 1,650
Error estándar de asimetría ,337
Curtosis 4,483
Error estándar de curtosis ,662
Mínimo 1
Máximo 5
58
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Con este gráfico se puede visualizar que de los 50 artículos científicos
observados, las palabras Big Data obtuvieron una media de 2,20, una mediana
de 2,00 y una moda de 2. Además obtuvo una desviación estándar 0,728, por
último, por la forma del histograma, se puede concluir que tiene una asimetría
positiva de 0,531, es decir que aquellos valores bajos (a la izquierda del eje de
simetría) son aquellos que tienen mayor frecuencia en comparación a los demás
datos
Variable 7: Número de veces que se repite la palabra “Traffic_vehicular” en los
artículos
59
Cuadro N 25 Tabla de frecuencia de la variable traffic_vehicular
Traffic_vehicular (agrupado)
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido <= 0 13 26,0 26,0 26,0
1 - 20 33 66,0 66,0 92,0
21 - 40 3 6,0 6,0 98,0
41+ 1 2,0 2,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Cuadro N 26 Tabla para el análisis de la variable traffic_vehicular
N Válido 50
Perdidos 0
Media 1,84
Mediana 2,00
Moda 2
Desviación estándar ,618
Varianza ,382
Asimetría ,647
Error estándar de asimetría ,337
Curtosis 2,132
Error estándar de curtosis ,662
Mínimo 1
Máximo 4
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 13. Diagrama de la Variables Traffic Vehicular
60
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Se puede apreciar con este gráfico, de los 50 artículos científicos
observados, las palabras Traffic vehicular obtuvieron una media de 1,84, una
mediana de 2,00 y una moda de 2. Además obtuvo una desviación estándar
0,618 por último, por la forma del histograma, se puede concluir que también
tiene una asimetría positiva de 0,647, es decir que tiene menor probabilidad de
encontrar dichas palabras.
Variable 8: Número de veces que se repite la palabra “Conjunto Difuso” en los
artículos.
Cuadro N 27 Tabla de frecuencia de la variable Lógica Difusa
61
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido <= 0 12 24,0 24,0 24,0
1 - 21 17 34,0 34,0 58,0
22 - 42 21 42,0 42,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Cuadro N 28 Tabla para el análisis de la variable Lógica Difusa
N Válido 50
Perdidos 0
Media 2,18
Mediana 2,00
Moda 3
Desviación estándar ,800
Varianza ,640
Asimetría -,342
Error estándar de asimetría ,337
Curtosis -1,349
Error estándar de curtosis ,662
Mínimo 1
Máximo 3
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Gráfico 14. Diagrama de la Variables Lógica Difusa
62
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Se puede apreciar con este gráfico, de los 50 artículos científicos
observados, las palabras Fuzzy Logic obtuvieron una media de 2,18, una
mediana de 2,00 y una moda de 3. Además obtuvo una desviación estándar 0,8,
por último, por la forma del histograma, se puede concluir que al contrario de los
gráficos anteriores, tiene una asimetría negativa de -0,342, es decir que tiene r
mayor probabilidad de encontrar dichas palabras
63
Variable 9: Número de veces que se repite la palabra “Mapa Cognitivo Difuso”
en los artículos.
Cuadro N 29 Tabla de frecuencia de la variable Mapa Cognitivo Difuso
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido <= 0 29 58,0 58,0 58,0
1 - 5 18 36,0 36,0 94,0
6 - 10 3 6,0 6,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Cuadro N 30 Tabla para el análisis de la variable Mapa Cognitivo Difuso
N Válido 50
Perdidos 0
Media 1,48
Mediana 1,00
Moda 1
Desviación estándar ,614
Varianza ,377
Asimetría ,905
Error estándar de asimetría ,337
Curtosis -,133
Error estándar de curtosis ,662
Mínimo 1
Máximo 3
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
64
Gráfico 15. Diagrama de la Variables Mapa Cognitivo Difuso
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Se puede apreciar con este gráfico, de los 50 artículos científicos
observados, las palabras Fuzzy Maps Cognitive obtuvieron una media de 1,48,
una mediana de 1,00 y una moda de 1. Además obtuvo una desviación estándar
0,614, por último, por la forma del histograma, se puede concluir que tiene una
asimetría positiva de 0,905, y esto se debe a que se encontraron pocos
documentos que trataban sobre mapas cognitivos difusos.
65
Variable 10: Número de veces que se repite la palabra “Conjunto Difuso” en
los artículos.
Cuadro N 31 Tabla para el análisis de la variable Conjunto Difuso
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido <= 0 14 28,0 28,0 28,0
1 - 22 28 56,0 56,0 84,0
23 - 44 7 14,0 14,0 98,0
45+ 1 2,0 2,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Cuadro N 32 Tabla para el análisis de la variable Conjunto Difuso
N
Válido 50
Perdidos 0
Media 1,90
Mediana 2,00
Moda 2
Desviación estándar ,707
Varianza ,500
Asimetría ,505
Error estándar de asimetría ,337
Curtosis ,395
Error estándar de curtosis ,662
Mínimo 1
Máximo 4
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
66
Gráfico 16. Diagrama de la Variables Conjunto Difuso
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Se puede apreciar con este gráfico, de los 50 artículos científicos
observados, las palabras Fuzzy Sets obtuvieron una media de 1,90, una
mediana de 2,00 y una moda de 2. Además obtuvo una desviación estándar
0,707, por último, por la forma del histograma, se puede concluir que tiene una
asimetría positiva de 0,505, y esto quiere decir que hay menor probabilidad de
encontrar dichas palabras.
67
Variable 11: Número de veces que se repite la palabra “Variables Lingüística” en
los artículos.
Cuadro N 33 Tabla de Frecuencia de la variable Variables Lingüística
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válido <= 0 17 34,0 34,0 34,0
1 – 18 20 40,0 40,0 74,0
19 – 36 13 26,0 26,0 100,0
Total 50 100,0 100,0
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Cuadro N 34 Tabla para el análisis de la variable Variables
Lingüística
N Válido 50
Perdidos 0
Media 1,92
Mediana 2,00
Moda 2
Desviación estándar ,778
Varianza ,606
Asimetría ,142
Error estándar de asimetría ,337
Curtosis -1,315
Error estándar de curtosis ,662
Mínimo 1
Máximo 3
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
68
Gráfico 17. Diagrama de la Variable Lingüística
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Análisis: Se puede apreciar con este gráfico, de los 50 artículos científicos
observados, las palabra variable lingüística obtuvieron una media de 1,92, una
mediana de 2,00 y una moda de 2. Además obtuvo una desviación estándar
0,778, por último, por la forma del histograma, se puede concluir que tiene una
asimetría positiva de 0,142, lo que quiere decir que hay menor probabilidad de
encontrar dichas palabras.
69
Uso de herramienta de Big Data
Entorno de Trabajo “Cloud Platform”
Antes De empezar a usar los servicios de Google Cloud Platform, se debe
establecer o crear el proyecto, se la asignado el nombre “Tráfico”, Crear un
proyecto es tan sencillo, tan solo se debe escoger la opción Crear un nuevo
proyecto y asignarle un nombre
Figura 5. Google Cloud Platform Creación de proyecto
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Figura 6. Google Cloud Platform Nombre de proyecto
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
70
Gracias a esta solución tecnológica se puede obtener el uso de las herramientas
necesarias, de forma fácil, rápida y eficaz para el desarrollo del proyecto la cual
cuenta con una amplia gama de servicios virtualizado de hardware y software las
cuales se presentan a continuación. Para esta investigación se ha usado los
servicios Compute Engine y BigQuery
Figura 7. Google Cloud Platform
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Compute Engine
Para el inicio del proyecto se necesita trabajar con una máquina virtual que
tenga la capacidad suficiente para ejecutar las consultas masivas de
información, esta con la capacidad tanto de disco de almacenamiento como de
memoria RAM y con la compatibilidad necesaria para el relacionamiento de
todos los datos y sistemas necesarios estos que se ejecutan en los innovadores
centros de datos de Google y están vinculadas a través de una red de fibra a
71
nivel mundial. La máquina virtual se inicia rápidamente, disponen de
almacenamiento de disco persistente y proporcionan un rendimiento uniforme.
Se ha creado una la máquina virtual Datalab-instance-trafic, en la cual se ha
configurado el número de procesadores y memoria que contiene.
Figura 8. Compute Engine
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Una vez creada la máquina virtual, se establece los recursos, memoria y
procesadores para determinar qué tan veloz se necesite que sea esta.
Figura 9. Recursos de Compute Engine
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
72
Tal como se visualiza en la figura anterior se puede conocer los recursos de la
máquina virtual, Compute Engine permite visualizar en cualquier momento los
recursos y el uso de CPU de la MV, esta se iniciará cada vez que se desea
utilizarla tan solo con dar clic en Iniciar.
BigQuery
Con esta sencilla aplicación se ejecutará consultas de los conjuntos de datos de
muestra disponibles y mostrará el resultado. Almacenar y consultar conjuntos de
datos masivos puede llevar mucho tiempo y ser costoso sin el hardware y la
infraestructura adecuados.
Google BigQuery se ha introducido información de tránsito vehicular por medio
de archivos csv, cargar la información es muy fácil, sin embargo antes de subir la
información se debe estructura la tabla con los datos y sus respectivos tipos de
datos, como se puede observar en la siguiente figura.
Figura 10. BigQuery Carga de datos
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
73
Tal como se puede observar en la figura anterior se debe seleccionar el archivo
csv que se desea almacenar, se coloca un nombre a la tabla, y luego se procede
a establecer los diferentes campos y seleccionar “Create Table” y nuestra nueva
nueva tabla contendrá los datos subidos. Nuestra tabla se llama “traficodemo”
Una vez creada se visualizará en la parte derecha de la interfaz, se puede crear
n tablas, para nuestro estudio se ha enfocado en la tabla anteriormente
mencionada. Se puede ver el esquema que contiene los datos y los tipos de
datos de la tabla, los detalles de la tabla que contiene los atributos de la tabla, y
Preview que contiene los datos que se cargaron.
Figura 11. BigQuery Esquema
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Figura 12. BigQuery Detalles de tabla
74
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Figura 13. BigQuery Preview
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
75
BigQuery no solo ha permitido cargar información y almacenarla, sino también
permite realizar consultas de tal manera que puede ser filtrada o consultada solo
la información que se necesite. La siguiente figura muestra una consulta de la
tabla que se creó anteriormente, filtrado por el año 2018, entonces solo permite
visualizar tal información, además se puede exportar la información a un archivo
csv.
Figura 14. BigQuery Consulta
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Datalab
Esta herramienta interactiva se utilizará para explorar datos, analizarlos y
visualizarlos, así como desarrollar modelos en Google Cloud Platform. Se
ejecuta en Google Compute Engine y se conecta fácilmente a varios servicios de
la nube para que puedas centrarte en las tareas relacionadas con la ciencia de
datos.
76
Se ha establecido esta herramienta para analizar nuestros datos, es fácil e
interactiva de usar, es escalable puede manejar información desde megabytes
hasta terabytes de manera rápida.
Para usar Datalab se ha instalado dentro de Google Cloud Platform a través de
la Shell de esta plataforma. Se coloca lo siguiente: google components install
datalab
Figura 15. Google Cloud Platform Shell
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Figura 16. Instalación Datalab
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Una vez instalado Datalab, para comenzar a usarla se debe iniciar la instancia
“datalab-instance-trafic”, además en la Shell se debe colocar lo siguiente:
datalab connect datalab-instance-traffic
77
Figura 17. Iniciar datalab
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Una vez instalado Datalab en Google Cloud Platform se debe ingresar a Datalab
por medio del icono “Vista previa” y automáticamente se abrirá Datalab en otra
pestaña del navegador web y se puede comenzar a trabajar con esta
herramienta, Datalab permite crear notebooks que son carpetas en la cual el
usuario coloca su trabajo y así poder tener una mejor organización de todo lo
que realiza. Se ha creado un notebook llamado “Demostracion”
Figura 18. Datalab Notebooks
Elaborado por: Rocha & Villarreal, 2017
78
Fuente: Propia
Se ingresará al notebook “Demostracion”, en este libro en cual se ha realizado
algunas consultas para poder analizar y visualizar que información contiene.
Debido a que se ha instalado Datalab en la plataforma de Google Cloud, esta
puede acceder a los demás servicios, se ha usado la información de tránsito
almacenada en Big Query
Figura 19. Datalab Consulta
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
79
Se puede acceder a los datos de BigQuery especificando el id de la tabla que se
desea visualizar, se puede realizar sin número de consultas, y obtener solo la
información que se necesite, en este caso se muestra la información de tránsito
por fecha, hora, mes en forma de tabla, en la cual se puede realizar el análisis
descriptivo, el cual consiste en usar datos históricos, identificar su
comportamiento, cuenta como van pasando las cosas hasta el momento,
permitiendo visualizar, detectar e identificar la situación de las cosas. Por medio
de Datalab se pudo realizar el análisis descriptivo debido a que contiene y
permite visualizar la información histórica, permitiendo conocer en qué mes hay
más tránsito o en qué mes no hay mucho tránsito, o cuánto ha incrementado el
tránsito de un año a otro, y lo permite realizar de manera rápida, debido a que
Datalab es una herramienta que procesa grandes cantidades de datos en
segundos. Para mejor análisis y visualización se lo puede realizar por medio de
gráficos, el cual se puede observar en la figura 34
IBM Cognos TM1
Además de la herramienta usada anteriormente, se decidió usar IBM Cognos
Tm1 para analizar gran cantidad de datos, debido a que permite manejar
grandes datos a una gran velocidad y permite realizar cubos de información
Se creó un cubo de información que contenga los datos de tránsito del cantón La
Libertad. IBM Cognos TM1, posee la herramienta Performance Modeler que
permitirá desarrollar nuestro modelo.
Para crear el cubo de información, se ha definido las siguientes dimensiones,
estas pueden ser métricas que contienen elementos cuantitativos, indicadores
que permite conocer el estado del tránsito vehicular y accidentes, dimensión de
tiempo que contienen los meses y años, dimensiones genéricas que contienen
elementos generales.
80
Cuadro N 35 Dimensión factores
Dimensiones Tipo de dimensión
Descripción
factores métrica Contiene las medidas que permiten visualizar los datos
indicador métrica indicador Contiene los elementos que permite visualizar el estado de un
elemento
mes_continuo tiempo Contiene los meses desde enero 2016 hasta febrero 2018
zonas genérica Contiene las zonas en la que se divide el cantón.
horas genérica Contiene los intervalos de
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
A continuación se muestra el contenido de cada dimensión
Figura 20. Dimensión factores
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
81
Figura 21. Dimensión indicador
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Figura 22. Dimensión mes_continuo
Elaborado por: Rocha & Villarreal, 2017
82
Fuente: Propia
Figura 23. Dimensión zona
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Figura 24. Dimensión horas
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
83
Una vez definida las dimensiones se las coloca en el cubo de datos, para ello
solo se debe arrastrar las dimensiones desde el panel izquierdo hacia el cubo,
cuando se defina el cubo se ingresa la información que corresponde al tránsito
vehicular, el cubo es una multiplicación de todas las dimensiones, por lo cual
resulta fácil visualizar la información y filtrarla como se requiera observar.
Figura 25. Cubo Transit
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Como se observa en la figura anterior, se ve el siguiente cruce: mes_continuo,
tránsito, horas, año actual, zona 3, sin embargo se puede ver diferentes cruces o
filtros, por ejemplo la figura siguiente en la cual se visualiza: horas,
mes_continuo, tránsito, ano anterior, zona 2
84
Figura 26. Cruce Cubo Transit
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
También se ha colocado la cantidad de accidentes del cantón en su respectivo
mes y hora, en el mismo cubo de información.
Figura 27. Cruce Cubo Transit: Accidentes
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
85
IBM Cognos TM1 Performance Modeler también permite realizar Diagramas, en
la cual se puede subir una imagen que servirá para visualizar de manera gráfica
la información, además de indicar las medidas o información que se desee
visualizar para realizar nuestro análisis descriptivo de manera rápida y fácil. Se
ha cargado la imagen “zonas la libertad”, la cual está dividida por tres zonas para
analizar de mejor manera el tránsito vehicular, para incluir los indicadores en el
mapa solo se debe arrastrar los elementos del panel izquierda en la ubicación
que se requiera en el mapa, como se visualiza en la siguiente figura.
Figura 28. Diagram en TM1
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Para ver su efecto e impacto se puede visualizar en la figura 37, en la cual los
analistas podrán ver la información de una manera que le permita interpretar los
datos.
86
Uso de Mapas Cognitivos Difusos
Aunque nuestro enfoque principal no son los Mapas Cognitivos Difusos y no
permite manejar Big Data, sin embargo se ha decidido hacer uso de estos,
debido a que también ayuda analizar la situación del tránsito vehicular y poder
analizar la situación para tomar alguna decisión.
El agigantado crecimiento en la población y el sector productivo, demanda a los
gobiernos locales la indagación en relación a las soluciones eficientes para los
conflictos de movilidad del cantón La Libertad.
Para identificar los nodos o factores y el peso de cada nodo, se consulta a
especialistas en el tema, se realizan preguntas que ayuden a identificar los
factores que inciden en el problema, por lo cual algunos expertos en el área de
gestión vehicular y en base a sus criterios ayudaron a realizar el mapa cognitivo
difuso con los diferentes pesos de cada nodo. (Leyva Vásquez, Pérez Teruel,
Febles Estrada, & Gullín González, 2013).
Para nuestro estudio se pidió la ayuda de expertos en la gestión de movilidad
vehicular mencionados en el cuadro 6 se realizó una entrevista a estos
profesionales para conocer los factores del tránsito vehicular en el cantón, (la
entrevista que se puede visualizar en el capítulo tres de este documento) y
además con su experiencia y conocimiento en el tema identificaron los
principales factores que afectan a la gestión del tránsito vehicular, en la cual se
concluyó se tendrá ocho variables o nodos: Semáforos dañados, Accidente.
Cantidad de Vehículos. Vías en mal estados. Lluvia, Señales en buen estado,
Trabajos en vías y Congestionamiento vehicular. A continuación se mostrará un
cuadro con los nodos con su respectiva descripción.
La matriz de adyacencia es una matriz que muestra los pesos que tienen entre
un nodo a otro. La matriz es muy sencilla de realizar, sólo se escribe los pesos
87
que tiene un nodo sobre otro nodo, los cuales fueron definidos por los 10
expertos en el área de gestión vehicular.
Cuadro N 36 Nodos de Mapa Cognitivo Difuso
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Para poder efectuar la relación que hay entre un nodo y otro, hay que considerar
dos preguntas:
¿Cuándo este componente incrementa, el otro componente incrementa o
decrementa?
¿Este incrementa o decrementa altamente, este incrementa o decrementa
mediamente o este incrementa o decrementa bajamente.
También se debe considerar que los valores que se pueden colocar para indicar
la influencia entre componente se encuentran en el rango de 1 al -1, para indicar
el peso que tiene un nodo sobre otro
Nodos Descripción
C1 Señales deTránsito en buen estado
C2 Semáforo en buen estado
C3 Lluvia
C4 Trabajos en las vías
C5 Vías en mal estado
C6 Congestionamiento vehicular
C7 Accidente
C8 Buen clima (No hay lluvias)
88
Figura 29. Mapa Cognitivo Difuso del Tránsito Vehicular
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Se realizará la lectura de un nodo para comprender cómo se lee el modelo: Si
los accidentes incrementan (C7), la congestión vehicular incrementa (C6).
De esta manera se realiza la lectura de cada nodo o concepto de nuestro
modelo, para mayor comprensión.
Se ha considerado la variable lingüística Cantidad con sus respectivas etiquetas
lingüísticas, las cuales ayudarán a darle un valor y sentido a nuestra variable de
estudio.
89
Cuadro N 37 Etiqueta Lingüística
Etiquetas Lingüísticas Valor
Demasiado 1
Medianamente mucho
0.5
Mucho 0.25
0
Poco -0.25
Mediamante Poco -0.50
Muy poco -1
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Una vez construido el MCD, se realiza la matriz adyacente: se coloca todos los
conceptos tanto en filas como en columnas (cabecera) y se ubica los pesos de
cada nodo que definimos en el modelo en su respectiva celda. Las relaciones
que existen en cada nodo, se deben detallar en la matriz de adyacencia,
indicando su peso
A continuación se visualizará representación de la matriz de adyacencia
90
Cuadro N 38 . Caso de Estudio: Representación de matriz de
adyacencia
C1 C2 C3 C4 C5 C6 C7 C8
C1 W11 W12 W13 W14 W15 W16 W17 W18
C2 W21 W22 W23 W24 W25 W26 W27 W28
C3 W31 W32 W33 W34 W35 W36 W37 W38
C4 W41 W42 W43 W44 W45 W46 W47 W48
C5 W51 W52 W53 W54 W55 W56 W57 W58
C6 W61 W62 W63 W64 W65 W66 W67 W68
C7 W71 W72 W73 W74 W75 W76 W77 W78
C8 W81 W82 W83 W84 W85 W86 W87 W88
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
A continuación se observará la matriz de adyacencia con los respectivos pesos
que se coloca en el MCD
Cuadro N 39 . Matriz adyacencia del MCD
C1 C2 C3 C4 C5 C6 C7 C8
C1 0 0 0 0 0 -0.64 0 0
C2 0 0 0 0 0 -0.75 0 0
C3 0 0 0 0 0.5 0.78 0 0
C4 0 0 0 0 0 0.53 0.67 0
C5 0 0 0 0 0 0.56 0.8 0
C6 0 0 0 0 0 0 0 0
C7 0 0 0 0 0 0.58 0 0
C8 0 0 0 0 0 -0-56 0 0
91
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Una vez obtenida la matriz de adyacencia en la cual se encuentran los pesos
determinados por los expertos, se necesita establecer los patrones de entrada
también llamado vector de entrada para poder simular los escenarios que se
necesite analizar.
El vector de entrada es el siguiente:
E = [E1 E2 E3 E4 E5 E6 E7 E8]
E = [0 0 0 0 1 0 0 0]
Cero significa que el nodo está apagado y 1 que el nodo esta prendido, también
se pueden usar valores comprendidos desde -1 hasta 1, en este caso se
encenderá E5 y se le coloca un valor de 1, y el resto de los nodos quedan
apagados. Los valores del vector de entrada dependerán de que se quiera
analizar en determinado momento.
Cuadro N 40 . Multiplicación de vector de entrada con matriz
adyacencia
VR= [E1 E2 E3 E4 E5 E6 E7 E8]
C1 C2 C3 C4 C5 C6 C7 C8
C1 W11 W12 W13 W14 W15 W16 W17 W18
C2 W21 W22 W23 W24 W25 W26 W27 W28
C3 W31 W32 W33 W34 W35 W36 W37 W38
C4 W41 W42 W43 W44 W45 W46 W47 W48
C5 W51 W52 W53 W54 W55 W56 W57 W58
C6 W61 W62 W63 W64 W65 W66 W67 W68
C7 W71 W72 W73 W74 W75 W76 W77 W78
C8 W81 W82 W83 W84 W85 W86 W87 W88
92
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Se debe realizar la multiplicación del vector con la matriz de adyacencia, en la
cual se obtiene un vector resultante
VR1= [R1 R2 R3 R4 R5 R6 R7 R8]
Se aplica la fórmula 1, donde x es cada elemento del vector resultante, se aplica
esta función en todos los elementos del vector resultante VR de la multiplicación,
obteniendo un nuevo vector resultado ya habiendo aplicado la función sigmoidal.
VS= [S1 S2 S3 S4 S5 S6 S7 S8
Nuestro vector resultante VS, será nuestro nuevo vector de entrada en la
siguiente iteración, realizar este procedimiento para los vectores resultantes VS
en cada iteración, este proceso continúa hasta cuando los valores de entradas y
los valores de salida sean los mismos.
Las iteraciones se las visualizará en el cuadro 42 que mostrará cual es nuestro
vector resultante, para analizar este escenario y ver el resultado de nuestro MCD
Mental Modeler
Mental Modeler permite modelar de manera ágil nuestro MCD, agregando los
factores o componentes de nuestra problemática, los cuales se pueden
visualizar en el cuadro 36, que como ya se había mencionado se realizaron con
ayuda de criterios de expertos para saber cuáles eran los componentes
necesarios para desarrollar nuestro MCD. Los expertos son los encargados de
definir las relaciones entre un nodo a otros y definir los pesos de las diferentes
relaciones entre estos.
93
Figura 30. Mental Modeler: Mapa Cognitivo Difuso
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
La herramienta llena automáticamente los valores en la matriz cuadrada
dependiendo del peso y las relaciones entre los factores, los cuales se colocaron
al realizar el modelo, es decir agiliza la labor de estar llenando celda por celda.
En la siguiente figura se muestra la matriz de adyacencia en Mental Modeler.
Figura 31. Mental Modeler: Matriz de adyacencia
94
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Mental Modeler coloca los valores de entrada y salida de cada nodo y calcula la
centralidad que posee cada nodo, optimizando tiempo al usuario, debido a que lo
realiza de manera automática.
Figura 32. Mental Modeler: Centralidad de los nodos
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Tal como se visualiza en la imagen anterior se suma todos los pesos que
ingresan (Indegree) y salen (Outdegree) de los diferentes nodos, para hallar la
centralidad se suman los pesos entrantes y salientes de los nodos y obtener
cuál es el nodo relevante, en nuestro caso es el Congestionamiento vehicular,
debido a que tiene la mayor centralidad
Se ingresa nuestro vector de entrada, es decir que conceptos consideramos
encender para conocer en cuánto influye al resto de los nodos
95
Figura 33. Mental Modeler: Vector de entrada
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
En la figura anterior observamos que encendemos el nodo Vías en mal estado,
asignando el valor lo cual indica que en este escenario hay demasiadas vías en
mal estado 1 (el valor lingüístico del nodo se lo conoce por medio de los valores
lingüísticos definidos en el cuadro 27). Una vez establecida que escenario,
Mental Modeler permitió conocer el resultado de este escenario (ver figura 40).
96
CAPITULO IV
RESULTADOS
Es preciso dar a conocer cuáles han sido los resultados obtenidos en esta
investigación, por medio del análisis de la información de movilidad vehicular y la
determinación de los factores que inciden en el tránsito vehicular.
Para el análisis de los datos se usó la herramienta Datalab y TM1 Performance
Modeler que permitió examinar la información del tránsito vehicular rápidamente
y eficaz. Para identificar los factores de la gestión de movilidad vehicular se han
usado Mapas Cognitivos Difusos desarrollado en la herramienta Mental Modeler.
A continuación se observará los resultados con Datalab
Resultado con Datalab
Se analizaron los datos de tránsito del cantón por medio de la herramienta de
Big Data Datalab desde Google Cloud Platform, la cual permitió realizar
consultas del tránsito vehicular y así mismo realizar gráficos que permitirán
visualizar de mejor manera los datos o la información con respecto al flujo de
tránsito en sus respectivos meses para mejor comprensión.
Los gráficos ha permitido visualizar la información de manera rápida lo cual
permitió sacar un análisis descriptivo de cómo es la situación actual del tránsito
por la que atraviesa el cantón La Libertad, de esta manera el analista sabrá
cuáles son los meses más transitados, y así dar a conocer esta información a los
encargados de la gestión de movilidad vehicular, para que tengan mejor
organización de la gestión de movilidad vehicular, debido a que este problema
afecta a toda la población en general.
En el eje x estarán contemplado los meses desde Octubre 2017 hasta Febrero
2018 y en el eje y la cantidad de vehículos transitados en esos meses
97
Figura 34.Resultado del análisis de la información de tránsito en Datalab
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Como se observa en la figura anterior, en el mes de noviembre hubo menos
tránsito, tal vez porque aún no empezaba la temporada de playa, o que en Enero
es el mes más transitado, porque los estudiantes empiezan a salir de la escuela
y las familias deciden ir a las playas del cantón, gracias a la información histórica
con la ayuda de Datalab se da a conocer todo el tránsito del cantón y así ayudar
a los encargados de la gestión vehicular a tomar decisiones y conocer de mejor
manera y rápida y oportuna la situación actual por la que atraviesa el cantón.
Resultado con la herramienta IBM Cognos TM1
Performance Modeler
Los cubos de TM1, permite conocer el estado de cada elemento usando
métricas (tránsito y accidentes) e indicadores (estados, que realiza una
comparación con el año anterior y tendencias realiza una comparación con el
mes anterior) a través de semáforos (rojo indica advertencia, verde un estado
satisfactorio, amarillo indica precaución), dimensión de tiempo (meses con los
años 2015, 2016) , dimensiones genéricas (horas, que contiene los rangos de
horas y zonas que las 3 zonas en que está dividida en cantón)
98
A continuación se interpretará el resultado de la información por medios los
indicadores.
Figura 35. Resultado Cubo Transit
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
En la figura anterior indica que en la zona 2, ha incrementado el tránsito con
respecto al año anterior, es decir el año 2016 con respecto al año 2015, además
se observa la tendencia de los meses, en el mes de Febrero 2016 ha
incrementado con respecto al mes anterior Enero 2016, de esta manera los
analistas podrán conocer rápidamente la información como un todo, sin
necesidad de armar más cubos de información debido a que un cubo puedo
contener grandes cantidades de datos.
También se ha incluido la información de accidentes, por lo cual se puede
interpretar los resultados de los accidentes
Figura 36. Resultado accidentes Cubo Transit
99
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propi
En la figura anterior indica que en la zona 1, hay diversos estados, por ejemplo
en Enero 2017 se observa que ha incrementado los accidentes con respecto a
Enero 2016, da como resultado un indicador rojo, en cambio en Marzo 2017
han disminuido los accidentes con respecto a Marzo 2016, por lo cual muestra
un indicador verde. Además se ha podido ver la tendencia de los meses con
respecto a la cantidad de accidentes, si se observa el mes de Mayo 2017 ha
incrementado la cantidad de accidentes con respecto al mes anterior Abril 2017,
que hubieron más accidentes, y así conocer en que fechas hay más accidentes
vehiculares y de esta manera poder analizar la información y poder tomar
decisiones importantes que ayuden a la gestión vehicular.
Además la herramienta permite visualizar de otra forma la información por medio
de diagramas, en la cual se define los indicadores (estado y tendencias), una
métrica (tránsito), dimensión de tiempo (año y meses) y la dimensión genérica
horas, para poder interpretar el resultado de manera gráfica.
A continuación se visualiza el diagrama
Figura 37. Visualización Diagrama Transit
100
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Una vez definido el diagrama, se puede visualizar en el mapa cómo se
encuentra el tránsito vehicular en las diferentes zonas del cantón La Libertad, en
la figura anterior, se visualizará la información del mes de Febrero 2017 y la hora
desde las 0:00 hasta 3:00, en la cual da como resultado que el tránsito en ese
intervalo de tiempo no es mucho, debido que muestra indicadores verdes, lo cual
que no hay problema en ese rango de hora. En la siguiente se visualizará otro
rango de hora
Figura 38. Visualización Diagram Transit 6-9 am
101
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Tal como se visualiza en la figura anterior, muestra los indicadores en el horario
de 6:00 a 9:00 am, se pudo mostrar que ese intervalo de hora si hay tránsito
pesado, excepto en la zona 3, debido a que a esa hora la gente sale de su casa
a su trabajo hay gran cantidad de vehículos sin embargo en la zona 3, no hay
edificios, empresas o negocios se interpreta que allí no hay muchos vehículos
circulando por esa zona.
En la figura siguiente se muestra los indicadores de accidentes de Febrero del
2016 en el intervalo de hora 3:00 a 6:00 am, se observa que los accidentes han
disminuido con respecto a los accidentes de Febrero 2015.
Figura 39. Visualización Diagrama Accidentes
102
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Con IBM Cognos TM1, se ha podido analizar el impacto que tiene usar Big Data
en una herramienta que permite visualizar de manera ágil la información, es una
herramienta que es de gran ayuda a los directores de área de la gestión
vehicular, debido a que a ellos les interesa ver el resultado rápidamente y
oportuna por medio de diagramas podrá interpretarlos para la toma de
decisiones, y dar a conocer el estado y la tendencia de éstos factores.
Resultados de Mapas Cognitivos Difusos
Además por medio del uso MCD y con ayuda de Mental Modeler se identificaron
los distintos factores y escenarios que pueden ocurrir en el cantón La Libertad en
cuanto a la movilidad vehicular.
Una vez construido el MCD y obtenido la matriz de adyacencia, en la cual esta
herramienta se identifica el peso y relación de cada nodo, se debe evaluar la
centralidad de un nodo para conocer cuál es el nodo importante, esta se lo
103
encuentra por medio de las entradas y salidas de un concepto. Para hallar las
entradas de un concepto se debe sumar todos los valores entrantes de dicho
nodo, para hallar las salidas de un concepto se debe sumar todos los valores
salientes de dicho nodo.
Cuadro N 41 . Resultado de la Centralidad de los nodos
Nodo Entradas Salidas Centralidad
C1 0 0.64 0.64
C2 0 0.75 0.75
C3 0 1.28 1.28
C4 0 1.20 1.20
C5 0.5 1,36 1.86
C6 4.4 0 4.4
C7 1.47 0.58 2.05
C8 0 0.56 0.56
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Como se puede ver en la figura anterior el nodo C6 que corresponde al
Congestionamiento vehicular, es el nodo que se ve afectado, es decir es nuestro
nodo relevante y al que hay que ponerle atención
Cuadro N 42 . Iteraciones del MCD
Iter. Vector entrada Vector de salida
1 0,0,0,0,1,0,0,0 0.5, 0.5, 0.5 ,0.5, 0.5, 0.64, 0.69, 0.50
2 0.5, 0.5, 0.5 ,0.5, 0.5, 0.64, 0.69, 0.50 0.5,0.5,0.5 ,0.5, 0.56, 0.59, 0.68, 0.50
3 0.5, 0.5, 0.5 ,0.5, 0.56, 0.59, 0.68, 0.50 0.5,0.5,0.5 ,0.5, 0.56, 0.60, 0.69, 0.50
4 0.5, 0.5, 0.5 ,0.5, 0.56, 0.60, 0.69, 0.50 0.5,0.5,0.5 ,0.5, 0.56, 0.60, 0.69, 0.50
104
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
El número de iteraciones no es definido ni por la cantidad de conceptos, ni por
los pesos, sino que se realiza una multiplicación del vector de entrada con la
matriz adyacente y repite hasta que el vector de salida sea igual que el vector de
entrada.
Mental Modeler
Mental Modeler permite realizar n escenarios con el fin de analizar diferentes
situaciones. Se ha determinado un escenario en el cual hay demasiadas Vías en
mal estado (ver figura 33) y poder conocer cómo influye esta situación en los
demás nodos
Figura 40. Mental Modeler: Resultado de análisis
105
Elaborado por: Rocha & Villarreal, 2017
Fuente: Propia
Como se observa en la figura anterior se ve el efecto que tiene el modelo cuando
hay demasiadas Vías en mal estado, por lo cual se ve afectado el
Congestionamiento vehicular y los Accidentes. Si se observa la figura 30, Vías
en mal estado está directamente relacionado con los factores mencionados
anteriormente, por ende da como resultado que se incremente el
Congestionamiento vehicular y los Accidentes.
Análisis del impacto del uso de Big Data en la
gestión de movilidad vehicular del cantón La Libertad
106
Para identificar el impacto del uso de Big Data en cuanto a la movilidad
vehicular del cantón se realizó una entrevista (ver anexo B) a la Arq. Kelly
Lara, quien está encargada de analizar la información de tránsito
vehicular de la Comisión de Tránsito del Ecuador. Con esta entrevista se
logró obtener información acerca del proceso de análisis de flujo
vehicular que realizan actualmente, y así poder realizar una comparación
con el estudio del uso de Big Data contemplada en esta tesis.
Los analistas de tránsito vehicular usan Autocad para colocar la
ubicación del accidente y Word para redactar los realizar los informes de
accidentes. Para realizar el análisis de información de flujo vehicular los
analistas de la Comisión de Tránsito del Ecuador usan la herramienta
Microsoft Office Excel, en la cual manejan los datos del tránsito vehicular
y los accidentes,
Esta información se encuentran en diferentes archivos de Excel, ya que
puede ser segregada por años, por meses o por zonas, elaborar esta
segmentación puede demorar hasta 4 horas, esto dependerá de lo que
se desee analizar, debido a que son archivos con gran cantidad de
información, se vuelven pesados, el hecho de solo abrir un documento
con esta información, puede tardar de 5 a 10 minutos y realizar alguna
pequeña modificación en los datos del archivo toma más de 10 minutos,
con ayuda de Big Query y Tm1 Performance Modeler esto dejará de ser
un problema ya que permite cargar una gran cantidad de información de
flujo vehicular y almacenarla, lo cual permitirá visualizar la información
rápidamente en el momento que se necesite y tener consistencia en los
datos.
Si se requiere alguna información específica se realizan tablas
dinámicas, esta se construye de tal manera que podamos visualizar la
información de tránsito y accidentes vehicular como se necesite, una vez
definida la tabla dinámica con esos datos se realiza los gráficos en Excel
con la información que se necesita para nuestro análisis, con el uso de
107
Datalab y TM1 Performance Modeler se puede observar toda la
información rápidamente y filtrar información específica en un segundo.
Dependiendo de la cantidad de archivos e información se necesita entre
2 a 3 analistas de tránsito vehicular, debido a que cada analista posee
sus propios archivos de Excel. Realizar todo este proceso para hacer un
análisis puede llevar de 4 horas, con TM1 Performance Modeler se tiene
la información en un sola plataforma, por lo cual no se requiere de
muchos analistas para obtener una información específica, solo se debe
acceder a ella, esto ayuda a optimizar tiempo valioso para realizar el
análisis.
Consolidar los datos de tránsito vehicular es una tarea tediosa debido a
que se debe recopilar la información de los archivos que contengan la
información, debido a que TM1 Performance Modeler permite construir
cubos de información que contiene todos los datos del tránsito vehicular
y accidentes, permite ver la información consolidada en cuestión de
segundos.
El proceso para realizar un análisis de la información de flujo vehicular se
lo realiza solo 2 veces al mes o cuando el director del área de tránsito
vehicular necesite visualizar información para tener conocimiento del cuál
es la situación con respecto al tránsito vehicular, con Datalab y TM1
Performance Modeler debido a que se puede visualizar la información al
instante, el análisis se lo puede realizar constantemente y ágilmente.
Conclusión
El impacto del uso de Big Data radica en que se puede tener gran
cantidad de información en una sola plataforma de tal manera que sea
accesible y fácil de usar, conocer rápidamente el estado del flujo
vehicular en los diferentes meses y años, consistencia en los datos, tener
grandes cantidades de información de manera consolidada, realizar un
análisis de la información de flujo y accidentes vehiculares en poco
tiempo, lo cual optimiza horas valiosas para la organización.
108
Pregunta científica
¿Mediante el uso de Big Data se pudo lograr un impacto en la
gestión de movilidad vehicular en el cantón La Libertad?
Cuando se habla de Big Data, es referirse a gran cantidad de datos, el
uso de esta tecnología, permitirá gestionar grandes volúmenes de
información, el análisis oportuno de los datos es clave para impulsar el
rendimiento de las organizaciones, debido a que el analista siempre
busca obtener información de fácil acceso y rápidamente.
Al usar la gran cantidad de información de la movilidad vehicular con
ayuda de herramientas Big Data como Datalab y la herramienta TM1
Performance Modeler, generó un impacto en la gestión de movilidad
vehicular debido a que permite realizar un análisis descriptivo de los
grandes datos de una manera fácil y rápida en la cual se puede conocer
cuál es el comportamiento del tránsito y accidentes vehiculares del
cantón La Libertad, optimizando tiempo valioso para los analistas de la
información de tránsito vehicular.
109
CONCLUSIONES
Se pudo identificar la situación actual de la movilidad vehicular del cantón
del cantón La Libertad por medio del análisis de la gran cantidad de
información y con la ayuda de la plataforma de Google Cloud, Big Query
y Datalab, además de usar IBM Cognos tm1, el cual permitió realizar
scorcarding para conocer por medio de semáforos el estado de los
factores a lo largo del tiempo, de manera rápida y efectiva.
Se realizó un análisis descriptivo con la información de movilidad
vehicular con la herramienta Performance Modeler, debido a que permitió
construir cubos de información para poder visualizar de mejor manera y
rápidamente esta información, lo cual permite a los encargados de la
gestión de movilidad vehicular a la toma de decisiones.
Se pudo visualizar la información rápidamente y simplificada a través de
gráficos en la cual se muestra los datos de movilidad vehicular y permite
ver en qué mes se concentra el tránsito vehicular, y ayuda a la toma de
decisiones que ayuden a mejorar el tránsitos vehicular, además se
realizó diagramas que permiten ver los indicadores de cada factor y a lo
largo del tiempo, para conocer el estado en las diferentes zonas del
cantón La Libertad
110
RECOMENDACIONES
Realizar un proceso continuo con ayuda de herramienta de Big Data e
identificar las situaciones anómalas que se presenten en el cantón.
Utilizar un software o herramienta que ayude a la recopilación de datos o
de los factores que inciden en el congestionamiento vehicular para tener
información actualizada y diaria, con esto poder realizar el análisis en
determinados momento, puesto que con las nuevas competencias en el
mercado, plataformas existentes pueden ser el gran incentivador para
que otras empresas del sector tomen los valiosos atributos que esta
herramienta ofrece y así propiciar una mejora en la toma de decisiones
de los entes regentes del tránsito y la seguridad vial.
Fomentar una cultura en donde el análisis de Big Data este integrado en
todas partes, facilitando a los analistas en la toma de decisiones basadas
en datos, y no solo confiar en su instinto.
Las técnicas de visualización de la data deben de ir orientados a la
población definiendo lo que realmente requiere. Por tal motivo, se
recomienda realizar un análisis exhaustivo sobre las necesidades de los
habitantes del sector.
Realizar estudio de los factores del congestionamiento vehicular
continuamente para poderlo sobrellevar de mejor manera y no cuando la
situación ya es caótica.
Capacitar a los encargados del área de gestión vehicular con la
tecnología para que puedan resolver los inconvenientes o situaciones
inesperadas de manera ágil y eficaz
111
REFERENCIAS
Alonso, J. A., & Donoso, V. (2003). Competir en el exterior. La empresa
española y los mercados internacionales. Madrid.
Baena, G. (2014). METODOLOGÍA. mexico: Grupo Editorial Patria.
Cañarte Manrique, M. I. (2015). Análisis del uso de big data en las
empresas guayaquileñas sobre la base de plataformas basadas en
tics en el año 2014. Guayaquil.
Cloud Google. (2015). Google Cloud Plattform.
Constitución de la Republica de Ecuador. (2008). Obtenido de
http://www.oas.org/juridico/pdfs/mesicic4_ecu_const.PDF
Dávila, F. (2014). La inteligencia del negocio Business Intelligence.
Espinoza, F., Gordillo, C., Jiménez, R., & Avilés, O. (2013). Machine
vision algorithms applied to dynamic traffic light control.
Feliciano Morales, A., Cuevas Valencia, R. E., & Martínez Castro, J. M.
(2016). Procesamiento Analítico con Minería de Datos. México.
Fletes Gudiño, P., & Farías Mendoza, N. (2013). Especificación formal de
cubos de datos aplicados a la administración de las actividades
docentes. Colima.
Garcia-Cascales, M., & Lamata, M. (2010). Nueva aproximación al
método topsis difuso con etiquetas linguísticas.
google. (Febrero de 2016). Obtenido de
https://cloud.google.com/products/big-data/?hl=es
Grajales G., T. (2000). Tipos de investigación.
Groumpos, P. (2010). Fuzzy Cognitive Maps: Basic Theores and Their
Application to Complex System. Berlin.
112
Guama Morales, S. C. (2015). Estudio Comparativo de Métodos
Existentes para Integrar la Información Estructurada y no
Estructurada de una Industria Enfocado en la Generación de
Conocimiento, Desde la Perspectiva de una Solución Integral de
Big Data. Quito.
Hernandéz, R. (2014). Metodologia de la Investigacion. 6ta Edición.
Mexico: Mc GrawHill.
IBM. (2013). IBM. Obtenido de
https://www.ibm.com/developerworks/library/bd-
archpatterns1/index.html
ibm. (2017). ibm cognos tm1. Obtenido de https://www.ibm.com/us-
en/marketplace/cognos-tm1
IBM. (2017). Understand Cognos TM1 Scorarding. Obtenido de
https://www.ibm.com/support/knowledgecenter/en/SS9RXT_10.2.2/
com.ibm.swg.ba.cognos.prfmdl_ug.10.2.2.doc/TM1_Scorecarding_
overview.html
Ibm Performance Modeler . (2017). Getting started with Cognos TM1
Perfomance Modeler. Obtenido de
https://www.ibm.com/support/knowledgecenter/en/SS9RXT_10.2.2/
com.ibm.swg.ba.cognos.prfmdl_ug.10.2.2.doc/c_prfmdl_usng_prfm
dl.html
INEC. (2016 ). Anueario de transporte 2016. Recuperado el 20 de
noviembre de 2017, de Ecuador en Cifras :
http://www.ecuadorencifras.gob.ec/documentos/web-
inec/Estadisticas_Economicas/Estadistica%20de%20Transporte/20
16/2016_AnuarioTransportes_%20Principales%20Resultados.pdf
Kalický, A. (2013). High Performance Analytics. Prague.
113
ley organica de transporte terrestre transito y seguridad vial. (2014).
Obtenido de http://www.turismo.gob.ec/wp-
content/uploads/2016/04/LEY-ORGANICA-DE-TRANSPORTE-
TERRESTRE-TRANSITO-Y-SEGURIDAD-VIAL.pdf
Leyva Vásquez, M., Peréz Teruel, K., Febles Estrada, A., & Gulín
González, J. (2012). Modelo para el análisis de escenarios
basados en mapas cognitivos difusos estudio de caso en software
biomédico. Bogotá.
Leyva Vásquez, M., Pérez Teruel, K., Febles Estrada, A., & Gullín
González, J. (2013). Mapas cognitivos difusos para la selección de
proyectos de tecnologías de la información.
Lukoianova, T. (2014). ir.lib.uwo. Retrieved from
http://ir.lib.uwo.ca/cgi/viewcontent.cgi?article=1065&context=fimspu
b
Martín, C. (2016). BIG DATA Y HADOOP. Obtenido de Big Data:
http://www.ctic.uni.edu.pe/index.php/tallerhadoop
Mental Modeler Org. (2015). Mental Modeler. Obtenido de
http://www.mentalmodeler.org/
Merca, J. S. (2010). Cómo realizar una revisión sistemática y un meta-
análisis.
Morcillo, C. G. (2013). Lógica Difusa Una introducción práctica.
Papageorgiou, E. I., & Stylios, C. D. (2008). Fuzzy cognitive maps: Basic
theories and their application to complex systems. Berlin.
Pedraza, L. F., Hernández, C. A., & López, D. A. (2012). Control de tráfico
vehicular usando ANFIS. Bogotá.
114
Peréz Teruel, K. (2014). Modelo de proceso de logro de concenso de
mapas cognitivos difusos para la toma de decisiones en grupo.
Habana.
Pesantes Solórzano, L. N., & Pesantes García, D. A. (2017). Análisis y
estudio de big data orientado a los grandes volúmenes de datos y
los principales usos de la información recolectada. Guayaquil.
Rodríguez, M., & Huertas, Y. (2016). Metodología para el diseño de
conjuntos difusos a partir de opiniones de expertos.
Salmeron, J. L., Vidal, R., & Mena, A. (2012). Ranking fuzzy cognitive map
based scenarios with Topsis.
Stach, W. (2010). Leraning and Agregation of Fuzzy Cognitive Maps- An
Evolutionary Approach. Alberta.
UNIVERSIDAD POLITÉCNICA DE MADRID. (2015). Big Data: el futuro a
través. UPM, 1.
Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining
Practical Machine Learning Tool and Techniques. Hamilton.
Zakir, J., Seymoir, T., & Berg, K. (2015). Big Data Analytics. Dakota del
Norte.
115
ANEXOS A
“Matriz Meta-análisis”
116
117
118
119
120
121
122
123
124
125
126
127
128
ANEXOS B
“Entrevista para conocer el análisis del flujo vehicular y
accidentes de tránsito”
129
130
ANEXOS C
“Solicitud CTE”
131
132
133
134
ANEXOS D
“Cronograma”
135
136
137