UNIVERSIDAD DE GUAYAQUIL -...

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS

CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES

IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD

VEHICULAR EN EL CANTÓN DE LA LIBERTAD.

PROYECTO DE TITULACIÓN

Previa a la obtención del Título de:

INGENIERO EN SISTEMAS COMPUTACIONALES

AUTORES:

ESTEFANÍA ROCHA TAMAYO

CARLOS VILLARREAL VÁSQUEZ

TUTOR:

ING. JIMMY SORNOZA MOREIRA M. SC.

GUAYAQUIL – ECUADOR

2018

REPOSITORIO NACIONAL EN CIENCIA Y TECNOLOGÍA

FICHA DE REGISTRO DE TESIS

TÍTULO: “IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD

VEHICULAR EN EL CANTÓN LA LIBERTAD”

AUTOR/ES:

Estefanía Rocha Tamayo

Carlos Villarreal Vásquez

REVISORES:

Ing. Lorenzo Cevallos Torres M. Sc.

Ing. Karla Abad Sacoto M. Sc

INSTITUCIÓN: Universidad de

Guayaquil

FACULTAD: Ciencias Matemáticas y Físicas

CARRERA: Ingeniería en Sistemas Computacionales

FECHA DE PUBLICACIÓN: N. DE PAGS: 162

AREAS TEMATICAS: Big Data

PALABRAS CLAVES: Control de Tránsito vehicular, Big Data , Toma de decisiones

RESUMEN: El tráfico vehicular es un mal común en casi cualquier ciudad o país del mundo, lo

cual afecta considerablemente a la población en general, el propósito de esta investigación se

centra en analizar datos e información por medio de una herramienta, la cual permitirá

visualizar el impacto del uso de Big Data enfocada a la movilidad vehicular del cantón de La

Libertad en Ecuador. El sistema está basado en un gran conjunto de datos que manejados con

la tecnología Big Data servirían de gran ayuda para la toma de decisiones en la organización y

planeación de una ciudad inteligente y automatizada

N. DE REGISTRO(en base de

datos):

N. DE CLASIFICACIÓN

DIRECCION URL(tesis en la web):

ADJUNTO PDF: SI

NO

CONTACTO CON AUTOR/ES:



Teléfono:

0939908443

0969580727

E-mail:

[email protected]

[email protected]

CONTACTO EN LA

INSTITUCIÓN:

Carrera de Ingeniería en

Sistemas Computacionales

Nombre: Ab. Juan Chávez Atocha

Teléfono:2307729

E-mail: [email protected]

X

mailto:[email protected]

II

APROBACIÓN DEL TUTOR

En mi calidad de Tutor del trabajo de investigación, “IMPACTO DEL USO DE

BIG DATA EN LA GESTIÓN DE MOVILIDAD VEHICULAR EN EL CANTÓN DE

LA LIBERTAD” elaborado por la Srta. Estefanía Priscila Rocha Tamayo y el Sr.

Carlos Alfredo Villarreal Vásquez, Alumnos no titulados de la Carrera de

Ingeniería en Sistemas Computacionales, Facultad de Ciencias Matemáticas y

Físicas de la Universidad de Guayaquil, previo a la obtención del Título de

Ingeniero en Sistemas Computacionales, me permito declarar que luego de

haber orientado, estudiado y revisado, la Apruebo en todas sus partes.

Atentamente

Ing. Jimmy Sornoza Moreira M.Sc.

TUTOR

III

DEDICATORIA

Este trabajo está dedicado a mi

familia quienes fueron el pilar

fundamental a lo largo de mis

estudios, llegando a culminar la

carrera profesional.

A mi madre quien siempre

estuvo en los buenos y malos

momentos y que gracias a su

sabiduría y amor supo guiarme

por buen camino y a no

desviarme de mis objetivos. A mi

padre quien siempre estuvo

dándome fuerzas para seguir

adelante. A mis hermanas y

sobrinos quienes siempre

confiaron en mí y me daban

ánimos para cumplir mis metas,

brindándome su ayuda

incondicionalmente.


IV

AGRADECIMIENTO

Agradezco a Dios por darme

fortaleza necesaria para

culminar los estudios

universitarios.

A mis padres por estar en los

buenos y difíciles momentos de

mi carrera universitaria, a mis

hermanas, sobrinos por siempre

apoyarme y darme ánimos

incondicionalmente, a mi tutor

por guiarme en este proyecto. A

mi compañero de tesis porque

fue una parte fundamental para

realizar este trabajo debido a

que se trabajó en equipo para

cumplir la meta deseada. A mi

tutor y revisor por ser los guías

que ayudaron a culminar este

objetivo.


V

DEDICATORIA

Este proyecto se lo dedico

primordialmente a Dios y a mis

padres por confiar en mí y por

haberme enseñado que la vida

siempre se la tiene que ganar a

base de esfuerzo y lucha

A mis hermanos por su apoyo en

todo momento. A mis

compañeros y amigos que me

acompañaron a lo largo de mi

vida como estudiante

universitario, me llevaré gratos

recuerdos de lo vivido en esta

universidad.


VI

AGRADECIMIENTO

Agradezco primeramente a Dios

por darme sabiduría en todo el

transcurso del estudio y poder

lograr mis objetivos.

Agradezco a mis padres,

familiares cercanos que me

brindaron su apoyo

incondicionalmente, al tutor y

revisor por haber brindado su

conocimiento en este trabajo de

titulación y por darme las

indicaciones necesarias para

culminar este proyecto y a mi

compañera de tesis por

acompañarme en este arduo

proceso


VII

TRIBUNAL PROYECTO DE TITULACIÓN

Ing. Eduardo Santos Baquerizo, M.Sc

DECANO DE LA FACULTAD

CIENCIAS MATEMÁTICAS Y

FÍSICAS

Ing. Abel Alarcón Salvatierra, Mgs.

DIRECTOR DE LA CARRERA DE

INGENIERÍA EN SISTEMAS

COMPUTACIONALES

Ing. Lorenzo Cevallos Torres M.Sc.

PROFESOR REVISOR DEL ÁREA

TRIBUNAL

Ing. Karla Abad Sacoto M.Sc.

PROFESOR REVISOR DEL ÁREA

TRIBUNAL

Ing. Jimmy Sornoza Moreira M.Sc.

PROFESOR TUTOR DEL PROYECTO

DE TITULACIÓN

Ab. Juan Chávez Atocha, Esp.

SECRETARIO

VIII

DECLARACIÓN EXPRESA

“La responsabilidad del contenido del proyecto

de titulación “IMPACTO DEL USO DE BIG

DATA EN LA GESTIÓN DE MOVILIDAD

VEHICULAR EN EL CANTÓN DE LA

LIBERTAD“, me corresponden

exclusivamente; y el patrimonio intelectual

de la misma a la UNIVERSIDAD DE

GUAYAQUIL”

ESTEFANÍA ROCHA TAMAYO CARLOS VILLARREAL VÁSQUEZ

IX




IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD

VEHICULAR EN EL CANTÓN DE LA LIBERTAD.

Proyecto de Titulación que se presenta como requisito para optar por el título

de INGENIERO EN SISTEMAS COMPUTACIONALES

Autora: Estefanía Priscila Rocha Tamayo

C.I: 0927256693

Autora: Carlos Villarreal Vásquez

C.I: 0931225056

X

CERTIFICADO DE ACEPTACIÓN DEL TUTOR

En mi calidad de Tutor del proyecto de titulación, nombrado por el Consejo

Directivo de la Facultad de Ciencias Matemáticas y Físicas de la Universidad

de Guayaquil.

CERTIFICO:

Que he analizado el Proyecto de Titulación presentado por el/la

estudiante CARLOS VILLARREAL VÁSQUEZ y ESTEFANÍA ROCHA

TAMAYO, como requisito previo para optar por el título de Ingeniero en

Sistemas Computacionales cuyo problema es:

“IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD

VEHICULAR EN EL CANTÓN DE LA LIBERTAD“.

Considero aprobado el trabajo en su totalidad.

Presentado por:


C.I: 0927256693 C.I: 0931225056

Tutor: Ing. Jimmy Sornoza Moreira M.Sc.

Guayaquil, marzo de 2018

XI




Autorización para Publicación de Proyecto de Titulación en Formato

Digital

1. Identificación del Proyecto de Titulación

Nombre Alumno: Estefanía Priscila Rocha Tamayo

Carlos Alfredo Villarreal Vásquez

Dirección: 31 entre Oriente y Amazonas

Miguel H. Alcívar y Plaza Dañín

Teléfono: 0939908443

0969580727

E-mail: [email protected]

[email protected]

Facultad: Ciencias Matemáticas y Físicas

Carrera: Ingeniería en Sistemas Computacionales

Proyecto de titulación al que opta: Ingeniero en Sistemas

Computacionales

Profesor guía: Ing. Jimmy Sornoza Moreira M. Sc.



XII

Título del Proyecto de titulación: “Impacto del uso de Big Data en la

gestión de movilidad vehicular en el cantón de La Libertad”

Tema del Proyecto de Titulación: datos, análisis, movilidad vehicular,

tránsito.

2. Autorización de Publicación de Versión Electrónica del Proyecto de

Titulación

A través de este medio autorizo a la Biblioteca de la Universidad de

Guayaquil y a la Facultad de Ciencias Matemáticas y Físicas a publicar la

versión electrónica de este Proyecto de titulación.

Publicación electrónica:

Inmediata x Después de 1 año


C.I: 0927256693 C.I: 0931225056

XIII

3. Forma de envío:

El texto del proyecto de titulación debe ser enviado en formato Word, como

archivo .Doc. O .RTF y .Puf para PC. Las imágenes que la acompañen

pueden ser: .gif, .jpg o .TIFF.

DVDROM CDROM x

XIV

INDICE GENERAL

INDICE GENERAL .................................................................................. XIV

ÍNDICE DE CUADROS .......................................................................... XVII

ÍNDICE DE FIGURAS ............................................................................. XIX

ÍNDICE DE GRÁFICOS........................................................................... XXI

RESUMEN ............................................................................................ XXIII

ABSTRACT .......................................................................................... XXIV

INTRODUCCIÓN ........................................................................................... 1

CAPITULO I .................................................................................................. 3

PLANTEAMIENTO DEL PROBLEMA ............................................................ 3

Ubicación del problema en un contexto ................................................... 3

Situación Conflicto Nudos Críticos .......................................................... 4

Delimitación del Problema ....................................................................... 5

Evaluación del problema ......................................................................... 5

OBJETIVOS DE LA INVESTIGACIÓN ........................................................ 6

Objetivo General ..................................................................................... 6

Objetivos Específicos .............................................................................. 6

ALCANCES DEL PROBLEMA .................................................................... 7

JUSTIFICACIÓN E IMPORTANCIA ............................................................ 7

CAPITULO II ................................................................................................. 9

MARCO TEÓRICO ...................................................................................... 9

ANTECEDENTES DEL ESTUDIO. .............................................................. 9

XV

FUNDAMENTACIÓN TEÓRICA ................................................................ 10

Big Data ................................................................................................ 10

Arquitectura de Big Data ....................................................................... 12

Componentes de arquitecturas de Big Data. ......................................... 12

Advanced Analytics ............................................................................... 14

Big Data Analytics ................................................................................. 14

Beneficios de Big Data Analytics ........................................................... 15

Minería de datos ................................................................................... 15

Las 5 V de Big Data. ............................................................................. 17

Cubos de Información ........................................................................... 19

Google Cloud Platform .......................................................................... 20

Cloud Datalab ....................................................................................... 21

IBM Cognos TM1 .................................................................................. 21

IBM Cognos TM1 Performance Modeler ............................................... 22

Gestión de la movilidad vehicular .......................................................... 25

Movilidad urbana y siniestralidad vial .................................................... 26

Antecedentes y estado de la técnica ..................................................... 27

Lógica difusa ......................................................................................... 27

Mapas Cognitivos Difusos ..................................................................... 28

FUNDAMENTACIÓN LEGAL .................................................................... 33

Artículos de la Constitución de la República del Ecuador. ..................... 33

Artículos de la Ley Orgánica de Transporte Terrestre Tránsito y

Seguridad Vial. ...................................................................................... 33

XVI

DEFINICIONES CONCEPTUALES ........................................................... 34

CAPITULO III .............................................................................................. 37

METODOLOGÍA DE LA INVESTIGACIÓN .................................................. 37

DISEÑO DE LA INVESTIGACIÓN ............................................................ 37

Meta-análisis ............................................................................................. 46

Codificación y descripción de variables ................................................. 47

Interpretación y análisis de los resultados: Análisis Univariado de los

datos ..................................................................................................... 51

Uso de herramienta de Big Data ........................................................... 69

Uso de Mapas Cognitivos Difusos ......................................................... 86

CAPITULO IV .............................................................................................. 96

RESULTADOS .......................................................................................... 96

CONCLUSIONES.................................................................................... 109

RECOMENDACIONES ........................................................................... 110

REFERENCIAS ..........................................................................................111

XVII

ÍNDICE DE CUADROS

Cuadro N 1 Causas y consecuencias del problema.................................. 4

Cuadro N 2 Delimitación del problema ..................................................... 5

Cuadro N 3 Íconos de Semáforo............................................................... 24

Cuadro N 4 Íconos de Tendencia ............................................................. 25

Cuadro N 5 Representación de una matriz de adyacencia ..................... 30

Cuadro N 6 . Caso de Estudio: Expertos de gestión vehicular ............... 38

Cuadro N 7 Pregunta 1 Expertos .............................................................. 39



Cuadro N 10 Pregunta 4 Expertos ............................................................ 42



Cuadro N 13 Portal Bibliográfico .............................................................. 47

Cuadro N 14 Género del Primer Autor ..................................................... 48

Cuadro N 15 Tipo de Journal .................................................................... 48

Cuadro N 16 Tipo de Investigación .......................................................... 49


Cuadro N 18 Portal Bibliográfico .............................................................. 51

Cuadro N 19 Género del Primer Autor ..................................................... 53

Cuadro N 20 Tipo de Journal .................................................................... 53


Cuadro N 22 Criterio de Inclusión y Exclusión ........................................ 55

Cuadro N 23 Tabla de Frecuencia de la variable Big Data ...................... 56

Cuadro N 24 Tabla para el análisis de la variable Big Data .................... 57

Cuadro N 25 Tabla de frecuencia de la variable traffic_vehicular .......... 59

Cuadro N 26 Tabla para el análisis de la variable traffic_vehicular ....... 59

XVIII

Cuadro N 27 Tabla de frecuencia de la variable Lógica Difusa .............. 60

Cuadro N 28 Tabla para el análisis de la variable Lógica Difusa ........... 61

Cuadro N 29 Tabla de frecuencia de la variable Mapa Cognitivo Difuso 63

Cuadro N 30 Tabla para el análisis de la variable Mapa Cognitivo Difuso

.................................................................................................................... 63

Cuadro N 31 Tabla para el análisis de la variable Conjunto Difuso ....... 65

Cuadro N 32 Tabla para el análisis de la variable Conjunto Difuso ....... 65

Cuadro N 33 Tabla de Frecuencia de la variable Variables Lingüística . 67

Cuadro N 34 Tabla para el análisis de la variable Variables Lingüística 67

Cuadro N 35 Dimensión factores.............................................................. 80

Cuadro N 36 Nodos de Mapa Cognitivo Difuso ....................................... 87

Cuadro N 37 Etiqueta Lingüística ............................................................. 89

Cuadro N 38 . Caso de Estudio: Representación de matriz de adyacencia

.................................................................................................................... 90

Cuadro N 39 . Matriz adyacencia del MCD ............................................... 90

Cuadro N 40 . Multiplicación de vector de entrada con matriz adyacencia

.................................................................................................................... 91

Cuadro N 41 . Resultado de la Centralidad de los nodos ......................103

Cuadro N 42 . Iteraciones del MCD ..........................................................103

XIX

ÍNDICE DE FIGURAS

Figura 1. Componentes de la Arquitectura Big Data ............................... 13

Figura 2. Cubo de métricas ....................................................................... 23

Figura 3. Relación entre dos conceptos .................................................. 29

Figura 4. Variables metaanálisis............................................................... 46

Figura 5. Google Cloud Platform Creación de proyecto ......................... 69

Figura 6. Google Cloud Platform Nombre de proyecto ........................... 69

Figura 7. Google Cloud Platform .............................................................. 70

Figura 8. Compute Engine ........................................................................ 71

Figura 9. Recursos de Compute Engine .................................................. 71

Figura 10. BigQuery Carga de datos ........................................................ 72

Figura 11. BigQuery Esquema .................................................................. 73

Figura 12. BigQuery Detalles de tabla ...................................................... 73

Figura 13. BigQuery Preview .................................................................... 74

Figura 14. BigQuery Consulta .................................................................. 75

Figura 15. Google Cloud Platform Shell ................................................... 76

Figura 16. Instalación Datalab .................................................................. 76

Figura 17. Iniciar datalab ........................................................................... 77

Figura 18. Datalab Notebooks .................................................................. 77

Figura 19. Datalab Consulta ...................................................................... 78

Figura 20. Dimensión factores .................................................................. 80

Figura 21. Dimensión indicador................................................................ 81

Figura 22. Dimensión mes_continuo ....................................................... 81

Figura 23. Dimensión zona ....................................................................... 82

Figura 24. Dimensión horas ...................................................................... 82

Figura 25. Cubo Transit ............................................................................. 83

Figura 26. Cruce Cubo Transit .................................................................. 84

XX

Figura 27. Cruce Cubo Transit: Accidentes ............................................. 84

Figura 28. Diagram en TM1 ....................................................................... 85

Figura 29. Mapa Cognitivo Difuso del Tránsito Vehicular ...................... 88

Figura 30. Mental Modeler: Mapa Cognitivo Difuso ................................ 93

Figura 31. Mental Modeler: Matriz de adyacencia ................................... 93

Figura 32. Mental Modeler: Centralidad de los nodos ............................ 94

Figura 33. Mental Modeler: Vector de entrada ......................................... 95

Figura 34.Resultado del análisis de la información de tránsito en

Datalab ....................................................................................................... 97

Figura 35. Resultado Cubo Transit ........................................................... 98

Figura 36. Resultado accidentes Cubo Transit ....................................... 98

Figura 37. Visualización Diagrama Transit .............................................. 99

Figura 38. Visualización Diagram Transit 6-9 am ...................................100

Figura 39. Visualización Diagrama Accidentes ......................................101

Figura 40. Mental Modeler: Resultado de análisis .................................104

XXI

ÍNDICE DE GRÁFICOS

Gráfico 1. Pregunta número uno realizada a los expertos ..................... 39

Gráfico 2. Pregunta número dos realizada a los expertos...................... 40

Gráfico 3. Pregunta número tres realizada a los expertos ..................... 41

Gráfico 4. Pregunta número cuatro realizada a los expertos ................. 42

Gráfico 5. Pregunta número cinco realizada a los expertos................... 43

Gráfico 6. Pregunta número uno a los expertos ..................................... 45

Gráfico 7. Diagrama de la Variables Portal Bibliográfico........................ 52

Gráfico 8. Diagrama de la Variables Género del Autor ........................... 53

Gráfico 9. Diagrama de la Variables Tipo Journal ................................... 54

Gráfico 10. Diagrama de la Variables Tipo de Investigación .................. 55

Gráfico 11. Diagrama de la Variables Criterio Inclusión y Exclusión .... 56

Gráfico 12. Diagrama de la Variables Big Data ........................................ 57

Gráfico 13. Diagrama de la Variables Traffic Vehicular .......................... 59

Gráfico 14. Diagrama de la Variables Lógica Difusa ............................... 61

Gráfico 15. Diagrama de la Variables Mapa Cognitivo Difuso ................ 64

Gráfico 16. Diagrama de la Variables Conjunto Difuso ........................... 66

Gráfico 17. Diagrama de la Variable Lingüística ..................................... 68

XXII

ABREVIATURAS

TI Tecnología de la información INEC Instituto Nacional de Estadística y Censo IBM International Business Machines CTIC Centro de Tecnologías de la Información y la Comunicación. CTE Comisión de Tránsito del Ecuador SQL Structured Query Language API Application Programming Interface MCD Mapas Cognitivos Difusos

XXIII

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS

CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES IMPACTO DEL USO DE BIG DATA EN LA GESTIÓN DE MOVILIDAD VEHICULAR EN EL

CANTÓN DE LA LIBERTAD.

Proyecto de Titulación que se presenta como requisito para optar por el título de INGENIERO EN SISTEMAS COMPUTACIONALES

Autor/a: ESTEFANÍA ROCHA TAMAYO

Autor/a: CARLOS VILLARREAL VÁSQUEZ Tutor: ING. JIMMY SORNOZA M. Sc.

RESUMEN

El tráfico vehicular es un mal común en casi cualquier ciudad o país del mundo, lo cual afecta considerablemente a la población en general, el propósito de esta investigación se centra en analizar datos e información por medio de una herramienta, la cual permitirá visualizar el impacto del uso de Big Data enfocada a la movilidad vehicular del cantón de La Libertad en Ecuador. El sistema está basado en un gran conjunto de datos que manejados con la tecnología Big Data servirían de gran ayuda para la toma de decisiones y planeación de una ciudad inteligente y automatizada. El problema radica en la congestión de vehículos que son generados por la falta de vías alternas, conjuntamente con la ligereza de los habitantes de la localidad en cuanto al incumplimiento de las leyes y normativas vigentes del tránsito y la seguridad vial. El análisis de la información permite examinar una cantidad considerable de datos, por medio de la asistencia del software destinado para los fines de captura, procesamiento y extracción de datos, se pudo realizar el impacto que alcanza la ejecución del mismo, así como también determinar la factibilidad, eficacia y eficiencia de la información que se obtiene como producto final, lo cual conduce al aporte de mejoras significativas de los servicios de transporte y seguridad vial.

Palabras clave: Control de Tránsito vehicular, Big Data, Análisis de datos, Toma de Decisiones

XXIV

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS


IMPACT OF THE USE OF BIG DATA IN THE MANAGEMENT OF VEHICULAR MOBILITY IN THE CANTON OF LIBERTAD.

Proyecto de Titulación que se presenta como requisito para optar por el título de

INGENIERO EN SISTEMAS COMPUTACIONALES

Autor/a: ESTEFANIA ROCHA TAMAYO Autor/a: CARLOS VILLARREAL VÁSQUEZ

Tutor: ING. JIMMY SORNOZA M. Sc.

ABSTRACT

Vehicular traffic is a common evil in any country in the world, which affects the population in general, the purpose of this research is focused on the analysis of data and information by means of a tool of the use of Big Data focused on the vehicular mobility of the canton of La Libertad in Ecuador. The system is based on a large data set that manages with the technology. Big Data is a great help for making decisions and planning a smarter and more automated city. The problem lies in the congestion of vehicles that are generated by the lack of alternative roads, with the lightness of the local populations in terms of non-compliance with the laws and regulations in force for traffic and road safety. The analysis of the information allows us to examine a considerable amount of data, through the assistance of the software for the purposes of capture, processing and extraction of data, the impact that allows the execution of the same could be made, as well as determining the feasibility, efficiency and efficiency of the information that was achieved as a final product led us to increase the significant costs of transport services and road safety.

Keywords: Vehicle Transit Control, Big Data, Data analysis, Decision making

1

INTRODUCCIÓN

A lo largo del tiempo en las ciudades urbanas del mundo, la fluidez

vehicular ha aumentado considerablemente, esto se debe a varios

factores culturales, económicos y sociales. La forma de desplazarse de un

lugar a otro no solo afecta al conductor del automóvil sino también a los

peatones, aunque existe avances en las infraestructuras de carreteras en

las ciudades no han logrado resolver este problema (Pedraza, Hernández,

& López, 2012) Es importante realizar este estudio para conocer las

inconformidades de la población debido al congestionamiento vehicular y

analizar los patrones que afectan al tránsito vehicular para poder

encontrar una solución efectiva a esta problemática.

El mal diseño de las infraestructuras viales y la utilización de los

controladores de tráfico que ya son obsoletos y su falta de mantenimiento,

son las causas principales que ocasionan que en varias ciudades en el

mundo tengan muchos problemas de transporte, por lo que cada vez se

dan a conocer estrategias que ayuden a solventar este problema que

afecta a muchas personas alrededor del mundo. (Espinoza, Gordillo,

Jiménez, & Avilés, 2013)

Este documento está constituido por cuatro capítulos, que se describen a

continuación:

Capítulo I: En este capítulo se detalla el problema de la investigación,

describir las causas y consecuencias, determinar los objetivos general y

específicos y la justificación del proyecto.

Capítulo II: En este capítulo se detalla el marco teórico que radica en dar

a conocer las definiciones de las herramientas que se usaron para llevar a

cabo la investigación.

2

Capitulo III: En este capítulo se detalla la metodología del proyecto, los

procedimientos para realizar la simulación de nuestro estudio.

Capítulo IV: En este capítulo se detalla las conclusiones y

recomendaciones del proyecto.

3

CAPITULO I

PLANTEAMIENTO DEL PROBLEMA

Ubicación del problema en un contexto

La Libertad, es una ciudad que se encuentra en la provincia de Santa Elena,

Está ubicada en el litoral ecuatoriano, al occidente del país. Forma parte del

conglomerado urbano de la puntilla de Santa Elena, junto con Salinas, Santa

Elena y Ballenita, es un cantón habitada por 95.942 pobladores otro aspecto que

se destaca en la última década, son las mejoras en las vías de accesos que se

han efectuado en el cantón, con la finalidad de seguir promoviendo las

actividades turísticas del mismo.

El inminente crecimiento de las ciudades en la actualidad y la sobrepoblación

son factores que inciden directamente en el pleno desarrollo de las actividades

de la misma. El tráfico vehicular es un elemento que no escapa de esta

situación, en el cantón La Libertad, el congestionamiento en las principales vías

de comunicación terrestres cada vez se encuentra comprometido por el gran

volumen de vehículos que transitan por las calles de esta urbe generando

inconformidades en sus habitantes. (INEC, 2016 )

Ahora bien, en vista del volumen de datos que se mencionan anteriormente, las

herramientas tecnológicas representan una solución viable ante el manejo y

producción de los mismos. Los análisis de Big Data personifican la apertura de

posibles mejoras en el sector del transporte y el control de las masas. Por lo

antes expuesto se propone una investigación que analice el impacto que genera

el uso de Big Data en cuanto a la planificación, gestión y control de la movilidad

vehicular.

4

Situación Conflicto Nudos Críticos

Uno de los graves problemas que enfrentan los habitantes del cantón de la

Libertad es el fuerte congestionamiento de tránsito vehicular en las principales

avenidas y calles, generado por la falta de vías alternas, sobre todo en los

feriados e inviernos, conjuntamente con la ligereza de los habitantes de la

localidad en cuanto al incumplimiento de las leyes y normativas vigentes del

tránsito y la seguridad vial.

La falta de herramientas que apoyen las actividades que realizan las

instituciones inherentes al control vehicular, aportando mejoras en las

estrategias que permitan optimizar la situación actual del cantón en cuanto el

tránsito de vehículos matriculados.

Causas y Consecuencias del Problema

Cuadro N 1 Causas y consecuencias del problema

Causas Consecuencias

Accidentes Los accidentes provocan tráfico vehicular, porque

es posible que se cierre las vías hasta que se

recogen a los heridos.

Vías en mal estado

Fuerte congestionamiento debido al gran volumen

de vehículos que transitan en la localidad y que

no pueden usar esas vías debido al estado en

que se encuentran

Lluvias Las fuertes lluvias producen congestionamiento,

debido a que producen inundación de calles y no

pueden transitar los carros con normalidad.

Elaborado por: Rocha & Villarreal, 2017

Fuente: Propia

5

Delimitación del Problema

Cuadro N 2 Delimitación del problema

Delimitación del Problema

Campo Soberanía, derechos y tecnologías en el ordenamiento

territorial y ambiente de la construcción.

Área Base de datos y Big Data

Aspecto Investigación de los aportes que se generan mediante la

aplicación el uso de Big Data para el análisis y

procesamiento de los datos vinculados a la temática de la

movilidad vehicular en el cantón de la Libertad.

Tema Impacto del uso de Big Data en la gestión de movilidad

vehicular en el cantón de la Libertad.


Fuente: Propia

Formulación del Problema

¿Cuál es la situación actual que se presenta en el cantón La Libertad con

respecto al congestionamiento y movilidad vehicular y cómo el uso de Big Data

puede aportar a la toma decisiones en la gestión vehicular?

Evaluación del problema

Delimitado: Se ha determinado el problema de la movilidad vehicular en el

cantón La Libertad.

Claro: Se detalla los puntos a tomar en cuenta en el problema como el

congestionamiento vehicular del cantón La Libertad.

6

Evidente: Por medio de entrevistas a expertos de la gestión de movilidad

vehicular y sus conocimientos y experiencias, se determinó que efectivamente

existe un gran problema en cuanto a la movilidad vehicular en el cantón.

Concreto: Se efectuará con la finalidad de realizar un aporte investigativo a la

sociedad del cantón La Libertad.

Relevante: Información obtenida por parte de los encargados de la gestión

vehicular y departamento de TI de la Comisión de Tránsito de La Libertad

ayudaron a determinar hacia donde llegar y obtener un resultado eficaz.

Factible: Una vez obtenida la información, es factible realizar el análisis, gracias

a la evolución de la tecnología se facilita la viabilidad de realizar una simulación

que ayude en el entorno de movilidad vehicular.

OBJETIVOS DE LA INVESTIGACIÓN

Objetivo General

Analizar el impacto que ejerce Big Data por medio de la información producida

de movilidad vehicular para examinar el flujo y accidentes vehiculares del cantón

de La Libertad.

Objetivos Específicos

1. Identificar la situación actual que atraviesa el cantón en cuanto a la

gestión de movilidad vehicular, por medio de indicadores que facilitarán

conocer el comportamiento y ayudar al análisis de la información.

2. Realizar un modelo de análisis de datos para determinar si se cuenta con

información de calidad que ayude a la toma de decisiones a los

encargados de la gestión de movilidad vehicular

3. Visualizar los datos de manera ágil y simplificada, para entender los

grandes volúmenes de datos rápidamente.

7

ALCANCES DEL PROBLEMA

Por medio de los scorcarding, se conocerá el estado de los indicadores

de la gestión de movilidad vehicular lo cual ayudara de manera

significativa a obtener resultados reales.

Por medio de la información vehicular del cantón La Libertad se realizará

un análisis descriptivo que permitirá analizar información histórica y así

un modelo óptimo que aporte a la toma de decisiones en el futuro no

muy lejano.

Por medio de gráficos y diagramas se podrá visualizar los datos

rápidamente para su mayor comprensión.

JUSTIFICACIÓN E IMPORTANCIA

Cuando las personas desean ir a un determinado lugar, toman las rutas de corta

distancia, y como consecuencia siempre toman la misma ruta creando un flujo

de tráfico mayor. Ahora ¿Será qué las rutas utilizadas son normalmente óptimas

o existirán otras alternativas adicionales? ¿Acaso las autoridades conoce las

rutas alternativas en su totalidad y podrían mejorar las rutas alternas? Existe

diversidad de información que generan grandes cantidades de datos del tráfico

que conlleva a resultados donde la calidad y precisión de la información generan

una alternativa de supervivencia en la carrera de la excelencia en el servicio que

se presta.

Lo antes mencionado guarda significativa relación con Big Data, la cual

representa un nuevo concepto en la innovación debido a que su principal función

es predecir el comportamiento del sector analizado a fin de apoyar la toma de

decisiones de manera oportuna, permitiendo mejoras considerables en la

planificación y control de actividades que beneficien a la población. La

importancia de este proyecto radica en generar un aporte significativo que

permita crear soluciones prácticas para la mejora de la situación que se presenta

en el cantón en cuanto a la movilidad vehicular.

8

Este proyecto ayudará a futuras investigaciones, su diseño serviría como guía

para el uso de su estructura en otras áreas de control de tránsito o

investigaciones con iguales características. Científicamente esta investigación

permitirá generar aplicaciones que ayudarán a monitorear en tiempo real las

condiciones del tránsito permitiendo a las instituciones poner en práctica las

últimas tendencias de la tecnología referenciadas a la ingeniería de la

computación a través del empleo de sistemas electrónicos inteligentes y

aplicativos móviles.

9

CAPITULO II

MARCO TEÓRICO

ANTECEDENTES DEL ESTUDIO.

En pro de evidenciar la veracidad de este trabajo se presentan a continuación

una serie de investigaciones realizadas en Ecuador que aportan conocimientos

previamente constituidos.

La primera investigación corresponde a Cedeño Solórzano Leandra Noelia Y

Pesantes García Daniel Adrián, 2017 quienes realizaron el trabajo: Análisis de

Estudio de Big Data Orientados a los Grandes Volúmenes de Datos y los

Principales Usos de Información Recolectada. En este trabajo se presentó la

gran importancia que tiene para las organizaciones el uso de Big Data. El

objetivo general del tema es el de realizar un análisis para explicar en que radica

Big Data detallando ciertas herramientas que permiten el manejo de grandes

volúmenes de datos, el beneficio es el de aportar grandes beneficios debido a

que se logra mejorar la toma de decisiones. (Pesantes Solórzano & Pesantes

García, 2017)

La segunda investigación corresponde a Cañarte Manrique y Milton Iván, 2016

quien presentó el trabajo: Análisis del uso de Big Data en las empresas

guayaquileñas sobre la base de plataformas basadas en TICS en el año 2014. El

objetivo general es determinar si existen estrategias de grandes datos en las

empresas guayaquileñas y el beneficio es saber qué tipo de datos son los

relevantes y son los usados para la toma de decisiones. (Cañarte Manrique,

2015)

El tercer trabajo corresponde a Guama Morales y Sonia Carolina, 2015 titulado:

Estudio Comparativo de Métodos Existentes para Integrar la Información

Estructurada y no Estructurada de una Industria Enfocado en la Generación de

Conocimiento, Desde la Perspectiva de una Solución Integral de Big Data, el

10

cual tiene como objetivo general identificar una técnica para integrar la

información de una industria que permita construir una base de conocimiento

ordenada desde la perspectiva de Big Data, y el beneficio de mantener el

equilibrio en los procesos de análisis de datos y generación de conocimiento en

la industria. (Guama Morales, 2015)

A diferencia de las investigaciones antes señaladas, en la cual analizan

información de las empresas comerciales para obtener información relevante

que mejore sus ventas, este proyecto va a examinar la información de la

movilidad vehicular del cantón La Libertad para realizar un modelo que permitirá

realizar un análisis de la información de tránsito vehicular para aportar de

manera relevante al análisis de esta información.

FUNDAMENTACIÓN TEÓRICA

En el presente capitulo se refiere a la revisión de la literatura y científica

relacionada con el tema objeto de investigación, haciendo referencia a: Teorías,

enfoques, modelos y proyectos relevantes las cuales detallan y analizan temas

vinculados directa o indirectamente al problema planteado.

Big Data

En la actualidad las grandes cantidades de datos pueden tener diferentes

características y tipos, que afectan su particularidad. Según la revista

(UNIVERSIDAD POLITÉCNICA DE MADRID, 2015). “No existe una definición

estándar, pero podemos decir que el término Big Data surge porque la

diversidad, complejidad y volumen de los datos que se están generando,

almacenando y analizando actualmente, requieren de nuevas arquitecturas,

algoritmos y técnicas de análisis para gestionarlos y extraer el conocimiento que

estos datos “esconden”. Esta complejidad se expresa en cinco dimensiones, las

denominadas “cinco „v‟ del Big Data”: el Volumen o cantidad de datos que se

están generando; la Velocidad con la que los datos se generan, transmiten y

analizan; la Variedad en los tipos de datos (texto, imagen, video, etc); la

Veracidad, que consiste en el intento de eliminar o minimizar la incertidumbre

11

que se tiene sobre los datos para no generar un conocimiento sesgado, y el

Valor, es decir si aportan significativamente a la empresa para la toma de

decisiones”

Como cualquier objeto, las características de Big Data pueden variar en muchas

dimensiones por lo tanto, dependiendo de su origen, procesamiento de datos

tecnologías y técnicas utilizadas para la recopilación de datos y descubrimientos

científicos, los grandes datos pueden tener más o menos calidad de información

y características especiales que necesitan la menor intervención del humano-

computadora en las interacciones para descubrimientos científicos para producir

viables soluciones gracias a la inteligencia artificial. Big Data no tiene valor a

menos que pueda ser utilizada efectiva y de forma correcta; Big Data depende

de reconocer los coeficientes de inteligencia y patrones no relacionados a datos

específicos, que ayudan a reducir los errores de inferencia y mejorar la precisión

de las ideas generadas. Estas características incluyen contenido y expresión

inherentes incertidumbre, que puede socavar la veracidad de los grandes datos.

(Lukoianova, 2014)

En la última década se han visto desarrollos considerables con los algoritmos de

Big Data, pero aún quedan desafíos importantes para el apuntalamiento teórico

del área. Estas plataformas permiten recopilar, indexar, visualizar y correlacionar

grandes cantidades de datos. La capacidad de recopilar y acumular tiene un

impacto significativo sobre la velocidad, la eficiencia y la forma rentable en que

se pueden llevar a cabo las investigaciones así como también la producción de

información.

En cuanto a Big Data permite capturar, procesar, almacenar y analizar sus

datos en una sola plataforma, puede concentrarse en buscar información en

lugar de administrar su infraestructura y puede combinar servicios nativos de la

nube con herramientas de código abierto, según sea necesario, tanto en modo

por lotes como en modo de flujo continuo (google, 2016)

12

Arquitectura de Big Data

Una arquitectura de Big Data está diseñada para manejar el procesamiento y el

análisis de la información que son demasiado grandes o complejos para los

sistemas de bases de datos tradicionales. (IBM, 2013)

Las soluciones de Big Data generalmente implican uno o más de los siguientes

tipos de carga de trabajo:

Procesamiento por lotes de grandes fuentes de datos en reposo.

Procesamiento en tiempo real de Big Data en movimiento.

Exploración interactiva de Big Data.

Análisis y aprendizaje automático.

Componentes de arquitecturas de Big Data.

Fuentes de datos: Todas las soluciones de Big Data comienzan con una o más

fuentes de datos. Ejemplos incluyen:

Almacenes de datos de aplicaciones, como bases de datos relacionales.

Archivos estáticos producidos por aplicaciones, como archivos de registro

del servidor web.

Fuentes de datos en tiempo real.

Almacenamiento de datos: Los datos para las operaciones de procesamiento

por lotes normalmente se guardan en un almacén de archivos distribuido que

puede contener grandes volúmenes de archivos grandes en varios formatos.

Procesamiento por lotes: Debido a que los conjuntos de información son muy

grandes, a menudo una solución de Big Data debe procesar archivos mediante

trabajos por lotes de larga ejecución para filtrar, agregar y preparar los datos

para el análisis.

13

Ingestión de mensajes en tiempo real: Si la solución incluye fuentes en tiempo

real, la arquitectura debe incluir una forma de capturar y almacenar mensajes en

tiempo real para el procesamiento de flujo. Esto podría ser un simple almacén de

datos, donde los mensajes entrantes se dejan caer en una carpeta para su

procesamiento.

Procesamiento de flujo: Después de capturar mensajes en tiempo real, la

solución debe procesarlos mediante el filtrado, la agregación y la preparación de

los datos para el análisis.

Almacén de datos analíticos: Muchas soluciones de Big Data preparan los

datos para el análisis y luego los mismos son procesados en un formato

estructurado que se puede consultar utilizando herramientas analíticas.

Análisis e informes: El objetivo de la mayoría de las soluciones de Big Data, es

proporcionar información sobre los datos mediante análisis e informes.

Figura 1. Componentes de la Arquitectura Big Data

Elaborado por (Martín, 2016)

Fuente: ctic.uni

14

Advanced Analytics

Mediante el análisis avanzado, se puede obtener una amplia categoría de

investigación que se puede utilizar para impulsar cambios y mejoras en las

prácticas comerciales o no comerciales. Mientras que las herramientas analíticas

tradicionales que comprenden inteligencia comercial básica (BI) examinan datos

históricos, las herramientas para análisis avanzados se enfocan en pronosticar

eventos y comportamientos futuros, permitiendo a las empresas realizar análisis

hipotéticos para predecir los efectos de los posibles cambios en las estrategias

comerciales. El análisis, la extracción de datos, el análisis de Big Data y la

inteligencia de ubicación son solo algunas de las categorías analíticas que se

incluyen en el análisis avanzado. Estas tecnologías se utilizan ampliamente en

industrias que incluyen marketing, atención médica, gestión de riesgos y

economía. (Kalický, 2013)

Aunque realizar análisis tan complejos generalmente requiere equipos de

estadísticos experimentados, las nuevas herramientas y las tecnologías de

visualización de datos han hecho que el modelado sea accesible para el usuario

comercial promedio.

Big Data Analytics

Big Data Analytics es el proceso de examinar grandes y variados conjuntos de

datos, es decir, Big Data, para descubrir patrones ocultos, correlaciones

desconocidas, tendencias del mercado, preferencias del cliente y otra

información útil que puede ayudar a las organizaciones a tomar decisiones

comerciales informadas.

Big Data Analytics evidencia desafíos de los datos que son muy amplios y

rápidos para ser controlados por métodos tradicionales. La recopilación de

información considerable de grandes cantidades de datos cada vez se vuelve

importante y escencial en muchos aspectos. Big Data Analytics permite mejorar

el rendimiento para la toma de decisiones. (Zakir, Seymoir, & Berg, 2015)

15

Beneficios de Big Data Analytics

Impulsado por sistemas analíticos especializados y software, el análisis de Big

Data puede señalar el camino hacia diversos beneficios comerciales, que

incluyen nuevas oportunidades de ingresos, marketing efectivo, mejor servicio al

cliente, mejor eficiencia operativa y ventajas competitivas sobre sus rivales.

Las aplicaciones de análisis de datos grandes permiten a los científicos de

datos, modeladores estadísticos y otros profesionales analíticos analizar

volúmenes crecientes de datos de transacciones estructuradas, además de otras

formas de datos que a menudo quedan sin explotar en los programas de

inteligencia de negocios (BI) y análisis convencionales. Esto incluye una mezcla

de datos semiestructurados y no estructurados, por ejemplo, registros de

servidor web, contenido de redes sociales, mensajes de correo electrónico de

clientes y respuestas de encuestas, registros detallados de llamadas de

teléfonos móviles y datos de máquinas capturados por sensores conectados a

internet de las cosas.

A gran escala, las tecnologías y técnicas de análisis de datos proporcionan un

medio para analizar conjuntos de datos y sacar conclusiones sobre ellos para

ayudar a las organizaciones a tomar decisiones comerciales informadas. Las

consultas de BI responden preguntas básicas sobre las operaciones comerciales

y el rendimiento. El análisis de datos grandes es una forma de análisis

avanzado, que involucra aplicaciones complejas con elementos tales como

modelos de datos, algoritmos estadísticos y análisis hipotéticos basados en

sistemas de análisis de alto rendimiento.

Minería de datos

La minería de datos es el proceso de descubrir información procesable de

grandes conjuntos de los mismos. La extracción de los antes mencionados,

utiliza análisis matemáticos para derivar patrones y tendencias. Normalmente,

estos patrones no pueden descubrirse mediante una exploración tradicional

16

porque las relaciones son demasiado complejas o porque existe un volumen

considerable.

En la minería de datos, la data es almacenada electrónicamente y su búsqueda

es automatizada, como el mundo crece en complejidad, a medida que el mundo

crece en complejidad, abrumando con los datos que genera, la minería de datos

se convierte en nuestra única esperanza para elucidar los patrones ocultos.

(Witten, Frank, Hall, & Pal, 2016)

Estos patrones y tendencias se pueden recopilar y definir como un modelo de

minería de datos. Los modelos de minería se pueden aplicar a escenarios

específicos, tales como:

Pronóstico: Estimación de números o escenarios, predicción de cargas del

servidor o tiempo de inactividad del servidor

Riesgo y probabilidad: Elegir los mejores resultados para envíos dirigidos,

determinar el punto de equilibrio probable para escenarios de riesgo, asignar

probabilidades a diagnósticos u otros resultados

Recomendaciones: Determinar qué sería lo satisfactorio para la empresa

generando recomendaciones.

Encontrar secuencias: Predecir los próximos eventos probables

Agrupación: Separación de eventos o elementos en un conjunto de elementos

relacionados, análisis y predicción de afinidades

La construcción de un modelo de minería, es parte de un proceso amplio que

incluye todo, desde hacer preguntas sobre los datos y crear un modelo para

responder esas preguntas, hasta implementar el modelo en un entorno de

trabajo. Este proceso puede definirse usando los siguientes seis pasos básicos:

1. Definiendo el problema

17

2. Preparación de datos

3. Explorando datos

4. La construcción de modelos

5. Explorando y Validando Modelos

6. Implementación y actualización de modelos

Las 5 V de Big Data.

Como bien se conoce, desde la aparición de Internet y los sistemas informáticos,

en su conjunto, la importancia y el crecimiento del Big Data no han disminuido.

Y, probablemente tampoco en el futuro. Para darle sentido a este concepto

definiendo lo que realmente significa, se desglosan las cinco V: velocidad,

volumen, valor, variedad y veracidad.

Velocidad

La velocidad se refiere a la rapidez a la que se generan, recopilan y analizan

nuevos datos en un momento dado. La cantidad de correos electrónicos,

publicaciones en redes sociales, videoclips o incluso texto nuevo agregado por

día supera los varios miles de millones de entradas. Además, esto continúa

aumentando a la velocidad debido a que las tabletas y los dispositivos móviles

brindan acceso para agregar contenido en línea. A medida que se agregan

nuevos datos, es importante que se analicen en tiempo real. La tecnología de

datos grandes de hoy le brinda la capacidad de analizar instantáneamente los

datos a medida que se generan.

Volumen

El volumen se refiere a la cantidad de datos producidos cada segundo en todos

los canales en línea, incluidos las plataformas de redes sociales, dispositivos

móviles, transacciones en línea, etc. Con los datos creciendo a pasos

agigantados cada minuto de cada día, ya no se pueden almacenar y analizar

utilizando tecnología tradicional. En cambio, las organizaciones deben pasar a

utilizar sistemas distribuidos, donde partes de los mismos se almacenan y se

unen mediante software para su análisis.

18

Ignorar Big Data ya no es una opción, estos datos pueden proporcionar una gran

visión de las tendencias emergentes, las preferencias del consumidor y la

competencia del mercado. La recopilación de esta información, tal como se

producen, en tiempo real, sin abrumar las infraestructuras de TI existentes, será

una prioridad constante para las organizaciones en 2017 y en adelante.

Valor

El valor se refiere al valor de los datos que se extraen. De hecho, tener

cantidades interminables de estos no siempre se traduce a que sean de alto

valor. Al tratar de descifrar datos grandes, es fundamental comprender

completamente los costos y beneficios de recopilar y analizarlos.

El análisis de datos puede dar a las empresas una idea de su mercado y

permitirles tomar decisiones comerciales informadas. Por ejemplo, agregar

información de redes sociales puede ayudar a una organización a ubicar

personas influyentes sociales para impulsar la conciencia del mercado. Así

mismo, también se pueden usar para realizar análisis de clusters y data mining

para mejorar las estrategias de marketing, ventas y crecimiento del negocio. La

clave es garantizar que la información que está recopilando se pueda convertir

en valor para su organización, de manera rápida y rentable posible.

Variedad

La variedad se define como los diferentes tipos de datos que se pueden usar. A

medida que Internet y la tecnología evolucionan, estos pueden volverse

obsoletos rápidamente. A menudo, con los datos de hoy en día, no se puede

categorizar fácilmente en tablas o etiquetas.

A medida que el uso de las redes sociales aumenta, gran cantidad de datos se

agruparán en la categoría de contenido para compartir en redes sociales. Sin

embargo, esta categoría en sí misma es muy amplia y podría incluir

publicaciones de blogs, redes sociales, perfiles de redes sociales, imágenes,

videos, archivos de audio, etc. Con innovadoras tecnologías de Big Data, su

19

organización puede ahora crear una estructura dentro de Big Data para recopilar

mejor, almacenar y analizar para generar valor.

Veracidad

La veracidad a menudo se define como la calidad o confiabilidad de la

información que recopila. Teniendo en cuenta la precisión de esta, que recopila y

analiza es importante. En este sentido, cuando se trata de Big Data, siempre se

prefiere la calidad sobre la cantidad. Para enfocarse en la calidad, es importante

establecer métricas sobre qué tipo de datos puede recopilar y de qué fuentes.

Otra cosa a tener en cuenta es la frecuencia con la que puede necesitar nueva

información que también puede ser útiles para determinar los tipos de fuentes de

datos que se deben buscar.

A medida que las herramientas en línea se expanden y la cantidad de usuarios

en Internet crece cada día, aprovechar los grandes datos será fundamental para

impulsar la valoración de una organización. El análisis de Big Data puede ser

una herramienta eficiente para el crecimiento en muchas industrias comerciales.

Sin embargo, cómo aprovechar al máximo los grandes datos y analizarlos de

manera eficiente es el desafío nuevo y creciente que las organizaciones deben

considerar actualmente.

Cubos de Información

Se define como una tecnología de base de datos que manipula más de dos

dimensiones y permite ver desde otras visualizaciones los datos que se

encuentran almacenados, los datos se ordenan de manera jerárquica, creando

información de manera ordenada para poder realizar un análisis. (Dávila, 2014)

Los cubos de datos se usan en los sistemas de procesamiento analítico en línea

para brindar apoyo en la toma de decisiones OLAP, los usuarios pueden

navegar datos multidimensionales y jerárquicamente. (Fletes Gudiño & Farías

Mendoza, 2013). Estos cubos se puede considerar como una ampliación de las

dos dimensiones en hojas de Excel, lo cual permite agilizar las consultas

20

grandes cantidades de datos. (Feliciano Morales, Cuevas Valencia, & Martínez

Castro, 2016)

Análisis Descriptivo

El análisis descriptivo permite usar datos históricos, y de esta manera permite

identificar comportamiento y conocer que es lo que en realidad está pasando,

permite saber cómo en realidad está la situación de algo. (Alonso & Donoso,

2003)

Google Cloud Platform

Google Cloud Platform ofrece una solución de Big Data de extremo a extremo,

permite capturar, procesar, almacenar y analizar los datos en una sola

plataforma, el análisis de datos posee familiaridad con SQL, también permite

ejecutar cargas de trabajo, con el fin de obtener información sobre tu entorno

comercial y operativo. (Cloud Google, 2015)

Compute Engine

Compute Engine ofrece máquinas virtuales que se ejecutan en los centros de

datos de Google, estas MV se inician de manera rápida, y ofrecen

almacenamiento de disco persistente, además de proporcionar un rendimiento

uniforme. (Cloud Google, 2015)

BigQuery

Big Query es un almacén de grandes cantidades de datos, administrados y con

capacidad de realizar análisis petabytes de datos, debido a que no hay que

21

gestionar ninguna infraestructura, se puede concentrar en el análisis de datos

para conseguir información a través del SQL. Big Query es un potente servicio

que se centra en realizar análisis de Big Datas utilizada por cualquier tipo de

empresas.

Big Query escanea terabytes en tal solo segundos, se pueden cargar los datos

para poder analizarlos en tiempo real. (Cloud Google, 2015)

Cloud Datalab

Es una herramienta interactiva fácil de usar para la exploración, el análisis, la

visualización y el aprendizaje automático de datos.

Entre las características de es aplicación se contemplan que:

Potente exploración de datos

Fuente integrada y abierta

Escalable

Gestión y visualización de datos

Aprendizaje automático con soporte de ciclo de vida

Entre Cloud Datalab usa “Notebook” que son carpetas contienen espacios de

trabajos en la cual se puede agregar, eliminar y modificar archivo de código

SQL, esto incluyo gráficos interactivos para proporcionar un análisis de

información efectivo y adecuado. (Cloud Google, 2015)

IBM Cognos TM1

Otra herramienta que se usará para el análisis de grandes cantidades de datos

es la herramienta IBM Cognos TM1, esta es una plataforma permite el

procesamiento inteligente de grandes cantidades de datos y así adaptarse a las

necesidades de las empresas u organizaciones, permite el análisis y previsión

de los datos. (ibm, 2017)

22

IBM Cognos TM1 Performance Modeler

Performance Modeler es una herramienta de la plataforma de IBM Cognos TM1,

que permite construir dimensiones, cubos, y así desarrollar modelos los cuales

contienen los objetos que son necesarios, permite crear reglas, que son códigos

realizadas con palabras propias de la herramientas, la cual permite realizar

cálculos entre los elementos del modelo, estas indican el formato y la

presentación de los datos, y pueden manipularlos, permite realizar enlaces o

conexiones entre dos o más cubos, incluye vistas de los cubos los cuales

permiten ver la información desde diferentes visualizaciones. Si el usuario es

administrador puede actualizar objetos del modelo, así como también eliminar y

agregar objetos que son necesarios para complementar el modelo. (Ibm

Performance Modeler , 2017)

Scorecarding en Performance Modeler

Scorecarding es un grupo de medidas de rendimiento para visualizar los

objetivos estratégicos de alguna organización. Permite conocer que tanto se

están cumpliendo los objetivos al realizar una comparación con los datos reales,

por medio de indicadores como semáforo, y las tendencias el usuario puede

evaluar y realizar un análisis de manera rápida de la información.

Para realizar un cubo que muestres scorcarding, se debe incluir en el cubo una

dimensión de métrica, una dimensión de indicadores métrico, una dimensión de

tiempo y otras dimensiones para contexto, es decir que permitan al usuario filtrar

la información. (IBM, 2017)

Dimensión genérica.- Posee elementos generales, como listas de artículos,

vendedores, etc.

Dimensión métrica.- Contiene un grupo de medidas de indicadores para realizar

seguimiento de la organización.

23

Dimensión indicador de métrica.- Contiene elementos de indicadores que

permiten conocer el estado, la tendencia de los elemento para conocer su

comportamiento.

Diagrama de Scorecarding

Performance Modeler permite realizar un diagrama que contenga las

dimensiones qué se necesita visualizar para poder mostrarlo de manera gráfica

para interpretarlo rápidamente. En la figura 28 se puede ver un ejemplo.

Cubo de métricas

Este cubo muestra los semáforos y las tendencias en las celdas del cubo, es

diseñada por una dimensión de métrica, una dimensión de indicador métrico,

dimensión de tiempo y dimensiones de contexto opcionales. (IBM, 2017)

Figura 2. Cubo de métricas

24

Elaborado por: IBM, 2017

Fuente: IBM

Indicador de Semáforos

Permite conocer el estado de un indicador por medio del semáforo, el estado se

indica por el color y forma del icono

Cuadro N 3 Íconos de Semáforo

Ícono Descripción

Indica un estado satisfactorio

Indica precaución con el indicador asociado

Indica una advertencia del indicador asociado

Indica que no se puede calcular una puntuación, porque faltan valores


Fuente: IBM

Indicador de Tendencia

25

Muestra el valor de una columna en comparación con el valor de la columna

anterior, muestra si el valor es mayor o menor que el otro valor

Cuadro N 4 Íconos de Tendencia

Ícono Descripción

Indica que la tendencia es mayor que el período anterior.

Indica que la tendencia no ha variado

Indica que la tendencia es menor que el periodo anterior

Celda vacía Indica que la tendencia este incompleta


Fuente: IBM

Gestión de la movilidad vehicular

El agigantado crecimiento en la población y el sector productivo, demanda a los

gobiernos locales la indagación en relación a las soluciones eficientes para los

conflictos de movilidad intraurbana. En este orden de ideas, se presentan un

conjunto de estrategias para la gestión eficiente y eficaz del tránsito vehicular así

como también introducirse en el ámbito de la concientización urbana sobre la

seguridad vial.

Indiferentemente del tipo de ciudad que se habite, el automóvil particular y la

motocicleta constituyen los principales medios de transporte, donde se pueden

26

circular en mínimas distancias, a altas velocidades, enfrentándose a numerosos

factores tales como el deterioro de las vías, peatones y otros vehículos que

circulan al mismo tiempo. Es por esto que, se deben diseñar planificaciones y

efectuar la ejecución de políticas urbanas que abarquen estos sectores, a

continuación se mencionan diversos elementos que intervienen en la gestión de

la movilidad vehicular.

Movilidad urbana y siniestralidad vial

En cuanto a la siniestralidad se mancomunan el factor humano y el diseño de

las calles y avenidas. Ahora bien, por lo general en las carreteras, la tipología

común de siniestros en movilidad vehicular son las salidas de las vías, es decir,

volcamiento, embestidas contra árboles, postes o columnas, derivados por los

excesos de velocidad, alcohol e insomnio, en otros caso se incluyen los malos

diseños y conservación de las vías.

Por otra parte, la evolución de la tecnología ha contribuido como herramienta

ventajosa para la seguridad vial donde destacan el controlador de velocidades a

distancia, la comunicación en carreteras, los controles de pesos y cargas, la

semaforización por demanda, las sofisticadas defensas y materiales retro

reflectantes, entre otros, son innovadores sistemas de seguridad que importan

mejoras el seguimiento y control de la movilidad de personas y de cargas.

En conjunto con lo antes expuesto, se señala el incumplimiento de las leyes y

señales de tránsito que se ubican en diferentes partes de los urbanismos, debido

a este atenuante es necesario recalcar a la ciudadanía las sanciones que

corresponden a cada violación de las normativas de tránsito

Distancias y Velocidades

El tránsito y la vialidad es un sistema que se compone de números elementos

tales como los vehículos, transporte público, automóviles, motos, bicicletas y

peatones, los cuales hacen vida en el mismo espacio. La velocidad es una

27

vertiente de alta peligrosidad que ha generado un alza significativa en los

siniestros viales, así como también el entorpecimiento del flujo correcto de la

circulación.

Antecedentes y estado de la técnica

El análisis de los datos de movimiento se basa en la capacidad de almacenar y

manipular la información donde el espacio y el tiempo están estrechamente

interconectados. Típicamente, la indagación de movimiento hace referencia al

espacio y también hace referencia al tiempo. En las siguientes secciones, se

presentará algunas partes significativas de la tecnología de punta, trabajos útiles

para una mejor introducción del marco propuesto para esta tesis. En primer

lugar, se proporcionará una descripción de los tipos de datos utilizados y

disponible hoy, centrándose en algunas técnicas de integración de datos, tales

como correlación de mapas y trayectorias semánticas.

Además se ha contemplado usar Mapas Cognitivos Difusos con el fin de adquirir,

aprender, decodificar conocimiento para descubrir los factores de un problema,

aunque los MCD no maneje Big Data, pero aporta otra solución y ayudar a la

toma de decisiones

Lógica difusa

La lógica difusa reconoce no simples valores falsos y verdaderos, sino valores

con cierto grado de falsedad o veracidad, esta proporciona un mecanismo de

inferencia que ayuda a simular procesos de razonamiento humano en sistemas

basados en el conocimiento (Morcillo, 2013). La lógica difusa ayudará a realizar

aproximaciones matemáticas que ayuden a la resolución de un problema difícil

de resolver.

Las variables lingüísticas brindan un medio de caracterización a fenómenos que

son muy difíciles de darle una descripción cuantitativa, por ejemplo cuando se

habla de la verdad se dice que toma valores como muy verdadero, no muy

cierto, falso, entre otros. Las relaciones causales por lo general son granulares,

28

esto se representa por medio de variables lingüísticas. (Garcia-Cascales &

Lamata, 2010), es decir las variables lingüísticas permiten describir el estado de

un objeto o fenómeno. Para entenderlo mejor se describirá un ejemplo

Una variable numérica toma valores numéricos, Estatura = 2 (metros)

Una variable lingüística toma valores lingüísticos, Estatura es alta

Los valores lingüísticos forman un conjunto de etiquetas por ejemplo: muy alta,

medianamente alta, alta, baja, muy baja, medianamente baja y baja.

Los conjuntos difusos son aquellos conjuntos que se usan para representar de

manera matemática la indecisión en los distintos aspectos de la vida, brindando

herramientas para utilizarlos. (Rodríguez & Huertas, 2016). Estos se caracterizan

por una función que asigna a cada elemento un grado de pertenencia oscilando

entre menos uno y uno.

La función de pertenencia µA, por lo cual un conjunto difuso es definido de la

siguiente forma:

µCi(x) [0,1] x E X

Esto representa el grado de pertenencia de la variable x en el conjunto difuso Ci

puede variar desde 0 a +1, y para definir en su totalidad el conjunto difuso Ci, se

debe definir µCi(x) para todos los valores que pueda tomar x en el universo de X.

Mapas Cognitivos Difusos

En términos generales los conceptos de los mapas cognitivos difusos

demuestran los factores claves y las características del sistema complejo

modelado y representan: entradas, salidas, variables y tendencias de un sistema

de modelado complejo. (Groumpos, Fuzzy Cognitive Maps: Basic Theores and

Their Application to Complex System, 2010).

29

Entre las ventajas de construir un mapa cognitivo difuso están las siguientes: la

estructuración de un proceso, construir el orden de todas las alternativas

permitiendo dar un grado de causalidad, por medio de un vector de pesos.

(Leyva Vásquez, Peréz Teruel, Febles Estrada, & Gulín González, 2012)

La causalidad es la representación de causa y efecto, su importancia se basa en

que encuentra una explicación a los eventos del mundo real, los mapas

cognitivos difusos también son llamados mapas causales difusos, se realiza la

representación de la causalidad que hay entre los componentes que lo

conforman.

Estructura de Mapas Cognitivos difusos

Los mapas cognitivos difusos están compuestos de nodos también llamados

conceptos, los cuales representan variables. Los enlaces que hay entre estos

conceptos son asignado con el signo + o – para representar si la relación es

negativa o positiva entre los nodos, esto describe el grado de pertenencia que

tienen los nodos. Estos permiten crear y modelar sistemas enfocados en una

explicación causal de interrelaciones entre los conceptos. (Papageorgiou &

Stylios, 2008). Al realizar la relación entre los conceptos se pueden establecer

tres tipos de nodos: Conductores, los cuales son los nodos que no tienen nodos

entrantes, recibidores, aquellos nodos que tienen nodos entrantes y los

ordinarios, son los nodos que tienen nodos entrantes y salientes.

Las direcciones de las relaciones son representadas pos flechas, además

permite tener grados de causalidad entre un nodo al otro comprendido entre -1 a

+1.

Figura 3. Relación entre dos conceptos


30

Fuente: Propia

La forma correcta de representar la causalidad es por medio de la matriz de

adyacencia, en la cual se encuentra todas las relaciones que hay entre los

nodos, se podrá observar el peso que tiene un nodo sobre otro.

La matriz de adyacencia es una matriz cuadrada utilizada con el fin de

representar la conectividad que existen entre los nodos. (Salmeron, Vidal, &

Mena, 2012). En la celda Cij se coloca el peso que tiene cada uno de los nodos

con respecto a otro.

Cuadro N 5 Representación de una matriz de adyacencia

Ci Cj

Ci Wij

Cj Wji


Fuente: Propia

Las casillas que corresponden a la diagonal principal, siempre tienen un peso de

cero, debido a que no debería existir una relación entre sí mismo.

Hay tres tipos posibles relaciones causales entre nodos representados en la

matriz:

Wij > 0, representa una causalidad positiva entre los nodos Ci y Cj. El

incremento o la disminución en el valor de Ci conducen al incremento o

disminución en el valor de Cj

Wij = 0, representa que no hay ninguna relación entre Ci y Cj

31

Wij < 0, representa una causalidad negativa entre los nodos Ci y Cj. El

incremento o la disminución en el valor de Ci conducen al incremento o

disminución en el valor de Cj

Wij representa el peso de la relación que existe entre dos conceptos Ci y Cj

La simulación comienza por medio de la deducción del Mapa Cognitivo Difuso y

de la definición del vector de estímulo. Se ha estimado usar la función sigmoidal,

para que los cambios de estado se realicen de manera continua y conocer el

estado final en el que se encontrarán los nodos o conceptos que intervienen. La

función sigmoidal es la siguiente.

f(x) = (1 / (1+ e -x )

La centralidad del grado se usa para encontrar el nodo importante, este se

determina por medio de la suma del grado de entrada y del grado de salida,

como se muestra en la siguiente fórmula:

C(v) = id(v) + od(v)

La centralidad que existe en un nodo muestra que tanto está relacionado un

nodo con otro.

Mental Modeler

Es un software de modelamiento de datos que permite realizar análisis por

medio de escenarios, tanto a individuos o grupos de personas y les deja capturar

sus conocimientos de manera estándar. (Mental Modeler Org, 2015). Se basa en

Mapas Cognitivos Difuso, se pueden crear de manera sencilla y rápida modelos

de preocupaciones sociales, sistemas socio ecológicos o de medio ambiente.

Pasos para crear el modelamiento:

32

Definir componentes

Definir relaciones entre componentes

Ejecutar escenarios “Que pasa si” para saber la reacción del sistema

según los rangos establecidos

Modelo.- Es donde se define los conceptos que se desean analizar y a la vez se

coloca el grado de influencia entre un concepto a otro, realizando el mapa

cognitivo difuso

Matriz adyacente (Análisis estático)- Es una matriz de n x m, para indicar el

peso de la arista se coloca en la entrada del renglón i, columna j y reserva un

valor especial null cuando indicamos un arista ausente. Representación en

columnas y filas del conjunto de asignados a los conceptos de los mapas

cognitivos difusos (Peréz Teruel, 2014). En Mental Modeler la matriz adyacente

se llena automática con los pesos que se definen en los modelos.

Métricas.- Se encuentran los valores de grados de entradas, es la suma de

todos los pesos que ingresan a un conceptos, valores de grados de salidas, es la

suma de todos los pesos que salen de un nodo, y la centralidad que es la suma

de los grados de entrada y salida.

Escenarios (Análisis dinámico).- El fin del análisis dinámico es realizar

escenarios hipotéticos que ayuden a simular el sistema de diferentes

condiciones. (Stach, 2010) Mental Modeler permite realizar diferentes escenarios

que permiten analizar los conceptos desde diferentes perspectivas.

33

FUNDAMENTACIÓN LEGAL

Artículos de la Constitución de la República del Ecuador.

Según el Art. 394. La Constitución del Ecuador establece que: El Estado

garantizará la libertad de transporte terrestre, aéreo, marítimo y fluvial dentro del

territorio nacional, sin privilegios de ninguna naturaleza. La promoción del

transporte público masivo y la adopción de una política de tarifas diferenciadas

de transporte serán prioritarias. El Estado regulará el transporte terrestre, aéreo

y acuático y las actividades aeroportuarias y portuarias. (Constitución de la

Republica de Ecuador, 2008)

Según lo leído: este artículo se consideró relevante para la investigación debido

a que en su contenido expresa claramente que el Estado como entidad

gubernamental es responsable y garante del correcto funcionamiento del todos

los aspectos que son vinculantes al libre tránsito dentro del espacio territorial y

sus fronteras. (Constitución de la Republica de Ecuador, 2008)

Artículos de la Ley Orgánica de Transporte Terrestre Tránsito y Seguridad

Vial.

Según el Art. 7. De la Ley Orgánica de Transporte Terrestre Tránsito y

Seguridad Vial indica que: Las vías de circulación terrestre del país son bienes

nacionales de uso público, y quedan abiertas al tránsito nacional e internacional

de peatones y vehículos motorizados y no motorizados, de conformidad con la

Ley, sus reglamentos e instrumentos internacionales vigentes. En materia de

transporte terrestre y tránsito, el Estado garantiza la libre movilidad de personas,

vehículos y bienes, bajo normas y condiciones de seguridad vial y observancia

de las disposiciones de circulación vial. (ley organica de transporte terrestre

transito y seguridad vial, 2014)


Seguridad Vial señala que: Los peatones, conductores, pasajeros, automotores y

vehículos de tracción humana, animal o mecánica podrán circular en las

34

carreteras y vías públicas del país, sujetándose a las disposiciones de esta Ley,

su reglamento, resoluciones y regulaciones técnicas vigentes. (ley organica de

transporte terrestre transito y seguridad vial, 2014)


Seguridad Vial indica que: El Estado fomentará la participación ciudadana en el

establecimiento de políticas nacionales de transporte terrestre, tránsito y

seguridad vial que garanticen la interacción, sustentabilidad y permanencia de

los sectores público, privado y social. (ley organica de transporte terrestre

transito y seguridad vial, 2014)


Seguridad Vial expresa que: El transporte terrestre automotor es un servicio

público esencial y una actividad económica estratégica del Estado, que consiste

en la movilización libre y segura de personas o de bienes de un lugar a otro,

haciendo uso del sistema vial nacional, terminales terrestres y centros de

transferencia de pasajeros y carga en el territorio ecuatoriano. Su organización

es un elemento fundamental contra la informalidad, mejorar la competitividad y

lograr el desarrollo productivo, económico y social del país, interconectado con la

red vial internacional. (ley organica de transporte terrestre transito y seguridad

vial, 2014)

Según lo leído: bajo la interpretación de los artículos tomados en consideración

de la Ley Orgánica de Transporte Terrestre Tránsito y Seguridad Vial, se

concluye que, el gobierno de la Reubica define los servicios y actividades

derivadas de la promoción del transporte terrestre, así como también fomenta la

participación ciudadana en pro de concebir mejoras que optimicen los servicios

de transportes y la seguridad vial definiendo de esta manera las normativas

vigentes para la circulación de la ciudadanía. (ley organica de transporte

terrestre transito y seguridad vial, 2014)

DEFINICIONES CONCEPTUALES

Agregación: Un proceso de búsqueda, recopilación y presentación de datos

35

Inteligencia empresarial (BI): El término general utilizado para la identificación,

extracción y análisis de datos.

Cloud Virtual: Un sistema informático distribuido a través de una red utilizada

para almacenar datos fuera de las instalaciones

Análisis de agrupamiento: El proceso de identificar objetos que son similares

entre sí y agruparlos para comprender las diferencias, así como las similitudes

dentro de los datos.

Cloud: Un término amplio que hace referencia a cualquier aplicación o servicio

basado en Internet alojado de forma remota.

Agregación de datos: El acto de recopilar datos de múltiples fuentes con el

propósito de informar o analizar.

Limpieza de datos: El acto de revisar y revisar los datos para eliminar entradas

duplicadas, corregir errores ortográficos, agregar datos faltantes y proporcionar

consistencia.

Integridad de los datos: La medida de confianza que tiene una organización en

la precisión, integridad, puntualidad y validez de los datos.

Migración de datos: El proceso de mover datos entre diferentes tipos de

almacenamiento o formatos, o entre diferentes sistemas informáticos.

Ciencia de los datos: Un término reciente que tiene múltiples definiciones, pero

que generalmente se acepta como una disciplina que incorpora estadísticas,

visualización de datos, programación de computadoras, extracción de datos,

aprendizaje automático e ingeniería de bases de datos para resolver problemas

complejos.

Seguridad de datos: La práctica de proteger los datos contra la destrucción o el

acceso no autorizado.

36

Conjunto de datos: Una colección de datos, generalmente en forma de tabla.

Fuente de datos: Cualquier proveedor de datos, por ejemplo, una base de datos

o una secuencia de datos.

Estructura de datos: Una forma específica de almacenar y organizar datos.

Visualización de datos: Una abstracción visual de datos diseñada con el

propósito de derivar significado o comunicar información de manera efectiva.

Almacén de datos: Un lugar para almacenar datos con el propósito de informar

y analizar.

Datos públicos: Información pública o conjuntos de datos creados con fondos

públicos

Datos en tiempo real: Datos que se crean, procesan, almacenan, analizan y

visualizan en milisegundos

37

CAPITULO III

METODOLOGÍA DE LA INVESTIGACIÓN

DISEÑO DE LA INVESTIGACIÓN

Este capítulo se mostrará los métodos de ensayo, así como también las

herramientas de resultados que se obtuvieron en el análisis de investigación a

través de revistas científicas, artículos científicos e investigaciones publicadas

como Dialnet, Scielo, ResearchGet, entre otras. Se darán a conocer conceptos

estadísticos para mejor comprensión, también se describirá el meta-análisis y las

variables que lo conforman, se mostrará la codificación de las variable que se

usaron.

Según (Baena, 2014), El diseño de la investigación es “proporcionar un modelo

de verificación que acceda a contrastar hechos con teorías, y su forma es la de

una estrategia o plan general que determina las operaciones necesarias para

hacerlo” (p.44).

Metodología descriptiva

La metodología descriptiva trabaja sobre las realidades de hecho y por presentar

una interpretación correcta, esto puede contener entrevistas, o casos, permite

describir situaciones y como se manifiesta un determinado fenómeno, (Grajales

G., 2000), por lo cual se ha considerado como metodología para nuestro estudio

y se describe como se presentan los factores de nuestro problema

Población

38

La población se define como la suma completa de todos los elementos que

intervienen en el trabajo a desarrollar, los cuales son poseedores de una serie

de características propias que permiten su procesamiento, dando origen a los

datos de la investigación. Tal como lo señalan (Hernandéz, 2014):

“es el conjunto de todos los casos que concuerdan con

una serie de especificaciones” (p.174).

Población objetivo

Nuestra población objetiva son los 10 expertos en el área de la gestión de

movilidad vehicular, los cuales fueron considerados por sus años de

experiencia, su conocimiento en el área de gestión de movilidad vehicular, para

poder resolver de manera real el problema.

Cuadro N 6 . Caso de Estudio: Expertos de gestión vehicular

No Personal de gestión vehicular

Ocupación Actividades

1 Coronel William Ayala Planificador de Tránsito

Realiza inspecciones sobre conflictos viales

2 Coronel Jorge Luna Planificador de Tránsito


3 Arq. Kelly Lara Analistas de semaforización y señalización

Analiza la información de tránsito vehicular

4 Coronel Jorge Rivera Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.

5 Coronel Luis Torres Planificador de Tránsito


6 Capitán Andrés Jiménez Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.

7 Ing Pedro Chilán Analistas de semaforización y señalización

Analiza la información de tránsito vehicular

8 Arq. Luis Rocha Analistas de estudio de tránsito 2

Analiza la información del tránsito vehicular

9 Coronel Ángel Jaramillo Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.

10 Sargento Jaime Palacios Inspector de Tránsito Verifica situaciones conflictivas de tránsitos y da posible solución.


Fuente: Propia

39

Entrevista

La entrevista es la técnica a través de la cual el investigador persigue la

obtención de información de forma oral e individualizada. Ahora bien, los datos

sustraídos exteriorizaran los acontecimientos que se ejecutaron así como

también opiniones subjetivas de los actores entrevistados en relación con la

situación indagada.

A continuación se muestra la entrevista realizada a los expertos en el tema.

1.- ¿Los resultados del análisis de los datos pueden mejorar la toma de

decisiones de las entidades de vialidad en el cantón de la Libertad?

Cuadro N 7 Pregunta 1 Expertos

Alternativa Frecuencia %

SI 7 70%

NO 3 30%

Elaborado por: Rocha & Villarreal, 2017.

Fuente: Propia

Gráfico 1. Pregunta número uno realizada a los expertos

0%

10%

20%

30%

40%

50%

60%

70%

80%

SI NO

Expertos

40


Fuente: Propia

Conclusión:

Del total del personal entrevistado, se obtienen una sumatoria de 10 respuestas

vinculadas a la pregunta número uno (1), donde en el gráfico que se presenta se

visualizan el 70% de respuestas afirmativas y el 30% negativas, lo que indica

que al realizar análisis de datos se podrían obtener mejoras en la toma de

decisiones.

2.- ¿Piensa usted que la semáforos en buen estado que circulan en cantón

La Libertad disminuye el tráfico vehicular?



SI 6 60%

NO 4 40%


Fuente: Propia

Gráfico 2. Pregunta número dos realizada a los expertos

0%

10%

20%

30%

40%

50%

60%

70%

SI NO

Expertos

41


Fuente: Propia

Conclusión:


vinculadas a la pregunta número dos (2), donde en el gráfico que se presenta se


que se considera que, los semáforos en buen estado disminuye el tráfico

vehicular.

3.- ¿Afecta el tener las vías en mal estado a la movilidad vehicular?



SI 8 80%

NO 2 20%


Fuente: Propia

Gráfico 3. Pregunta número tres realizada a los expertos


0%

20%

40%

60%

80%

100%

SI NO

Expertos

42

Fuente: Propia

Conclusión:


vinculadas a la pregunta número tres (3), donde en el gráfico que se presenta se


que se considera que si afecta el tener vías en mal estado en la movilidad

vehicular.

4.-. ¿Las lluvias permiten el buen funcionamiento del flujo vehicular?



SI 1 10%

NO 9 90%


Fuente: Propia

Gráfico 4. Pregunta número cuatro realizada a los expertos

43


Fuente: Propia

Conclusión:


vinculadas a la pregunta número cuatro (4), donde en el gráfico que se presenta

se visualizan el 10% de respuestas afirmativas y el 90% negativas, lo que indica

que las lluvias si afectan al flujo vehicular

5.- ¿Cree usted que señalizaciones de tránsito en buen estado disminuyen

el congestionamiento vehicular?



SI 7 70%

NO 3 30%


Fuente: Propia

Gráfico 5. Pregunta número cinco realizada a los expertos

0%

20%

40%

60%

80%

100%

SI NO

Expertos

44


Fuente: Propia

Conclusión:


vinculadas a la pregunta número cinco (5), donde en el gráfico que se presenta

se visualizan el 70% de respuestas afirmativas y el 30% negativas, lo que indica

el tener señales de tránsito en buen estado disminuyen el congestionamiento

vehicular.

6.- ¿Piensa usted que utilizando la tecnología bajarían los niveles de

tránsito en el cantón de La Libertad?



SI 6 60%

NO 4 40%


Fuente: Propia

0%

10%

20%

30%

40%

50%

60%

70%

80%

SI NO

Expertos

45

Gráfico 6. Pregunta número uno a los expertos


Fuente: Propia

Conclusión:


vinculadas a la pregunta número seis (6), donde en el gráfico que se presenta se


que si se usa la tecnología se puede solventar el problema del tráfico vehicular.

Marco Muestral

Es la lista de todos los componentes que se usó para el estudio de Big Data y

mapas cognitivos difusos. El marco muestral de esta investigación son los

artículos científicos que fueron extraídos en una base de datos, ingresados en

una matriz de metaanálisis, y de esta manera adquirir información relevante

acerca de investigaciones referente a nuestro tema. La población escogida son

los 50 papers de los cuales se obtuvieron a través de criterios de inclusión y

exclusión solo 30 cumplieron el criterio de inclusión, y son válidos en nuestra

investigación debido a que cumplían con la mayoría de palabras claves.

0%

10%

20%

30%

40%

50%

60%

70%

SI NO

Expertos

46

Meta-análisis

Es una investigación que tiene como objetivo la integración de manera

sistemática y objetiva los resultados de los estudios empíricos sobre algún

problema o tema de investigación específica. (Merca, 2010)

Diseño de la base de meta-análisis

La matriz de metaanálisis fue una herramienta eficiente que ha ayudado a

reducir información y conocer la información relevante. Para llevar a cabo la

meta-análisis de nuestro proyecto se realizó algunas investigaciones desde

diferentes fuentes, en la cuales se analizan que tienen en común los artículos,

así como también las variables de nuestra investigación. Las variables fueron

“Género de Primer autor”, “Tipo de revista”, “Tipo de journal”, “Tipo de

biblioteca”, “Tipo de investigación”.

Figura 4. Variables metaanálisis

47


Fuente: Propia

Codificación y descripción de variables

En la siguiente codificación de variables se pudo identificar e indicar sobre las

variables investigadas, por lo tanto es muy importante para cada variable su

análisis.

La codificación de acuerdo a los temas indicados, nombrados, permite saber el

análisis univariado, el manejo y definición de la estadística como una muestra

de resultados.

Descripción de las variables usadas para el análisis

Variable 1: Portal Bibliográfico

La variable 1 se refiere al portal bibliográfico en el cual se desarrolló el artículo

Cuadro N 13 Portal Bibliográfico

PORTALES BIBLIOGRÁFICO

REDALYC

1

SCIELO

2

SCIENCEDIRECT

3

DIALNET

4

48

RESEARCHGATE

5

GRÁFICOS Elaborado por: Rocha & Villarreal, 2017

Fuente: Propia

Variable 2: Género del Primer Autor

La variable 2 se refiere al género de primer autor que se desarrolló el artículo

Cuadro N 14 Género del Primer Autor

GENERO DEL PRIMER AUTOR

MASCULINO

1

FEMENINO

2

GRÁFICOS


Fuente: Propia

Variable 3: Tipo de Journal La variable 3 se refiere al tipo de journal que se desarrolló el artículo.

Cuadro N 15 Tipo de Journal

TIPO DE JOURNAL

ARTICULOS CIENTIFICOS

1

49


Fuente: Propia

Variable 4: Tipo de Investigación

La variable 4 se refiere al tipo de investigación que se desarrolló el artículo.

Cuadro N 16 Tipo de Investigación


Fuente: Propia

Variable 5: Criterio Inclusión y Exclusión

La variable 5 se refiere al criterio de inclusión o exclusión del artículo


TESIS 2

LIBROS

3

TIPO DE INVESTIGACIÓN

INVESTIGACIÓN

1

CAMPO

2

TEÓRICO

3

CRITERIO DE INCLUSIÓN Y EXCLUSIÓN

IINCLUSIÓN

1

50


Fuente: Propia

Variable 6: Número de veces que se repite la palabra “Big Data”

La variable numero 6 indica la cantidad de veces que aparece la palabra “Big

Data” hay en cada artículo.

Variable 7: Número de veces que se repite la palabra “Traffic_vehicular” en los

artículos.

El variable número 7 indica la cantidad de veces que se repite la palabra

“Traffic_vehicular” aparece en cada uno de los 50 artículos.

Variable 8: Número de veces que aparece la palabra “Lógica Difusa” en los

artículos.

La variable número 8 indica la cantidad de veces que aparece la palabra “Lógica

Difusa” aparece en cada uno de los 50 artículos.

Variable 9: Número de veces que se repite la palabra “Conjunto Difuso” en los

artículos.

La variable número 9 indica la cantidad de veces que aparece la palabra

“Conjunto Difuso” aparece en cada uno de los 50 artículos.

Variable 10: Número de veces que se repite la palabra “Mapa Cognitivo Difuso”

en los artículos.

La variable número 10 indica la cantidad de veces que aparece la palabra “Mapa

Cognitivo Difuso” aparece en cada uno de los 50 artículos.

EXCLUSIÓN

2

51

Variable 11: Número de veces que se repite la palabra “Variables Lingüística” en

los artículos.

La variable número 11 indica la cantidad de veces que aparece la palabra

“Variables Lingüística” aparece en cada uno de los 50 artículos.

Interpretación y análisis de los resultados: Análisis

Univariado de los datos

Para continuar con el metaanálisis estadístico, se han considerado algunas

variables respectivas para este estudio. Por lo tanto en este parte se mostrará

gráficos realizados que presenta la estabilidad de cada variable ya sea

cualitativa y cuantitativa se llevara a cabo de esta manera. Para analizar las

variables cuantitativas se procede a realizar medidas de tendencia central como

media, moda, mediana así como también la dispersión como la varianza y a

desviación estándar y para realizar el análisis cualitativo se realiza el cálculo

para interpretar las características de las variables.

Sección: Información general meta-análisis

Variable 1: Portal Bibliográfico

Cuadro N 18 Portal Bibliográfico

Frecuencia Porcentaje Porcentaje

válido Porcentaje acumulado

Válido Dialnet 8 16,0 16,0 16,0

52

Redalyc 13 26,0 26,0 42,0

Researchgate 5 10,0 10,0 52,0

Scielo 12 24,0 24,0 76,0

ScienceDirect 12 24,0 24,0 100,0

Total 50 100,0 100,0

RÁFICOS Elaborado por: Rocha & Villarreal, 2017

Fuente: Propia

Gráfico 7. Diagrama de la Variables Portal Bibliográfico


Fuente: Propia

Análisis: De acuerdo a los resultados de un total de 50 artículos, se puede

apreciar que la variable Redalyc es aquel que tuvo mayor frecuencia, con un

porcentaje de 26%, mientras que las variables Scielo y ScienceDirect obtuvieron

un porcentaje de 24, la variable Dialnet obtuvo un porcentaje de 16% y la

variable Researchgate obtuvo un porcentaje de 10%.

Variable 2: Género del Primer Autor

Frecuencia Porcentaje

Porcentaje

válido

Porcentaje

acumulado

Válido F 17 34,0 34,0 34,0

M 33 66,0 66,0 100,0

53

Cuadro N 19 Género del Primer Autor


Fuente: Propia

Gráfico 8. Diagrama de la Variables Género del Autor


Fuente: Propia

Análisis: De acuerdo a los resultados de un total de 50 artículos, se puede

observar que el género masculino es aquel que cuenta con mayor frecuencia,

con un porcentaje de 34%, mientras que el género femenino tuvo un porcentaje

de 66%.

Variable 3: Tipo de Journal

Cuadro N 20 Tipo de Journal

Total 50 100,0 100,0

54


Porcentaje

válido

Porcentaje

acumulado

Válido Artículo científico 43 86,0 86,0 86,0

Tesis 7 14,0 14,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Gráfico 9. Diagrama de la Variables Tipo Journal


Fuente: Propia

Análisis: Basados en este gráfico se obtuvo que el artículo científico fue aquel

que tuvo mayor frecuencia, con un porcentaje 86%; mientras la variable tesis

obtuve un porcentaje de 14%.

Variable 4: Tipo de Investigación

La variable 4 se refiere al Tipo de Investigación que se desarrolló en este artículo.

55



Fuente: Propia

Gráfico 10. Diagrama de la Variables Tipo de Investigación


Fuente: Propia

Análisis: Se puede apreciar en base a este grafico que la variable investigación

fue aquella que tuvo mayor frecuencia, con un porcentaje de 48%; mientras que

la variable teórica obtuvo un porcentaje de 40% y variable campo obtuvo un

porcentaje de 12%.

Variable 5: Criterio de Inclusión y Exclusión

Cuadro N 22 Criterio de Inclusión y Exclusión


Porcentaje

válido

Porcentaje

acumulado

Válido Campo 6 12,0 12,0 12,0

Investigación 24 48,0 48,0 60,0

Teórica 20 40,0 40,0 100,0

Total 50 100,0 100,0

56


Porcentaje

válido

Porcentaje

acumulado

Válido Exclusión 20 40,0 40,0 40,0

Inclusión 30 60,0 60,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Gráfico 11. Diagrama de la Variables Criterio Inclusión y Exclusión


Fuente: Propia

Análisis: En base a este gráfico se puede observar que hubo más artículos

científicos aceptados obteniendo un porcentaje de 60% mientras que aquellos

que fueron excluidos obtuvieron un porcentaje de 40%.

Variable 6: Número de veces que se repite la palabra “Big Data”

Cuadro N 23 Tabla de Frecuencia de la variable Big Data

57


Porcentaje

válido

Porcentaje

acumulado

Válido <= 0 4 8,0 8,0 8,0

1 - 43 36 72,0 72,0 80,0

44 - 86 7 14,0 14,0 94,0

87 - 129 2 4,0 4,0 98,0

130+ 1 2,0 2,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Cuadro N 24 Tabla para el análisis de la variable Big Data


Fuente: Propia

Gráfico 12. Diagrama de la Variables Big Data

Estadísticos

Big_Data (agrupado)

N Válido 50

Perdidos 0

Media 2,20

Mediana 2,00

Moda 2

Desviación estándar ,728

Varianza ,531

Asimetría 1,650

Error estándar de asimetría ,337

Curtosis 4,483

Error estándar de curtosis ,662

Mínimo 1

Máximo 5

58


Fuente: Propia

Análisis: Con este gráfico se puede visualizar que de los 50 artículos científicos

observados, las palabras Big Data obtuvieron una media de 2,20, una mediana

de 2,00 y una moda de 2. Además obtuvo una desviación estándar 0,728, por

último, por la forma del histograma, se puede concluir que tiene una asimetría

positiva de 0,531, es decir que aquellos valores bajos (a la izquierda del eje de

simetría) son aquellos que tienen mayor frecuencia en comparación a los demás

datos

Variable 7: Número de veces que se repite la palabra “Traffic_vehicular” en los

artículos

59

Cuadro N 25 Tabla de frecuencia de la variable traffic_vehicular

Traffic_vehicular (agrupado)


Porcentaje

válido

Porcentaje

acumulado

Válido <= 0 13 26,0 26,0 26,0

1 - 20 33 66,0 66,0 92,0

21 - 40 3 6,0 6,0 98,0

41+ 1 2,0 2,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Cuadro N 26 Tabla para el análisis de la variable traffic_vehicular

N Válido 50

Perdidos 0

Media 1,84

Mediana 2,00

Moda 2


Varianza ,382

Asimetría ,647


Curtosis 2,132


Mínimo 1

Máximo 4


Fuente: Propia

Gráfico 13. Diagrama de la Variables Traffic Vehicular

60


Fuente: Propia

Análisis: Se puede apreciar con este gráfico, de los 50 artículos científicos

observados, las palabras Traffic vehicular obtuvieron una media de 1,84, una

mediana de 2,00 y una moda de 2. Además obtuvo una desviación estándar

0,618 por último, por la forma del histograma, se puede concluir que también

tiene una asimetría positiva de 0,647, es decir que tiene menor probabilidad de

encontrar dichas palabras.

Variable 8: Número de veces que se repite la palabra “Conjunto Difuso” en los

artículos.

Cuadro N 27 Tabla de frecuencia de la variable Lógica Difusa

61


Porcentaje

válido

Porcentaje

acumulado

Válido <= 0 12 24,0 24,0 24,0

1 - 21 17 34,0 34,0 58,0

22 - 42 21 42,0 42,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Cuadro N 28 Tabla para el análisis de la variable Lógica Difusa

N Válido 50

Perdidos 0

Media 2,18

Mediana 2,00

Moda 3


Varianza ,640

Asimetría -,342


Curtosis -1,349


Mínimo 1

Máximo 3


Fuente: Propia

Gráfico 14. Diagrama de la Variables Lógica Difusa

62


Fuente: Propia


observados, las palabras Fuzzy Logic obtuvieron una media de 2,18, una

mediana de 2,00 y una moda de 3. Además obtuvo una desviación estándar 0,8,

por último, por la forma del histograma, se puede concluir que al contrario de los

gráficos anteriores, tiene una asimetría negativa de -0,342, es decir que tiene r

mayor probabilidad de encontrar dichas palabras

63

Variable 9: Número de veces que se repite la palabra “Mapa Cognitivo Difuso”

en los artículos.

Cuadro N 29 Tabla de frecuencia de la variable Mapa Cognitivo Difuso


Porcentaje

válido

Porcentaje

acumulado

Válido <= 0 29 58,0 58,0 58,0

1 - 5 18 36,0 36,0 94,0

6 - 10 3 6,0 6,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Cuadro N 30 Tabla para el análisis de la variable Mapa Cognitivo Difuso

N Válido 50

Perdidos 0

Media 1,48

Mediana 1,00

Moda 1


Varianza ,377

Asimetría ,905


Curtosis -,133


Mínimo 1

Máximo 3


Fuente: Propia

64

Gráfico 15. Diagrama de la Variables Mapa Cognitivo Difuso


Fuente: Propia


observados, las palabras Fuzzy Maps Cognitive obtuvieron una media de 1,48,

una mediana de 1,00 y una moda de 1. Además obtuvo una desviación estándar

0,614, por último, por la forma del histograma, se puede concluir que tiene una

asimetría positiva de 0,905, y esto se debe a que se encontraron pocos

documentos que trataban sobre mapas cognitivos difusos.

65

Variable 10: Número de veces que se repite la palabra “Conjunto Difuso” en

los artículos.

Cuadro N 31 Tabla para el análisis de la variable Conjunto Difuso


Porcentaje

válido

Porcentaje

acumulado

Válido <= 0 14 28,0 28,0 28,0

1 - 22 28 56,0 56,0 84,0

23 - 44 7 14,0 14,0 98,0

45+ 1 2,0 2,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Cuadro N 32 Tabla para el análisis de la variable Conjunto Difuso

N

Válido 50

Perdidos 0

Media 1,90

Mediana 2,00

Moda 2


Varianza ,500

Asimetría ,505


Curtosis ,395


Mínimo 1

Máximo 4


Fuente: Propia

66

Gráfico 16. Diagrama de la Variables Conjunto Difuso


Fuente: Propia


observados, las palabras Fuzzy Sets obtuvieron una media de 1,90, una



asimetría positiva de 0,505, y esto quiere decir que hay menor probabilidad de


67

Variable 11: Número de veces que se repite la palabra “Variables Lingüística” en

los artículos.

Cuadro N 33 Tabla de Frecuencia de la variable Variables Lingüística


Porcentaje

válido

Porcentaje

acumulado

Válido <= 0 17 34,0 34,0 34,0

1 – 18 20 40,0 40,0 74,0

19 – 36 13 26,0 26,0 100,0

Total 50 100,0 100,0


Fuente: Propia

Cuadro N 34 Tabla para el análisis de la variable Variables

Lingüística

N Válido 50

Perdidos 0

Media 1,92

Mediana 2,00

Moda 2


Varianza ,606

Asimetría ,142


Curtosis -1,315


Mínimo 1

Máximo 3


Fuente: Propia

68

Gráfico 17. Diagrama de la Variable Lingüística


Fuente: Propia


observados, las palabra variable lingüística obtuvieron una media de 1,92, una



asimetría positiva de 0,142, lo que quiere decir que hay menor probabilidad de


69

Uso de herramienta de Big Data

Entorno de Trabajo “Cloud Platform”

Antes De empezar a usar los servicios de Google Cloud Platform, se debe

establecer o crear el proyecto, se la asignado el nombre “Tráfico”, Crear un

proyecto es tan sencillo, tan solo se debe escoger la opción Crear un nuevo

proyecto y asignarle un nombre

Figura 5. Google Cloud Platform Creación de proyecto


Fuente: Propia

Figura 6. Google Cloud Platform Nombre de proyecto


Fuente: Propia

70

Gracias a esta solución tecnológica se puede obtener el uso de las herramientas

necesarias, de forma fácil, rápida y eficaz para el desarrollo del proyecto la cual

cuenta con una amplia gama de servicios virtualizado de hardware y software las

cuales se presentan a continuación. Para esta investigación se ha usado los

servicios Compute Engine y BigQuery

Figura 7. Google Cloud Platform


Fuente: Propia

Compute Engine

Para el inicio del proyecto se necesita trabajar con una máquina virtual que

tenga la capacidad suficiente para ejecutar las consultas masivas de

información, esta con la capacidad tanto de disco de almacenamiento como de

memoria RAM y con la compatibilidad necesaria para el relacionamiento de

todos los datos y sistemas necesarios estos que se ejecutan en los innovadores

centros de datos de Google y están vinculadas a través de una red de fibra a

71

nivel mundial. La máquina virtual se inicia rápidamente, disponen de

almacenamiento de disco persistente y proporcionan un rendimiento uniforme.

Se ha creado una la máquina virtual Datalab-instance-trafic, en la cual se ha

configurado el número de procesadores y memoria que contiene.

Figura 8. Compute Engine


Fuente: Propia

Una vez creada la máquina virtual, se establece los recursos, memoria y

procesadores para determinar qué tan veloz se necesite que sea esta.

Figura 9. Recursos de Compute Engine


Fuente: Propia

72

Tal como se visualiza en la figura anterior se puede conocer los recursos de la

máquina virtual, Compute Engine permite visualizar en cualquier momento los

recursos y el uso de CPU de la MV, esta se iniciará cada vez que se desea

utilizarla tan solo con dar clic en Iniciar.

BigQuery

Con esta sencilla aplicación se ejecutará consultas de los conjuntos de datos de

muestra disponibles y mostrará el resultado. Almacenar y consultar conjuntos de

datos masivos puede llevar mucho tiempo y ser costoso sin el hardware y la

infraestructura adecuados.

Google BigQuery se ha introducido información de tránsito vehicular por medio

de archivos csv, cargar la información es muy fácil, sin embargo antes de subir la

información se debe estructura la tabla con los datos y sus respectivos tipos de

datos, como se puede observar en la siguiente figura.

Figura 10. BigQuery Carga de datos


Fuente: Propia

73

Tal como se puede observar en la figura anterior se debe seleccionar el archivo

csv que se desea almacenar, se coloca un nombre a la tabla, y luego se procede

a establecer los diferentes campos y seleccionar “Create Table” y nuestra nueva

nueva tabla contendrá los datos subidos. Nuestra tabla se llama “traficodemo”

Una vez creada se visualizará en la parte derecha de la interfaz, se puede crear

n tablas, para nuestro estudio se ha enfocado en la tabla anteriormente

mencionada. Se puede ver el esquema que contiene los datos y los tipos de

datos de la tabla, los detalles de la tabla que contiene los atributos de la tabla, y

Preview que contiene los datos que se cargaron.

Figura 11. BigQuery Esquema


Fuente: Propia

Figura 12. BigQuery Detalles de tabla

74


Fuente: Propia

Figura 13. BigQuery Preview


Fuente: Propia

75

BigQuery no solo ha permitido cargar información y almacenarla, sino también

permite realizar consultas de tal manera que puede ser filtrada o consultada solo

la información que se necesite. La siguiente figura muestra una consulta de la

tabla que se creó anteriormente, filtrado por el año 2018, entonces solo permite

visualizar tal información, además se puede exportar la información a un archivo

csv.

Figura 14. BigQuery Consulta


Fuente: Propia

Datalab

Esta herramienta interactiva se utilizará para explorar datos, analizarlos y

visualizarlos, así como desarrollar modelos en Google Cloud Platform. Se

ejecuta en Google Compute Engine y se conecta fácilmente a varios servicios de

la nube para que puedas centrarte en las tareas relacionadas con la ciencia de

datos.

76

Se ha establecido esta herramienta para analizar nuestros datos, es fácil e

interactiva de usar, es escalable puede manejar información desde megabytes

hasta terabytes de manera rápida.

Para usar Datalab se ha instalado dentro de Google Cloud Platform a través de

la Shell de esta plataforma. Se coloca lo siguiente: google components install

datalab

Figura 15. Google Cloud Platform Shell


Fuente: Propia

Figura 16. Instalación Datalab


Fuente: Propia

Una vez instalado Datalab, para comenzar a usarla se debe iniciar la instancia

“datalab-instance-trafic”, además en la Shell se debe colocar lo siguiente:

datalab connect datalab-instance-traffic

77

Figura 17. Iniciar datalab


Fuente: Propia

Una vez instalado Datalab en Google Cloud Platform se debe ingresar a Datalab

por medio del icono “Vista previa” y automáticamente se abrirá Datalab en otra

pestaña del navegador web y se puede comenzar a trabajar con esta

herramienta, Datalab permite crear notebooks que son carpetas en la cual el

usuario coloca su trabajo y así poder tener una mejor organización de todo lo

que realiza. Se ha creado un notebook llamado “Demostracion”

Figura 18. Datalab Notebooks


78

Fuente: Propia

Se ingresará al notebook “Demostracion”, en este libro en cual se ha realizado

algunas consultas para poder analizar y visualizar que información contiene.

Debido a que se ha instalado Datalab en la plataforma de Google Cloud, esta

puede acceder a los demás servicios, se ha usado la información de tránsito

almacenada en Big Query

Figura 19. Datalab Consulta


Fuente: Propia

79

Se puede acceder a los datos de BigQuery especificando el id de la tabla que se

desea visualizar, se puede realizar sin número de consultas, y obtener solo la

información que se necesite, en este caso se muestra la información de tránsito

por fecha, hora, mes en forma de tabla, en la cual se puede realizar el análisis

descriptivo, el cual consiste en usar datos históricos, identificar su

comportamiento, cuenta como van pasando las cosas hasta el momento,

permitiendo visualizar, detectar e identificar la situación de las cosas. Por medio

de Datalab se pudo realizar el análisis descriptivo debido a que contiene y

permite visualizar la información histórica, permitiendo conocer en qué mes hay

más tránsito o en qué mes no hay mucho tránsito, o cuánto ha incrementado el

tránsito de un año a otro, y lo permite realizar de manera rápida, debido a que

Datalab es una herramienta que procesa grandes cantidades de datos en

segundos. Para mejor análisis y visualización se lo puede realizar por medio de

gráficos, el cual se puede observar en la figura 34

IBM Cognos TM1

Además de la herramienta usada anteriormente, se decidió usar IBM Cognos

Tm1 para analizar gran cantidad de datos, debido a que permite manejar

grandes datos a una gran velocidad y permite realizar cubos de información

Se creó un cubo de información que contenga los datos de tránsito del cantón La

Libertad. IBM Cognos TM1, posee la herramienta Performance Modeler que

permitirá desarrollar nuestro modelo.

Para crear el cubo de información, se ha definido las siguientes dimensiones,

estas pueden ser métricas que contienen elementos cuantitativos, indicadores

que permite conocer el estado del tránsito vehicular y accidentes, dimensión de

tiempo que contienen los meses y años, dimensiones genéricas que contienen

elementos generales.

80

Cuadro N 35 Dimensión factores

Dimensiones Tipo de dimensión

Descripción

factores métrica Contiene las medidas que permiten visualizar los datos

indicador métrica indicador Contiene los elementos que permite visualizar el estado de un

elemento

mes_continuo tiempo Contiene los meses desde enero 2016 hasta febrero 2018

zonas genérica Contiene las zonas en la que se divide el cantón.

horas genérica Contiene los intervalos de


Fuente: Propia

A continuación se muestra el contenido de cada dimensión

Figura 20. Dimensión factores


Fuente: Propia

81

Figura 21. Dimensión indicador


Fuente: Propia

Figura 22. Dimensión mes_continuo


82

Fuente: Propia

Figura 23. Dimensión zona


Fuente: Propia

Figura 24. Dimensión horas


Fuente: Propia

83

Una vez definida las dimensiones se las coloca en el cubo de datos, para ello

solo se debe arrastrar las dimensiones desde el panel izquierdo hacia el cubo,

cuando se defina el cubo se ingresa la información que corresponde al tránsito

vehicular, el cubo es una multiplicación de todas las dimensiones, por lo cual

resulta fácil visualizar la información y filtrarla como se requiera observar.

Figura 25. Cubo Transit


Fuente: Propia

Como se observa en la figura anterior, se ve el siguiente cruce: mes_continuo,

tránsito, horas, año actual, zona 3, sin embargo se puede ver diferentes cruces o

filtros, por ejemplo la figura siguiente en la cual se visualiza: horas,

mes_continuo, tránsito, ano anterior, zona 2

84

Figura 26. Cruce Cubo Transit


Fuente: Propia

También se ha colocado la cantidad de accidentes del cantón en su respectivo

mes y hora, en el mismo cubo de información.

Figura 27. Cruce Cubo Transit: Accidentes


Fuente: Propia

85

IBM Cognos TM1 Performance Modeler también permite realizar Diagramas, en

la cual se puede subir una imagen que servirá para visualizar de manera gráfica

la información, además de indicar las medidas o información que se desee

visualizar para realizar nuestro análisis descriptivo de manera rápida y fácil. Se

ha cargado la imagen “zonas la libertad”, la cual está dividida por tres zonas para

analizar de mejor manera el tránsito vehicular, para incluir los indicadores en el

mapa solo se debe arrastrar los elementos del panel izquierda en la ubicación

que se requiera en el mapa, como se visualiza en la siguiente figura.

Figura 28. Diagram en TM1


Fuente: Propia

Para ver su efecto e impacto se puede visualizar en la figura 37, en la cual los

analistas podrán ver la información de una manera que le permita interpretar los

datos.

86

Uso de Mapas Cognitivos Difusos

Aunque nuestro enfoque principal no son los Mapas Cognitivos Difusos y no

permite manejar Big Data, sin embargo se ha decidido hacer uso de estos,

debido a que también ayuda analizar la situación del tránsito vehicular y poder

analizar la situación para tomar alguna decisión.

El agigantado crecimiento en la población y el sector productivo, demanda a los

gobiernos locales la indagación en relación a las soluciones eficientes para los

conflictos de movilidad del cantón La Libertad.

Para identificar los nodos o factores y el peso de cada nodo, se consulta a

especialistas en el tema, se realizan preguntas que ayuden a identificar los

factores que inciden en el problema, por lo cual algunos expertos en el área de

gestión vehicular y en base a sus criterios ayudaron a realizar el mapa cognitivo

difuso con los diferentes pesos de cada nodo. (Leyva Vásquez, Pérez Teruel,

Febles Estrada, & Gullín González, 2013).

Para nuestro estudio se pidió la ayuda de expertos en la gestión de movilidad

vehicular mencionados en el cuadro 6 se realizó una entrevista a estos

profesionales para conocer los factores del tránsito vehicular en el cantón, (la

entrevista que se puede visualizar en el capítulo tres de este documento) y

además con su experiencia y conocimiento en el tema identificaron los

principales factores que afectan a la gestión del tránsito vehicular, en la cual se

concluyó se tendrá ocho variables o nodos: Semáforos dañados, Accidente.

Cantidad de Vehículos. Vías en mal estados. Lluvia, Señales en buen estado,

Trabajos en vías y Congestionamiento vehicular. A continuación se mostrará un

cuadro con los nodos con su respectiva descripción.

La matriz de adyacencia es una matriz que muestra los pesos que tienen entre

un nodo a otro. La matriz es muy sencilla de realizar, sólo se escribe los pesos

87

que tiene un nodo sobre otro nodo, los cuales fueron definidos por los 10

expertos en el área de gestión vehicular.

Cuadro N 36 Nodos de Mapa Cognitivo Difuso


Fuente: Propia

Para poder efectuar la relación que hay entre un nodo y otro, hay que considerar

dos preguntas:

¿Cuándo este componente incrementa, el otro componente incrementa o

decrementa?

¿Este incrementa o decrementa altamente, este incrementa o decrementa

mediamente o este incrementa o decrementa bajamente.

También se debe considerar que los valores que se pueden colocar para indicar

la influencia entre componente se encuentran en el rango de 1 al -1, para indicar

el peso que tiene un nodo sobre otro

Nodos Descripción

C1 Señales deTránsito en buen estado

C2 Semáforo en buen estado

C3 Lluvia

C4 Trabajos en las vías

C5 Vías en mal estado

C6 Congestionamiento vehicular

C7 Accidente

C8 Buen clima (No hay lluvias)

88

Figura 29. Mapa Cognitivo Difuso del Tránsito Vehicular


Fuente: Propia

Se realizará la lectura de un nodo para comprender cómo se lee el modelo: Si

los accidentes incrementan (C7), la congestión vehicular incrementa (C6).

De esta manera se realiza la lectura de cada nodo o concepto de nuestro

modelo, para mayor comprensión.

Se ha considerado la variable lingüística Cantidad con sus respectivas etiquetas

lingüísticas, las cuales ayudarán a darle un valor y sentido a nuestra variable de

estudio.

89

Cuadro N 37 Etiqueta Lingüística

Etiquetas Lingüísticas Valor

Demasiado 1

Medianamente mucho

0.5

Mucho 0.25

0

Poco -0.25

Mediamante Poco -0.50

Muy poco -1


Fuente: Propia

Una vez construido el MCD, se realiza la matriz adyacente: se coloca todos los

conceptos tanto en filas como en columnas (cabecera) y se ubica los pesos de

cada nodo que definimos en el modelo en su respectiva celda. Las relaciones

que existen en cada nodo, se deben detallar en la matriz de adyacencia,

indicando su peso

A continuación se visualizará representación de la matriz de adyacencia

90

Cuadro N 38 . Caso de Estudio: Representación de matriz de

adyacencia

C1 C2 C3 C4 C5 C6 C7 C8

C1 W11 W12 W13 W14 W15 W16 W17 W18

C2 W21 W22 W23 W24 W25 W26 W27 W28

C3 W31 W32 W33 W34 W35 W36 W37 W38

C4 W41 W42 W43 W44 W45 W46 W47 W48

C5 W51 W52 W53 W54 W55 W56 W57 W58

C6 W61 W62 W63 W64 W65 W66 W67 W68

C7 W71 W72 W73 W74 W75 W76 W77 W78

C8 W81 W82 W83 W84 W85 W86 W87 W88


Fuente: Propia

A continuación se observará la matriz de adyacencia con los respectivos pesos

que se coloca en el MCD

Cuadro N 39 . Matriz adyacencia del MCD

C1 C2 C3 C4 C5 C6 C7 C8

C1 0 0 0 0 0 -0.64 0 0

C2 0 0 0 0 0 -0.75 0 0

C3 0 0 0 0 0.5 0.78 0 0

C4 0 0 0 0 0 0.53 0.67 0

C5 0 0 0 0 0 0.56 0.8 0

C6 0 0 0 0 0 0 0 0

C7 0 0 0 0 0 0.58 0 0

C8 0 0 0 0 0 -0-56 0 0

91


Fuente: Propia

Una vez obtenida la matriz de adyacencia en la cual se encuentran los pesos

determinados por los expertos, se necesita establecer los patrones de entrada

también llamado vector de entrada para poder simular los escenarios que se

necesite analizar.

El vector de entrada es el siguiente:

E = [E1 E2 E3 E4 E5 E6 E7 E8]

E = [0 0 0 0 1 0 0 0]

Cero significa que el nodo está apagado y 1 que el nodo esta prendido, también

se pueden usar valores comprendidos desde -1 hasta 1, en este caso se

encenderá E5 y se le coloca un valor de 1, y el resto de los nodos quedan

apagados. Los valores del vector de entrada dependerán de que se quiera

analizar en determinado momento.

Cuadro N 40 . Multiplicación de vector de entrada con matriz

adyacencia

VR= [E1 E2 E3 E4 E5 E6 E7 E8]

C1 C2 C3 C4 C5 C6 C7 C8

C1 W11 W12 W13 W14 W15 W16 W17 W18

C2 W21 W22 W23 W24 W25 W26 W27 W28

C3 W31 W32 W33 W34 W35 W36 W37 W38

C4 W41 W42 W43 W44 W45 W46 W47 W48

C5 W51 W52 W53 W54 W55 W56 W57 W58

C6 W61 W62 W63 W64 W65 W66 W67 W68

C7 W71 W72 W73 W74 W75 W76 W77 W78

C8 W81 W82 W83 W84 W85 W86 W87 W88

92


Fuente: Propia

Se debe realizar la multiplicación del vector con la matriz de adyacencia, en la

cual se obtiene un vector resultante

VR1= [R1 R2 R3 R4 R5 R6 R7 R8]

Se aplica la fórmula 1, donde x es cada elemento del vector resultante, se aplica

esta función en todos los elementos del vector resultante VR de la multiplicación,

obteniendo un nuevo vector resultado ya habiendo aplicado la función sigmoidal.

VS= [S1 S2 S3 S4 S5 S6 S7 S8

Nuestro vector resultante VS, será nuestro nuevo vector de entrada en la

siguiente iteración, realizar este procedimiento para los vectores resultantes VS

en cada iteración, este proceso continúa hasta cuando los valores de entradas y

los valores de salida sean los mismos.

Las iteraciones se las visualizará en el cuadro 42 que mostrará cual es nuestro

vector resultante, para analizar este escenario y ver el resultado de nuestro MCD

Mental Modeler

Mental Modeler permite modelar de manera ágil nuestro MCD, agregando los

factores o componentes de nuestra problemática, los cuales se pueden

visualizar en el cuadro 36, que como ya se había mencionado se realizaron con

ayuda de criterios de expertos para saber cuáles eran los componentes

necesarios para desarrollar nuestro MCD. Los expertos son los encargados de

definir las relaciones entre un nodo a otros y definir los pesos de las diferentes

relaciones entre estos.

93

Figura 30. Mental Modeler: Mapa Cognitivo Difuso


Fuente: Propia

La herramienta llena automáticamente los valores en la matriz cuadrada

dependiendo del peso y las relaciones entre los factores, los cuales se colocaron

al realizar el modelo, es decir agiliza la labor de estar llenando celda por celda.

En la siguiente figura se muestra la matriz de adyacencia en Mental Modeler.

Figura 31. Mental Modeler: Matriz de adyacencia

94


Fuente: Propia

Mental Modeler coloca los valores de entrada y salida de cada nodo y calcula la

centralidad que posee cada nodo, optimizando tiempo al usuario, debido a que lo

realiza de manera automática.

Figura 32. Mental Modeler: Centralidad de los nodos


Fuente: Propia

Tal como se visualiza en la imagen anterior se suma todos los pesos que

ingresan (Indegree) y salen (Outdegree) de los diferentes nodos, para hallar la

centralidad se suman los pesos entrantes y salientes de los nodos y obtener

cuál es el nodo relevante, en nuestro caso es el Congestionamiento vehicular,

debido a que tiene la mayor centralidad

Se ingresa nuestro vector de entrada, es decir que conceptos consideramos

encender para conocer en cuánto influye al resto de los nodos

95

Figura 33. Mental Modeler: Vector de entrada


Fuente: Propia

En la figura anterior observamos que encendemos el nodo Vías en mal estado,

asignando el valor lo cual indica que en este escenario hay demasiadas vías en

mal estado 1 (el valor lingüístico del nodo se lo conoce por medio de los valores

lingüísticos definidos en el cuadro 27). Una vez establecida que escenario,

Mental Modeler permitió conocer el resultado de este escenario (ver figura 40).

96

CAPITULO IV

RESULTADOS

Es preciso dar a conocer cuáles han sido los resultados obtenidos en esta

investigación, por medio del análisis de la información de movilidad vehicular y la

determinación de los factores que inciden en el tránsito vehicular.

Para el análisis de los datos se usó la herramienta Datalab y TM1 Performance

Modeler que permitió examinar la información del tránsito vehicular rápidamente

y eficaz. Para identificar los factores de la gestión de movilidad vehicular se han

usado Mapas Cognitivos Difusos desarrollado en la herramienta Mental Modeler.

A continuación se observará los resultados con Datalab

Resultado con Datalab

Se analizaron los datos de tránsito del cantón por medio de la herramienta de

Big Data Datalab desde Google Cloud Platform, la cual permitió realizar

consultas del tránsito vehicular y así mismo realizar gráficos que permitirán

visualizar de mejor manera los datos o la información con respecto al flujo de

tránsito en sus respectivos meses para mejor comprensión.

Los gráficos ha permitido visualizar la información de manera rápida lo cual

permitió sacar un análisis descriptivo de cómo es la situación actual del tránsito

por la que atraviesa el cantón La Libertad, de esta manera el analista sabrá

cuáles son los meses más transitados, y así dar a conocer esta información a los

encargados de la gestión de movilidad vehicular, para que tengan mejor

organización de la gestión de movilidad vehicular, debido a que este problema

afecta a toda la población en general.

En el eje x estarán contemplado los meses desde Octubre 2017 hasta Febrero

2018 y en el eje y la cantidad de vehículos transitados en esos meses

97

Figura 34.Resultado del análisis de la información de tránsito en Datalab


Fuente: Propia

Como se observa en la figura anterior, en el mes de noviembre hubo menos

tránsito, tal vez porque aún no empezaba la temporada de playa, o que en Enero

es el mes más transitado, porque los estudiantes empiezan a salir de la escuela

y las familias deciden ir a las playas del cantón, gracias a la información histórica

con la ayuda de Datalab se da a conocer todo el tránsito del cantón y así ayudar

a los encargados de la gestión vehicular a tomar decisiones y conocer de mejor

manera y rápida y oportuna la situación actual por la que atraviesa el cantón.

Resultado con la herramienta IBM Cognos TM1

Performance Modeler

Los cubos de TM1, permite conocer el estado de cada elemento usando

métricas (tránsito y accidentes) e indicadores (estados, que realiza una

comparación con el año anterior y tendencias realiza una comparación con el

mes anterior) a través de semáforos (rojo indica advertencia, verde un estado

satisfactorio, amarillo indica precaución), dimensión de tiempo (meses con los

años 2015, 2016) , dimensiones genéricas (horas, que contiene los rangos de

horas y zonas que las 3 zonas en que está dividida en cantón)

98

A continuación se interpretará el resultado de la información por medios los

indicadores.

Figura 35. Resultado Cubo Transit


Fuente: Propia

En la figura anterior indica que en la zona 2, ha incrementado el tránsito con

respecto al año anterior, es decir el año 2016 con respecto al año 2015, además

se observa la tendencia de los meses, en el mes de Febrero 2016 ha

incrementado con respecto al mes anterior Enero 2016, de esta manera los

analistas podrán conocer rápidamente la información como un todo, sin

necesidad de armar más cubos de información debido a que un cubo puedo

contener grandes cantidades de datos.

También se ha incluido la información de accidentes, por lo cual se puede

interpretar los resultados de los accidentes

Figura 36. Resultado accidentes Cubo Transit

99


Fuente: Propi

En la figura anterior indica que en la zona 1, hay diversos estados, por ejemplo

en Enero 2017 se observa que ha incrementado los accidentes con respecto a

Enero 2016, da como resultado un indicador rojo, en cambio en Marzo 2017

han disminuido los accidentes con respecto a Marzo 2016, por lo cual muestra

un indicador verde. Además se ha podido ver la tendencia de los meses con

respecto a la cantidad de accidentes, si se observa el mes de Mayo 2017 ha

incrementado la cantidad de accidentes con respecto al mes anterior Abril 2017,

que hubieron más accidentes, y así conocer en que fechas hay más accidentes

vehiculares y de esta manera poder analizar la información y poder tomar

decisiones importantes que ayuden a la gestión vehicular.

Además la herramienta permite visualizar de otra forma la información por medio

de diagramas, en la cual se define los indicadores (estado y tendencias), una

métrica (tránsito), dimensión de tiempo (año y meses) y la dimensión genérica

horas, para poder interpretar el resultado de manera gráfica.

A continuación se visualiza el diagrama

Figura 37. Visualización Diagrama Transit

100


Fuente: Propia

Una vez definido el diagrama, se puede visualizar en el mapa cómo se

encuentra el tránsito vehicular en las diferentes zonas del cantón La Libertad, en

la figura anterior, se visualizará la información del mes de Febrero 2017 y la hora

desde las 0:00 hasta 3:00, en la cual da como resultado que el tránsito en ese

intervalo de tiempo no es mucho, debido que muestra indicadores verdes, lo cual

que no hay problema en ese rango de hora. En la siguiente se visualizará otro

rango de hora

Figura 38. Visualización Diagram Transit 6-9 am

101


Fuente: Propia

Tal como se visualiza en la figura anterior, muestra los indicadores en el horario

de 6:00 a 9:00 am, se pudo mostrar que ese intervalo de hora si hay tránsito

pesado, excepto en la zona 3, debido a que a esa hora la gente sale de su casa

a su trabajo hay gran cantidad de vehículos sin embargo en la zona 3, no hay

edificios, empresas o negocios se interpreta que allí no hay muchos vehículos

circulando por esa zona.

En la figura siguiente se muestra los indicadores de accidentes de Febrero del

2016 en el intervalo de hora 3:00 a 6:00 am, se observa que los accidentes han

disminuido con respecto a los accidentes de Febrero 2015.

Figura 39. Visualización Diagrama Accidentes

102


Fuente: Propia

Con IBM Cognos TM1, se ha podido analizar el impacto que tiene usar Big Data

en una herramienta que permite visualizar de manera ágil la información, es una

herramienta que es de gran ayuda a los directores de área de la gestión

vehicular, debido a que a ellos les interesa ver el resultado rápidamente y

oportuna por medio de diagramas podrá interpretarlos para la toma de

decisiones, y dar a conocer el estado y la tendencia de éstos factores.

Resultados de Mapas Cognitivos Difusos

Además por medio del uso MCD y con ayuda de Mental Modeler se identificaron

los distintos factores y escenarios que pueden ocurrir en el cantón La Libertad en

cuanto a la movilidad vehicular.

Una vez construido el MCD y obtenido la matriz de adyacencia, en la cual esta

herramienta se identifica el peso y relación de cada nodo, se debe evaluar la

centralidad de un nodo para conocer cuál es el nodo importante, esta se lo

103

encuentra por medio de las entradas y salidas de un concepto. Para hallar las

entradas de un concepto se debe sumar todos los valores entrantes de dicho

nodo, para hallar las salidas de un concepto se debe sumar todos los valores

salientes de dicho nodo.

Cuadro N 41 . Resultado de la Centralidad de los nodos

Nodo Entradas Salidas Centralidad

C1 0 0.64 0.64

C2 0 0.75 0.75

C3 0 1.28 1.28

C4 0 1.20 1.20

C5 0.5 1,36 1.86

C6 4.4 0 4.4

C7 1.47 0.58 2.05

C8 0 0.56 0.56


Fuente: Propia

Como se puede ver en la figura anterior el nodo C6 que corresponde al

Congestionamiento vehicular, es el nodo que se ve afectado, es decir es nuestro

nodo relevante y al que hay que ponerle atención

Cuadro N 42 . Iteraciones del MCD

Iter. Vector entrada Vector de salida

1 0,0,0,0,1,0,0,0 0.5, 0.5, 0.5 ,0.5, 0.5, 0.64, 0.69, 0.50

2 0.5, 0.5, 0.5 ,0.5, 0.5, 0.64, 0.69, 0.50 0.5,0.5,0.5 ,0.5, 0.56, 0.59, 0.68, 0.50

3 0.5, 0.5, 0.5 ,0.5, 0.56, 0.59, 0.68, 0.50 0.5,0.5,0.5 ,0.5, 0.56, 0.60, 0.69, 0.50

4 0.5, 0.5, 0.5 ,0.5, 0.56, 0.60, 0.69, 0.50 0.5,0.5,0.5 ,0.5, 0.56, 0.60, 0.69, 0.50

104


Fuente: Propia

El número de iteraciones no es definido ni por la cantidad de conceptos, ni por

los pesos, sino que se realiza una multiplicación del vector de entrada con la

matriz adyacente y repite hasta que el vector de salida sea igual que el vector de

entrada.

Mental Modeler

Mental Modeler permite realizar n escenarios con el fin de analizar diferentes

situaciones. Se ha determinado un escenario en el cual hay demasiadas Vías en

mal estado (ver figura 33) y poder conocer cómo influye esta situación en los

demás nodos

Figura 40. Mental Modeler: Resultado de análisis

105


Fuente: Propia

Como se observa en la figura anterior se ve el efecto que tiene el modelo cuando

hay demasiadas Vías en mal estado, por lo cual se ve afectado el

Congestionamiento vehicular y los Accidentes. Si se observa la figura 30, Vías

en mal estado está directamente relacionado con los factores mencionados

anteriormente, por ende da como resultado que se incremente el

Congestionamiento vehicular y los Accidentes.

Análisis del impacto del uso de Big Data en la

gestión de movilidad vehicular del cantón La Libertad

106

Para identificar el impacto del uso de Big Data en cuanto a la movilidad

vehicular del cantón se realizó una entrevista (ver anexo B) a la Arq. Kelly

Lara, quien está encargada de analizar la información de tránsito

vehicular de la Comisión de Tránsito del Ecuador. Con esta entrevista se

logró obtener información acerca del proceso de análisis de flujo

vehicular que realizan actualmente, y así poder realizar una comparación

con el estudio del uso de Big Data contemplada en esta tesis.

Los analistas de tránsito vehicular usan Autocad para colocar la

ubicación del accidente y Word para redactar los realizar los informes de

accidentes. Para realizar el análisis de información de flujo vehicular los

analistas de la Comisión de Tránsito del Ecuador usan la herramienta

Microsoft Office Excel, en la cual manejan los datos del tránsito vehicular

y los accidentes,

Esta información se encuentran en diferentes archivos de Excel, ya que

puede ser segregada por años, por meses o por zonas, elaborar esta

segmentación puede demorar hasta 4 horas, esto dependerá de lo que

se desee analizar, debido a que son archivos con gran cantidad de

información, se vuelven pesados, el hecho de solo abrir un documento

con esta información, puede tardar de 5 a 10 minutos y realizar alguna

pequeña modificación en los datos del archivo toma más de 10 minutos,

con ayuda de Big Query y Tm1 Performance Modeler esto dejará de ser

un problema ya que permite cargar una gran cantidad de información de

flujo vehicular y almacenarla, lo cual permitirá visualizar la información

rápidamente en el momento que se necesite y tener consistencia en los

datos.

Si se requiere alguna información específica se realizan tablas

dinámicas, esta se construye de tal manera que podamos visualizar la

información de tránsito y accidentes vehicular como se necesite, una vez

definida la tabla dinámica con esos datos se realiza los gráficos en Excel

con la información que se necesita para nuestro análisis, con el uso de

107

Datalab y TM1 Performance Modeler se puede observar toda la

información rápidamente y filtrar información específica en un segundo.

Dependiendo de la cantidad de archivos e información se necesita entre

2 a 3 analistas de tránsito vehicular, debido a que cada analista posee

sus propios archivos de Excel. Realizar todo este proceso para hacer un

análisis puede llevar de 4 horas, con TM1 Performance Modeler se tiene

la información en un sola plataforma, por lo cual no se requiere de

muchos analistas para obtener una información específica, solo se debe

acceder a ella, esto ayuda a optimizar tiempo valioso para realizar el

análisis.

Consolidar los datos de tránsito vehicular es una tarea tediosa debido a

que se debe recopilar la información de los archivos que contengan la

información, debido a que TM1 Performance Modeler permite construir

cubos de información que contiene todos los datos del tránsito vehicular

y accidentes, permite ver la información consolidada en cuestión de

segundos.

El proceso para realizar un análisis de la información de flujo vehicular se

lo realiza solo 2 veces al mes o cuando el director del área de tránsito

vehicular necesite visualizar información para tener conocimiento del cuál

es la situación con respecto al tránsito vehicular, con Datalab y TM1

Performance Modeler debido a que se puede visualizar la información al

instante, el análisis se lo puede realizar constantemente y ágilmente.

Conclusión

El impacto del uso de Big Data radica en que se puede tener gran

cantidad de información en una sola plataforma de tal manera que sea

accesible y fácil de usar, conocer rápidamente el estado del flujo

vehicular en los diferentes meses y años, consistencia en los datos, tener

grandes cantidades de información de manera consolidada, realizar un

análisis de la información de flujo y accidentes vehiculares en poco

tiempo, lo cual optimiza horas valiosas para la organización.

108

Pregunta científica

¿Mediante el uso de Big Data se pudo lograr un impacto en la

gestión de movilidad vehicular en el cantón La Libertad?

Cuando se habla de Big Data, es referirse a gran cantidad de datos, el

uso de esta tecnología, permitirá gestionar grandes volúmenes de

información, el análisis oportuno de los datos es clave para impulsar el

rendimiento de las organizaciones, debido a que el analista siempre

busca obtener información de fácil acceso y rápidamente.

Al usar la gran cantidad de información de la movilidad vehicular con

ayuda de herramientas Big Data como Datalab y la herramienta TM1

Performance Modeler, generó un impacto en la gestión de movilidad

vehicular debido a que permite realizar un análisis descriptivo de los

grandes datos de una manera fácil y rápida en la cual se puede conocer

cuál es el comportamiento del tránsito y accidentes vehiculares del

cantón La Libertad, optimizando tiempo valioso para los analistas de la

información de tránsito vehicular.

109

CONCLUSIONES

Se pudo identificar la situación actual de la movilidad vehicular del cantón

del cantón La Libertad por medio del análisis de la gran cantidad de

información y con la ayuda de la plataforma de Google Cloud, Big Query

y Datalab, además de usar IBM Cognos tm1, el cual permitió realizar

scorcarding para conocer por medio de semáforos el estado de los

factores a lo largo del tiempo, de manera rápida y efectiva.

Se realizó un análisis descriptivo con la información de movilidad

vehicular con la herramienta Performance Modeler, debido a que permitió

construir cubos de información para poder visualizar de mejor manera y

rápidamente esta información, lo cual permite a los encargados de la

gestión de movilidad vehicular a la toma de decisiones.

Se pudo visualizar la información rápidamente y simplificada a través de

gráficos en la cual se muestra los datos de movilidad vehicular y permite

ver en qué mes se concentra el tránsito vehicular, y ayuda a la toma de

decisiones que ayuden a mejorar el tránsitos vehicular, además se

realizó diagramas que permiten ver los indicadores de cada factor y a lo

largo del tiempo, para conocer el estado en las diferentes zonas del

cantón La Libertad

110

RECOMENDACIONES

Realizar un proceso continuo con ayuda de herramienta de Big Data e

identificar las situaciones anómalas que se presenten en el cantón.

Utilizar un software o herramienta que ayude a la recopilación de datos o

de los factores que inciden en el congestionamiento vehicular para tener

información actualizada y diaria, con esto poder realizar el análisis en

determinados momento, puesto que con las nuevas competencias en el

mercado, plataformas existentes pueden ser el gran incentivador para

que otras empresas del sector tomen los valiosos atributos que esta

herramienta ofrece y así propiciar una mejora en la toma de decisiones

de los entes regentes del tránsito y la seguridad vial.

Fomentar una cultura en donde el análisis de Big Data este integrado en

todas partes, facilitando a los analistas en la toma de decisiones basadas

en datos, y no solo confiar en su instinto.

Las técnicas de visualización de la data deben de ir orientados a la

población definiendo lo que realmente requiere. Por tal motivo, se

recomienda realizar un análisis exhaustivo sobre las necesidades de los

habitantes del sector.

Realizar estudio de los factores del congestionamiento vehicular

continuamente para poderlo sobrellevar de mejor manera y no cuando la

situación ya es caótica.

Capacitar a los encargados del área de gestión vehicular con la

tecnología para que puedan resolver los inconvenientes o situaciones

inesperadas de manera ágil y eficaz

111

REFERENCIAS

Alonso, J. A., & Donoso, V. (2003). Competir en el exterior. La empresa

española y los mercados internacionales. Madrid.

Baena, G. (2014). METODOLOGÍA. mexico: Grupo Editorial Patria.

Cañarte Manrique, M. I. (2015). Análisis del uso de big data en las

empresas guayaquileñas sobre la base de plataformas basadas en

tics en el año 2014. Guayaquil.

Cloud Google. (2015). Google Cloud Plattform.

Constitución de la Republica de Ecuador. (2008). Obtenido de

http://www.oas.org/juridico/pdfs/mesicic4_ecu_const.PDF

Dávila, F. (2014). La inteligencia del negocio Business Intelligence.

Espinoza, F., Gordillo, C., Jiménez, R., & Avilés, O. (2013). Machine

vision algorithms applied to dynamic traffic light control.

Feliciano Morales, A., Cuevas Valencia, R. E., & Martínez Castro, J. M.

(2016). Procesamiento Analítico con Minería de Datos. México.

Fletes Gudiño, P., & Farías Mendoza, N. (2013). Especificación formal de

cubos de datos aplicados a la administración de las actividades

docentes. Colima.

Garcia-Cascales, M., & Lamata, M. (2010). Nueva aproximación al

método topsis difuso con etiquetas linguísticas.

google. (Febrero de 2016). Obtenido de

https://cloud.google.com/products/big-data/?hl=es

Grajales G., T. (2000). Tipos de investigación.

Groumpos, P. (2010). Fuzzy Cognitive Maps: Basic Theores and Their

Application to Complex System. Berlin.

112

Guama Morales, S. C. (2015). Estudio Comparativo de Métodos

Existentes para Integrar la Información Estructurada y no

Estructurada de una Industria Enfocado en la Generación de

Conocimiento, Desde la Perspectiva de una Solución Integral de

Big Data. Quito.

Hernandéz, R. (2014). Metodologia de la Investigacion. 6ta Edición.

Mexico: Mc GrawHill.

IBM. (2013). IBM. Obtenido de

https://www.ibm.com/developerworks/library/bd-

archpatterns1/index.html

ibm. (2017). ibm cognos tm1. Obtenido de https://www.ibm.com/us-

en/marketplace/cognos-tm1

IBM. (2017). Understand Cognos TM1 Scorarding. Obtenido de

https://www.ibm.com/support/knowledgecenter/en/SS9RXT_10.2.2/

com.ibm.swg.ba.cognos.prfmdl_ug.10.2.2.doc/TM1_Scorecarding_

overview.html

Ibm Performance Modeler . (2017). Getting started with Cognos TM1

Perfomance Modeler. Obtenido de

https://www.ibm.com/support/knowledgecenter/en/SS9RXT_10.2.2/

com.ibm.swg.ba.cognos.prfmdl_ug.10.2.2.doc/c_prfmdl_usng_prfm

dl.html

INEC. (2016 ). Anueario de transporte 2016. Recuperado el 20 de

noviembre de 2017, de Ecuador en Cifras :

http://www.ecuadorencifras.gob.ec/documentos/web-

inec/Estadisticas_Economicas/Estadistica%20de%20Transporte/20

16/2016_AnuarioTransportes_%20Principales%20Resultados.pdf

Kalický, A. (2013). High Performance Analytics. Prague.

113

ley organica de transporte terrestre transito y seguridad vial. (2014).

Obtenido de http://www.turismo.gob.ec/wp-

content/uploads/2016/04/LEY-ORGANICA-DE-TRANSPORTE-

TERRESTRE-TRANSITO-Y-SEGURIDAD-VIAL.pdf

Leyva Vásquez, M., Peréz Teruel, K., Febles Estrada, A., & Gulín

González, J. (2012). Modelo para el análisis de escenarios

basados en mapas cognitivos difusos estudio de caso en software

biomédico. Bogotá.

Leyva Vásquez, M., Pérez Teruel, K., Febles Estrada, A., & Gullín

González, J. (2013). Mapas cognitivos difusos para la selección de

proyectos de tecnologías de la información.

Lukoianova, T. (2014). ir.lib.uwo. Retrieved from

http://ir.lib.uwo.ca/cgi/viewcontent.cgi?article=1065&context=fimspu

b

Martín, C. (2016). BIG DATA Y HADOOP. Obtenido de Big Data:

http://www.ctic.uni.edu.pe/index.php/tallerhadoop

Mental Modeler Org. (2015). Mental Modeler. Obtenido de

http://www.mentalmodeler.org/

Merca, J. S. (2010). Cómo realizar una revisión sistemática y un meta-

análisis.

Morcillo, C. G. (2013). Lógica Difusa Una introducción práctica.

Papageorgiou, E. I., & Stylios, C. D. (2008). Fuzzy cognitive maps: Basic

theories and their application to complex systems. Berlin.

Pedraza, L. F., Hernández, C. A., & López, D. A. (2012). Control de tráfico

vehicular usando ANFIS. Bogotá.

114

Peréz Teruel, K. (2014). Modelo de proceso de logro de concenso de

mapas cognitivos difusos para la toma de decisiones en grupo.

Habana.

Pesantes Solórzano, L. N., & Pesantes García, D. A. (2017). Análisis y

estudio de big data orientado a los grandes volúmenes de datos y

los principales usos de la información recolectada. Guayaquil.

Rodríguez, M., & Huertas, Y. (2016). Metodología para el diseño de

conjuntos difusos a partir de opiniones de expertos.

Salmeron, J. L., Vidal, R., & Mena, A. (2012). Ranking fuzzy cognitive map

based scenarios with Topsis.

Stach, W. (2010). Leraning and Agregation of Fuzzy Cognitive Maps- An

Evolutionary Approach. Alberta.

UNIVERSIDAD POLITÉCNICA DE MADRID. (2015). Big Data: el futuro a

través. UPM, 1.

Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining

Practical Machine Learning Tool and Techniques. Hamilton.

Zakir, J., Seymoir, T., & Berg, K. (2015). Big Data Analytics. Dakota del

Norte.

115

ANEXOS A

“Matriz Meta-análisis”

128

ANEXOS B

“Entrevista para conocer el análisis del flujo vehicular y

accidentes de tránsito”

130

ANEXOS C

“Solicitud CTE”

134

ANEXOS D

“Cronograma”

UNIVERSIDAD DE GUAYAQUIL -...

Documents

Transcript of UNIVERSIDAD DE GUAYAQUIL -...