Determinación de patrones de ventas en boticas independientes...
Transcript of Determinación de patrones de ventas en boticas independientes...
FACULTAD DE INGENIERÍA
Carrera de Ingeniería Empresarial y de Sistemas
DETERMINACIÓN DE PATRONES DE VENTAS EN
BOTICAS INDEPENDIENTES PARA MEJORAR LAS VENTAS
Tesis para optar el Título Profesional de Ingeniero Empresarial y de
Sistemas
JUAN FRANCISCO MENDOZA BERNEDO
WILDER RAUL ANCHIRAICO BERNAOLA
Asesor:
Mg. Gabriela Cauvi Suazo
Lima – Perú
2018
2
JURADO DE LA SUSTENTACION ORAL
…………………................................
Presidente
…………………................................
Jurado 1
…………………................................
Jurado 2
Entregado el: 31 de agosto de 2018 Aprobado por:
…………………………………….
Graduando
Juan Francisco Mendoza Bernedo
DNI° 43977334
…………………………………… …………….…………………………….
Graduando Asesor de Tesis: Mg. Gabriela Cauvi
Wilder Raul Anchiraico Bernaola
DNI° 42134851
3
UNIVERSIDAD SAN IGNACIO DE LOYOLA
FACULTAD DE INGENIERIA
DECLARACIÓN DE AUTENTICIDAD
Yo, Wilder Raul Anchiraico Bernaola, identificado con DNI° 42134851 y Juan Francisco
Mendoza Bernedo, identificado con DNI°43977334, Bachilleres del programa Académico
de la Carrera de Ingeniería Empresarial y de Sistemas, de la Facultad de Ingeniería de la
Universidad San Ignacio de Loyola, presentamos nuestra tesis titulada: Determinación de
patrones de ventas en boticas independientes para mejorar las ventas.
Declaramos en honor a la verdad, que el trabajo de tesis es de nuestra autoría; que los
datos, los resultados, análisis e interpretación constituyen nuestro aporte. Todas las
referencias han sido debidamente consultadas y reconocidas en la investigación.
En tal sentido, asumimos la responsabilidad que corresponda ante cualquier falsedad u
ocultamiento de la información aportada. Por todas las afirmaciones, ratificamos lo
expresado a través de nuestras firmas.
Lima, 31 de agosto de 2018
…………………………………….. ……..…………………………………
Juan Francisco Mendoza Bernedo Wilder Raul Anchiraico Bernaola
DNI° 43977334 DNI° 42134851
4
Epígrafe
El aspecto más triste de la vida actual,
es que la ciencia gana en conocimiento
más rápidamente que la sociedad en
sabiduría.
(Isaac Asimov)
5
Índice de contenidos
Resumen 14
Abstract 15
Introducción 16
Problema de investigación 17
Identificación del problema 17
Formulación del problema 29
Problema general. 29
Problemas específicos. 29
Marco referencial 30
Antecedentes 30
Estado del arte 32
Marco teórico 34
Minería de datos. 34
Arquitectura de minería de datos. 35
Metodologías para la minería de datos. 37
Metodología KDD. 37
Metodología SEMMA. 39
Metodología CRISP-DM. 40
Comparación de metodologías. 46
Selección de metodología. 48
Herramientas de minería de datos. 50
Rapid Miner. 51
SQL Server Integration Services. 51
R Studio. 52
IBM SPSS Modeler. 53
Evaluación y selección de herramienta. 53
Costo del trabajo. 55
Modelos de análisis. 57
Modelo reglas de asociación. 57
Modelo árbol de regresión. 57
Objetivos 59
Objetivo general 59
Objetivos específicos 59
6
Justificación de la investigación 59
Teórica 59
Práctica 60
Social 60
Hipótesis 60
Hipótesis general 60
Hipótesis específicas 61
Matriz de consistencia 62
Marco metodológico 63
Metodología 63
Paradigma 63
Enfoque 63
Método 64
Variables 64
Independiente 64
Dependiente 64
Población y muestra 65
Población 65
Muestra 66
Unidad de análisis 68
Instrumentos y técnicas 68
Instrumentos 68
Entrevistas. 68
Archivo de datos. 68
Técnicas 69
Procedimientos y métodos de análisis 69
Procedimiento 69
Comprensión del negocio. 70
Comprensión de los datos. 74
Preparación de los datos. 75
Método de análisis. 76
Modelado. 76
Valor del ticket promedio. 76
Rentabilidad. 85
Análisis con reglas de asociación. 95
7
Análisis con árbol de regresión. 105
Resultados 113
Patrones de venta sucursal Chorrillos 113
Patrones de ventas sucursal Huaraz 115
Patrones de ventas sucursal Riva Agüero 116
Patrones de ventas sucursal Túpac Amaru 117
Patrones de ventas sucursal Ventanilla 118
Patrones de ventas empresa Amberfarma 119
Discusión 123
Conclusiones 124
Recomendaciones 125
Referencias 127
8
TABLA 1: Ventas del año 2017 por sucursales 27
TABLA 2: Crecimiento de las ventas del año 2017 por sucursal 29
TABLA 3: Comparación de fases por metodología de minería de datos 47
TABLA 4: Leyenda de evaluación 49
TABLA 5: Evaluación de metodología 50
TABLA 6: Evaluación de herramienta 54
TABLA 7: Costos horas hombre por fase 55
TABLA 8: Costos de servicios y viáticos 56
TABLA 9: Resumen de costos y costo total 56
TABLA 10: Matriz de consistencia 62
TABLA 11: Cantidad de transacciones en el año 2017 65
TABLA 12: Características de hardware de la arquitectura planteada 70
TABLA 13: Descripción del proceso core del negocio 71
TABLA 14: Información de sucursales Boticas Amberfarma 73
TABLA 15: Reglas de asociación sucursal Chorrillos – verano 96
TABLA 16: Reglas de asociación sucursal Chorrillos – invierno 97
TABLA 17: Reglas de asociación sucursal Huaraz - verano 99
TABLA 18: Reglas de asociación sucursal Huaraz - invierno 99
TABLA 19: Reglas de asociación sucursal Riva Agüero – verano 100
TABLA 20: Reglas de asociación sucursal Riva Agüero – invierno 101
TABLA 21: Reglas de asociación sucursal Túpac Amaru – verano 102
TABLA 22: Reglas de asociación sucursal Túpac Amaru – invierno 102
TABLA 23: Reglas de asociación sucursal Ventanilla – verano 103
TABLA 24: Reglas de asociación sucursal Ventanilla – invierno 104
TABLA 25: Patrones de ventas – sucursal Chorrillos 113
TABLA 26: Propuestas de mejora y optimización – sucursal Chorrillos 114
TABLA 27: Patrones de ventas – sucursal Huaraz 115
TABLA 28: Propuestas de mejora y optimización – sucursal Huaraz 115
TABLA 29: Patrones de ventas – Riva Agüero 116
TABLA 30: Propuestas de mejora y optimización – Riva Agüero 117
TABLA 31: Patrones de ventas – Túpac Amaru 117
TABLA 32: Propuestas de mejora y optimización – Túpac Amaru 118
TABLA 33: Patrones de ventas – Ventanilla 118
TABLA 34: Propuestas de mejora y optimización – Ventanilla 119
TABLA 35: Patrones de Ventas – Amberfarma 119
TABLA 36: Propuestas de mejora y optimización – Amberfarma 120
Índice de tablas
9
Índice de figuras
FIGURA 1: Lugar donde compró medicinas, 2017-2014 17
FIGURA 2: Lugar donde compró medicinas, 2014 18
FIGURA 3: Número de empresas comercializadores de farmacéuticos,
2008 - 2014 18
FIGURA 4: Comercio de productos farmacéuticos 19
FIGURA 5: Perú: Número de locales de farmacias, boticas: 2010-15 20
FIGURA 6: Bajas de empresas según trimestre 2015-17 21
FIGURA 7: Organigrama Quicorp S.A. 22
FIGURA 8: Análisis FODA Boticas Amberfama 24
FIGURA 9: Análisis Ishikawa, altos descuentos por inventarios 25
FIGURA 10: Análisis Ishikawa, precios no competitivos 26
FIGURA 11: Ventas por sucursal 2017 28
FIGURA 12: Clasificación de las técnicas de minería de datos 35
FIGURA 13: Arquitectura minería de datos 36
FIGURA 14: Etapas proceso KDD 39
FIGURA 15: Etapas metodología SEMMA 40
FIGURA 16: Esquema 4 niveles de CRISP-DM 41
FIGURA 17: Modelo de proceso de CRISP-DM 42
FIGURA 18: Fases y actividades del proceso de CRISP-DM 46
FIGURA 19: Comparación metodologías KDD, SEMMA, CRISP-DM 47
FIGURA 20: Metodología más utilizada 49
FIGURA 21: Flujo de Rapid Miner 51
FIGURA 22: Elementos del árbol de regresión 58
FIGURA 23: Calculadora de muestra estadística 66
FIGURA 24: Evolución de la muestra de acuerdo al margen de error 67
FIGURA 25: Logotipo del nombre comercial de Boticas Amberfarma 72
FIGURA 26: Consulta query en SQL para obtener data 74
FIGURA 27: Data en crudo obtenida de Base de Datos 75
FIGURA 28: Data al finalizar la fase preparación de los datos 76
FIGURA 29: Ticket promedio mensual Chorrillos 77
FIGURA 30: Ticket promedio mensual Huaraz 77
FIGURA 31: Ticket promedio mensual Riva Agüero 78
FIGURA 32: Ticket promedio mensual Túpac Amaru 78
FIGURA 33: Ticket promedio mensual Ventanilla 79
10
FIGURA 34: Ticket promedio cinco sucursales 80
FIGURA 35: Ticket promedio por sucursal anualizado 81
FIGURA 36: Ticket promedio semanal sucursal Chorrillos 82
FIGURA 37: Ticket promedio semanal sucursal Huaraz 82
FIGURA 38: Ticket promedio semanal sucursal Riva Agüero 83
FIGURA 39: Ticket promedio semanal sucursal Túpac Amaru 83
FIGURA 40: Ticket promedio semanal sucursal Ventanilla 84
FIGURA 41: Ticket promedio semanal cinco sucursales 85
FIGURA 42: Rentabilidad mensual 05 sucursales 86
FIGURA 43: Rentabilidad mensual por cadena en base a sucursales 87
FIGURA 44: Rentabilidad anualizada 05 sucursales 87
FIGURA 45: Productos más rentables Chorrillos 89
FIGURA 46: Productos más rentables Huaraz 89
FIGURA 47: Productos más rentables Riva Agüero 90
FIGURA 48: Productos más rentables Túpac Amaru 91
FIGURA 49: Productos más rentables Ventanilla 91
FIGURA 50: Productos con mayor rotación Chorrillos 92
FIGURA 51: Productos con mayor rotación Huaraz 93
FIGURA 52: Productos con mayor rotación Riva Agüero 93
FIGURA 53: Productos con mayor rotación Túpac Amaru 94
FIGURA 54: Productos con mayor rotación Ventanilla 94
FIGURA 55: Código R para reglas de asociación de Chorrillos en verano 95
FIGURA 56: Árbol de regresión ticket promedio (S/) – verano 107
FIGURA 57: Árbol de regresión ticket promedio (S/) - invierno 108
FIGURA 58: Árbol de regresión rentabilidad promedio(S/) - verano 109
FIGURA 59: Árbol de regresión rentabilidad promedio(S/) - invierno 110
FIGURA 60: Árbol de regresión rentabilidad porcentaje (%) - verano 111
FIGURA 61: Árbol de regresión rentabilidad porcentaje (%) - invierno 112
11
Índice de anexos
ANEXO 1: Ficha entrevista 131
ANEXO 2: Correo DIGEMID 135
ANEXO 3: Diagrama general de flujo proceso core Amberfarma 136
ANEXO 4: Organigrama general Boticas Amberfarma E.I.R.L. 137
ANEXO 5: Organigrama de oficina farmacéutica 138
ANEXO 6: Análisis de resultados de la entrevista 139
ANEXO 7: Análisis VAN y TIR 141
ANEXO 8: Cronograma de actividades 142
ANEXO 9: Riesgos del proyecto 144
ANEXO 10: Arquitectura y flujo de la solución planteada 145
ANEXO 11: Glosario de términos 146
12
Dedicatoria
La presente tesis la dedicamos a nuestros
padres, por enseñarnos con paciencia y amor
a tomar decisiones, ser modelo de nuestra
conducta, por inculcarnos valores,
enseñarnos a trazar metas y ser
responsables socialmente.
13
Agradecimiento
Agradecemos a la empresa BOTICA
AMBERFARMA E.I.R.L. y las demás MICRO
EMPRESAS FARMACÉUTICAS, quienes
nos brindaron información necesaria y de
mucha importancia para la elaboración de la
presente tesis.
14
Resumen
La presente tesis busca determinar los patrones de ventas en una botica independiente
para mejorar las ventas, aprovechando la información histórica con la que cuenta esta
empresa, por medio de un análisis de información a través de técnicas de minería de datos
con algoritmos de reglas de asociación y árboles de regresión, utilizando un software de
análisis de datos.
Las microempresas farmacéuticas y boticas atraviesan problemas en la gestión
y riesgo de subsistencia, debido a la fusión de las dos empresas más grandes de este rubro
con mayor presencia y volumen de ventas en Perú a inicios del presente año. Frente a este
escenario las boticas y micro farmacias se ven obligadas a reinventarse e implementar
nuevas formas de gestión, de servicios, así como nuevas políticas comerciales. A partir de
estos hechos se toma como caso de investigación a la empresa Boticas Amberfarma
E.I.R.L, que es una microempresa con cinco puntos de ventas.
Uno de los problemas en este tipo de farmacias, es que desconocen las
diferentes herramientas tecnológicas que pueden utilizar para mejorar su toma de
decisiones, como la explotación de datos de sus registros históricos. Por consiguiente,
desconocen información relevante para implementar u optimizar políticas de marketing y
gestión tales como: ticket promedio, horario con mayores ventas, productos de poca, baja
y alta rotación, productos de alta, media y baja rentabilidad, productos con alto riesgo de
vencimiento, productos con sobre stock, requerimiento de compras optimas, valorización
de almacenes, productos relacionados entre sí, entre otros.
El objetivo de la tesis es analizar la información histórica de ventas con un
software de minería de datos y determinar los patrones de ventas para que en su posterior
implementación se evidencie principalmente una mejora en los volúmenes de ventas,
trayendo como otros resultados reducción de vencimientos, mejor clima laboral por los
incrementos salariales y menores descuentos, así como mayores volúmenes de márgenes
de utilidad para el propietario o empresa.
Palabras clave: Explotación de datos, minería de datos, optimización de la gestión
farmacéutica, patrones de ventas.
15
Abstract
This thesis seeks to determine the sales patterns in an independent pharmacy to improve
sales, taking advantage of the historical information of this company, through an analysis
of information with data mining techniques and with rules of association and trees
regression algorithms using a data analysis software.
Due to the problematic in the management and the subsistence risk of micro
pharmaceutical companies and pharmacies are immersed, by the merger of the two largest
companies of this business line with the highest presence and sales volume in Peru at the
beginning of the present year, Mifarma and Inkafarma. Faced to this situation, pharmacies
and micro-pharmacies are forced to reinvent themselves and implement new forms of
management, services and new commercial policies. From this context, the Botica
Amberfarma E.I.R.L company, which is a microenterprise in development with five sales
points, is taken as a research case.
Within the problems in this type of pharmacies, is that many of them unknown the
different technological tools that can be used to improve their decision, among them we
could mention the exploitation of data from their historical records, therefore they ignore
relevant information to implement or optimize marketing and management policies such as:
average ticket, hours of higher sales, low and high turnover products, high, medium and
low profitability, products with high risk of expiration, products with over stock, requirement
of optimal purchases, valuation of warehouses, related products, among others.
The objective of the thesis is to analyze the historical sales information with a
data mining software and determine the sales patterns, so that in its subsequent
implementation there will be an improvement in the sales volumes, bringing other results
such as reduction of maturities, better working environment for the salary increases and
lower discounts, as well as higher volumes of profit margins for the owner or company.
Key words: Explode data, data mining, pharmaceutical management optimization, sales
patterns.
16
Introducción
En el Perú, las farmacias o boticas horizontales poseen, por lo general, poco conocimiento
en gestión farmacéutica. Esto se traduce en una serie de problemas, como la ubicación
poco estratégica de sus sedes comerciales, poca capacidad financiera, personal no
capacitado, poco conocimiento en gestión contable, gestión no estructurada, poco o nulo
conocimiento de herramientas digitales de gestión, proveedores poco confiables, entre
otros. Por consiguiente, infringen diferentes normativas del MINSA, por lo cual
constantemente reciben sanciones de parte de la autoridad sanitaria.
En este contexto, ingresan y se desarrollan exponencialmente las grandes
cadenas farmacéuticas, dentro de las principales estrategias que implementan se tienen:
Estrategias de precios alto - bajo (high and low), maquila de productos propios de las
cadenas, ubicaciones estratégicas (por lo general esquinas y frente a hospitales,
mercados, centro comerciales y parques), también una fuerte y dura campaña publicitaria,
este escenario facilita a las cadenas presionar a las farmacias horizontales, en muchos
casos llegando a extinguirlas del mercado. Actualmente, las cadenas farmacéuticas
peruanas vienen optimizando la estructura de su cadena de producción, importación,
distribución y comercialización.
Las principales cadenas farmacéuticas son: Eckerd Peru (Inkafarma) Quicorp
(Mifarma) las dos actualmente pertenecientes al Grupo Intercorp, Boticas y salud S.A.C
(Boticas ByS ), Corporacion Interpharma S.A.C. (Boticas Hogar y Salud) y Farmacias
Hollywood S.A.C.(Boticas Hollywood).
Luego de una investigación del entorno de las farmacias horizontales, se decide
desarrollar una tesis relacionada al caso, para de esta forma proveer de herramientas y
conocimientos alternativos, en base a minería de datos, para enfrentar esta situación de
competencia con las grandes cadenas y mejorar sus ventas.
17
Problema de investigación
Identificación del problema
Vivimos en un país en donde existen diferencias bien marcadas, en relación a los tipos de
empresas de acuerdo a su magnitud, tenemos a las grandes empresas y corporaciones
que se encuentran presentes en varios rubros del mercado peruano, como el mercado
financiero, de alimentos, de educación y otros, así como también el mercado de medicinas
a través de sus grandes cadenas de farmacias. Por otro lado tenemos a las microempresas
y pequeñas empresas que representan la mayor cantidad de empresas en nuestro país.
Siendo un país en desarrollo, los emprendedores a través de sus iniciativas de negocio se
hacen presentes para competir contra las grandes empresas, que dominan el mercado,
como es el caso de las pequeñas farmacias y boticas, quienes con protocolos, procesos y
gestión no optimizada, hacen frente a las grandes cadenas de farmacias.
De acuerdo con un estudio de investigación sectorial del Ministerio de la
Producción referente a la industria farmacéutica, los lugares preferidos por los peruanos
para la adquisición de medicamentos en el año 2014 son las boticas o farmacias,
representando un 85% frente a las otras opciones de lugares de compra. En la siguiente
figura se muestra la cantidad de personas por lugar de compra y su crecimiento desde el
año 2010.
Figura 1. Lugar donde compró medicinas, 2007-2014. Recuperado del Ministerio de la Producción (2015), estudio de investigación sectorial farmacéutica.
18
Figura 2. Lugar donde compró las medicinas, 2014. Recuperado del Ministerio de la Producción (2015), estudio de investigación sectorial farmacéutica
El mismo estudio nos muestra información del número de empresas
comercializadoras de farmacéuticos desde el año 2008 al 2014, donde podemos observar
que existe un crecimiento por año, a pesar de existir una disminución en los últimos años,
el promedio de variación es de 5.1%. La siguiente figura muestra la información descrita.
Figura 3. Número de empresas comercializadoras de farmacéuticos, 2008 – 2014. Recuperado del Ministerio de la Producción (2015), Estudio de investigación sectorial Farmacéutica.
19
En el análisis que realiza este estudio, considerando el estrato, las microempresas
constituyen el 96.9% del total de empresas a nivel nacional. Este tipo de empresas
adquieren sus productos con grandes distribuidores y la venta es realizada en boticas de
su propiedad. En cambio, las grandes empresas, representadas por las cadenas de boticas
y farmacias que tienen presencia a nivel nacional, realizan la venta a través de la gran
cantidad de establecimientos que poseen. La siguiente figura muestra el comercio de
productos farmacéuticos según el tamaño de empresa.
Figura 4. Comercio de productos farmacéuticos. Recuperado del Ministerio de la Producción (2015), estudio de investigación sectorial farmacéutica.
De acuerdo al Anuario Estadístico Industrial, Mipyme y Comercio Interno 2015, la
distribución de locales de farmacias en el mercado peruano era liderado por la empresa
InRetail con su cadena de farmacias Inkafarma, una representación importante en el
mercado farmacéutico en este año fueron Farmacias Peruanas SAC y Mifarma. La
siguiente figura, muestra la cantidad de locales de las grandes cadenas de farmacias y su
crecimiento por año hasta el 2015, donde se puede apreciar que desde el año 2010
Inkafarma tuvo un crecimiento de 382 a 759 locales al año 2015, en comparación al resto
de cadenas. Es la empresa que logró el mayor crecimiento en locales en los 5 años de
análisis del estudio.
20
Figura 5. Perú: Número de locales de farmacias, boticas: 2010-15. Recuperado del Ministerio de la Producción (2015), Anuario Estadístico Industrial, Mipyme y Comericio Interno 2015.
Además, de acuerdo a la información proporcionada por el INEI, indica una
realidad a considerar, ya que las farmacias están catalogadas como empresas, “Al finalizar
el IV Trimestre de 2017, el número de empresas activas en el Directorio Central de
Empresas y Establecimientos ascendió a 2 millones 303 mil 662 unidades, mayor en 8,4%
respecto a similar periodo del año anterior. Asimismo, se crearon 68 mil 416 empresas y
se dieron de baja 34 mil 718 presentando una variación neta de 33 mil 698 unidades
económicas. La tasa de nacimientos de empresas que relaciona las unidades económicas
creadas en el IV Trimestre de 2017 con el stock empresarial representó el 3,0% del total,
mientras que la tasa de mortalidad empresarial fue de 1,5% en el mismo período”.
21
Figura 6. Perú: Bajas de empresas, según trimestre, 2015-17. Recuperado del Instituto Nacional de Estadística e Informática (2018).
A finales de enero de este año, se dio un hecho muy importante en el mercado
farmacéutico del país, donde el grupo Intercorp a través de su compañía InRetail dueño de
Inkafarma, una de las cadenas más grandes del Perú, compró a Quicorp S.A, la empresa
dueña de las cadenas de farmacias Mifarma, BTL, Fasa, Arcángel entre otras,
convirtiéndose así en dueño de alrededor del 95% de la participación del mercado, con
aproximadamente 2245 puntos de venta. Además de integrar a su portafolio de empresas,
al laboratorio Quinfa y a Química Suiza como distribuidor de productos de alto
reconocimiento y demanda dentro del mercado peruano e internacional, logrando de esta
manera tener presencia en todo el ciclo de abastecimiento de medicamentos en el Perú,
siendo importador, productor, distribuidor y comercializador al por menor de productos
farmacéuticos. En la siguiente figura se muestra el conjunto de empresas que conforma
Quicorp S.A.
22
Figura 7. Organigrama Quicorp S.A. Recuperado de Diario Gestión Publicación en Línea (2018-02-03)
Frente a este hecho, los microempresarios farmacéuticos presentan un
riesgo muy grande de no poder subsistir en el mercado, al tener a una sola corporación
dueña de una gran mayoría de las actividades comerciales, de producción, distribución y
comercialización, todo esto apoyado con una gran gama de productos propios registrados
en INDECOPI. Ante el gran poder de negociación de InRetail, se ven obligados a
plantearse nuevas estrategias comerciales y de gestión, para poder afrontar las dificultades
que se les presentarán y poder competir con este gigante de las farmacias.
Es dentro de este contexto, que las pequeñas farmacias y boticas deben evaluar
sus debilidades, como la falta de experiencia, técnicas en gestión administrativa y
financiera, falta de presupuesto para inversión e innovación, personal no capacitado ni
comprometido, falta de plan marketing y ventas, así como el posicionamiento de marca,
falta de almacenes especializados, locales mal ubicados, dentro de los más importantes
servicios no orientados al cliente así como la falta de exploración de datos, ya que en
muchos casos las micro farmacias disponen de software de ventas con información
histórica de las ventas de la gran gama de productos aplicados para el retail farmacéutico,
donde toda esta información no es analizada. Siendo esta última debilidad, el motivo de
este trabajo de investigación, tomando como caso de estudio a Boticas Amberfarma.
Boticas Amberfarma es una microempresa que se encuentra constituida por 5
puntos de venta ubicados en los siguientes distritos de Lima, El Agustino, Chorrillos,
23
Ventanilla y una sucursal en Huaraz. Su planilla consta de 32 empleados, además tiene
contratos de servicios profesionales de 5 personas. Cuenta con un establecimiento para el
almacenamiento de medicinas, el cual es el punto de llegada de la mercadería para luego
ser despachada a cada uno de los puntos de ventas bajo un cronograma establecido de
forma semanal. Cuando la mercadería llega al punto de venta es recibida y registrada,
luego es guardada en los anaqueles de cada local. Posterior a esto, cuando la venta se
realiza, los técnicos extraen los productos de los anaqueles y dispensan la cantidad que
vayan a vender. Todo el flujo del proceso core del negocio se puede observar en el Anexo
3, desde la compra de los productos a los proveedores hasta la dispensación a los clientes.
De acuerdo a lo indicado por el gerente de Amberfarma, su empresa presenta
diversos problemas dentro del proceso descrito anteriormente, entre los cuales menciona
que la demanda de productos por cada punto de venta no es siempre la misma y en caso
de agotarse un producto en algún punto de venta, por no llevar un correcto control de
rotación y stock de producto, solicita un nuevo abastecimiento fuera del cronograma
establecido, ocasionando un gasto adicional a la unidad de despacho. Otro problema
presentado, es en relación a la rotación de los productos, específicamente el riesgo de
mantener en anaqueles de cada punto de venta productos que están próximos a su fecha
de vencimiento, los cuales al convertirse en productos vencidos en anaquel, inician un
proceso de descuento de remuneración al personal encargado de tienda, por no reportar
el producto, lo que ocasiona un malestar entre el personal y un clima laboral tenso por los
constantes descuentos que ven en sus remuneraciones.
Además, el mayor problema presentado de acuerdo a lo indicado por el gerente de
la empresa, ha sido un declive y variación en el volumen de las ventas, teniendo como
resultado la falta de crecimiento en las ventas, manteniendo el mismo monto de facturación
por sucursal y empresa durante todo el año 2017, viendo un impacto económico en la
empresa.
Para poder tener un mayor contexto de la empresa e identificar el problema que
será motivo de investigación, necesitamos primero conocer las fortalezas y debilidades,
esto lo logramos desarrollando un análisis FODA de la empresa, donde buscamos
identificar las debilidades con las que cuenta. Este análisis se muestra en la siguiente
figura.
24
Figura 8. Análisis FODA Botica Amberfarma. Fuente Boticas Amberfarma (2018), elaboración propia.
Dentro de las debilidades identificadas en el análisis FODA, y la que destacamos
para el presente trabajo de investigación, señalamos la siguiente: Ausencia de software
integrado y optimizado.
Para poder abarcar los problemas descritos por el gerente, realizamos un análisis
detallado con Ishikawa a dos de los problemas que presentan en la empresa y son
abarcados para el desarrollo del presente estudio. Tenemos los siguientes: Altos
descuentos por inventario y precios no competitivos.
25
Figura 9. Análisis Ishikawa Boticas Amberfarma, altos descuentos por inventario. Fuente Boticas Amberfarma (2018), elaboración propia.
De acuerdo a las causas identificadas en el diagrama anterior, para el problema de
altos descuentos por inventario, se tuvo que consultar con el administrador sobre la
frecuencia de ocurrencia de cada una de las causas, ya que la empresa no lleva un conteo
y medida sobre estas, por lo que de acuerdo a la respuesta del experto, las causas que
resaltamos y que serán consideradas como parte de las propuestas de mejora en el
presente estudio son: Abastecimiento con excesivas diferencias, transporte poco
optimizado, carga de inventarios mal distribuidos, mala programación de inventarios.
Todas las causas identificadas por el experto, denotan una falta de análisis en la
rotación de sus productos, esto demuestra que a pesar de tener información histórica de
las ventas no es analizada para aplicarla a otros procedimientos, que no necesariamente
tienen una influencia directa sobre las ventas, como son los inventarios mal distribuidos y
la mala programación de inventarios, también existe una relación entre el transporte poco
optimizado y la falta de conocimiento con la distribución de productos de acuerdo a la
información de ventas.
26
Figura 10. Análisis Ishikawa Boticas Amberfarma, precios no competitivos. Fuente Boticas Amberfarma (2018), elaboración propia.
Para el problema de precios no competitivos, analizado en el diagrama anterior y
por la misma razón del primer diagrama, la mala práctica de no tomar medida de la cantidad
de ocurrencias de estas causas, es lo que nos lleva a basarnos en el juicio del experto para
determinar aquellas de mayor ocurrencia y que serán abarcadas en el presente trabajo
dentro de las propuestas de mejora, las cuales son: Carga de compras mal distribuida,
elaboración de lista reactiva, programación de compras no optimizada.
Como parte de la identificación del problema, realizamos una ficha de entrevista
(ver Anexo 1), esta ficha fue aplicada a dueños y administradores de boticas
independientes para conocer su percepción de los problemas que afrontan y su forma de
trabajo sobre puntos relevantes para la presente investigación. El resultado de la ficha de
entrevista se utiliza como un apoyo y soporte adicional para la identificación del problema,
no se la considera como objetivo del trabajo de investigación. Todos los resultados de las
18 preguntas de la ficha de entrevista se encuentran en el Anexo 6. Dentro de los
resultados, observamos que del total de entrevistados el 77.61% cree que la fusión de
Inkafarma y Mifarma tendrá un impacto negativo en el desarrollo de sus establecimientos
independientes, esto es considerado como parte de la identificación del problema. Además,
los resultados de dos preguntas nos brindan soporte para el desarrollo de nuestra
27
investigación, donde el 61.19% de entrevistados utiliza algún software para la optimización
comercial de sus establecimientos, lo que nos indica que existen boticas independientes
que vienen utilizando y están familiarizados con tecnologías de información en sus
procedimientos. Como tercer resultado a mencionar de la ficha de entrevista, obtuvimos
que el 77.61% de los que realizaron la ficha efectúan registro de sus operaciones de ventas,
lo cual nos dice que existe un histórico de información que se puede aprovechar en
analizar.
De acuerdo a todo lo descrito, se utilizaron varias herramientas en la identificación
del problema para el estudio, como FODA, Ishikawa y ficha de entrevistas. Según lo
analizado, existen diversidad de problemas, pero debido a que se trata de una
microempresa, donde no se lleva el control y mediciones de los procesos que permitan
determinar con exactitud las causas de los problemas mencionados por la gerencia de la
empresa, contando simplemente con la referencia del juicio de expertos, es que se decide
analizar la información histórica de lo que sí tienen con registro de datos en este tipo de
negocios, como es el registro de las ventas, donde el objetivo es abordar el principal
problema mencionado por la gerencia, el descenso y estancamiento de las ventas.
En la siguiente tabla, se observa en resumen el reporte de ventas de las 5
sucursales de la empresa por meses en el año 2017, las cantidades son los montos en
Soles vendidos por cada una de las sucursales. Se debe considerar que en el caso de la
sucursal Chorrillos, registra un monto de ventas cero en el mes de enero, debido a que la
apertura de esta sucursal se realizó en el mes de febrero. El resto de sucursales muestran
montos similares durante todo el año, pero de acuerdo a lo reportado por la gerencia y que
se afirma con los números del registro en la tabla es que el año finalizó con números de
montos de venta inferiores en comparación al inicio del año.
TABLA 1
Ventas del año 2017 por sucursales (S/).
Túpac Amaru Chorrillos Huaraz Riva Agüero Ventanilla
Enero 53,576.20 0.00 37,303.57 89,772.80 148,817.25
Febrero 48,800.10 11,182.50 32,881.67 77,490.50 160,225.84
Marzo 54,055.70 33,911.72 29,419.72 83,004.40 153,618.12
Abril 59,801.20 35,879.86 37,189.89 77,036.40 172,643.91
Mayo 54,744.60 37,166.19 38,686.88 78,304.50 104,315.03
Junio 53,947.40 30,335.84 36,954.61 74,305.50 88,337.12
Julio 56,971.30 30,047.83 41,649.39 84,529.70 105,533.01
28
Agosto 56,262.70 35,839.83 39,444.45 83,173.30 111,965.54
Setiembre 52,971.40 42,532.17 37,240.43 74,646.90 135,153.44
Octubre 57,148.10 41,617.12 39,318.05 81,359.80 130,854.11
Noviembre 53,311.60 39,936.82 37,394.90 75,154.30 123,271.55
Diciembre 51,522.30 42,058.75 36,391.03 74,202.80 139,185.62
Total S/ 653,112.60 380,508.63 443,874.59 952,980.90 1,573,920.54
Fuente: Boticas Amberfarma registro de ventas 2017 - elaboración propia.
Para comprender y visualizar el estancamiento de las ventas en el año 2017,
realizamos la siguiente figura, donde se puede apreciar claramente que las sucursales
Túpac Amaru, Riva Agüero y Huaraz muestran un comportamiento sin mayor crecimiento
en las ventas durante todo el año e incluso finalizando el año con una ligera tendencia a la
baja, mientras que la sucursal Ventanilla sufrió una caída en las ventas en el mes de mayo,
tendiendo a recuperarse paulatinamente el resto del año, sin embargo finalizó el 2017 con
ventas menores en comparación de inicio del año. La sucursal Chorrillos es la única que
presenta un crecimiento en las ventas en comparación a inicio del año, pero esto es debido
al comienzo de operaciones que se realizó en febrero.
Figura 11. Ventas por sucursal 2017(S/). Fuente Boticas Amberfarma (2017), elaboración propia.
A manera de comprensión sobre la tendencia a la baja en el final del año 2017,
debíamos determinar la baja en comparación a inicios de ese mismo año, en la siguiente
tabla vemos en porcentaje el crecimiento de las ventas tomando como referencia la
diferencia entre enero y diciembre del mismo año, obteniendo como resultado un
crecimiento negativo en las sucursales Túpac Amaru, Huaraz, Riva Agüero y Ventanilla. Si
0.00
20,000.00
40,000.00
60,000.00
80,000.00
100,000.00
120,000.00
140,000.00
160,000.00
180,000.00
200,000.00
Ventas por sucursal 2017 (S/)
Túpac Amaru Chorrillos Huaraz Riva Agüero Ventanilla
29
bien es cierto el porcentaje es mínimo en 3 de ellas, se debe considerar que estamos
analizando información de una microempresa en donde estos pequeños márgenes de
diferencia en las ventas tienen un mayor impacto sobre el estado de la empresa.
TABLA 2
Crecimiento de las ventas del año 2017 por sucursal (S/).
Túpac Amaru Chorrillos Huaraz
Riva Agüero Ventanilla
Ventas Enero 2017 (S/) 53576.20 11182.50 37303.57 89772.8 148817.25
Ventas Diciembre 2017 (S/) 51522.30 42058.750 36391.03 74202.8 139185.62
Diferencia (S/) -2053.90 30876.25 -912.54 -15570.00 -9631.63
% Crecimiento Ventas
-4% 276% -2% -17% -6%
Fuente: Boticas Amberfarma registro de ventas 2017 - Elaboración propia.
Con la información revisada, podemos confirmar que el problema que expone la
gerencia en relación a las ventas es medible y presenta una tendencia a la baja que afecta
al negocio, es en el marco de este problema en donde se enfoca el presente estudio de
investigación, en analizar la información que tiene disponible la empresa Boticas
Amberfarma, para poder determinar patrones de ventas que nos ayuden a proponer
mejoras para que las ventas puedan aumentar y cambiar esa tendencia a la baja que se
identificó al final del año 2017. A partir de esta problemática se identificó la necesidad de
estudiar ciertas variables en relación a las ventas, como la rentabilidad, el ticket promedio,
abastecimiento y ofertas, buscando el impacto e influencia que puedan tener los patrones
de ventas que se logren identificar sobre estas variables.
Formulación del problema
Problema general.
¿Cuáles son los patrones de ventas que determinan las ventas para Boticas
Amberfarma E.I.R.L. en el año 2018?
Problemas específicos.
¿Cuál es el impacto de los patrones de ventas sobre el valor promedio del ticket de
venta para Boticas Amberfarma E.I.R.L. en el año 2018?
30
¿Cuál es el impacto de los patrones de ventas sobre la rentabilidad para Boticas
Amberfarma E.I.R.L. en el año 2018?
¿Qué influencia tienen los patrones de ventas con referencia al abastecimiento de
productos para Boticas Amberfarma E.I.R.L. en el año 2018?
¿Cuál es las influencia de los patrones de ventas que determinan las ofertas para
Boticas Amberfarma E.I.R.L. en el año 2018?
Marco referencial
Antecedentes
Miguel Angel Grández Márquez (2017), Aplicación de minería de datos para determinar
patrones de consumo futuro en clientes de una distribuidora de suplementos nutricionales,
(Tesis de Pregrado) Universidad San Ignacio de Loyola, Lima Perú. El autor en la tesis
busca conseguir las reglas que determinan el patrón de consumo de productos
nutricionales considerando variables, se observa la aplicación de técnicas de minería de
datos con visual studio 2015, y también SQL SERVER 2014.
Obando Velásquez, Daniel André (2017), Estudio y análisis de entornos comerciales
mediante la evaluación, comparación y experimentación de algoritmos de minería de datos
(Tesis de Pregrado) Universidad Católica de Santa María, Arequipa Perú. La tesis trata
sobre el impacto de la minería de datos en la parte comercial, administrativa y en la relación
con el cliente dentro de las organizaciones, se busca identificar algoritmos de minería de
datos más eficientes para los diferentes entornos de la organización antes mencionados.
Roque Montalvo, Irene Leydi (2016), Análisis comparativo de técnicas de minería de datos
para la predicción de ventas (Tesis de Pregrado) Universidad Señor de Sipan, Pimentel
Perú. El autor en la tesis realiza un análisis comparativo de diferentes técnicas utilizadas
en minería de datos, la tesis evalúa técnicas y algoritmos, concluye que no aplica de igual
modo para las diferentes variables. La empresa estudiada es “El Astro S.A.C.”
Mejia Segura, Moises Humberto (2015), Desarrollo de un sistema de proyecciones de
ventas con minería de datos para el apoyo en la toma de decisiones en Boticas Arcangel
31
de la Ciudad de Chiclayo (Tesis de Pregrado) Universidad Señor de Sipan, Pimentel Perú.
El autor en la tesis busca encontrar patrones, anomalías y tendencias utilizando minería
de datos, en una sucursal de Boticas Arcángel en la ciudad de Chiclayo, en la tesis se
utiliza la Metodología CRISP-DM para el desarrollo del modelo de minería de datos.
Vásquez Valles, Edson (2015), Minería de datos para la inteligencia de negocios (Tesis de
Pregrado) Universidad Nacional de La Amazonia Peruana, Iquitos Perú. El autor justifica la
importancia de la explotación de datos, cuando se procesa grandes volúmenes de datos,
la importancia de esta al momento de la toma de decisiones dentro de las empresas y su
relación la inteligencia de negocios.
Rivero Sarmiento, Carlos Alberto (2012), desarrolla una investigación donde realiza la
clasificación de clientes mediante técnicas de minería de datos para una empresa textil en
Santander, Colombia. El objetivo fue la elaboración de un modelo conceptual que permitió
la construcción de perfiles de los compradores a través de la identificación de relaciones
variables. Dentro de las conclusiones de su investigación indica que la construcción de
perfiles de los compradores permitió la visualización de oportunidades de negocio y mejora.
Abhijit Raorane & R.V.Kulkarni (2016), en su estudio sobre técnicas de Minería de Datos:
Una fuente para el análisis del comportamiento del consumidor, tuvieron como objetivo
conocer el comportamiento del consumidor y su condición psicológica al momento de
comprar, y que tan aplicable es el método de minería de datos para mejorar el método
convencional. Ellos concluyen que la minería de datos es útil para estudiar el
comportamiento de compra de clientes en tiendas retail, y de acuerdo a este
comportamiento los administradores pueden actualizar los tipos de servicios que ofrecen.
Eckert, Karina & Suénaga Roberto (2013), en el estudio que desarrollaron, Aplicación de
técnicas de Minería de Datos al análisis de situación y comportamiento académico de
alumnos, desarrollado en Argentina. Dentro de los objetivos que formularon tuvieron los de
detectar patrones entre datos de trayectoria académica y los alumnos, además de
identificar variables que influyen sobre el desempeño, con estos resultados elaborarían
recomendaciones a manera de contribución en la toma de decisiones sobre el proceso de
gestión académica.
Pulla Elizalde, Cinthia Elizabeth (2011), en su investigación utilizó minería de datos para
determinar patrones de colaboración de estudiantes que hacen uso de una herramienta de
32
entorno virtual de aprendizaje en una universidad en Ecuador, logrando obtener como
resultados que en forma genérica existe un carente interés colaborativo en los estudiantes,
además de la no utilización de todas las herramientas por parte de los docentes. También
determina que el nivel de colaboración no es proporcional a su calificación final, así como
la categorización de los estudiantes por el nivel de colaboración permite determinar
aquellos que requieren un mayor apoyo por parte del docente. Dentro de sus
recomendaciones sugiere la capacitación de los estudiantes de los primeros ciclos en la
herramienta y a los profesores.
Amores Hurtado, Blanca & Cruza Casa, Diego (2008), desarrollaron un estudio donde
aplicaron minería de datos para determinar patrones de comportamientos de datos
meteorológicos en la ciudad de Quito en Ecuador. Utilizaron información de 10 años desde
1995 a 2005, dentro de sus conclusiones indican que para determinar mayor cantidad de
patrones con el modelo que aplicaron necesitaban información de 50 años. Dentro de sus
recomendaciones, indican que se debe unificar la información de las tres estaciones
meteorológicas de la ciudad de Quito para contar con mayor data y tener datos
consolidados.
Estado del arte
La exploración de datos, dentro del comercio farmacéutico minorista y específicamente en
farmacias horizontales, actualmente es poco usada, por ende la información disponible de
pequeñas empresas es relativamente escasa. En las grandes corporaciones u
organizaciones, esta herramienta es ampliamente utilizada, comúnmente llamada data
mining o minería de datos. De acuerdo a lo indicado en el artículo (2015, Proquest) Minería
de datos: Qué es y 5 consejos para aprovecharla, el concepto que se le atribuye es la de
un proceso que consiste en la recolección y análisis de grandes cantidades de datos
tomando en consideración distintos puntos de vista para la identificación de patrones,
correlaciones y además tendencias que no son apreciadas a simple vista, pasando
desapercibidas entre muchas variables, todo esto con el fin de realizar proyecciones al
futuro.
Estas técnicas de minería de datos permiten recolectar y analizar diferentes
tamaños de datos, sea para pequeñas o grandes organizaciones, permite extraer
información relevante de un mar de datos, esta información ayuda optimizar las decisiones
33
estratégicas, el cual se evidencia con la reducción de costos, maximización de rentabilidad,
mayor eficiencia de procesos, entre otros.
Dentro del modelo de negocio de comercio farmacéutico, esta herramienta sería de
gran ayuda para establecer estrategias, conocer el estado actual y mejorar diferentes
procesos y la eficiencia de la misma empresa. En la venta de medicamentos participan
diferentes variables como: Edad, género, hora, día, principio activo, clase de fármaco,
patología, sintomatología, temporada, experiencia del colaborador, entre otros. Poseer
esta información (conocer los patrones ocultos) de manera confiable, permitiría
asociaciones estratégicas, bien planteadas y eficientes.
En el mercado actual existen varias herramientas para el análisis con minería de
datos, si bien es cierto no son herramientas específicas para el mercado farmacéutico se
pueden aplicar con el fin del estudio, el cual es la determinación de patrones de ventas con
base a datos históricos. Dentro de las principales herramientas y más utilizadas tenemos
a IBM SPSS, Microsfot SQL Server Integration Services y Oracle Data Mining ODM.
IBM SPSS Modeler es una herramienta predictiva propia de la empresa IBM, la cual
utiliza técnicas de recolección de información y analítica predictiva, permite el análisis a
través de pruebas de hipótesis, intercambio de resultados, análisis multivariado. Esta
plataforma permite el ingreso de datos en múltiples formatos, incluyendo CSV, archivos en
formato Excel, SAS, todos sin restricciones de tamaños. Es una herramienta muy conocida
en el mercado corporativo para el análisis de datos y para el trabajo con minería de datos,
cuenta con muchos profesionales que tienen el conocimiento sobre su funcionamiento y
manejo. El software al ser una herramienta propietaria de IBM tiene un costo de licencia,
este varía de acuerdo a la versión que se utilice, que va desde una versión Profesional,
Premium y Gold, cada una cuenta con características diferentes, la elección de la versión
depende de la necesidad de cada negocio.
Microsoft SQL Server Integration Services, es una plataforma que permite la
integración de distintos datos, extracción, transformación a nivel de empresarial, esta
herramienta es propietaria de Microsoft y viene como parte de la solución de base de datos
SQL Server. A pesar de no ser una herramienta exclusivamente dedicada a la minería de
datos, permite el análisis y trabajo con la información más allá de un motor de base de
datos. Al igual que la herramienta anterior, permite la extracción de distintos tipos de
orígenes de datos, aceptando distintos formatos como como archivos XML, archivos de
texto plano, bases de datos relacionales. Esta herramienta cuenta con una característica
de utilizar una interface gráfica, lo que le brinda la facilidad de uso para muchos usuarios
34
que se les complica utilizar código fuente. Pero el hecho de tener un entorno gráfico no
descarta la opción de utilizar código para los usuarios que deseen aplicarlo. Con esta
herramienta se pueden utilizar distintas técnicas de minería de datos y obtener reglas en
base al análisis que se realice. Al ser una herramienta propietaria de Microsoft, tiene un
costo de licenciamiento dependiendo de la versión que se utiliza.
Oracle Data Mining ODM, es un componente que viene en la suite de Oracle
Advanced Analytics Database Option. Este componente posee una amplia cantidad de
algoritmos de minería de datos y análisis de datos, los cuales permiten la creación,
manipulación, aplicación, prueba y despliegue de modelos con lo que las personas
encargadas pueden realizar análisis predictivos aprovechando la hoja de cálculo que viene
integrada en esta herramienta de Oracle. Es una herramienta que conlleva un mayor costo
de licenciamiento, es por esta razón que su uso se da en empresas que cuentan con
mayores recursos y mayor cantidad de información, los cuales les permitirá aprovechar
mejor estas técnicas y obtener resultados de acuerdo a la magnitud de variables e
información que manejan.
Marco teórico
Minería de datos.
De acuerdo a Beltrán(2013) ,en su publicación Minería de Datos, menciona que hoy
en día existen muchas definiciones de lo que representa minería de datos, y van
enfocadas desde el área que la utiliza, para darle un concepto que abarque su
magnitud podemos decir que consiste en los métodos y algoritmos que permite
extracción de información sintetizada que permite identificar las relaciones que no
se muestran a simple vista entre la gran cantidad de datos, también lo que se busca
es que la información obtenida nos brinde un detalle de predicción para que exista
un análisis de forma eficiente.
Otra definición más concreta, define a la minería de datos como el
conjunto de técnicas que automatizan la detección de patrones relevantes, así
mismo también se le conoce a la minería de datos como el proceso por el cual se
transforma la información en conocimiento útil, para el área, centro empresarial o
de investigación que tenga la necesidad de utilizar este análisis.
35
Por último, tomamos una definición muy importante para este trabajo de
investigación, a la minería de datos como el descubrimiento significativo de nuevas
correlaciones patrones y tendencias en base al análisis realizado a las grandes
cantidades de datos almacenados utilizando técnicas de reconocimiento de
patrones. Existen varias técnicas en la minería de datos, y son categorizadas de
distintas formas, de acuerdo a Pérez López (2007) la clasificación que brinda es de
3 categorías, predictivas, descriptivas y técnicas auxiliares, dentro de cada
clasificación existen distintas técnicas. Para el presente trabajo de investigación se
utilizarán dos técnicas de minería de datos, árboles de decisión y técnicas de
asociación. La siguiente figura muestra la clasificación planteada para las técnicas
de minería de datos.
Figura 12. Clasificación de las Técnicas de Minería de Datos. Recuperado de Minería de Datos: Técnicas y Herramientas, Pérez L., César (2007)
Arquitectura de minería de datos.
En el proceso de la minería de datos intervienen varios componentes, donde la
información que es previamente desconocida se obtiene de grandes volúmenes de
datos. Para lograr obtener este conocimiento es que cada uno de los componentes
se encuentran estructurados de acuerdo al siguiente diagrama.
36
Figura 13. Arquitectura minería de datos. Recuperado de Han and Kamber (2001)
Componente fuente de los datos, son representados en la parte inferior de
la figura anterior, la fuente de los datos para la minería de datos puede provenir de
distintos orígenes, como internet, data warehouses, bases de datos y otros
repositorios como pueden ser archivos de textos, documentos, hojas de cálculo. Lo
indispensable, indistintamente del origen de los datos, es que se necesita grandes
volúmenes de datos históricos para que el proceso de minería de datos tenga éxito.
El siguiente componente referido a la limpieza de los datos, integración y
selección, se realiza con el objetivo de pasar los datos al siguiente componente con
la mayor integridad y limpieza, proveyendo sólo aquellos datos que serán utilizados
para el proceso minería de datos. Los datos al provenir de distintos orígenes vienen
en distintos formatos, diferentes estructuras e incluso información incompleta, es
labor de este componente limpiar los datos y asegurar la integración y selección de
aquellos que se utilizarán.
Los servidores de bases de datos o los data warehouse, son los equipos
físicos que contendrán la información lista y debidamente procesada por el anterior
componente. Son en estos servidores donde se almacenará la data actualizada
para que sea analizada y trabajada de forma exclusiva para su análisis. Estos
servidores no son de tipo transaccionales para las operaciones del negocio, su
objetivo es el análisis de los datos.
37
El siguiente componente, es el más importante de la arquitectura, el motor
de minería de datos. Este componente es una herramienta de software,
indistintamente del fabricante o marca, esta herramienta es la encargada de
ejecutar las tareas de minería de datos, que pueden incluir tareas de asociación,
clasificación, predicción, series de análisis de tiempo, entre otras.
El módulo de evaluación de patrones es el responsable de la medida de
interés del patrón, apoyándose en un valor umbral. Este módulo interactúa con el
motor de minería de datos para enfocar su búsqueda en patrones relevantes.
El entorno gráfico, es el componente que actúa de intermedio entre el
usuario y el motor de minería de datos. A través de este componente el usuario
utilizará el sistema de una forma fácil y eficiente. Cada herramienta de minería de
datos cuenta con su entorno gráfico.
Base de conocimiento, este último componente soporta todo el proceso de
minería de datos, aportando la experiencia del usuario de tal forma que la extracción
de datos tenga una verdadera utilidad, todo esto gracias a la guía que brinda esta
experiencia. Además la base de conocimientos aporta y recibe de la evaluación de
patrones, donde como resultado del análisis de los patrones la base de
conocimiento podrá obtener nuevos registros.
Metodologías para la minería de datos.
Las metodologías de minería de datos son los procesos que aplican como práctica
la industria dedicada al análisis de datos, en el mercado existen varias
metodologías, pero para efectos del estudio analizaremos las más conocidas por
los especialistas, las cuales son la metodología KDD, metodología SEMMA,
metodología CRISP-DM.
Metodología KDD.
Las siglas KDD hacen referencia a Knowledge Discovery in Databases, que
traducido al español significa Descubrimiento del Conocimiento en Bases de
Datos. En la actualidad existen varias definiciones para KDD, nosotros
tomaremos una de las definiciones más aceptadas, de acuerdo a Fayyad(1996),
38
es un proceso el cual consiste en utilizar la minería de datos para la obtención
de conocimiento, a través de una base de datos y un procesamiento seguido de
una transformación, para esto se considera cinco etapas. Debemos tener muy
en claro que KDD no es un software, sino un proceso iterativo, que en la
actualidad surgen varias herramientas que trabajan en alguna de las distintas 5
etapas. Para entender y comprender de forma clara este proceso describiremos
cada una de las etapas.
La primera etapa denominada, selección, la cual consiste en
enfocarse en el conjunto de datos objetivos sobre los cuales se realizará el
descubrimiento. Estos datos deben ser elegidos en base a un entendimiento de
la aplicación de dominio desde un punto de vista del negocio o cliente.
En la segunda etapa, procesamiento previo y limpieza, se busca la
consistencia de los datos por medio de la limpieza de datos. Dentro de esta etapa
se eliminan aquellos datos que causan ruido como campos vacíos o que no
serán utilizados para el análisis.
La tercera etapa es llamada la transformación, la cual a través de
métodos de reducción de dimensionalidad transforman los datos, de tal forma
que sólo se utilicen aquellos datos que serán representativos para la función
objetivo.
La cuarta etapa, llamada la minería de datos, se desarrolla a través
de la determinación de patrones que tengan representatividad dependiendo del
objetivo que se esté analizando, lo usual es analizar predicciones.
La quinta y última etapa, evaluación, en este proceso consiste en la
interpretación o evaluación que se realizan a los patrones definidos en la etapa
anterior. Este paso puede implicar regresar a una etapa previa causando la
iteración del proceso. Como resultado de esta última etapa se obtiene el
conocimiento obtenido gracias a todo este proceso y a los datos almacenados.
39
Figura 14. Etapas proceso KDD. Fuente: Fayyad et al.(1995). Recuperado de https://nocodewebscraping.com/
Metodología SEMMA.
El acrónimo significa Sample Explore Modify Model and Assess y corresponde a
las cinco fases del proceso. Es un proceso implementado por el instituto SAS y
el objetivo de este proceso es la guía del usuario al desarrollo de Data Mining
para descubrir patrones de negocios desconocidos. Esta metodología se
encuentra enfocada en características técnicas, discriminando actividades de
comprensión del problema. Fue elaborada con el propósito de ser utilizada para
el trabajo con el software de minería de datos de la empresa SAS. Este producto
brinda una serie de herramientas para cada una de las etapas de la metodología.
Este proceso trabaja en base a un ciclo, el cual se encuentra constituido en cinco
etapas.
La primera etapa denominada muestra (Sample), la cual lleva ese
nombre por realizar la tarea de obtener una muestra de datos que contenga la
suficiente información significativa, pero además que sea idealmente pequeño
para poder manipular eficientemente la data obtenida.
La segunda etapa es la de explorar (Explore), la que consiste en
exploración de la data con el fin de encontrar tendencias y anomalías.
La tercera etapa llamada modificar (Modify), tiene el objetivo de la
transformación de los datos seleccionando las variables en las cuales se enfoca
el proceso de selección.
40
La cuarta etapa es denominada modelo (Model), debido a que es en
este momento del proceso en donde los datos deben ser modelados para que la
solución pueda identificar automáticamente combinaciones que predigan un
resultado fiable.
La quinta y última etapa es la evaluación (Assess), donde al resultado
obtenido se le debe evaluar en base a la utilidad y fiabilidad para poder
determinar cuan buen resultado se obtuvo.
Figura 15. Etapas metodología SEMMA. Fuente: SAS Institue. Recuperado de https://www.slideserve.com/
Metodología CRISP-DM.
El acrónimo hace referencia a Cross Industry Standard Process for Data Mining.
Esta metodología fue creada por una agrupación de empresas, las cuales
mencionamos, SPSS, NCR y Daimer Chrysler, teniendo como año de creación
2000. Hoy en día se considera como la metodología más utilizada en lo referente
a desarrollo de proyectos en minería de datos, por la gran versatilidad que ofrece
para los distintos tipos de usuarios, ya sean usuarios con poco conocimiento de
minería de datos como para usuarios con amplia experiencia en el sector. Una
de las ventajas de esta metodología es su lenguaje simple, que permite la
integración de los usuarios de distintos sectores, permitiendo enriquecer los
proyectos de minería de datos. Esta metodología, al igual que las anteriores, se
divide en fases teniendo un total de seis fases. La secuencia de las fases no es
necesariamente rígida, el modelo permite cierta flexibilidad. Esta metodología
41
establece varias tareas y actividades por fase, pero no determina cómo debe
llevarse a cabo cada una de las tareas. Las actividades y tareas se encuentran
organizadas en 04 niveles de forma jerárquica por cada fase, la organización de
estos niveles se muestran en la siguiente figura.
Figura 16. Esquema 4 niveles de CRISP-DM. Fuente: CRISP-DM (2000). Recuperado de http://www.oldemarrodriguez.com/
La próxima figura muestra el flujo que se da en el proceso de CRISP-
DM entre las fases, como se puede observar es un proceso iterativo, donde
existe flexibilidad para retornar a fases anteriores, este modelo también es
llamado como el ciclo de vida de CRISP-DM debido a que existen puntos de
retorno dentro del modelo.
Figura 17. Modelo de proceso de CRISP-DM.Fuente CRISP-DM (2000). Recuperada de http://www.oldemarrodriguez.com/
42
La primera fase, compresión del negocio, tal vez la fase más
importante de esta metodología, en esta fase se agrupan las tareas de
comprensión de objetivos y requisitos del proyecto de minería de datos teniendo
un punto de vista empresarial, con la meta de convertirlos en objetivos técnicos
y de un plan de proyecto para la minería de datos. Es en esta fase donde radica
la importancia de poder convertir el conocimiento adquirido del negocio en un
problema de Minería de Datos y en un plan cuyo fin sea alcanzar los objetivos
propuestos por el negocio. Esta fase se encuentra conformada por las siguientes
tareas.
La tarea de determinar los objetivos del negocio, en esta primera fase,
es utilizada como la primera tarea a implementar, el fin de esta tarea es identificar
el problema a resolver, los criterios de éxito y el motivo de utilizar minería de
datos. En esta tarea participan los expertos del negocio o área donde se está
aplicando la metodología, ya que ellos serán las personas encargadas de definir
estos criterios.
La siguiente tarea dentro de la primera fase es la de evaluar la
situación, en esta tarea se califica la situación antes de dar por iniciado el
proceso, es muy importante reconocer el estado actual de diversos puntos, como
el conocimiento actual acerca del problema, la información disponible, el costo
beneficio de la aplicación de decidir aplicar alguna técnica de minería de datos y
además se deben identificar los requisitos del negocio con referencia al
problema.
La próxima tarea es determinar el objetivo de minería de datos, esta
tarea tienen como fin determinar el alcance de la parte de minería de datos, es
muy importante saber diferenciar cual es el objetivo del negocio y el objetivo de
minería de datos, por lo general el objetivo de minería de datos brinda soporte y
apoyo al objetivo del negocio, es importante lograr primero el objetivo de minería
de datos para poder llegar al objetivo que se traza en la parte del negocio. Como
siguiente tarea se tiene la de realizar el plan del proyecto, es la última tarea de
esta fase y el fin es determinar cada uno de los siguientes pasos y técnicas a
ejecutar en cada uno de ellos.
43
La segunda fase, comprensión de los datos, esta fase consiste en la
familiarización de los datos, recolectándolos con el objetivo de tener la primera
vista del problema, identificar la calidad y definir las relaciones que permitan
identificar nuestras primeras hipótesis. Esta fase con las próximas dos, son las
fases en donde se invierte mayor cantidad de tiempo y esfuerzo.
La primera tarea en esta fase es obtener los datos iniciales, el fin de
esta tarea es identificar los datos que se recolectaran, de dónde se obtendrán y
a través de que técnica serán recolectados. La siguiente tarea en esta fase es
describir los datos, en esta tarea de debe detallar el significado de los datos de
los campos obtenidos, así como la cantidad de información que fue recolectada.
Las siguientes dos tareas de esta fase son la exploración de los datos
y la verificación de la calidad, la primera consiste en identificar una estructura
general de la información descrita en la tarea anterior, el resultado de esta tarea
es un informe exploratorio donde se evidencia ciertas estadísticas básicas
identificadas. La segunda tarea hace referencia a verificar la calidad de los datos,
donde se deben realizar verificaciones de la información obtenida para
determinar consistencia y poder descartar valores nulos que causen ruido al
análisis de la información.
La tercera fase, preparación de los datos, es la fase donde se
preparan los datos para adaptarlos a las técnicas de Minería de Datos que se
utilizarán posteriormente. En esta fase se incluye la selección de los datos,
limpieza, generación de variables adicionales, integración de diferentes orígenes
y cambios en los formatos.
La primera tarea en esta fase es la selección de los datos, la cual
consiste en escoger aquel subconjunto de datos que serán utilizados con las
técnicas de minerías de datos y que cumplen con los criterios previamente
definidos por los expertos. La siguiente tarea complementaria a la primera es la
de limpiar los datos, la cual consiste en la normalización de los datos, depuración
de valores faltantes, entre otros que permitan optimizar la calidad.
La tercera tarea de esta fase es la de construir datos, la cual tiene
como fin la generación de nuevos valores a partir de datos ya existentes, esto se
44
realiza a través de operaciones y cálculos. La siguiente tarea es la de integrar
datos, cuyo objetivo es integrar datos de distintos orígenes obteniendo nueva
información consistente y que ayude al análisis que se planteará en las técnicas
de minerías de datos. La última tarea de esta fase es dar formato a los datos, la
cual consiste en editar los datos por temas de caracteres, como pueden ser
formatos de fechas, números, decimales con el fin adaptar la información al
análisis de la técnica de minería de datos.
Como cuarta fase, el modelado, esta fase consiste en la selección
de técnicas de modelado apropiadas para el proyecto de Minería de datos, se
deben tener en cuenta criterios como, disponer de datos adecuados, cumplir con
requisitos del problema, que sea apropiada para el problema, conocimiento de
la técnica y tiempo adecuado para obtener el modelo.
La primera tarea de esta fase es seleccionar la técnica de
modelamiento, la cual es importante de acuerdo al objetivo principal del proyecto,
es la tarea en donde se escoge la técnica de minería de datos que se utilizará
para el análisis que se realizará ya sea en base a una proyección o clasificación,
dependiendo del objetivo del proyecto. La siguiente tarea es generar el diseño
de prueba, la cual consiste en elaborar una guía con el paso a paso para realizar
una validación de calidad y del modelo elegido.
La tercera tarea en esta fase es construir el modelo, es en esta tarea
donde se ejecuta la técnica del modelo escogido sobre la información
seleccionada y se observan los resultados, realizando varias iteraciones hasta
identificar correctamente los parámetros a utilizar para satisfacer el correcto
análisis en base a los criterios de los expertos. La última tarea de esta fase es la
evaluación del modelo, es en esta tarea en donde los expertos del negocio y los
de minería de datos aplican sus criterios para juzgar el modelo previamente
definido.
La quinta fase, la evaluación, esta es la fase donde se evalúan los
modelos elegidos en la fase anterior, se deben considerar la fiabilidad calculada
y si el modelo aplica para el objetivo del negocio. Es en esta fase donde se
requiere revisar el procedo, teniendo en cuenta los resultados, y en caso de ser
necesario regresar a una fase anterior.
45
La tarea inicial en esta fase es evaluar los resultados, esta evaluación
es específica para el negocio, en donde evaluará los resultados directamente en
relación a los objetivos del negocio, es en esta tarea en donde se puede realizar
una evaluación en un problema real. La siguiente tarea es la de evaluación del
proceso, consistente en revisar todo el procedimiento de minería de datos para
identificar mejoras. La última tarea en esta fase es determinar los siguientes
pasos, en esta tarea se debe tomar una decisión muy importante en base al
resultado de las evaluaciones, en caso de ser satisfactorias las pruebas se podrá
decidir en ir a la siguiente fase y de no tener resultados favorables se podrá
decidir en regresar a una fase anterior o incluso empezar un nuevo proyecto
desde cero.
Sexta fase, la implementación, está última fase se aplica cuando el
modelo ya fue aprobado por la evaluación, es donde se transforma el
conocimiento que hemos logrado obtener y se traducen en acciones dentro del
proceso del negocio. Para esto debemos presentar el resultado de todo el
proceso, de forma tal que sea comprensible para el interesado del negocio, con
el fin de lograr un incremento de conocimiento.
La primera tarea en esta fase es desplegar el plan, es en esta tarea
donde en base al resultado se establece una estrategia de implementación,
donde se aplicará los cambios que son el resultado del análisis del proyecto de
minería de datos. La próxima tarea en esta fase es la de monitorear y mantener,
en esta tarea se deben definir puntos de control donde se pueda obtener
información como retro alimentación para identificar el correcto uso del modelo.
La tercera tarea en esta fase es desarrollar el reporte final, como todo
proyecto se debe desarrollar un informe en donde se muestre los resultados o el
conocimiento adquirido como producto de la técnica de minería de datos. La
última tarea en esta fase es la revisión del proyecto, como última tarea de todo
el proceso se evalúa todo el procedimiento seguido identificando los pasos
correctos que se dieron así como los errores y aquellos que pueden tener
oportunidad de mejora.
46
La siguiente figura muestra las fases con las tareas que se desarrollan en cada
una de ellas y fueron anteriormente descritas.
Figura 18. Fases y actividades del proceso de CRISP-DM. Fuente CRISP-DM (2000). Recuperado de http://disi.unal.edu.co/
Comparación de metodologías.
Para nuestro estudio es muy importante escoger la metodología adecuada y que
calce con el motivo de la investigación, por consiguiente debemos realizar una
comparación entre las metodologías más conocidas y utilizadas, la comparación
deberá mostrar similitudes y diferencias entre cada metodología. Si bien es cierto
que cada metodología cuenta con su propio procedimiento, pero en esencia las tres
tienen el mismo objetivo para los fines de la minería de datos, es en tal sentido que
se hace de importancia su comparación y así conocer sus diferencias.
Para poder comparar las 03 metodologías anteriormente descritas, KDD,
SEMMA y CRISP-DM debemos tener en claro cuáles son su procesos, esto lo
podemos apreciar en la siguiente figura, donde se pretende apreciar en una sola
vista cada uno de los tres procesos y así poder realizar una primera comparación
visual.
47
Figura 19. Comparación de metodologías KDD, SEMMA, CRISP-DM. Fuente: KDD, SEMMA,CRISP-DM (2000) Recuperado de https://slideplayer.es/slide/4116383/
A partir de la figura anterior, se puede observar que tanto la metodología
KDD y SEMMA cuentan con la misma cantidad de fases, mientras que CRISP-DM
cuenta en total con 6 fases, una más que las metodologías anteriores. Para realizar
un equivalente entre las distintas fases, dentro de lo que por sus características por
fase son equivalentes entre ellas por cada una de las metodologías, elaboramos la
siguiente tabla.
TABLA 3
Comparación de fases por metodología de minería de datos
KDD SEMMA CRISP-DM
Fase 1 - - Comprensión del negocio
Fase 2 Selección Muestra Comprensión de los datos
Fase 3 Procesamiento previo Explorar
Fase 4 Transformación Modificar Preparación de los datos
Fase 5 Minería de datos Modelar Modelado
Fase 6 Evaluación Evaluación Evaluación
Fase 7 - - Implementación
Fuente: KDD, SEMMA and CRISP-DM: A parallel overview
48
De la tabla anterior podemos observar lo siguiente, respecto a las fases
de las metodologías KDD y SEMMA son muy similares y tienen una equivalencia
entre ellas, esto debido a que SEMMA fue pensada y creada como una metodología
por el SAS Institute con la finalidad de utilizar su software, por tanto SEMMA es una
aplicación práctica que elaboró SAS de forma particular, y donde se puede apreciar
que existe una base en KDD.
En referencia a las fases de CRISP-DM, la principal diferencia que salta
a la vista respecto a las metodologías KDD y SEMMA, son la primera y última fase,
comprensión del negocio e implementación respectivamente. KDD y SEMMA no
consideran estas fases, debido a que tienen un enfoque aplicado a la minería de
datos, mientras que CRISP-DM considera muy importante el valor empresarial al
que va a dar valor en incremento de conocimiento a la empresa en la que se aplique
esta metodología, es por eso que incluye en su proceso una primera fase de
comprensión del negocio, donde se dedica a conocer el funcionamiento del negocio,
y la última fase de implementación, donde se pretende llegar un paso más adelante
en comparación a KDD y SEMMA, buscando la aplicación del nuevo conocimiento
en los procesos de la empresa.
Otra diferencia apreciada en las fases de CRISP-DM con respecto a la
otras dos metodologías, es su fase de comprensión de los datos, esta fase engloba
y abarca actividades que se realizan en dos fases en las metodologías anteriores,
para el caso de KDD engloba las fases de Procesamiento previo y Selección y para
el caso de SEMMA las fases de Muestra y Explorar. CRISP-DM no hace distinción
a nivel de fases para las actividades que se realizan en comparación de las otras
metodologías.
Selección de metodología.
Para elegir una correcta metodología debemos definir algunos criterios que nos
permitan valorizar cada una de las opciones, de tal forma que al final podamos
escoger la que nos permita obtener un mejor resultado de acuerdo al proyecto de
minería de datos donde la apliquemos.
Uno de los puntos muy importantes para escoger una metodología es de
acuerdo a lo que otras experiencias y personas utilizan como práctica y uso común,
49
basándonos es una encuesta sobre este tema realizada por KDnuggets, importante
asociación en minería de datos, que es utilizada como referencia en varios estudios
sobre minería de datos, se puede decir que la metodología de uso común en su
mayoría es CRISP-DM, como segunda opción en esta encuesta se obtiene que el
uso de metodologías propia a cada especialista de minería de datos es una práctica
común y en tercera posición se encuentra SEMMA, con una tendencia a disminuir
su uso en el mercado. En quinta posición de esta encuesta se ubica la metodología
KDD. En la siguiente tabla se muestra el resultado de la encuesta antes descrita.
Figura 20. Metodología más utilizada, preferencia de metodología minería de datos. Fuente KDnuggets Recuperado de https://www.kdnuggets.com/
Para realizar la selección de la metodología, definiremos los criterios que
de acuerdo a los expertos en este rubro, se consideran para este tipo de proyectos,
estos criterios tendrán un valor de acuerdo a su importancia. En las siguientes
tablas se observan los criterios considerados, así como el valor que se asignó a
cada criterio y el resultado final de la evaluación en cada una de las metodologías.
TABLA 4
Leyenda de evaluación
Leyenda de valor Valor
Muy importante 3
Importante 2
Bueno 1
50
Leyenda de aplicación de criterio X/O
No aplica al criterio O
Aplica al criterio X
Fuente: Elaboración propia
TABLA 5
Evaluación de metodología
Criterios Valor KDD SEMMA CRISP-DM
Ampliamente usada 3 O 0 O 0 X 3
Incluye análisis de negocio 3 O 0 O 0 X 3
Independencia de software 2 X 2 O 0 X 2
Facilidad de uso 1 X 1 X 1 X 1
Aplicación al negocio 2 X 2 X 2 X 2
Mejora resultados de Minería de Datos 2 X 2 X 2 X 2
Permite iteración 1 X 1 X 1 X 1
RESULTADO - - 8 - 6 - 14
Fuente: KDnuggets. Elaboración propia
De acuerdo al resultado de la evaluación de metodología mostrado en la
tabla anterior, la opción con mayor valoración es CRISP-DM donde obtuvo un
resultado de 14 puntos. Siendo este el resultado, la metodología escogida para el
desarrollo del presente este estudio será CRISP-DM.
Herramientas de minería de datos.
Las herramientas que se utilizan para el análisis en minería de datos que existen
en el mercado son varias, teniendo en consideración que existen herramientas con
pago de licencia y herramientas distribuidas como software libre. Dentro de las
principales herramientas más conocidas en el mercado podemos nombrar a R,
RapidMiner, SQL, Python, KNIME, Tableau, SAS Base, SPSS entre otras. El uso
de las herramientas varían en el tiempo, de acuerdo al nivel de complejidad que
tengan para su uso, mientras más sencilla sea la herramienta mayor cantidad de
personas preferirán utilizarla, esto sin considerar el costo, que también es un factor
muy importante para su elección.
Existen herramientas muy buenas, con un amplio soporte y una interface
gráfica que permite una interacción sencilla, pero el inconveniente que presentan
son su elevado costo de licencia como SPSS u Oracle Data Mining. Para el presente
estudio revisaremos con mayor detalle las cuatro herramientas más utilizadas en el
mercado de acuerdo a la encuesta realizada por KDnuggest.
51
Rapid Miner.
De acuerdo a lo especificado en el sitio web oficial de esta herramienta, se
considera como una herramienta utilizada para la minería de datos, que
proporciona un entorno integrado a través de una interface gráfica con 500
operadores para el análisis de minería de datos.
Fue desarrollada por la unidad de inteligencia artificial de la
Universidad Técnica de Dortmund en el año 2001, luego su desarrollo fue
impulsado en el año 2006 por la empresa formada por dos de sus creadores, en
el año 2007 su nombre original YALE fue cambiado a Rapid Miner. Esta
herramienta cuenta con varias versiones, la versión Starter Edition es disponible
para descarga gratuita y distribuida bajo la licencia AGPL, licencia de código
abierto. También cuenta con otras versiones pagadas como Personal Edition y
Profesional Edition.
Rapid Miner fue desarrollado con código JAVA, proporciona una
intuitiva interface gráfica para elaborar flujos de análisis. A los flujos son
conocidos como procesos y cada proceso es constituido por múltiples
operadores. Cada operador tiene una entrada por donde ingresa un resultado de
un operador previo, a su vez cada operador puede tener una o varias salidas que
son llevadas como entradas al operador siguiente.
Figura 21. Flujo de Rapid Miner. Fuente: Postecnología.com Recuperado de: https://www.postecnologia.com/
SQL Server Integration Services.
Dentro de las herramientas pagadas, por compra de licencia, tenemos la solución
de Microsoft, que si bien es cierto SQL Server tiene un enfoque orientado a motor
52
de base de datos cuenta dentro de su gama con herramientas que lo
complementan como opción a utilizar dentro de la minería de datos. Como es el
caso de SQL Server Analysis Services, la cual proporciona un variado rango de
herramientas que se pueden utilizar para este enfoque.
Cuenta con un asistente para minería de datos que facilita la creación
de estructuras y modelos, utilizando distintos orígenes de datos relacionados.
Además de este asistente SQL Server cuenta con la herramienta Management
Studio, donde existen visores de modelos, para explorar modelos de minería de
datos una vez creados. Adicionalmente, cuenta con un generador de consultas
de predicción que proporciona a SQL Server Management Studio ayuda a crear
consultas de predicción.
SQL Server Integration Services, integra herramientas que se pueden
utilizar con el fin de limpiar datos, automatizar tareas como pueden ser la
creación de predicciones, actualizar modelo y crear soluciones de minería de
datos con texto. Dentro de sus características, puede realizar segmentación o
muestreo personalizado de ciertos registros de casos, usar valores de
probabilidad, utilizar regresión logística, generar predicciones, asociar variables
con reglas.
R Studio.
Esta herramienta varía un poco a las anteriores alternativas, debido a que no es
sólo una herramienta de entorno gráfico, de acuerdo al sitio oficial del proyecto
R, es denominado como un lenguaje y ambiente para la computación estadística
y gráfica. Hoy en día esta herramienta es la preferida por los analistas de minería
de datos por su flexibilidad y potencia, además de ser distribuida gratuitamente.
El inicio de R se dio en los laboratorios de la empresa Bell, la que luego
formaría AT&T, pero el origen de R se dio gracias a S, que fue el primer lenguaje
creado en este laboratorio. Más adelante se dio el cambio de nombre, cuando
se realizaron cambios a partir de S, mejorando sus funcionalidades, dentro de
las que podemos destacar la variedad de modelos con los que cuenta, como
modelos lineales y no lineales, series de tiempo, clasificación, clustering, reglas
de asociación.
53
Esta herramienta R es entendida como un lenguaje, y para que sea
posible de trabajar con este lenguaje se debe acoplar un entorno gráfico llamado
R Studio, ambos se complementan y dan como resultado una poderosa
herramienta de bajo costo para el análisis en minería de datos. Gracias a esta
integración, R nos permite obtener gráficas exactas de acuerdo a los modelos
con los que trabajemos. En un primer instante esta herramienta parece de uso
complicado para los que no se encuentran familiarizados con los modelos de
minería de datos, pero conforme se utiliza se muestra su lógica, de tal forma que
hoy en día se perfila como la herramienta de mayor uso para este tema.
IBM SPSS Modeler.
Es una herramienta de propiedad de IBM, para utilizarla requiere de un pago por
el licenciamiento, está compuesta por un conjunto de herramientas que permiten
un rápido desarrollo de modelos predictivos. Se encuentra diseñada sobre
estándar CRISP-DM, soportando el proceso completo de minería de datos desde
los datos hasta obtener los mejores resultados para el negocio.
Posee un entorno gráfico amigable que la hace de fácil uso y comprensión
para los usuarios que la utilizan en la elaboración de sus modelos de minería de
datos sin necesidad de utilizar código de programación. Esta herramienta puede
ser instalada en una computadora de escritorio o también de manera distribuida
a través de su versión IBM SPSS Modeler Server, la cual permite mejorar el
performance sobre el análisis de gran cantidad de datos.
Evaluación y selección de herramienta.
Para poder seleccionar la herramienta que sea la adecuada para el estudio,
debemos tener en cuenta los criterios de la empresa en donde se aplicará la
investigación, ya que las 04 herramientas antes descritas tienen similares
características técnicas que pueden cubrir el objetivo de la determinación de
patrones de ventas, pero la diferencia que determinará la elección de una de las
herramientas se basa en el criterio del experto de la empresa, debido a que él tiene
el conocimiento de los recursos con los que cuenta la empresa para poder optar por
54
una decisión. En base a los criterios determinados por la empresa, se realiza la
siguiente tabla de evaluación.
TABLA 6
Evaluación de herramienta
Rapid Miner
SQL Server
R
IBM SPSS
Integration Services
Modeler
Licenciamiento de uso libre. 1 0 1 0
No requiere infraestructura adicional para instalación.
1 1 1 1
Conocida en el mercado. 0 1 1 1
Cuenta con profesionales en el mercado local.
0 1 1 1
TOTAL 2 3 4 3
Fuente: Boticas Amberfarma. Elaboración propia.
Los criterios de evaluación fueron definidos por la persona encargada de
tecnología en la empresa Amberfarma, donde se brindaba un punto aquella
herramienta que cumplía con los criterios solicitados. Se observa que el primer
criterio es el licenciamiento de la herramienta, al tratarse de una pequeña empresa
no cuentan con recursos para invertir en soluciones con costo de licenciamiento, es
por ello que establecen un criterio con preferencia por el software de uso libre. En
este criterio dos herramientas cumplen con lo especificado, Rapid Miner y R.
Acerca del criterio de infraestructura adicional, hace referencia a la
necesidad de requerir algún tipo de inversión en hardware adicional al que cuenta
la empresa, para el caso de todas las herramientas no será necesario invertir en
hardware adicional, debido a que la empresa actualmente cuenta con equipos para
realizar la instalación de cualquiera de las herramientas para el tipo de análisis que
se va a realizar.
El criterio siguiente criterio, conocida en el mercado, se refiere a que la
empresa busca contar con una herramienta que tenga posicionamiento en el
mercado dentro de su sector, esto con el fin de no presentar problemas de soporte
en caso lo requieran. Para este criterio, la única herramienta que no cumple con
este requerimiento es Rapid Miner, debido a que es un software que aún no es muy
utilizado en el mercado peruano.
55
El último criterio hace referencia a los profesionales que cuentan con el
conocimiento de administración de la herramienta en el mercado local, ya que al ser
una herramienta de análisis con data histórica, la frecuencia de análisis es
prolongada, por lo que el planteamiento de determinación de patrones de ventas
será tercerizado con un especialista que domine el uso de la herramienta con la
frecuencia que determine la empresa. En este criterio Rapid Miner tampoco cumple
con este requerimiento, mientras las otras herramientas si cuentan con
profesionales en el mercado local que pueden ejecutar la herramienta para realizar
el análisis de patrones de ventas.
Como resultado de esta evaluación, en la tabla se observa que la
herramienta con mayor puntaje es R, obteniendo 4 puntos correspondientes a los 4
criterios solicitados por la empresa, en segundo lugar quedan con 3 puntos SQL
Server e IBM SPSS Modeler, siendo descartadas por el costo de licenciamiento, y
en el último lugar Rapid Miner obteniendo una calificación de 2 puntos. Debido a
este resultado es que se selecciona a R como herramienta para el desarrollo del
presente estudio.
Costo del trabajo.
Para la estimación de los costos del trabajo consideramos el cálculo de costo hora
hombre de cada uno de los participantes en cada una de las fases de la metodología
escogida. Para el caso de licenciamiento de software, no se consideran costos
debido a que el trabajo se realizó con una herramienta de uso libre, bajo una licencia
de software libre. La siguiente tabla muestra el cálculo en base a la remuneración
por hora de cada uno de los recursos involucrados en realizar el trabajo.
TABLA 7
Costos horas hombre por fase
Admin. del
negocio
Gerente de
Proyecto
Analista de
minería de datos
Analista de
base de datos
Costo por
Fase (S/)
Remuneración Horas Hombre (S/) 70 70 60 55
F. Comprensión del Negocio (Hrs.) 12 3 12 4 1990
F. Comprensión de Datos (Hrs.) 3 6 15 9 270
F. Preparación de Datos (Hrs.) 0 3 12 0 198
F. Modelamiento (Hrs.) 0 6 18 0 234
F. Evaluación (Hrs.) 5 3 6 0 126
56
F. Despliegue (Hrs.) 5 12 8 0 109
Fuente: Elaboración propia
Es importante otro tipo de gatos indirectos que se incurre al realizar este
trabajo, como se describe en la siguiente tabla, se categorizan los servicios
adicionales que se utilizarán.
TABLA 8
Costos de servicios y viáticos
Ítems Costo semanal (S/) Costo en 12 Semanas
(S/) Costo total
(S/)
Internet 10 120 120
Energía eléctrica 7 84 84
Materiales de Escritorio. 12 144 144
Impresión de informes. 9 108 108
Laptop 1200 - 1200
Gastos viáticos 40 480 480
Costo total (S/) 2 136
Fuente: Elaboración propia
El costo total de todo el trabajo, involucra todos los montos calculados
por fase del proyecto con referencia a la remuneración, considerando las horas
hombre y los costos esperados en otros servicios. En caso se desee aplicar el
presente trabajo a una botica independiente que requiera digitalización de
información se deberá incluir este costo. Para este trabajo de investigación el costo
total es la suma de los costos obtenidos en las dos tablas previas donde el monto
asciende a S/ 11 171.00, en la siguiente tabla resumen se muestra el cálculo final
detallado por fase.
TABLA 9
Resumen de costos y costo total
COSTO POR FASE COSTO (S/)
FASE 1. Compresión del negocio. 1990
FASE 2. Comprensión de datos. 2025
FASE 3. Preparación de datos. 930
FASE 4. Modelamiento. 1500
FASE 5. Evaluación. 920
FASE 6. Despliegue. 1670
Costos esperados en servicios y viáticos. 2136
COSTO TOTAL (S/) 11 171.00
Fuente: Elaboración propia
57
En el Anexo 7 se observa el VAN y TIR calculado para el proyecto, donde
se obtiene resultado positivo de VAN en el mes 8 y un 13% de TIR, mayor a la tasa
de inversión que ofrece el mercado en 5%, considerando estos dos indicadores el
proyecto es viable.
Modelos de análisis.
Modelo reglas de asociación.
De acuerdo al IBM Knowledge Center (2018), las reglas de asociación constan
de un conjunto de ítems que pueden ir de dos a más, donde se identifica que
algunos de los ítems son el cuerpo de la regla y se obtienen como un resultado
la cabecera de la regla. Dentro de las características de las reglas de asociación
tenemos la información estadística sobre cada uno de los ítems que conforman
las reglas con referencia a la frecuencia, además tenemos a la fiabilidad y la
importancia. Para desarrollar un mejor entendimiento sobre este concepto,
emplearemos un ejemplo con 03 productos: Producto A, Producto B y Producto
C. La regla es definida de la siguiente forma:
𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑜 𝐴 + 𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑜 𝐵 ==> 𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑜 𝐶 (𝑆𝑜𝑝𝑜𝑟𝑡𝑒 = 24%)
𝐶𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = 60%
Lo que se debe entender en esta regla es que si los clientes compran el
Producto A y el Producto B, el 60% de las veces también comprarán el Producto
C y la combinación entre el Producto A, Producto B y Producto C aparece el 24%
de las veces del total de las transacciones.
Modelo árbol de regresión.
El modelo de árbol de regresión se encuentra ubicado dentro de la clasificación
de los árboles de decisiones, los árboles de regresión corresponden a técnicas
donde la variable objetivo es un número. De acuerdo a Díaz Sepúlveda (2012),
el planteamiento de los árboles fue realizado por Breiman en 1984. Los árboles
de decisión trabajan en base a una variable objetivo, donde particionan los datos
teniendo como base relaciones entre variables independientes y la variable
dependiente o también llamada variable objetivo.
58
El resultado que muestra el árbol de decisión son las variables que se
encuentran con una relación fuerte en referencia a la variable dependiente,
dentro de este resultado se observan nodos terminales que son constituidos por
la concentración de casos que aplican a las características del nodo, el resultado
es mostrado de forma gráfica, de tal manera que su interpretación es fácil de
realizar.
Los elementos que constituyen a un árbol de decisión y por tanto a una
de regresión son los nodos, estos nodos se los divide en tres categorías, el nodo
raíz, ubicado en la parte superior del árbol, este nodo contiene una muestra o el
total de datos a analizar desde donde se van a desprender el resto de nodos, los
nodos de segundo nivel que derivan a partir de la raíz, se les denomina nodos
internos, el nodo raíz de divide en nodos internos. El último nivel de nodos es
conocido como el nodo terminal, son los últimos nodos del árbol y se dan cuando
ya se pueden realizar mayores divisiones a los nodos. Breiman, indica que el
límite de parada define si el particionamiento de los nodos termina tarde o
temprano. La siguiente figura muestra los tres nodos descritos.
Figura 22. – Elementos del árbol de regresión. Recuperado: https://www.uv.es/mlejarza/actuariales/tam/arbolesdecision.pdf
59
Objetivos
Objetivo general
Establecer los patrones de ventas que determinan las ventas para Boticas Amberfarma
E.I.R.L. en el año 2018.
Objetivos específicos
Determinar el impacto de los patrones de ventas sobre el valor promedio del ticket de venta
para Boticas Amberfarma E.I.R.L. en el año 2018.
Determinar el impacto de los patrones de ventas sobre la rentabilidad para Boticas
Amberfarma E.I.R.L. en el año 2018.
Determinar la influencia de los patrones de ventas con referencia al abastecimiento de
productos para Boticas Amberfarma E.I.R.L. en el año 2018.
Identificar la influencia de los patrones de ventas que determinan las ofertas para Boticas
Amberfarma E.I.R.L. el año 2018.
Justificación de la investigación
Teórica
Este trabajo de investigación pretende aplicar un conjunto de herramientas de tecnologías
de información desarrolladas en la ingeniería de sistemas, para mejorar los niveles de
ventas en empresas micro farmacéuticas, siendo esto relevante para la ingeniería
empresarial ya que se aportará con un caso de estudio práctico en este tipo de mercado
microempresario farmacéutico, utilizando tecnología que permitirá la mejor toma de
decisiones y restructuración empresarial en base a los resultados obtenidos.
60
Práctica
La investigación es justificada de manera práctica debido a que se obtendrán patrones de
ventas, definidos en distintas variables como temporadas de verano o invierno, rotación de
productos, rentabilidad por producto. Con el resultado se podrán establecer planes
comerciales en base a asociación de productos con el objetivo de incrementar el valor
promedio del ticket de venta, además de tener un plan de abastecimiento en base a la
rotación de productos y un plan de ofertas en base al riesgo del vencimiento. Todos estos
planes ayudarán a elevar las ventas a este tipo de negocios de microempresarios
farmacéuticos.
Social
Sobre el aspecto social, la investigación tiene una relevancia muy importante en el contexto
actual del mercado farmacéutico, donde existe mucha incertidumbre por la fusión de las
dos cadenas de farmacias más grandes del mercado, Inkafarma y Mifarma. Los
beneficiarios serán los microempresarios de este sector, que contarán con una herramienta
más para tomar decisiones adecuadas, que les permitirá aumentar sus ventas y optimizar
sus procesos, de tal manera que puedan hacerle cara y subsistir al nuevo mercado que
afrontarán con un competidor dominante.
Hipótesis
Hipótesis general
La determinación de patrones de ventas influye positivamente sobre las ventas para
Boticas Amberfarma E.I.R.L. en el año 2018.
Hipótesis nula.
La determinación de patrones de ventas no influye positivamente sobre las ventas
para Boticas Amberfarma E.I.R.L. en el año 2018.
61
Hipótesis específicas
Los patrones de ventas incrementan el valor promedio del ticket de venta para Boticas
Amberfarma E.I.R.L. en el año 2018.
Los patrones de ventas afectan positivamente a la rentabilidad para Boticas Amberfarma
E.I.R.L. en el año 2018.
Los patrones de ventas influyen directamente sobre el abastecimiento de productos para
Boticas Amberfarma E.I.R.L. en el año 2018.
Los patrones de ventas influyen directamente sobre determinación de las ofertas para
Boticas Amberfarma E.I.R.L. el año 2018.
Hipótesis nulas.
Los patrones de ventas no incrementan el valor promedio del ticket de venta para
Boticas Amberfarma E.I.R.L. en el año 2018.
Los patrones de ventas no afectan positivamente a la rentabilidad para Boticas
Amberfarma E.I.R.L. en el año 2018.
Los patrones de ventas no influyen directamente sobre el abastecimiento de
productos para Boticas Amberfarma E.I.R.L. en el año 2018.
Los patrones de ventas no influyen directamente sobre determinación de las ofertas
para Boticas Amberfarma E.I.R.L. el año 2018.
62
Matriz de consistencia
TÍTULO DE TESIS DETERMINACIÓN DE PATRONES DE VENTAS EN BOTICAS INDEPENDIENTES PARA MEJORAR LAS VENTAS PROBLEMA OBJETIVOS HIPÓTESIS VARIABLES METODOLOGÍA
Problema general ¿Cuáles son los patrones de ventas
que determinan las ventas para
Boticas Amberfarma E.I.R.L. en el
año 2018?
Problemas específicos ¿Cuál es el impacto de los patrones
de ventas sobre el valor promedio
del ticket de venta para Boticas
Amberfarma E.I.R.L. en el año
2018?
¿Cuál es el impacto de los patrones
de ventas sobre la rentabilidad para
Boticas Amberfarma E.I.R.L. en el
año 2018?
¿Qué influencia tienen los patrones
de ventas con referencia al
abastecimiento de productos para
Boticas Amberfarma E.I.R.L. en el
año 2018?
¿Cuál es la influencia de los
patrones de ventas que determinan
las ofertas de venta para Boticas
Amberfarma E.I.R.L. en el año
2018?
Problema general Establecer los patrones de ventas
que determinan las ventas para
Boticas Amberfarma E.I.R.L. en el
año 2018.
Problemas específicos Determinar el impacto de los
patrones de ventas sobre el valor
promedio del ticket de venta para
Boticas Amberfarma E.I.R.L. en el
año 2018.
Determinar el impacto de los
patrones de ventas sobre la
rentabilidad para Boticas
Amberfarma E.I.R.L. en el año 2018.
Determinar la influencia de los
patrones de ventas con referencia al
abastecimiento de productos para
Boticas Amberfarma E.I.R.L. en el
año 2018
Identificar la influencia de los
patrones de ventas que determinan
las ofertas de venta para Boticas
Amberfarma E.I.R.L. en el año 2018
Hipótesis principal La determinación de patrones de ventas
influye positivamente sobre las ventas
para boticas Amberfarma E.I.R.L. en el
año 2018.
Hipótesis específicas Los patrones de ventas incrementan el
valor promedio del ticket de venta para
Boticas Amberfarma E.I.R.L. en el año
2018.
Los patrones de ventas afectan
positivamente a la rentabilidad para
Boticas Amberfarma E.I.R.L. en el año
2018.
Los patrones de ventas influyen
directamente sobre el abastecimiento de
productos para Boticas Amberfarma
E.I.R.L. en el año 2018
Los patrones de ventas influyen
directamente sobre las ofertas de venta
para Boticas Amberfarma E.I.R.L. en el
año 2018
Variable Independiente Patrones de ventas de productos farmacéuticos. Variable dependiente Ventas Valor promedio del ticket Rentabilidad Abastecimiento de productos Ofertas de venta .
Tipo de investigación El tipo de investigación que se adapta al trabajo es no experimental. Método de investigación El trabajo es de método cuantitativo, bivariado, correlacional, paradigma postivista. Marco teórico Diagrama de Ishikawa para identificar las causas y efectos. Diagrama FODA para identificar las debilidades.
Fuente: Elaboración propia
63
Marco metodológico
Metodología
La presente tesis es no experimental, por no manipular las variables, además se trata de
una investigación correlacional entre las variables “Patrones de Ventas” y “Ventas”. Según
lo mencionado por Hernández, “El estudio será correlacional cuando los antecedentes nos
proporcionan generalizaciones que vinculan variables (hipótesis) sobre las cuales trabajar.”
En este estudio se determinará la relación que existe entre las variables que han sido
definidas en la hipótesis.
Paradigma
Esta tesis tiene un paradigma positivista, a través de diferentes técnicas buscamos analizar
datos con el uso de ciencias como la estadística, ciencias de la computación, matemáticas
y las ciencias sociales (administración), de acuerdo a lo mencionado por Hernández “para
el positivismo, objetividad es muy importante, el investigador observa, mide; además de
que se desprende de sus propias tendencias y es que la relación entre este y el fenómeno
de estudios independiente. Lo que no puede medirse u observase con precisión se
descarta como objeto de estudio”.
Enfoque
El enfoque que se usa en la investigación es cuantitativo, en la tesis buscamos alcanzar
resultados cuantificables. De acuerdo a lo que indica Hernández en su libro Metodología
de la Investigación, este enfoque consiste en un análisis objetivo de la realidad, por medio
de la medición de los eventos y datos observados, con el propósito de validar nuestra
hipótesis, para ello realizamos cálculos y análisis estadístico, de datos disponibles
previamente recolectados en las pequeñas oficinas farmacéuticas.
64
Método
El método usado en esta tesis es el método no experimental, la investigación está realizada
en base a la observación, al registro y análisis de las variables de eventos ya sucedidos,
por tanto no manipulamos la variable independiente. Según Hernández la investigación no
experimental se aplica en estudios sin manipulación de variables donde sólo se observan
fenómenos en su ambiente natural con el fin de poder analizarlos.
Variables
Independiente
Patrones de ventas, como variable independiente debido a que es el comportamiento que
afectará a las variables dependientes. Los patrones de ventas en este estudio se deben
entender como el comportamiento de venta de los productos dispensados por las boticas
de la empresa.
Dependiente
Ventas, como variable dependiente ya que es afectada por los patrones de venta, de
acuerdo al comportamiento que tenga la variable independiente las ventas pueden variar.
Para el estudio, se debe entender como ventas a la comercialización de productos que
realiza la empresa cuyas medidas son definidas por el dueño del negocio como indicadores
de beneficio para su empresa, dentro de las cuales tenemos cantidad de productos
vendidos, valor del ticket promedio, rentabilidad.
Ticket promedio, es el valor monetario que representa la venta promedio en una farmacia,
el ticket promedio es calculado con una frecuencia mensual considerando la suma en Soles
(S/) del valor de todos los tickets, dividido entre la cantidad de tickets. El ticket promedio
se representa con la siguiente formula.
𝑇𝑖𝑐𝑘𝑒𝑡 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = ∑ 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑇𝑖𝑐𝑘𝑒𝑡
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑇𝑖𝑐𝑘𝑒𝑡𝑠
Rentabilidad, la rentabilidad como variable dependiente para el estudio,
representa la utilidad que deja la venta de un producto, para los fines del presente trabajo
65
se considera la rentabilidad bruta que es calculada por la diferencia entre el precio de venta
y el precio de compra, esto se muestra en la siguiente formula.
𝑅𝑒𝑛𝑡𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 𝑃𝑟𝑒𝑐𝑖𝑜 𝑑𝑒 𝑉𝑒𝑛𝑡𝑎 − 𝑃𝑟𝑒𝑐𝑖𝑜 𝑑𝑒 𝐶𝑜𝑚𝑝𝑟𝑎
Abastecimiento, es el proceso de compra y distribución de los productos que
realiza la empresa para su posterior comercialización, el abastecimiento se inicia desde la
identificación de los productos a comprar, la negociación con el proveedor, la recepción de
productos, la distribución a los puntos de venta y el almacenaje en los anaqueles de las
farmacias.
Ofertas de venta, son las promociones que realiza la empresa ofreciendo
productos con precios de venta menores o promociones que brindan productos adicionales
a la compra de algún producto en específico. Los criterios de ofertas son determinados por
el dueño del negocio.
Población y muestra
Población
Para esta investigación consideramos como población la cantidad de registros de las
transacciones de la empresa Boticas Amberfarma E.I.R.L, que serán observados y
analizados para la determinación de los patrones de ventas. La cantidad total de registros
que representa la población es de 465 240, constituidos por todos aquellos registros de
ventas de las 5 sucursales pertenecientes a la empresa en el periodo de Enero a Diciembre
del año 2017.
La siguiente tabla muestra la cantidad de registros por cada mes durante el año
2017 en cada una de las 5 sucursales.
TABLA 11
Cantidad de transacciones en el año 2017
Sucursal Túpac Amaru Chorrillos Huaraz Riva Agüero Ventanilla Total
Enero 6598 0 3745 12816 18046 41205
Febrero 5560 1338 3234 10755 18562 39449
Marzo 6241 2772 2894 11460 17890 41257
Abril 6664 2224 3399 10939 17881 41107
66
Mayo 6542 2442 3968 10832 12572 36356
Junio 6416 1670 3803 10604 10537 33030
Julio 6724 1591 4324 12002 11825 36466
Agosto 6321 2322 4339 11843 12925 37750
Setiembre 6145 2621 3845 10848 16037 39496
Octubre 6145 2680 4094 11855 16248 41022
Noviembre 5784 2661 4170 11405 16191 40211
Diciembre 5997 2544 4138 7168 18044 37891
Total 75137 24865 45953 132527 186758 465240
Fuente: Boticas Amberfarma registro de ventas 2017 – Elaboración propia
Muestra
La muestra calculada en base a la población corresponde a 384 registros de transacciones
de ventas de la empresa Boticas Amberfarma. El tamaño de muestra mencionado se utiliza
como referencia, debido a que el estudio utiliza el total de la población para su análisis por
tratarse de un trabajo de minería de datos, donde se utiliza la mayor cantidad de
información disponible.
De acuerdo al cálculo obtenido utilizando una calculadora estadística, con un
nivel de confianza de 95% y un margen de error del 5%, el valor calculado para la muestra
es de 384. La siguiente imagen muestra la herramienta utilizada que nos brinda la
calculadora estadística de la empresa Adimen.
Figura 23. Calculadora de muestra estadística. Fuente: Adimen (2018)
67
Figura 24. Evolución de la muestra de acuerdo al margen de error. Fuente Adimen (2018).
En la figura anterior observamos la evolución de la muestra de acuerdo al margen
de error, mientras mayor sea la muestra el margen de error disminuirá.
El cálculo obtenido a través de la herramienta, fue validado con la siguiente formula,
correspondiente al cálculo del tamaño de una muestra en base a una población, donde n
es el tamaño de la muestra a calcular, Z el nivel de confianza 95% por tanto utilizaremos el
Z alfa es 1.96, p tomamos como valor 0.5 así como para q 0.5, N es la población en nuestro
caso 465240 y el margen de error de 0.05.
𝑛 =𝑍2 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁
𝑒2(𝑁 − 1) + 𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛 =(1.96)2 ∗ 0.5 ∗ 0.5 ∗ 465240
(0.05)2(465240 − 1) + (1.96)2 ∗ 0.5 ∗ 0.5
𝑛 =446816.496
1164.0579
𝑛 = 383.84
Este estudio pretende determinar los patrones de ventas de todo un año en base a
minería de datos, teniendo como principio utilizar la mayor cantidad de información para
procesar, por tanto se trabajará con el total de la población de las transacciones de ventas
de Boticas Amberfarma E.I.R.L del año 2017, los 465240 registros, por lo que al utilizar una
cantidad mayor a los registros calculados en la muestra el margen de error disminuirá.
68
Unidad de análisis
La unidad de análisis son las personas a quienes se les realizará las entrevistas, estas
personas son los dueños de las micro farmacias ubicadas en el distrito del Agustino.
Sobre la investigación del caso de estudio en Boticas Amberfarma, la unidad de
análisis son las transacciones de ventas de esta empresa. Cada transacción es
representada por un registro que se obtiene de la base de datos de ventas.
Instrumentos y técnicas
Instrumentos
Entrevistas.
Se realizarán entrevistas a los dueños de micro farmacias, con el objetivo de
conocer su percepción, como experto en el rubro farmacéutico, sobre el impacto
que tendrá la fusión de Inkafarma y Mi Farma en el mercado, comentando los
problemas que ellos presentarán como micro empresarios frente a estos dos
grandes competidores.
Las entrevistas también cuentan con preguntas que nos permitirán
conocer el negocio, su funcionamiento y detalles que nos brindarán un contexto que
nos apoyarán para la determinación de los problemas que presentan este tipo de
negocios, además de conocer si utilizan algún tipo de herramienta de tecnologías
de información dentro de sus procesos, que les permitan obtener alguna ventaja
competitiva o los ayude en su administración y toma de decisiones. La ficha de
entrevista pude se encuentra en al Anexo 1.
Archivo de datos.
En un archivo de datos se obtendrá la información necesaria para la determinación
de los patrones de ventas. Esta información debe contener las transacciones de
ventas de Boticas Amberfarma, dentro de la información obtenida se debe incluir
fechas de ventas, sucursales, productos, cantidades, costo de compra, costo de
venta, comisiones, vendedores. Es en base a esta información que se llevará a cabo
69
el estudio de esta tesis. Imagen de los primeros registros del archivo de datos en el
Anexo 2.
Técnicas
La técnica utilizada es la recolección de datos empleando ambos instrumentos, las
entrevistas y archivos de datos. Las entrevistas nos permitirán recolectar datos para
comprender el negocio y el contexto por el cual está pasando este sector. Mientras
que los archivos de datos nos permitirán realizar nuestros análisis para la
determinación de patrones en base a datos reales, obtenidos directamente de la
base de datos del sistema de ventas de la empresa Boticas Amberfarma.
Procedimientos y métodos de análisis
Procedimiento
El procedimiento a seguir será basado en la metodología CRISP-DM, definido dentro del
marco teórico como la opción más adecuada para el presente estudio. Esta metodología
se encuentra conformada por 6 fases, cada fase se encuentra integrada por un número de
actividades, el cronograma de actividades por fase se encuentra en el Anexo 8.
Dentro del procedimiento, se determinaron los riesgos de la implementación en
base a juicio de expertos del negocio, identificando en total 6 riesgos, los cuales son
detallados en la primera tabla del Anexo 9. Para cada uno de los riesgos identificados, se
elaboró un método de control, algunos de los cuales conllevan un costo adicional que se
deberá asumir en caso el riesgo se vea materializado. El total en costos de los riesgos
asciende a S/ 1200.00. Los métodos de control con su respectivo costo se observan en la
segunda tabla del Anexo 9.
Como arquitectura de la solución planteada, se utiliza un servidor de base de datos
que es propiedad de la empresa y una estación de trabajo para el análisis de minería de
datos. El servidor no es de uso exclusivo para el trabajo de investigación, el rol del principal
de este servidor es ser el repositorio de las transacciones del sistema de ventas de la
empresa, para nuestro trabajo sólo es utilizado en la extracción de la información
correspondiente a las ventas del año 2017. La estación de trabajo es una computadora con
70
ciertas características de hardware que nos permitan ejecutar el análisis de minería de
datos de acuerdo a la cantidad de información a procesar, la estación debe contar con el
software instalado R Studio. Debido a que se trata de una microempresa, el volumen de
información con el que trabaja no es excesivo, por lo que los recursos de hardware
requeridos son los necesarios para el alcance del trabajo. Las características detalladas
tanto del servidor como de la estación de trabajo se observan en la siguiente tabla.
TABLA 12
Características de hardware de la arquitectura planteada.
Servidor Estación
Procesador Intel(R) Xeon(R) CPU E3-1220 [email protected] Intel(R) Core(TM) i5-2410M [email protected]
Memoria 12 GB 8 GB
Disco 1 TB 500 GB Sistema Operativo Windows Server 2012 R2 Standard Windows 10 Professional
Software SQL Server 2014 R Studio
Fuente: Boticas Amberfarma. Elaboración propia.
La arquitectura planteada es sencilla a nivel de equipos, debido a que la magnitud
de la empresa es pequeña y la mayor parte del trabajo se concentra en el análisis que se
realiza a la información a través de las metodología de minería de datos escogida y al
resultado que se obtenga de la aplicación de los modelos escogidos para el análisis. En el
Anexo 10 se muestra una figura con la arquitectura y el flujo de trabajo que se realiza sobre
esta arquitectura, esta figura tiene como objetivo presentar en forma sencilla y de fácil
comprensión en un primer vistazo para las personas del negocio, el planteamiento de la
solución y en pasos sencillos cómo se realizará el procesamiento de la información
obteniendo los reportes con los resultados del análisis de minería de datos.
Comprensión del negocio.
La primera fase de este procedimiento es la comprensión del negocio, para realizar
esto hemos desarrollado una ficha de entrevista que nos permitirá obtener un
contexto del rubro farmacéutico y de ciertas características del negocio. La
entrevista se desarrolló a algunos dueños de micro farmacias de la zona y al
administrador de Boticas Amberfarma, la ficha de la entrevista se observa en el
Anexo 1.
71
Los resultados de la entrevista se encuentran en el Anexo 6, de acuerdo
estos resultados obtenemos que el 52.24% de los entrevistados consideran que el
valor del ticket promedio se encuentra entre S/ 5.00 y S/ 10.00, además que el
53.73% de los entrevistados determinan el abastecimiento de sus productos en
base a la rotación de los mismos.
Citando más resultado de la entrevista con el objetivo de comprender el
negocio, podemos decir que el 58,21% de los que fueron entrevistados consideran
que la temporada más rentable es invierno y que en verano se realiza más ofertas
de acuerdo al 59.70% de los entrevistados, también en esta misma temporada,
verano, el 62.69% considera que tiene mayores ventas en comparación a invierno.
Es importante mencionar que para el negocio farmacéutico se consideran dos
temporadas bien marcadas en el año, verano e invierno, donde el consumo de
productos varía en base a cada temporada.
Además de la entrevista, se obtuvo un diagrama del proceso del negocio
para conocer mejor cada una de sus etapas, en el Anexo 3 se muestra con detalle
la gráfica del proceso. La descripción detallada del proceso core del negocio la
detallamos a continuación.
TABLA 13
Descripción del proceso core del negocio
N° Actividad Descripción Área
Responsable
1 ORDEN DE COMPRA
DE ARTICULOS
Este proceso se basa en realizar las órdenes de pedido, las cuales pueden ser de manera manual o automatizada con el apoyo de un software de gestión
y venta.
Compras
2 APROBACION DE
ORDEN DE COMPRA Validación del pedido. Compras
3 PRE INGRESO DE COMPRAS En este proceso el personal de
compras, validad el stock solicitado con el stock que se facturó.
Compras
4 INGRESO DE COMPRAS
En el presente proceso, los colaboradores del área de compras, se encargan de asignar precio de venta al público, considerando variables como grado de rotación, rentabilidad y otros.
Compras
5 DISTRIBUCION DIGITAL
Proceso donde se asignan cantidad y sucursal donde se enviará el producto, la variable pilar para este proceso, es el grado de rotación del producto que se
está distribuyendo.
Compras
72
6 PICKING & PACKING Proceso de selección, asignación de bandejas y preparado de mercaduría
para su posterior traslado. Almacen
7 DISTRIBUCION A LAS
DIFERENTES SUCURSALES
Es la actividad logística en sí, es decir es el traslado de los productos a las
diferentes sucursales. Logística
8 RECEPCION DE MERCADERIA
Es la actividad de recepción de la mercaduría que llega en los camiones,
bajo ciertos criterios y protocolos previamente asignados.
Sucursal
9 VERIFICACION DE
PRODUCTOS Y GUIAS
Es el proceso de validación de stock, estado, cantidad, entre la guía
ingresante y los productos físicos. Sucursal
10 INGRESO DE INFORMACION
AL SOFTWARE
Es el proceso de recepción de información de guías de distribución de
forma digital. Sucursal
11 DISPENSACION
Es un conjunto de acciones y sub procesos por parte del personal de
salud, Químico farmacéutico), el cual se puede resumir como el proceso de
entrega de los fármacos a los pacientes.
Ventas en Sucursal
12 SEGUIMIENTO POST – VENTA
Es el conjunto de acciones que se emplean con fines de optimizar la satisfacción del cliente posterior al servicio o con respecto al producto.
Ventas en Sucursal
Fuente: Boticas Amberfarma
Se entrevistaron a diferentes trabajadores de la empresa, con el objetivo
de conocer su labor diaria y validar la información que nos fue proporciona en el
diagrama de proceso de la empresa. Para conocer la estructura orgánica de la
empresa, nos fueron proporcionados los organigramas, uno referente a toda la
estructura orgánica administrativa que se adjunta en el Anexo 4 y otro organigrama
que comprende la estructura de cada sucursal, este último organigrama se adjunta
en el Anexo 5.
Para poder tener una mejor comprensión del análisis que se realizará en
la empresa Amberfarma, debemos conocer de cada sucursal la capacidad en
recursos humanos, horario de atención al público así como su ubicación.
Figura 25. Logotipo del nombre comercial de Boticas Amberfarma. Fuente: Boticas Amberfarma E.I.R.L.
73
TABLA 14
Información de sucursales Boticas Amberfarma.
Sucursal: RIVA AGÜERO - EL AGUSTINO - LIMA
Razón Social: Botica Amberfarma E.I.R.L.
Nombre Comercial: Boticas Amberfarma
Ruc: 20522813266
Dirección: Av. Riva Agüero Nro. 700 Lima - Lima - El agustino
Director Técnico: Sandy Vela Ramos
Técnicos en Farmacia: 5
Cajeros: 2
Horario de actividad: 16 Horas
Antigüedad: 9 Años
Sucursal: TUPAC AMARU- EL AGUSTINO - LIMA
Razón Social: Botica Amberfarma E.I.R.L.
Nombre Comercial: Boticas Economikas
Ruc: 20522813267
Dirección: Av. Túpac Amaru Nro. 128 urb. El Agustino (Zona II. Cine. Cruce
con Riva Agüero) Lima - Lima - El Agustino
Director Técnico: Carlos Alfonso Quispe Balcazar
Técnicos en Farmacia: 4
Cajeros: 1
Horario de actividad: 16 Horas
Antigüedad: 12 Años
Sucursal: VENTANILLA - CALLAO
Razón Social: Botica amberfarma E.I.R.L.
Nombre Comercial: Boticas Amberfarma
Ruc: 20522813268
Dirección: AV. PEDRO BELTRAN NRO. S/N (HOSPITAL DE VENTANILLA) PROV. CONST. DEL CALLAO - PROV. CONST. DEL CALLAO -
VENTANILLA
Director Técnico: LUIS MIGUEL, CASTILLA MORAN
Técnicos en Farmacia: 6
Cajeros: 2
Horario de actividad: 24 Horas
Antigüedad: 5 Años
Sucursal: HUARAZ - ANCASH
Razón Social: Botica Amberfarma E.I.R.L.
Nombre Comercial: Boticas Amberfarma
Ruc: 20522813269
Dirección: Jr. Juan de la Cruz Romero Nro. 415 Bar. Huarupampa (Huaraz-
Restauración) Ancash - Huaraz - Huaraz
Director Técnico: Greissi Estefhafany Sanchez Nuñez
Técnicos en Farmacia: 5
Cajeros: 0
Horario de actividad: 16 Horas
Antigüedad: 2 Años
Sucursal: CHORRILLOS - LIMA
Razón Social: Botica Amberfarma E.I.R.L.
Nombre Comercial: Boticas Amberfarma
Ruc: 20522813270
Dirección: Av. Defensores del morro nro. 2007 urb. Santa Leonor (Ex Av.
Huaylas Alt. Cdra. 20) Lima - Lima - Chorrillos
Director Técnico: Edgar Ramos Peña
Técnicos en Farmacia: 2
Cajeros: 0
Horario de actividad: 12 Horas
74
Antigüedad: 2 Años
Fuente: Boticas Amberfarma
Es en este conocimiento del negocio en donde se determina que conocer
los patrones de ventas podría ayudar al área comercial, al área de compras y al
área administrativa, con el objetivo que nos plantea el negocio, el cual es aumentar
las ventas.
Comprensión de los datos.
En la segunda fase, correspondiente a la comprensión de los datos, tuvimos acceso
a la base de ventas de la empresa Boticas Amberfarma, donde seleccionamos
aquellos datos que nos son importantes para su extracción y análisis. En esta etapa
debemos aclarar que para el caso de Boticas Amberfarma cuenta con un sistema y
una base de datos digitalizada, si nosotros queremos generalizar este estudio para
las empresas de este tipo, es muy probable que sólo lleven un registro en cuadernos
de ventas, es bajo este contexto en donde se deberá considerar la digitalización de
esta información en algún archivo de fácil manejo para los usuarios de estas
empresas, como por ejemplo un archivo Excel.
Hablando para el caso de Boticas Amberfarma, la selección de los datos
la realizamos por medio de una consulta a la base de datos, en este query basado
en SQL seleccionamos aquellos campos de la tabla ventas que analizaremos, para
el presente estudio utilizaremos la data correspondiente al año 2017, la extracción
se realizará mes a mes y por sucursal. En la siguiente imagen se muestra un
ejemplo del Query utilizado.
Figura 26. Consulta query en SQL para obtener data. Fuente: Boticas Amberfarma.
75
Una vez obtenidos los datos, estos son exportados a un archivo texto
plano, de tal forma que se procedan a limpiarlos, eliminando aquellos campos que
no sean de utilidad, campos vacíos y calculando variables adicionales que sean
necesarias para nuestro análisis de minería de datos, ya que es data que no es
almacenada en las tablas, como por ejemplo la rentabilidad de un producto, que fue
calculada en base a la diferencia del costo de venta, costo de compra y la comisión
para todos aquellos productos que sean comisionados. La siguiente figura nos
muestra unos cuantos registros de la data en crudo extraída de la base de datos.
Figura 27. Data en crudo obtenida de base de datos. Fuente: Boticas Amberfarma. Elaboración propia.
Preparación de los datos.
La información en crudo debe ser preparada como ya fue mencionado en el paso
anterior, para su manipulación llevamos los datos a un Excel donde los datos
necesarios fueron calculados y los campos eliminados, el objetivo de toda esta
actividad es dejar la data limpia para que pueda pasar a la fase del modelado. La
siguiente figura es una muestra de cómo quedan los datos después de la fase de
preparación.
76
Figura 28. Data al finalizar la fase preparación de los datos. Fuente Boticas Amberfarma. Elaboración propia.
Método de análisis.
El método de análisis para este estudio es consecuente a la metodología CRISP-
DM que estamos utilizando, en su fase de modelado.
Modelado.
Es en esta fase donde debemos definir como analizar nuestra información y
determinar los modelos a seguir para que sean procesados con la herramienta que
hemos elegido, para la tesis la herramienta elegida es R.
Como primer paso, antes de utilizar las técnicas de minería de datos,
debemos analizar dos variables que forman parte de nuestras hipótesis, el valor del
ticket promedio y la rentabilidad, con la ayuda de R y en base a la data obtenida.
Valor del ticket promedio.
El ticket promedio es considerado el indicador que utiliza el sector farmacéutico
para conocer el valor promedio de una venta en una sucursal determinada
expresado en soles. Para el presente estudio determinamos el valor del ticket
77
promedio por sucursal y por mes, para mostrar este valor y que sea de mejor
entendimiento lo representamos en los siguientes gráficos por sucursal.
Figura 29. Ticket promedio mensual Chorrillos. Fuente: Boticas Amberfarma. Elaboración propia.
De la figura anterior, podemos destacar que el valor promedio mínimo
de la sucursal Chorrillos fue en el mes de Febrero con S/ 8.40, y el valor máximo
se obtuvo el mes de Julio con S/ 18.90. Es importante mencionar que en esta
sucursal no cuenta con data del mes de enero por haber iniciado operaciones en
el mes de Febrero.
Figura 30. Ticket promedio mensual Huaraz. Fuente: Boticas Amberfarma. Elaboración propia.
0
8.4
12.2
16.115.2 18.2 18.9 15.4 16.2 15.5 15 16.5
02468
101214161820
S/
Sucursal Chorrillos - Ticket Promedio Mensual
10 10.2 10.210.9
9.8 9.7 9.69.1
9.7 9.69 8.8
0
2
4
6
8
10
12
S/
Sucursal Huaraz - Ticket Promedio Mensual
78
En el caso de la sucursal Huaraz, apoyándonos en la figura podemos
indicar que el valor promedio mínimo del ticket fue en el mes de Diciembre con
S/ 8.80, y el valor máximo se obtuvo el mes de Abril con S/ 10.90.
Figura 31. Ticket promedio mensual Riva Agüero. Fuente: Boticas Amberfarma. Elaboración propia.
Para el caso de la sucursal Riva Agüero, según la figura podemos
indicar que el valor promedio mínimo del ticket fue en el mes de Noviembre con
S/ 6.60, y el mes siguiente obtuvo un despunta con un valor máximo de S/ 10.40
en Diciembre.
Figura 32. Ticket promedio mensual Túpac Amaru. Fuente: Boticas Amberfarma. Elaboración propia.
77.2 7.2 7 7.2 7 7 7 6.9 6.9 6.6
10.4
0
2
4
6
8
10
12
S/
Sucursal Riva Agüero - Ticket Promedio Mensual
8.18.8 8.7 9
8.4 8.4 8.5 8.9 8.69.3 9.2
8.6
0
2
4
6
8
10
12
S/
Sucursal Túpac Amaru - Ticket Promedio Mensual
79
La sucursal Túpac Amaru, la figura muestra que el valor promedio
mínimo del ticket fue en el mes de Enero con S/ 8.10, y el mes con el resultado
más alto fue Octubre con S/ 9.30, en esta figura se observa que esta sucursal
lleva un comportamiento si mayores variaciones en el transcurso del año.
Figura 33. Ticket promedio mensual Ventanilla. Fuente: Boticas Amberfarma. Elaboración propia.
La sucursal Ventanilla, la figura muestra una variación considerable
en el mes de Abril, donde se observa el valor más alto del año con S/ 9.70 y
como valor mínimo se identifica el mes de Noviembre con S/ 7.60.
Todas estas gráficas muestran de manera independiente el
comportamiento del ticket promedio en cada una de ellas a lo largo del año. Pero
es importante tener una sola vista de este comportamiento, para poder analizar
en conjunto al ticket promedio como cadena farmacéutica. La siguiente figura
reúne esta información.
8.28.6 8.6
9.7
8.3 8.48.9
8.7 8.4 8.1 7.6 7.7
0
2
4
6
8
10
12
S/
Sucursal Ventanilla - Ticket Promedio Mensual
80
Figura 34. Ticket promedio mensual cinco sucursales. Fuente: Boticas Amberfarma. Elaboración propia.
La figura anterior nos muestra que el ticket promedio en las sucursales
Huaraz, Túpac Amaru y Ventanilla tienen un valor aproximado entre S/ 7.50 y
S/10.00, la sucursal que tiene el ticket promedio más alto es Chorrillos, por
encima de los S/ 15.00, se observa claramente que el primer mes del año no
tuvo operaciones, debido a que su apertura fue en Febrero. La sucursal Riva
Agüero es la que tiene el ticket promedio más bajo de la cadena, con un valor
inferior a los S/ 7.50, notándose además un comportamiento anómalo en el
último mes del año para esta sucursal, en donde el valor del ticket subió por
encima de los S/ 10.00.
Resumiendo todo el análisis realizado por sucursal, agrupamos el
valor del ticket promedio de forma anualizada, para identificar la sucursal que
cuenta con el mayor valor del ticket promedio y la sucursal con el menor valor.
El resultado se muestra en la siguiente figura.
81
Figura 35. Ticket promedio por sucursal anualizado. Fuente: Boticas Amberfarma. Elaboración propia.
La figura nos muestra claramente que la sucursal Chorrillos posee el
ticket promedio más alto con S/ 15.24 y la sucursal con el menor valor es Riva
Agüero con S/ 7.28. El resto de sucursales, incluida Riva Agüero cuentan con un
ticket promedio semejante, la única que difiere por el doble es Chorrillos. De
acuerdo a lo observado y consultado con el negocio a que se debe este
fenómeno, nos indica que la sucursal Chorrillos se encuentre dentro de una
clínica, la cual abastece de medicinas a los pacientes con recetas médicas, por
tal razón el alza en el valor del ticket en esta sucursal.
Con el objetivo de determinar si existe un comportamiento del ticket
promedio teniendo como base los días de la semana, es que se analiza la data
teniendo en cuenta este criterio. Las siguientes figuras mostrarán el
comportamiento del ticket por sucursal en base a los días.
0.00
5.00
10.00
15.00
20.00
ChorrillosHuaraz
RivaAgüero Túpac
Amaru Ventanilla
15.24
9.72
7.28 8.718.43
S/
Ticket Promedio Anualizado por Sucursal
82
Figura 36. Ticket promedio semanal sucursal Chorrillos. Fuente: Boticas Amberfarma. Elaboración propia.
En la figura anterior se observa que para sucursal Chorrillos no se
registra actividad en el día domingo, consultando con el negocio, esto se debe a
que la clínica en donde se encuentra ubicada esta sucursal no atiende al público
ese día. El resto de días de la semana se observa un comportamiento
homogéneo con referencia al valor del ticket promedio, el valor mínimo se da los
días martes con S/ 14.70 y el valor máximo el miércoles con S/ 15.80.
Figura 37. Ticket promedio semanal sucursal Huaraz. Fuente: Boticas Amberfarma. Elaboración propia.
14.5 14.715.8 15
15.7 15.4 15.6
0
2
4
6
8
10
12
14
16
18
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
S/
Sucursal Chorrillos - Ticket Promedio Semanal
9.810.3
9.99.5
10.49.7 9.7
0
2
4
6
8
10
12
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
S/
Sucursal Huaraz - Ticket Promedio Semanal
83
La figura correspondiente a Huaraz, no presenta alguna variación
considerable durante la semana, el valor del ticket promedio se mantiene en el
transcurso de los días. El valor más bajo corresponde al miércoles con S/ 9.50 y
el más alto con S/ 10.40 el día viernes.
Figura 38. Ticket promedio semanal sucursal Riva Agüero. Fuente: Boticas Amberfarma. Elaboración propia.
En la sucursal Riva Agüero, se observa el mismo comportamiento
durante la semana, no existe una variación considerable. El valor mínimo del
ticket se el día lunes con S/ 6.80 y el máximo el domingo con S/ 7.50.
Figura 39. Ticket promedio semanal sucursal Túpac Amaru. Fuente: Boticas Amberfarma. Elaboración propia.
6.8 7.2 7.3 7.1 7.3 7 7.5
0
2
4
6
8
10
12
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
S/
Sucursal Riva Agüero - Ticket Promedio Semanal
8.3 8.7 8.8 8.5 8.8 8.9 8.9
0
2
4
6
8
10
12
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
S/
Sucursal Túpac Amaru - Ticket Promedio Semanal
84
En Túpac Amaru, se muestra el mismo comportamiento, sin mayor
variación durante la semana, el valor mínimo del ticket se da el lunes con S/ 8.30
y el valor máximo se identifica en dos días correspondientes al fin de semana,
sábado y domingo con S/ 8.90.
Figura 40. Ticket promedio semanal sucursal Ventanilla. Fuente: Boticas Amberfarma. Elaboración propia.
La sucursal Ventanilla, muestra una diferencia notable con referencia
al día lunes, donde el valor más alto del ticket promedio se ubica en este día
llegando a S/ 9.70, el resto de la semana muestra un comportamiento
homogéneo donde el valor del ticket promedio mínimo se presentó en dos días,
martes y miércoles con S/ 8.20.
Los gráficos anteriores muestran el comportamiento de forma
individual en cada sucursal, pero para poder determinar un comportamiento es
necesario analizar las cinco sucursales en una sola vista, que nos permitirá
determinar similitudes y de esta forma poder obtener un resultado en conjunto
que nos pueda mostrar un comportamiento en común entre las sucursales. La
siguiente figura muestra el resultado del ticket promedio en función a los días de
la semana de las cinco sucursales.
9.7
8.2 8.2 8.3 8.3 8.4 8.4
0
2
4
6
8
10
12
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
S/
Sucursal Ventanilla - Ticket Promedio Semanal
85
Figura 41. Ticket promedio semanal cinco sucursales. Fuente: Boticas Amberfarma. Elaboración propia.
De la figura anterior, podemos observar claramente que en Chorrillos
no se labora un día de la semana, además se confirma que Chorrillos cuenta con
el valor del ticket promedio más alto de todas las sucursales por encima de los
S/ 15.00. Observando cuidadosamente se logra determinar un comportamiento
común en todas las sucursales y es que el cuarto día de la semana, todas las
sucursales presentan una caída en sus tickets promedio, teniendo luego una
tendencia al alza en el fin de semana. Una particularidad se presenta en
Ventanilla, en donde se observa claramente que el primer día de la semana
muestra un alza del ticket promedio, siendo este comportamiento distinto al resto
de sucursales.
Rentabilidad.
La segunda variable necesaria de analizar, previamente a las técnicas de
minería, es la rentabilidad, entendiendo que rentabilidad es la diferencia entre el
precio de venta y precio de compra, obteniendo este cálculo en base a la data
obtenida de cada una de las transacciones por sucursal. De acuerdo a esto es
86
que presentamos la rentabilidad por sucursal en una sola vista, para poder
realizar una comparativa entre ellas.
Figura 42. Rentabilidad mensual 05 sucursales. Fuente: Boticas Amberfarma. Elaboración propia.
De acuerdo a la figura previa, la sucursal que representa la mayor
rentabilidad en todos los meses es Ventanilla, superando en 5 meses los S/ 60
000.00 y en contraparte la sucursal que presenta la menor rentabilidad en 8
meses por un monto inferior a S/ 20 0000 es la sucursal Chorrillos. Es en este
punto donde debemos observar que la sucursal Chorrillos, a pesar de tener el
ticket promedio más alto de todas las sucursales, de acuerdo al análisis realizado
en el punto anterior, presenta la rentabilidad más baja de todas las sucursales.
Y en contraposición a esto, Ventanilla que presenta un ticket promedio bajo es
la sucursal que brinda mayor rentabilidad en soles a la cadena Amberfarma.
Si orientamos nuestro análisis a identificar la rentabilidad como
empresa de manera mensual, debemos observar la rentabilidad de todas las
sucursales en forma acumulada en cada uno de los meses, de tal manera que
se obtenga el monto total mensual de la rentabilidad por mes. Con el fin de
identificar el mes en donde el negocio como empresa obtuvo la mayor
rentabilidad y así como el mes donde se obtuvo la menor rentabilidad, además
de poder identificar la tendencia de la rentabilidad en el transcurso del año,
podemos observar la siguiente figura, que nos permitirá identificar toda la
información descrita con referencia a la rentabilidad en la empresa.
0
10000
20000
30000
40000
50000
60000
70000
80000
Rentabilidad Mensual (S/)
Chorrillos Huaraz Riva Agüero Túpac Amaru Ventanilla
87
Figura 43. Rentabilidad mensual por cadena en base a sucursales. Fuente: Boticas Amberfarma. Elaboración propia.
La figura anterior nos muestra que el mes con mayor rentabilidad se
dio en Abril, donde el monto total como cadena superó los S/ 150 000.00. Del
otro lado, se observa que el mes con menor rentabilidad se dio en Junio donde
se superó por una mínima diferencia los S/ 100 000.00. Otra observación
importante en la figura es que en ambos meses de monto máximo y mínimo en
rentabilidad como cadena, coincide con la rentabilidad máxima y mínima de la
sucursal Ventanilla, por tanto se identifica que existe gran influencia de esta
sucursal sobre el resultado final como cadena. En conjunto a este análisis es
muy importante considerar la rentabilidad anualizada por sucursal con montos,
esta vista se muestra en la siguiente figura.
Figura 44. Rentabilidad anualizada 05 sucursales. Fuente: Boticas Amberfarma. Elaboración propia.
88
Como se puede apreciar en la figura, la menor rentabilidad se da en la
sucursal Chorrillos con un monto de S/ 155 698.70 y la sucursal Ventanilla es la
de mayor rentabilidad, con un monto de S/ 689 324.90. La figura muestra una
gran diferencia entre la sucursal Ventanilla y el resto de sucursales, este es un
comportamiento importante de tener en consideración para el análisis que se
realizará con las técnicas de minería de datos.
Dentro del análisis de rentabilidad identificamos aquellos productos
que son los más rentables para el negocio, el conocimiento de aquellos
productos que aportan en mayor proporción es esencial para poder establecer
estrategias incentivando su venta. Este análisis debe ser identificado por
sucursal, ya que no necesariamente existe el mimo comportamiento de venta por
cada sucursal, además la venta de los productos deben ser analizados por
periodos de tiempo.
Las siguientes figuras muestran este análisis en base a los periodos
de verano e invierno. Estas dos periodos son marcados en el mercado
farmacéutico, para el presente estudio se considera, de acuerdo al dueño del
negocio, a los meses de verano como noviembre, diciembre, enero, febrero,
marzo y abril, para el caso de los meses de invierno se consideran a mayo, junio,
julio, agosto, setiembre y octubre.
La siguiente figura muestra los productos más rentables en la sucursal
Chorrillos tanto en la temporada de verano como invierno. En esta sucursal se
evidencia poca diferencia entre la cantidad de unidades comercializadas y la
rentabilidad obtenida del producto envase estéril, en base a esto es
recomendable hacer un estudio comparativo de precios respecto de este
producto, en otros establecimientos farmacéuticos. Se evidencia también que en
el invierno Tiogama es el producto referente, se recomienda disponer stock de
ese producto en todo momento y con mayor incidencia en el invierno. Este tipo
de figuras permiten tomar decisiones a productos con referencia al
abastecimiento por temporadas y sobre precios de productos en específico. El
análisis de esta figura en Chorrillos puede ser cruzado con los resultados de los
siguientes análisis utilizando las técnicas y modelos de minería de datos, el
análisis en conjunto se define en los resultados por sucursal.
89
Figura 45. Productos más rentables Chorrillos. Fuente: Boticas Amberfarma. Elaboración propia.
La sucursal de provincia, ubicada en la capital de Áncash, es una
sucursal de comercio múltiple, no se evidencia un grupo específico de productos
rentables, los técnicos en farmacia, dispensan diferentes productos,
independientemente de su forma farmacéutica. No existe una clase bastante
marcada al cual se pude decir que es rentable. Las políticas de marketing a
aplicar en esta sucursal son variadas.
Figura 46. Productos más rentables Huaraz. Fuente: Boticas Amberfarma. Elaboración propia.
90
El establecimiento farmacéutico ubicada en la Avenida Riva
Agüero, en el Distrito De el Agustino, se caracteriza por que sus técnicos en
farmacia, expenden medicinas, usualmente del tipo tabletas, comprimidos o
capsulas, se puede afirmar que no incentiva las ventas de productos que
tengan la presentación farmacéutica de ampolla, por consiguiente se pude
aplicar políticas de marketing fomentando la dispensación de productos
inyectables.
Figura 47. Productos más rentables Riva Agüero. Fuente: Boticas Amberfarma. Elaboración propia.
Según la figura se afirma que la tienda de Túpac Amaru, es una
sucursal que comercialmente se soporta en la dispensación por recomendación,
los productos como el Dolminex Forte tabletas, son productos que rotan
únicamente por recomendación, se podría afirmar que en la mencionada
sucursal podría funcionar óptimamente, esto debido a lo que muestran los datos
con referencia a la rentabilidad de los productos más rentables, es una sucursal
donde se evidencia que los productos vendidos dejan una alta rentabilidad,
donde en base a políticas comerciales amparadas en la recomendación dirigida
a los productos más rentables y soportada en el pago por incentivos a los
técnicos en farmacia por lograr la colocación de estos productos, se pueden
lograr resultados con mayor rentabilidad en beneficio de la empresa, es muy
importante este tipo de análisis para poder aplicar esta estrategia comercial.
91
Figura 48. Productos más rentables Túpac Amaru. Fuente: Boticas Amberfarma. Elaboración propia.
En la sucursal de Ventanilla, se evidencia según la figura, ciertos
productos con una considerable rentabilidad en comparación con los demás
productos que se ofrecen en la mencionada sucursal, estos productos
independientemente a la temporada no deberían desabastecerse, se considera
que el desabastecimiento de los mencionados productos impactaría
drásticamente en la rentabilidad de la sucursal. La oficina farmacéutica se
caracteriza por tener entre sus productos más rentables a productos
directamente ligados a procedimientos quirúrgicos, lo cual se puede corroborar
con la figura resultante, obtenida por minería de datos.
Figura 49. Productos más rentables Ventanilla. Fuente: Boticas Amberfarma. Elaboración propia.
92
Continuando con el análisis de productos, es importante conocer
aquellos productos que tienen mayor rotación, ya que no necesariamente los
productos que son más rentables se encuentran dentro de los que rotan más.
Este análisis permitirá definir estrategias de abastecimiento y ventas, para ello
se realiza la revisión de este comportamiento por sucursal y por tiempo basado
en las dos estaciones verano e inverno. Las siguientes figuras muestran los
productos con mayor rotación en cada sucursal.
Figura 50. Productos con mayor rotación Chorrillos. Fuente: Boticas Amberfarma. Elaboración propia.
Según la siguiente figura, en la sucursal Huaraz se evidencia un alta
demanda de servicio de recargas virtuales, esta demanda podría utilizarse en un
futuro para políticas estratégicas de marketing, debido a que la recargas virtuales
no está categorizado como un producto que deje un margen de ganancia alto,
pero sin embargo es un producto que atrae a clientes al local de venta, por lo
que es una oportunidad para tener potenciales clientes para otro tipo de
productos. No se dispone de información en el invierno de recarga virtuales,
debido a que recientemente se implementó tal servicio. Es una de las pocas
sucursales donde se aprecia la demanda de la marca Pampers en pañales para
niños, es una información a tener en cuenta al momento de implementar políticas
de logística y marketing.
93
Figura 51. Productos con mayor rotación Huaraz. Fuente: Boticas Amberfarma. Elaboración propia.
Considerando la variable productos con mayor demanda, se aprecia
que en esta sucursal los productos farmacéuticos con clasificación de genéricos
presenta alta demanda, se puede concluir que el impacto respecto del ticket
promedio es directo, se evidencia poca rotación de productos con clasificación
de comisionados.
Figura 52. Productos con mayor rotación Riva Agüero. Fuente: Boticas Amberfarma. Elaboración propia.
En la sucursal de Túpac Amaru, se aprecia demanda diversa, es
decir se evidencia demanda de productos de diferente clase, tales como los
comisionados, genéricos y otros. En el verano es necesario trabajar en
incrementar la rotación del producto Quilnax Dúo en tabletas, toda vez que es
un producto conocido y con considerable rentabilidad.
94
Figura 53. Productos con mayor rotación Túpac Amaru. Fuente: Boticas Amberfarma. Elaboración propia.
En esta sucursal, una vez más se evidencia la fuerte demanda de los
productos con clasificación de medico quirúrgicos, se aprecia claramente que la
aguja descartable de 20 x 1, es la de mayor rotación en el verano así como en
invierno, lógicamente con diferentes índices. Los termómetros orales y los
envases estériles, son de gran demanda tanto en invierno como en verano.
Figura 54. Productos con mayor rotación Ventanilla. Fuente: Boticas Amberfarma. Elaboración propia.
Todas las figuras y análisis anteriores, son reportes y análisis
exploratorios para apoyarnos y definir claramente cuáles serán los modelos
apropiados para aplicar en minería de datos. Es en base a esto y para la
validación de cada una de nuestras hipótesis específicas planteamos utilizar
distintos modelos que nos ayuden a obtener un resultado. Los modelos a utilizar
serán de dos tipos, modelos de reglas de asociación y modelos de árbol de
95
regresión, con esto podremos determinar los patrones de ventas para analizar la
rentabilidad, el valor del ticket promedio, el abastecimiento y las ofertas de
ventas.
Análisis con reglas de asociación.
Las reglas de asociación nos permitirán analizar patrones en el comportamiento
de las ventas donde podremos identificas una relación entre productos, en base
a la data obtenida podremos determinar cuáles son los productos que tienen un
grado de probabilidad de ser adquiridos por los clientes en conjunto, esto nos
permitirá definir un comportamiento que será un criterio adicional para
determinar si se aplican ofertas a determinados productos.
Para este análisis se ejecutará el modelo de reglas de asociación por
sucursal, este modelo es ejecutado a través de un algoritmo en la herramienta R
escogida para la ejecución de los métodos de minería de datos. Como ya se
mencionó, existen dos temporadas marcadas en el sector farmacéutico, que son
verano e invierno, para el estudio la temporada de verano corresponde a los
meses de noviembre, diciembre, enero, febrero, marzo y abril; mientras que para
la temporada de invierno los meses correspondientes son mayo, junio, julio,
agosto, setiembre y octubre. El objetivo es tratar de identificar patrones que nos
indiquen por sucursal un comportamiento que nos permita definir relaciones
entre los productos en ambas temporadas, verano e invierno. La siguiente
imagen, muestra el código utilizado en R para obtener las reglas de asociación
de la Sucursal Chorrillos en verano.
Figura 55. Código R para reglas de asociación de Chorrillos en verano. Fuente: Boticas Amberfarma. Elaboración propia.
96
En la imagen anterior se muestra resaltado como se define el código
para obtener la regla de asociación. El procedimiento para obtener el resto de
reglas de asociación es el mismo, se utiliza la misma lógica de código en el
software R, la única variación es la data utilizada, para cada caso se utiliza data
de diferente sucursal por cada una de las dos temporadas definidas en el año,
verano e invierno. La cantidad de reglas de asociación que se pueden obtener
varía por cada sucursal, esto es definido por la información analizada, no se
puede obtener resultados iguales dado que cada sucursal muestra un
comportamiento distinto en base a cada una de las características de las
sucursales, como la ubicación, horario de atención, lo cual lleva a una mayor o
menor cantidad de registros de ventas analizados. Como resultado del código de
la anterior figura obtenemos las siguientes reglas detalladas en esta tabla.
TABLA 15
Reglas de asociación sucursal Chorrillos - verano.
N° Antecedente Resultado Soporte Confianza Lift
[1] Preser. Enjoy surtido-- x
3uu. Papel higiénico x 1
(surtido). 0.012 0.775 5.964
[2] Papel higiénico x 1
(surtido). Preser.enjoy surtido-- x
3uu. 0.012 0.094 5.964
[3] Aguja descart.23 x 1 1/2
caj x 100. Jeringa nº10 x 100. 0.01 0.753 15.412
[4] Jeringa nº10 x 100. Aguja descart.23 x 1 1/2
caj x 100. 0.01 0.206 15.412
[5] Guantes quirúrgicos #7 1/2
glomex. Papel higiénico x 1
(surtido). 0.012 0.407 3.133
[6] Apel higiénico x 1 (surtido). Guantes quirúrgicos #7
1/2 glomex. 0.012 0.093 3.133
[7] Terbometasona 4mg/2ml
amp x 25 unid. Jeringa nº10 x 100. 0.013 0.714 14.601
[8] Jeringa nº10 x 100. Terbometasona 4mg/2ml
amp x 25 unid. 0.013 0.27 14.601
[9] Preser. Combate clásico
x 3 uu. Guantes quirúrgicos #7
glomex. 0.021 0.713 16.134
[10] Guantes quirúrgicos #7
glomex. Preser. Combate clásico x
3 uu. 0.021 0.473 16.134
[11] Preser. Combate clasico
x 3 uu. Papel higiénico x 1
(surtido). 0.023 0.778 5.99
[12] Papel higiénico x 1
(surtido). Preser. Combate clásico x
3 uu. 0.023 0.175 5.99
[13] Guantes quirúrgicos #7
glomex. Papel higiénico x 1
(surtido). 0.025 0.555 4.272
[14] Papel higiénico x 1
(surtido). Guantes quirúrgicos #7
glomex. 0.025 0.189 4.272
[15] Guantes quirúrgicos #7
glomex,. Papel higiénico x 1
(surtido). 0.016 0.788 6.069
97
Preser. Combate clásico x 3 uu.
[16]
Papel higiénico x 1 (surtido),. Guantes quirúrgicos #7
glomex. 0.016 0.722 16.347
Preser. Combate clasico x 3 uu.
[17]
Guantes quirúrgicos #7 glomex,. Preser. Combate clásico
x 3 uu. 0.016 0.671 22.922
Papel higiénico x 1 (surtido).
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
El mismo procedimiento es realizado para la temporada de invierno,
ejecutando el código correspondiente para obtener las reglas de asociación de
esa temporada, el resultado se muestra en la siguiente tabla.
TABLA 16
Reglas de asociación sucursal Chorrillos - invierno.
N° Antecedente Resultado Soporte Confianza Lift
[1] Mascarilla nebulizadora
adulto alcimax. Jeringa nº5 x 100.
0.011 0.803 17.666
[2] Jeringa nº5 x 100. Mascarilla nebulizadora
adulto alcimax. 0.011 0.243 17.666
[3] Aguja descart.23 x 1 1/2 caj
x 100. Jeringa nº10 x 100.
0.01 0.703 13.83
[4] Jeringa nº10 x 100. Aguja descart.23 x 1 1/2
caj x 100. 0.01 0.202 13.83
[5] Terbometasona 4mg/2ml
amp x 25 unid. Jeringa nº10 x 100.
0.014 0.703 13.847
[6] Jeringa nº10 x 100. Terbometasona 4mg/2ml
amp x 25 unid. 0.014 0.273 13.847
[7] Guantes quirúrgicos #6 ½. Preser. Combate clasico x
3 uu. 0.01 0.28 5.792
[8] Preser. Combate clasico x 3
uu. Guantes quirúrgicos #6 ½.
0.01 0.208 5.792
[9] Guantes quirúrgicos #6 ½. Envase estéril p/muestra. 0.013 0.349 3.335
[10] Envase estéril p/muestra. Guantes quirúrgicos #6 ½. 0.013 0.12 3.335
[11] Guantes quirúrgicos #6 ½. Papel higiénico x 1
(surtido). 0.012 0.341 2.47
[12] Papel higiénico x 1 (surtido). Guantes quirúrgicos #6 ½. 0.012 0.089 2.47
[13] Guantes quirúrgicos #7
glomex. Preser. Combate clásico x
3 uu. 0.024 0.642 13.259
[14] Preser. Combate clasico x 3
uu. Guantes quirúrgicos #7
glomex. 0.024 0.505 13.259
[15] Guantes quirúrgicos #7
glomex. Papel higiénico x 1
(surtido). 0.021 0.543 3.935
[16] Papel higiénico x 1 (surtido). Guantes quirúrgicos #7
glomex. 0.021 0.15 3.935
[17] Preser. Combate clasico x
3 uu. Papel higiénico x 1
(surtido). 0.036 0.743 5.379
98
[18] Papel higiénico x 1 (surtido). Preser. Combate clásico x
3 uu. 0.036 0.26 5.379
[19]
GUantes quirúrgicos #7 glomex,. Papel higiénico x 1
(surtido). 0.019 0.758 5.488
Reser. Combate clasico x 3 uu.
[20] Guantes quirúrgicos #7
glomex,. Preser. Combate clásico x 3 uu.
0.019 0.895 18.491
Apel higienico x 1
(surtido).
[21] Papel higiénico x 1
(surtido). Guantes quirúrgicos #7 glomex.
0.019 0.516 13.528
Preser. Combate clásico x
3 uu.
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
La tabla anterior nos muestra el resultado de ejecutar el modelo de
reglas de asociación en la sucursal Chorrillos, dando como resultado 13 reglas
de asociación. Para poder analizar correctamente estas reglas, debemos tomar
en consideración el porcentaje de confianza de cada regla y tomar aquellos que
tenga un porcentaje de confianza elevado. Esta sucursal tiene la peculiaridad
que muestra varias reglas de asociación con un alto porcentaje de confianza,
pero si se analiza cuidadosamente los productos que forman parte de las reglas
con este alto nivel de confianza son los mismos, por tanto se puede concluir que
identificamos un comportamiento para esta sucursal, en donde podríamos decir
que a un 96.47% de confianza, todos aquellos clientes que compren guantes
quirúrgicos y papel higiénico llevarán como consecuencia un preservativo
Combate clásico. Las siguientes reglas de asociación que muestran porcentajes
de confianza alrededor del 70% son una variación de estos tres productos, lo
cual confirma este comportamiento.
Se puede observar en esta misma tabla, otra regla identificada a un
37.29% de confianza entre los productos jeringa N°10 y aguja descartable, esta
regla nos indica otro comportamiento en donde se observa que existen clientes
que compran estos productos en una sola venta.
El mismo análisis con el modelo de reglas de asociación lo realizamos
a la sucursal Huaraz en ambas temporadas, verano e invierno, teniendo en
consideración que por la ubicación geográfica de Huaraz el comportamiento del
clima es inverso al de Lima, donde los meses de verano es época de lluvias y
frío, mientras que los meses de invierno son meses calurosos. Las siguientes
dos tablas son el resultado de las reglas de asociación en la sucursal Huaraz.
99
TABLA 17
Reglas de asociación sucursal Huaraz - verano.
N° Antecedente Resultado Soporte Confianza Lift
[1] Clinomin amp x 1ml. Jeringa nº3 x 100. 0.004 1 62.187
[2] Jeringa nº3 x 100. Clinomin amp x 1ml. 0.004 0.277 62.187
[3] Roxtrim balsamico tab x
100. Nopramax 550mg tab x
100. 0.005 0.529 36.131
[4] Nopramax 550mg tab x 100. Roxtrim balsamico tab x
100. 0.005 0.316 36.131
[5] Mexadex 4 mg/2ml x 25
amp Aguja descart.22 x 1 1/2
caj x 100. 0.005 0.864 26.458
[6] Aguja descart.22 x 1 1/2 caj
x 100. Mexadex 4 mg/2ml x 25
amp. 0.005 0.145 26.458
[7] Jeringa nº3 x 100}. Aguja descart.22 x 1 1/2
caj x 100. 0.007 0.455 13.937
[8] Aguja descart.22 x 1 1/2 caj
x 100. Jeringa nº3 x 100.
0.007 0.224 13.937
[9] Jeringa nº5 x 100}. Aguja descart.22 x 1 1/2
caj x 100. 0.009 0.596 18.231
[10] Aguja descart.22 x 1 1/2 caj
x 100. Jeringa nº5 x 100.
0.009 0.27 18.231
[11] Jeringa nº10 x 100}. Aguja descart.22 x 1 1/2
caj x 100. 0.014 0.788 24.106
[12] Aguja descart.22 x 1 1/2 caj
x 100. Jeringa nº10 x 100.
0.014 0.431 24.106
[11] Eringa nº10 x 100}. Aguja descart.22 x 1 1/2
caj x 100. 0.014 0.788 24.106
[12] Aguja descart.22 x 1 1/2 caj
x 100. Jeringa nº10 x 100.
0.014 0.431 24.106
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
TABLA 18
Reglas de asociación sucursal Huaraz - invierno.
N° Antecedente Resultado Soporte Confianza Lift
[1] Jeringa nº3 x 100. Aguja descart.22 x 1 1/2
caj x 10. 0.008 0.497 14.753
[2] Aguja descart.22 x 1 1/2 caj
x 100. Jeringa nº3 x 100. 0.008 0.235 14.753
[3] Jeringa nº5 x 100. Aguja descart.22 x 1 1/2
caj x 100. 0.008 0.589 17.468
[4] Aguja descart.22 x 1 1/2 caj
x 100. Jeringa nº5 x 100. 0.008 0.243 17.468
[5] Mexadex 4 mg/2ml x 25
amp. Jeringa nº10 x 100. 0.009 0.711 32.811
[6] Jeringa nº10 x 100. Mexadex 4 mg/2ml x 25
amp. 0.009 0.403 32.811
[7] Mexadex 4 mg/2ml x 25
amp. Aguja descart.22 x 1 1/2
caj x 100. 0.01 0.817 24.235
[8] Aguja descart.22 x 1 1/2 caj
x 100. Mexadex 4 mg/2ml x 25
amp. 0.01 0.298 24.235
100
[9] Jeringa nº10 x 100. Aguja descart.22 x 1 1/2
caj x 100. 0.015 0.705 20.903
[10] Aguja descart.22 x 1 1/2 caj
x 100. Jeringa nº10 x 100. 0.015 0.453 20.903
[11]
Jeringa nº10 x 100. Aguja descart.22 x 1 1/2
caj x 100. 0.007 0.827 24.527 Mexadex 4 mg/2ml x 25
amp.
[12]
Aguja descart.22 x 1 1/2 caj x 100.
Jeringa nº10 x 100. 0.007 0.72 33.205 Mexadex 4 mg/2ml x 25
amp.
[13]
Aguja descart.22 x 1 1/2 caj x 100. Mexadex 4 mg/2ml x 25
ampolla. 0.007 0.473 38.498
Jeringa nº10 x 100.
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
En la tabla previa, correspondiente a la sucursal Huaraz, se
obtuvieron un total de 17 reglas, de las cuales se observan 4 reglas con un nivel
de confianza por encima del 50%, la primera regla que destaca con un 76.29%
de confianza es la compra de jeringa N°10 con aguja descartable 22. La segunda
regla destacable es la de jeringa N°5 con aguja descartable 22. La siguiente regla
con 52.91% de confianza Roxtrim Balsámico con Nopramax 550Mg. Otra regla
importante a observar es aquella que incluye los productos de la primera regla,
donde se define con 45.20% de confianza que todos aquellos clientes que
compren jeringa N°10 y aguja descartable 22 es probable que compren Mexadex
4Mg. Se puede observar que la regla constituida por jeringa y aguja descartable
también se encontró presente en la sucursal Chorrillos. La siguiente tabla
muestra el resultado de las reglas de asociación en la sucursal de Riva Agüero.
TABLA 19
Reglas de asociación sucursal Riva Agüero - verano.
N° Antecedente Resultado Soporte Confianza Lift
[1] Betamycol crema x 10gr. Fluconazol 150mg x 2
cap. 0.002 0.926 149.11
[2] Fluconazol 150mg x 2 cap----
--fage. Betamycol crema x 10gr. 0.002 0.381 149.11
[3] Control de glucosa. Diabeteglin 5mg tab x
100. 0.004 0.988 229.82
[4] Diabeteglin 5mg tab x 100. Control de glucosa. 0.004 0.894 229.82
[5] Clinomin amp x 1ml. Jeringa nº3 x 100. 0.004 1 187.47
[6] Jeringa nº3 x 100. Clinomin amp x 1ml. 0.004 0.691 187.47
[7] Plidoxim compuesto x 100
tab.. Nifloral x 100 tab. 0.002 0.262 25.818
[8] Nifloral x 100 tab. Plidoxim compuesto x 100
tab. 0.002 0.235 25.818
101
[9] Aguja descart.21 x 1 1/2 caj
x 100. Jeringa nº10 x 100. 0.003 0.469 53.217
[10] Jeringa nº10 x 100. Aguja descart.21 x 1 1/2
caj x 100. 0.003 0.285 53.217
[11] Rhynofriol compositum x 100
tab. Lorafast x 100 comprimidos.
0.004 0.365 13.037
[12] Lorafast x 100 comprimidos. Rhynofriol compositum x
100 tab. 0.004 0.158 13.037
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
TABLA 20
Reglas de asociación sucursal Riva Agüero - invierno.
N° Antecedente Resultado Soporte Confianza Lift
[1] Betamycol crema x 10gr. Fluconazol 150mg x 2
cap. 0.003 0.994 194.27
[2] Fluconazol 150mg x 2 cap. Betamycol crema x 10gr. 0.003 0.511 194.27
[3] Control de glucosa. Diabeteglin 5mg tab x
100. 0.004 1 241.94
[4] Diabeteglin 5mg tab x 100. Control de glucosa. 0.004 0.879 241.94
[5] Braxfar 1gr/3.5ml iny/vial. Jeringa nº10 x 100. 0.002 0.951 119.96
[6] Jeringa nº10 x 100. Braxfar 1gr/3.5ml iny/vial. 0.002 0.252 119.96
[7] Clinomin amp x 1ml. Jeringa nº3 x 100. 0.004 0.992 175.64
[8] Jeringa nº3 x 100. Clinomin amp x 1ml. 0.004 0.654 175.64
[9] Mexadex 4 mg/2ml x 25
amp. Jeringa nº10 x 100. 0.002 0.772 97.318
[10] Jeringa nº10 x 100. Mexadex 4 mg/2ml x 25
amp. 0.002 0.282 97.318
[11] Gripamedic-c x 100 tab. Lorafast x 100 comprimidos.
0.003 0.277 9.201
[12] Lorafast x 100 comprimidos. Gripamedic-c x 100 tab. 0.003 0.097 9.201
[13] Rhynofriol compositum x 100
tab. Lorafast x 100 comprimidos.
0.004 0.319 10.572
[14] Lorafast x 100 comprimidos. Rhynofriol compositum x
100 tab. 0.004 0.127 10.572
[15] Urodefloxin forte x 100 comp. Dolminex forte x 200 tab. 0.002 0.179 5.292
[16] Dolminex forte x 200 tab. Urodefloxin forte x 100
comp. 0.002 0.07 5.292
[17] Beckatrim balsamico x 100
tab. Lorafast x 100 comprimidos.
0.003 0.216 7.176
[18] Lorafast x 100 comprimidos. Beckatrim balsamico x
100 tab. 0.003 0.091 7.176
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
En Riva Agüero el resultado mostró 11 reglas, pero se observa un
caso particular identificado en los niveles de confianza, donde se muestra que
todas las reglas cuentan con un nivel de confianza menor al 12%. La primera
regla identificada indica que todos aquellos clientes que compren Dolminex ya
sea en su presentación Forte o Rapid comprarán como segundo producto
102
Lorafast. La siguiente regla muestra el resultado inverso pero con un nivel de
confianza del 10.95%, lo cual apoya a las primeras reglas. El resto de reglas
cuentan con un % de confianza bajo, por lo cual no se considerarán para un
mayor análisis. La siguiente tabla muestra el resultado en la sucursal Túpac
Amaru.
TABLA 21
Reglas de asociación sucursal Túpac Amaru - verano.
N° Antecedente Resultado Soporte Confianza Lift
[1] Diabeteglin 5mg tab x 100. Control de glucosa. 0.011 0.958 82.098
[2] Control de glucosa. Diabeteglin 5mg tab x
100. 0.011 0.905 82.098
[3] Clinomin amp x 1ml. Jeringa nº3 x 100. 0.008 0.986 85.314
[4] Jeringa nº3 x 100. Clinomin amp x 1ml. 0.008 0.681 85.314
[5] Jeringa nº3 x 100. Aguja descart.21 x 1 1/2
caj x 100. 0.007 0.568 23.077
[6] Aguja descart.21 x 1 1/2
caja x 100. Jeringa nº3 x 100. 0.007 0.267 23.077
[7] Mexadex 4 mg/2ml x 25
amp. Jeringa nº10 x 100. 0.006 0.833 34.204
[8] Jeringa nº10 x 100. Mexadex 4 mg/2ml x 25
amp. 0.006 0.25 34.204
[9] Braxfar 1gr/3.5ml iny/vial. Jeringa nº10 x 100. 0.007 0.951 39.045
[10] Jeringa nº10 x 100. Braxfar 1gr/3.5ml iny/vial. 0.007 0.279 39.045
[11] Flexiodic 75mg/3ml x 10
amp. Jeringa nº10 x 100. 0.008 0.807 33.159
[12] Jeringa nº10 x 100. Flexiodic 75mg/3ml x 10
amp. 0.008 0.322 33.159
[13] Dexacler 4mg tab x 100. Dolminex-rapid x 100 tab. 0.006 0.193 5.35
[14] Dolminex-rapid x 100 tab.. Dexacler 4mg tab x 100. 0.006 0.171 5.35
[15] Aguja descart.21 x 1 1/2 caj
x 100. Jeringa nº10 x 100. 0.014 0.56 23.006
[16] Jeringa nº10 x 100. Aguja descart.21 x 1 1/2
caj x 100. 0.014 0.566 23.006
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
TABLA 22
Reglas de asociación sucursal Túpac Amaru - invierno.
N° Antecedente Resultado Soporte Confianza Lift
[1] Clinomin amp x 1ml. Jeringa nº3 x 100. 0.008 0.994 84.568
[2] Jeringa nº3 x 100. Clinomin amp x 1ml. 0.008 0.709 84.568
[3] Diabeteglin 5mg tab x 100. Control de glucosa. 0.013 0.992 73.351
[4] Control de glucosa. Diabeteglin 5mg tab x
100. 0.013 0.985 73.351
[5] Flexiodic 75mg/3ml x 10
amp. Jeringa nº10 x 100. 0.008 0.837 33.086
103
[6] Jeringa nº10 x 100. Flexiodic 75mg/3ml x 10
amp. 0.008 0.334 33.086
[7] Braxfar 1gr/3.5ml iny/vial. Jeringa nº10 x 100. 0.011 0.953 37.655
[8] Jeringa nº10 x 100. Braxfar 1gr/3.5ml iny/vial. 0.011 0.417 37.655
[9] Mexadex 4 mg/2ml x 25
amp. Guja descart.21 x 1 1/2
caj x 100. 0.008 0.596 27.68
[10] Aguja descart.21 x 1 1/2 caj
x 100. Mexadex 4 mg/2ml x 25
amp. 0.008 0.394 27.68
[11] Mexadex 4 mg/2ml x 25
amp. Jeringa nº10 x 100. 0.012 0.864 34.153
[12] Jeringa nº10 x 100. Mexadex 4 mg/2ml x 25
amp. 0.012 0.486 34.153
[13] Aguja descart.21 x 1 1/2 caj
x 100. Jeringa nº10 x 100. 0.013 0.617 24.382
[14] Jeringa nº10 x 100 Aguja descart.21 x 1 1/2
caj x 100. 0.013 0.525 24.382
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
La tabla de Túpac Amaru nos muestra 14 reglas de asociación
identificadas, dos de las cuales con un porcentaje de confianza elevado. La
primera regla con un 67.21% de confianza nos indica que todos los clientes que
lleven una jeringa N°10 también compraran una aguja descartable 21, la
segunda regla nos muestra los mismos productos pero en distinto orden y a un
61.83% de confianza. Además existen otras reglas de asociación por encima del
40% de confianza, en donde incluyen los productos de la primera regla, pero
además un tercer producto, estas reglas indican lo siguiente, que un cliente al
comprar aguja descartable y jeringa el cliente también optará por comprar
Mexadex de 4 mg. con un 44.20% de confianza. Otra regla que se observa con
similar comportamiento es la de los productos jeringa y aguja descartable con
Flexiodic de 15mg con un 39,10% de confianza. Si analizamos estas reglas con
las resaltadas en las sucursales anteriores podemos encontrar que se repiten las
reglas de jeringas y agujas con la sucursal Chorrillos y Huaraz, pero además en
esta sucursal, Tupac Amaru, se observa que adicionalmente a estos productos
se incorporan Mexadex y Fexiodic, lo cual no fue mostrado en las sucursales
anteriores. La siguiente tabla muestra los resultados de las reglas en la sucursal
Ventanilla.
TABLA 23
Reglas de asociación sucursal Ventanilla - verano.
N° Antecedente Resultado Soporte Confianza Lift
[1] Guantes quirurgicos #7 1/2
go me Termometro oral x12 uni. 0.012 0.332 3.698
104
[2] Termometro oral x12 uni. Guantes quirurgicos #7
1/2 glomex 0.012 0.133 3.698
[3] Volutrol x 1. Llave triple via
c/exten.50cm x 1 ---sigma. 0.009 0.277 7.205
[4] Llave triple via c/exten.50cm
x1 ---sigma). Volutrol x 1. 0.009 0.247 7.205
[5] Volutrol x 1. Equipo venoclisis -intrafix. 0.013 0.374 7.728
[6] Equipo venoclisis -intrafix. Volutrol x 1. 0.013 0.265 7.728
[7] Llave triple via c/exten.50cm
x 1 ---sigma. Cloruro-sodio 9% x 1lt. 0.009 0.228 5.703
[8] Cloruro-sodio 9% x 1lt. Llave triple via
c/exten.50cm x 1 ---(sigma).
0.009 0.219 5.703
[9] Llave triple via
c/exten.50cm x 1 ---(sigma). Equipo venoclisis -
intrafix. 0.022 0.584 12.058
[10] Equipo venoclisis -intrafix. Llave triple via
c/exten.50cm x 1 ---(sigma).
0.022 0.464 12.058
[11] Cloruro-sodio 9% x 1lt. Quipo venoclisis -
intrafix. 0.017 0.419 8.649
[12] Equipo venoclisis -intrafix. Cloruro-sodio 9% x 1lt. 0.017 0.346 8.649
[13] Envase esteril p/muestra. Aguja descart.20 x 1 caj
x 100. 0.035 0.427 3.894
[14] Aguja descart.20 x 1 caj x
100. Envase esteril p/muestra. 0.035 0.321 3.894
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
TABLA 24
Reglas de asociación sucursal Ventanilla - invierno.
N° Antecedente Resultado Soporte Confianza Lift
[1] Guantes quirurgicos #7 1/2
glo me Termometro oral x12 uni. 0.014 0.374 3.601
[2] Termometro oral x12 uni. Guantes quirurgicos #7 1/2
glomex. 0.014 0.138 3.601
[3] Volutrol x 1. Equipo venoclisis -intrafix. 0.014 0.378 8.54
[4] Equipo venoclisis -intrafix. Volutrol x 1. 0.014 0.322 8.54
[5] Volutrol x 1. Llave triple via
c/exten.50cm x 1 ---(sigma).
0.015 0.401 8.361
[6] Llave triple via c/exten.50cm
x 1 ---(sigma). Volutrol x 1. 0.015 0.316 8.361
[7] Equipo venoclisis -intrafix. Llave triple via
c/exten.50cm x 1 ---sigma).
0.029 0.657 13.689
[8] Llave triple via
c/exten.50cm x 1 ---(sigma). Equipo venoclisis -
intrafix. 0.029 0.606 13.689
[9] Envase esteril p/muestra. Aguja descart.20 x 1 caj x
100. 0.036 0.399 4.47
[10] Aguja descart.20 x 1 caj x
100. Envase esteril p/muestra. 0.036 0.399 4.47
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
105
Para el caso de la sucursal Ventanilla, se identificaron 10 reglas donde
se observan 02 con un nivel de confianza elevado. La primera regla que indica
que todo cliente que lleve un Equipo Venoclisis también llevará una Llave Triple
Vía con un 70.82% de confianza. La segunda regla muestra los mismo productos
pero en orden distinto, con un 62,59% de confianza. Las siguientes reglas
involucran los productos de la primera, pero además agrega el Volutrol, donde la
regla define que todo aquel cliente que compre un Equipo Venoclisis y una Llave
Ttriple Vía también comprará Volutrol. Es importante observar que en esta
sucursal no destaca la regla de jeringa con aguja, como fue el caso de las 03
sucursales anteriores.
Análisis con árbol de regresión.
El análisis con árbol de regresión fue ejecutado con R, los árboles de regresión
muestran patrones en base a una variable objetivo, el algoritmo del árbol de
regresión identifica las variables dependientes que se representen un indicador
alto de Mejora o Ganancia con relación a la variable objetivo. Con esta técnica
de minería de datos, se pretende completar el análisis para la identificación de
patrones en referencia al ticket promedio y a la rentabilidad.
Para este análisis se utilizará toda la data considerando la cadena
completa de Amberfarma, es decir se agruparán las 5 sucursales, esto debido a
que lo que se busca como objetivo son patrones en el ticket promedio y en la
rentabilidad. El análisis será divido en dos periodos de tiempo, el primer periodo
denominado verano, los cuales incluyen los meses de noviembre, diciembre,
enero, febrero, marzo, abril y el segundo periodo de tiempo denominado invierno
que es conformado por los meses de mayo, junio, julio, agosto setiembre y
octubre. Es importante aclarar que el criterio de dividir al año en estos dos
grandes periodos obedece a las patologías o enfermedades que se suelen
presentar en cada periodo, donde los meses de invierno se presentan en mayor
cantidad enfermedades respiratorias, como gripes, bronquios, etc., mientras que
en el periodo denominado verano se presentan mayores enfermedades de
infecciones estomacales entre otra tipo de infecciones causadas por el calor del
periodo.
106
La siguiente imagen muestra el resultado del algoritmo ejecutado en
R correspondiente al árbol de regresión para el análisis del ticket promedio en
Soles en verano, se puede apreciar en el nivel inferior del árbol 6 nodos con
diferentes valores del ticket promedio que van desde S/ 7.10 en el nodo 8 a S/
16.00 en el nodo 7. Además vemos que el nodo con mayor representatividad con
un 31% es el nodo 10 con un valor de ticket promedio de S/ 8.90. El objetivo es
aumentar el valor del ticket promedio, por tanto se debe determinar una meta
alcanzable, por lo que en la imagen se resalta de rojo el camino a seguir para el
nodo 11, donde el valor del ticket promedio se eleva a S/ 10.00, es decir que las
estrategias que se planteen deben considerar las variables que se encuentra
dentro de este camino.
107
Monto Promedio
por Ítem < S/ 7.00 > = S/ 7.00
Rentabilidad Promedio
por Comprobante < S/ 2.10 > = S/ 2.10
Desv. Estándar de
unidades
comercializadas > = 2.9 < 2.9
Sumatoria de
unidades
comercializadas >= 13 000 < 13 000
Figura 56. Árbol de regresión ticket promedio (S/) - verano. Fuente Boticas Amberfarma. Elaboración propia.
< S/ 5.90 >= S/ 5.90
Monto Promedio
por Ítem
108
El siguiente árbol de regresión muestra el resultado del análisis del
Ticket Promedio en Soles para invierno, en el nivel inferior del árbol se observan
5 nodos que muestran un valor de Ticket Promedio desde S/ 7.00 en el Nodo 4
a S/ 19.00 en el Nodo 7, la mayor representatividad se encuentra en el Nodo 8
con un 40% donde el valor del ticket promedio es de S/ 8.40, como objetivo para
aumentar el valor del ticket promedio se escoge el Nodo 9 con que muestra un
valor de Ticket Promedio de S/ 9.50, la imagen muestra resaltado en rojo el
camino a seguir, donde las estrategias que se apliquen para lograr este objetivo
deben considerar las variables y condiciones que se muestran en la imagen
dentro del camino resaltado en rojo.
Figura 57. Árbol de regresión ticket promedio (S/) - invierno. Fuente: Boticas Amberfarma. Elaboración propia
109
La siguiente figura muestra el análisis del árbol de regresión de la
Rentabilidad Promedio en Soles en verano, como se puede observar en el nivel
inferior del árbol se muestra cinco nodos, donde el valor de la rentabilidad
promedio va desde S/ 2.00 en el Nodo 8 a S/ 3.80 en el Nodo 7, además el Nodo
8 es el que tiene mayor representatividad con un 38%. Como objetivo para
aumentar la rentabilidad promedio se determina al Nodo 5 donde la rentabilidad
promedio es de S/ 2.50, la imagen muestra el camino a seguir en rojo, las
estrategias que sean implementadas para llegar al objetivo deben considerar las
variables que se observan en este camino, en este caso que el Monto Promedio
por ítem que sea menor a S/ 7.00 pero no debe ser menor a S/ 5.60, la estrategia
que lleve la tendencia de las ventas por este comportamiento aumentará la
representatividad del Nodo 5.
Figura 58. Árbol de regresión rentabilidad promedio (S/) - verano. Fuente: Boticas Amberfarma. Elaboración propia.
El siguiente árbol corresponde al análisis de la rentabilidad promedio
en Soles en invierno, se observa que el árbol cuenta con 4 nodos en el nivel
110
inferior, que muestran valores de rentabilidad promedio que van desde S/ 2.00
en el Nodo 4 al Nodo 7 con rentabilidad promedio de S/ 4.10, el nodo con mayor
representatividad es el Nodo 4 con un 53%, el objetivo para aumentar la
rentabilidad promedio es el Nodo 5, donde su valor de rentabilidad promedio se
encuentra en S/ 2.40, la imagen muestra el camino a seguir resaltado en rojo
para lograr el objetivo del Nodo 5. LA estrategia que se plantee para lograr este
objetivo debe considerar las variables que se encuentran dentro de este camino,
que determina el comportamiento de estas ventas. Para este caso se debe
considerar que si el valor del monto promedio es menor a S/ 7.20 no debe ser
inferior a S/ 5.10, de esta forma se buscaría llevar las ventas a este
comportamiento.
Figura 59. Árbol de regresión rentabilidad promedio (S/) - invierno. Fuente: Boticas Amberfarma. Elaboración propia.
La siguiente figura corresponde al análisis del árbol de rentabilidad
promedio en porcentaje en verano, observamos en el nivel inferior a los nodos
terminales que tienen un valor de rentabilidad desde 26% a 62%, el Nodo 10 es
el que tiene una mayor representatividad con un 41% y rentabilidad de 26%. Se
escoge como objetivo al Nodo 11 para alcanzar una rentabilidad de 32%. En rojo
se muestra el camino a seguir, la estrategia debe considerar las variables que
se encuentran dentro.
111
Precio de Compra Promedio
por unidad >= S/ 2.10 < S/ 2.10
Monto Máximo
por
comprobante < S/ 240.00
< S/ 43 000
Monto total
de ventas
mensual
>= S/ 131 000 < S/ 131 000
Figura 60. Árbol de regresión rentabilidad porcentaje (%) - verano. Fuente: Boticas Amberfarma. Elaboración Propia.
Desv. Estándar de
Monto por
comprobante
< S/ 12.00
>= S/ 12.00
>= S/ 240.00
Monto total
de ventas
mensual
> = S/ 43 000
112
Monto Máximo de
ventas por mes
< S/ 162.00 >= S/ 162.00
Precio Compra Máximo por presentación
> = S/ 37 000 < S/ 37 000 >= S/ 6.80
Desviación estándar de
Precio Compra
>= S/ 96 000 >= S/ 121.00
Monto total
de ventas
mensual
Monto total de
ventas mensual
< S/ 6.80
< S/ 121.00 < S/ 96 000
FIGURA 61. Árbol de regresión rentabilidad porcentaje (%) – invierno. Fuente: Boticas Amberfarma. Elaboración propia-
113
La figura anterior muestra el último árbol de regresión analizado,
correspondiente a la rentabilidad promedio en porcentaje en invierno, este árbol
muestra 6 nodos terminales en su último nivel, con valores de rentabilidad
promedio que van desde 25% a 58%, el Nodo 4 tiene maro representatividad con
50% y un valor de rentabilidad promedio de 25%, en este caso el negocio decide
optar como nodo objetivo al Nodo 11, donde se busca que la rentabilidad
aumente a 58%, para esto se debe considerar el camino mostrado en rojo
teniendo presente las variables incluidas, como son el monto máximo de venta,
desviación del precio de compra y monto total de ventas de acuerdo a los valores
mostrados en la gráfica.
Resultados
De acuerdo al análisis realizado en el capítulo anterior, apoyándonos en las gráficas
exploratorias elaboradas para las distintas sucursales y en los resultados obtenidos de la
ejecución de los modelos de minería de datos como son las reglas de asociación y los
árboles de regresión, en la siguiente tabla estructuramos por sucursal los patrones de
ventas identificados, el análisis de los patrones de ventas y las propuestas para la empresa,
que surgen a partir de los patrones.
Patrones de venta sucursal Chorrillos
La siguiente tabla muestra los patrones identificados para la sucursal Chorrillos, se
encuentran doce patrones identificados entre análisis exploratorio y reglas de asociación.
TABLA 25
Patrones de ventas sucursal Chorrillos.
N° Patrón Técnica de
identificación
1 El ticket promedio es superior a los s/ 15.00. Análisis exploratorio
2 Los días de mayor venta son los lunes. Análisis exploratorio
3 Los días de menores ventas son los sábados. Análisis exploratorio
4 En verano, los clientes que compran guantes quirúrgicos #7 Glomex y Preser. Combate clásico x 3 uu también compran papel higiénico x 1 (surtido), con un 78.8% de confianza.
Regla de asociación
5 En verano, los clientes que compran preser. Combate clásico x 3 uu también compran guantes quirúrgicos #7 Glomex, con un 71.3% de confianza.
Regla de asociación
6 En verano, los clientes que compran Preser. Combate clásico x 3 uu también compran papel higiénico x 1 (surtido), con un 77.8% de confianza.
Regla de asociación
114
7 En verano, los clientes que compran Preser.Enjoy surtido-- x 3uu también compran papel higiénico x 1 (surtido), con un 77.5% de confianza.
Regla de asociación
8 En invierno, los clientes que compran Terbometasona 4mg/2ml Amp x 25 unid también compran jeringa nº10 x 100, con un 71.4% de confianza.
Regla de asociación
9 En invierno, los clientes que compran guantes quirúrgicos #7 Glomex y papel higiénico x 1 (surtido) también compran Preser. Combate clásico x 3 uu, al 89.5% de confianza.
Regla de asociación
10 En invierno, los clientes que compran Preser. Combate clásico x 3 uu también compran papel higiénico x 1 (surtido), al 74.3% de confianza.
Regla de asociación
11 En invierno, los clientes que compran mascarilla nebulizadora adulto Alcimax también compran jeringa nº5 x 100, al 80.3% de confianza.
Regla de asociación
12 En invierno, los clientes que compran Terbometasona 4mg/2ml Amp x 25 unid también compran jeringa nº10 x 100, al 70,3% de confianza.
Regla de asociación
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
Chorrillos tiene ticket promedio alto porque se encuentra dentro de las
instalaciones de la clínica municipal del mencionado distrito, por tanto los pacientes
conocen que los medicamentos no son subsidiados por el estado y llevan mayor prepuesto
para invertir. La primera figura de la página 79, muestra claramente que los días de
mayores ventas se dan los fines de semana. La rentabilidad en la tienda está en desarrollo
constante a razón de pequeños índices.
Debido a las reglas de asociación, concluimos en que usualmente los pacientes
que compran preservativos y guantes y papel higiénico de manera frecuente para
exámenes ginecológicos.
TABLA 26
Propuestas de mejora y optimización sucursal Chorrillos.
N° Propuesta
1 Adquirir productos guantes, preservativos y Papel Higiénico con menores precios.
2 Crear ofertas en relación a enfermedades geniturinarias.
3 Crear ofertas utilizando la jeringa como producto de promoción a cero costos, amparados en su bajo costo de adquisición.
4 En invierno realizar negociación con proveedores para adquirir Mascarillas en un menor precio.
5 Los días sábados optimizar los horarios del personal de atención para reducir las horas hombre.
6 Crear paquetes de productos rentables para diferentes enfermedades teniendo como referencia el ticket promedio de S/ 15.00.
7 Los días lunes optimizar los recursos humanos para dedicar las horas de trabajo a la atención en las ventas, se sugiere evitar programación de inventarios, limpiezas, capacitaciones y otras actividades de menor importancia.
Fuente: Elaboración propia.
115
Patrones de ventas sucursal Huaraz
La siguiente tabla muestra los patrones identificados para la sucursal Huaraz, se
encuentran doce patrones identificados entre análisis exploratorio y reglas de asociación.
TABLA 27
Patrones de ventas sucursal Huaraz.
N° Patrón Técnica de
identificación
1 El ticket promedio durante la semana no presenta mayor variación. Análisis exploratorio
2 El ticket promedio muestra una tendencia a la baja que va de enero con s/ 10.00 a diciembre con s/ 8.80
Análisis exploratorio
3 La rentabilidad en el 2017 no muestra crecimiento. Análisis exploratorio
4 En verano, los clientes que compran Mexadex 4 mg/2ml x 25 Amp también compran aguja descart.22 x 1 1/2 caj x 100, al 86.4% de confianza.
Regla de asociación
5 En verano, los clientes que compran Roxtrim balsámico tab x 100 también compran Nopramax 550mg tab x 100 al 52.9% de confianza.
Regla de asociación
6 En invierno, los clientes que compran jeringa nº10 x 100 y Mexadex 4 mg/2ml x 25 Amp también compran aguja descart.22 x 1 1/2 caj x 100, al 82.7% de confianza.
Regla de asociación
7 En invierno, los clientes que compran Mexadex 4 mg/2ml x 25 Amp también compran aguja descart.22 x 1 1/2 caj x 100 al 81.7% de confianza.
Regla de asociación
8 En invierno, los clientes que compran Mexadex 4 mg/2ml x 25 Amp también compran jeringa nº10 x 100, al 71.1% de confianza.
Regla de asociación
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
En los meses de invierno el clima impacta directamente sobre el ticket promedio.
El ticket promedio presenta una tendencia hacia la baja. El ticket promedio durante la
semana presenta variación mínima. La rentabilidad durante el año 2017 no presenta
evolución. En invierno se incrementa el consumo de antibióticos (Roxtrim Balsámico
tabletas) para las vías respiratorias, el cual la dosificación adicional de desinflamantes
(Nopramax 550mg Tabletas).
TABLA 28
Propuestas de mejora y optimización sucursal Huaraz.
N° Propuesta
1 Optimizar las estrategias de ventas a fin de mejorar el ticket promedio y evitar la caída del ticket promedio en el transcurso del tiempo.
2 Se sugiere optimizar las políticas comerciales de productos rentables con el objetivo de maximizar la utilidad.
3 Crear ofertas utilizando las agujas y jeringas como productos de promoción a cero costos, amparado en su bajo costo de adquisición.
116
4 En invierno (verano), definir estratégicamente políticas comerciales de productos categorizados como antibióticos y antinflamatorios para las vías respiratorias considerando la rentabilidad, la proximidad de la fecha de vencimiento y el grado de rotación.
Fuente: Elaboración propia.
Patrones de ventas sucursal Riva Agüero
La siguiente tabla muestra los patrones identificados para la sucursal Huaraz, se
encuentran doce patrones identificados entre análisis exploratorio y reglas de asociación.
TABLA 29
Patrones de ventas sucursal Riva Agüero.
N° Patrón Técnica de
identificación
1 En diciembre se muestra que el ticket promedio incrementa su valor a s/ 10.40.
Análisis exploratorio
2 El ticket promedio de la sucursal es s/ 7.28. Análisis exploratorio
3 La rentabilidad en el 2017 no muestra crecimiento. Análisis exploratorio
4 La rentabilidad de la sucursal represente el 22% de la empresa. Análisis exploratorio
5 En verano, los clientes que compran control de glucosa también compran Diabeteglin 5mg tab x 100, al 98.8 % de confianza.
Regla de asociación
6 En verano, los clientes que compran Betamycol crema x 10gr. También compran fluconazol 150mg x 2 cap------fage al 92.6% de confianza.
Regla de asociación
7 En invierno, los clientes que compran control de glucosa también compran Diabeteglin 5mg tab x 100 al 100% de confianza.
Regla de asociación
8 En invierno, los clientes que compran Betamycol crema x 10gr. También compran fluconazol 150mg x 2 cap------fage, al 99.4% de confianza.
Regla de asociación
9 En invierno, los clientes que compran Braxfar 1gr/3.5ml iny/vial también compran jeringa nº10 x 100 al 95.1% de confianza.
Regla de asociación
10 En invierno, los clientes que compran Mexadex 4 mg/2ml x 25 amp también compran jeringa nº10 x 100 al 77.2% de confianza.
Regla de asociación
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
Esta sucursal muestra claramente cómo mes atípico al mes de diciembre, debido
a que es el mes donde se incrementan las ventas por cuestiones de fiestas de fin de año,
el mismo fenómeno sufre el ticket promedio. En la sucursal Riva Agüero observamos que
tiene el ticket promedio bastante bajo. El cual indica que el público que acude a mercados
va con presupuesto establecido. La rentabilidad no presenta mayor evolución. A pesar de
que el ticket promedio es el más bajo dentro de la cadena, es el segundo en rentabilidad a
nivel de la empresa con un 22% de rentabilidad bruta. De acuerdo a lo observado en las
reglas de asociación se demuestra que la estrategia de pagar incentivos por ventas
funciona tanto para invierno como para verano, se hace referencia a Betamycol Crema y
FLUCONAZOL de 150 mg. Los pacientes que consumen DIABETEGLIN5 mg en tabletas
(medicamento para bajar los niveles de glucosa sanguíneo) con un 89.4% de confianza,
termina midiéndose la glucosa.
117
TABLA 30
Propuestas de mejora y optimización sucursal Riva Agüero.
N° Propuesta
1 En el mes de diciembre, crear ofertas por monto, considerando un incremento del 20% al ticket promedio.
2 Se sugiere optimizar las políticas comerciales de productos rentables con el objetivo de maximizar la utilidad.
3 Se sugiere conseguir producto más rentable que el Diabeteglin 5mg Tab. x 100 y ofrecerlo a los clientes en el control de glucosa.
4 En verano, negociar mejores precios de Betamycol cremax 10GR con proveedores, porque se evidencia demanda en esta temporada.
5 Crear ofertas utilizando las jeringas como productos de promoción a cero costos, amparado en su bajo costo de adquisición.
Fuente: Elaboración propia.
Patrones de ventas sucursal Túpac Amaru
La siguiente tabla muestra los patrones identificados para la sucursal Túpac Amaru, se
encuentran doce patrones identificados entre análisis exploratorio y reglas de asociación.
TABLA 31
Patrones de ventas sucursal Túpac Amaru.
N° Patrón Técnica de identificación
1 El ticket promedio mensual se muestra en s/ 8.71. Análisis exploratorio
2 Los días viernes sábado y domingo el ticket promedio llega a s/ 8.90. Análisis exploratorio
3 La rentabilidad en el 2017 no muestra crecimiento. Análisis exploratorio
4 La rentabilidad de la sucursal representa el 17% de la empresa. Análisis exploratorio
5 En verano, los clientes que compran Diabeteglin 5mg tab x 100 también compran control de glucosa al 95.8% de confianza.
Regla de asociación
6 En verano, los clientes que compran Braxfar 1gr/3.5ml iny/vial también compran jeringa nº10 x 100 al 95.1% de confianza.
Regla de asociación
7 En verano, los clientes que compran Mexadex 4 mg/2ml x 25 amp también compran jeringa nº10 x 100 al 83.3% de confianza.
Regla de asociación
8 En verano, los clientes que compran Flexiodic 75mg/3ml x 10 amp también compran jeringa nº10 x 100 al 80.7% de confianza.
Regla de asociación
9 En invierno, los clientes que compran Diabeteglin 5mg tab x 100 también compran control de glucosa al 99.2% de confianza.
Regla de asociación
10 En invierno, los clientes que compran Braxfar 1gr/3.5ml iny/vial también compran jeringa nº10 x 100 al 95.3% de confianza.
Regla de asociación
11 En invierno, los clientes que compran Mexadex 4 mg/2ml x 25 amp también compran jeringa nº10 x 100 al 86.4% de confianza.
Regla de asociación
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
El ticket promedio se muestra estable durante el año. La sucursal Túpac Amaru
es un local con ventas no tan elevadas, pero evidencia una estabilidad en el ticket
promedio. Durante los fines de semana, el ticket promedio sufre incremento usualmente.
118
Respecto de la rentabilidad, es una sucursal que no presenta desarrollo. Con 17% de
Rentabilidad Bruta, se ubica en tercera posición de rentabilidad en la cadena. Al estar
relativamente cerca, la sucursal Riva Agüero con Túpac Amarú son similares, considerando
las reglas de asociación, es decir los fenómenos comerciales son semejantes, salvo ventas
totales.
TABLA 32
Propuestas de mejora y optimización sucursal Túpac Amaru.
N° Propuesta
1 Se sugiere optimizar las políticas de marketing con el objetivo de mejorar el ticket promedio y maximizar la rentabilidad.
2 Se sugiere conseguir producto más rentable que el diabeteglin 5mg Tab. x 100 y ofrecerlo a los clientes en el control de glucosa.
3 Crear ofertas utilizando las jeringas como productos de promoción a cero costos, amparado en su bajo costo de adquisición.
Fuente: Elaboración propia.
Patrones de ventas sucursal Ventanilla
La siguiente tabla muestra los patrones identificados para la sucursal Ventanilla, se
encuentran doce patrones identificados entre análisis exploratorio y reglas de asociación.
TABLA 33
Patrones de ventas sucursal Ventanilla.
N° Patrón Técnica de identificación
1 El ticket promedio mensual se muestra en s/ 8.43. Análisis exploratorio
2 Los días lunes el ticket promedio llega a s/ 9.70. Análisis exploratorio
3 La rentabilidad en el 2017 muestra crecimiento luego de una caída. Análisis exploratorio
4 La rentabilidad de la sucursal representa el 41% de la empresa. Análisis exploratorio
5 En verano, los clientes que compran llave triple vía c/exten.50cm x 1 ---(sigma) también compran equipo venoclisis –Intrafix al 58.4% de confianza.
Regla de asociación
6 En verano, los clientes que compran envase estéril p/muestra también compran aguja descart.20 x 1 caj x 100 al 42.7% de confianza.
Regla de asociación
7 En verano, los clientes que compran cloruro-sodio 9% x 1lt también compran equipo venoclisis –Intrafix al 41.9% de confianza.
Regla de asociación
8 En invierno, los clientes que compran equipo venoclisis –Intrafix también compran llave triple vía c/exten.50cm x 1 ---(sigma).
Regla de asociación
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
El ticket promedio no tiene relación directa con los volúmenes de venta. Aunque
se hayan aumentado, se percibe que entre enero del 2017 y diciembre del 2017, ha sufrido
una caída de 5.9%. Se observa que el ticket promedio presenta un comportamiento atípico
119
los días lunes con un aumento del 15.42 %. Es la tienda con mayor rentabilidad,
independiente al ticket promedio. La crisis política y social impactó con mayor intensidad a
esta sucursal, viéndose en el mes de junio del 2017, su mayor caída. Esta sucursal
presenta una ligera tendencia creciente, con respecto a la rentabilidad en comparación al
primer trimestre. Con un 41% de rentabilidad bruta de participación en la empresa, se ubica
en la primera posición. Según la regla de asociación se evidencia una mínima diferencia
en el índice de confianza, que al ser una tienda con mayores ventas de productos médico
quirúrgicos, no presenta mayor variación en las ventas.
TABLA 34
Propuestas de mejora y optimización sucursal Ventanilla.
N° Propuesta
1 Se sugiere optimizar las políticas de marketing con el objetivo de mejorar el ticket promedio y maximizar la rentabilidad.
2 Realizar ofertas en relación a productos médico quirúrgicos, porque se evidencia ventas con mayor recurrencia de estos productos.
3 Considerar el impacto directo que sufren las ventas por parte del programa SIS del Ministerio de Salud, debido a que la tienda se encuentra dentro del hospital.
Fuente: Elaboración propia.
Patrones de ventas empresa Amberfarma
La siguiente tabla muestra los patrones identificados para la sucursal Ventanilla, se
encuentran doce patrones identificados entre análisis exploratorio y reglas de asociación.
TABLA 35
Patrones de ventas Boticas Amberfarma.
N° Patrón Técnica de identificación
1 El ticket promedio los días jueves presenta una caída en todas las sucursales.
Análisis exploratorio
2 El mes de abril el ticket promedio sube en las sucursales. Análisis exploratorio
3 Los días de fines de semana, viernes, sábado, domingo el ticket promedio sube en las sucursales.
Análisis exploratorio
4 En el periodo de verano el ticket promedio sube. Análisis exploratorio
5 La rentabilidad en los meses de verano sube. Análisis exploratorio
6 En chorrillos, los clientes que compran aguja descart.23 x 1 1/2 caj x 100 también compran jeringa nº10 x 100 al 75.3% de confianza.
Regla de asociación
7 En Huaraz, los clientes que compran jeringa nº10 x 100 también compran aguja descart.22 x 1 1/2 caj x 100 al 78.8% de confianza.
Regla de asociación
8 En Riva Agüero, los clientes que compran Clinomin amp x 1ml también compran jeringa nº3 x 100 al 100% de confianza.
Regla de asociación
9 En Túpac Amaru, los clientes que compran Clinomin amp x 1ml también compran jeringa nº3 x 100 al 98.6% de confianza.
Regla de asociación
120
10
En verano, el ticket promedio tiene su mayor representación con 31% con un valor de s/8.90 del total de los tickets en todas las sucursales, donde son identificados en todos aquellos tickets que su monto promedio sea menor a s/7.00, con rentabilidad promedio mayor a s/2.10 y monto promedio menor a s/5.90.
Árbol de regresión
12
En invierno, el ticket promedio tiene su mayor representación con un valor de s/8.40 equivalente al 40% del total de los tickets, donde son identificados en todos aquellos tickets que su desviación de la cantidad sea menor a 4.4 productos, con rentabilidad promedio mayor a s/2.00 y monto promedio menor a s/5.10.
Árbol de regresión
13
En verano, la rentabilidad en soles se encuentra mayor representada con el 38% (11 meses) con un valor de rentabilidad de s/2.00, en aquellas transacciones donde el monto promedio sea menor a s/5.60 y la suma del monto del mes sea mayor o igual a s/67 000.00.
Árbol de regresión
14 En invierno, la rentabilidad en soles se encuentra mayor representada con el 53% con un valor de s/2.00, en aquellas transacciones donde el monto promedio sea menor a s/5.10.
Árbol de regresión
15
En verano, la rentabilidad promedio en porcentaje se encuentra mayor representada con el 41% con un valor de 26% de rentabilidad, en aquellos meses donde el precio de compra promedio por unidad es mayor igual a s/2.10 y la desviación del monto es menor a s/ 12.00 y el monto máximo del mes es menor a s/240.00 y la suma del monto del mes es mayor igual a s/43 000.00.
Árbol de regresión
16
En invierno, la rentabilidad promedio en porcentaje se encuentra mayor representada con un el 50% con un valor del 25% en todos aquellos meses en donde el monto máximo sea menor a s/ 162.00 y la suma del monto sea mayor igual a s/37 000.00.
Árbol de regresión
Fuente: Boticas Amberfarma, registro de ventas 2017. Elaboración propia.
Considerando todas las sucursales, se demostró que son vulnerables ante crisis
políticas o sociales, el cual impacta a la población y la economía, lo cual se puede
evidenciar en las gráficas en una caída en el mes de abril del 2017, por la crisis de la
empresa Odebrech. La tienda Chorrillos dentro de la rentabilidad como cadena representa
el 9%, el cual es la de menor participación. El ticket promedio entre los días miércoles y
viernes, sufre una caída recurrente. La tienda de Huaraz con 11% de rentabilidad ocupa la
penúltima posición en la cadena. De acuerdo a las reglas de asociación que el Clinomin
ampolla (anticonceptivo mensual), al no traer jeringa exige la venta de una adicional para
su aplicación. No existe relación directa y tampoco recurrente entre las variables ticket
promedio y venta total, indistintamente al periodo que se evalúe.
TABLA 36
Propuestas de mejora y optimización sucursal Boticas Amberfarma.
N° Propuesta
1 Los días jueves deben ser utilizados para realizar actividades como: inventarios, limpieza, capacitaciones.
2 Los días viernes, sábados y domingos el personal de las sucursales debe priorizar la atención de los clientes y considerar estos indicadores de incremento al momento de asignar permisos y descansos.
121
3 Optimizar las políticas de compra para los meses de invierno, considerando mayores días de crédito.
4 Se sugiere capacitar al personal técnico de dispensación para que su facturación esté en un rango entre S/ 5.60 y S/ 7.00, y al personal de compras para negociar mejores precios de adquisición de los productos.
5 Se sugiere capacitar al personal técnico de dispensación para que su facturación, en verano, esté en un rango entre S/ 5.90 y S/ 7.00.
6 Si la cantidad de productos en una venta es menor a 4.4, los técnicos de dispensación deben buscar que la rentabilidad sea superior a S/2.00 y el monto de facturación sea mayor a S/5.10, para obtener un ticket promedio estimado de S/9.50.
7 Se sugiere capacitar al personal técnico de dispensación para que su facturación esté en un rango entre S/ 5.10 y S/ 7.20 para que la rentabilidad sea de S/ 2.40.
8 Se sugiere que el personal compras puede permitirse comprar productos unitarios superiores o iguales a S/2.10, pero la desviación del monto de venta debe ser superior a los S/12.00.
9 Se sugiere promover como meta por sucursal en invierno, que la venta total sea mayor S/ 96 000.00 al mes por sucursal, considerando que el personal de compra mantenga la desviación del precio de compra por unidad de producto menor a S/ 6.80, con el objetivo de obtener una rentabilidad del 58%.
Fuente: Elaboración propia.
Luego del estudio realizado, con referencia a nuestra hipótesis general se
concluye que la determinación de los patrones de venta, si influyen positivamente en las
ventas, siempre que se dé uso analítico, racional y oportuno, esta afirmación queda
evidenciada en las diferentes tablas de análisis y gráficas, las cuales muestran claramente
el comportamiento de los patrones. Dependiendo del comportamiento de los mencionados
patrones, se pueden utilizar estratégicamente para diferentes fines dentro del ámbito
comercial, administrativo, de marketing, entre otros. Los patrones de ventas propiamente
dichos, no son los que incrementan las ventas, se demostró que los patrones generan
conocimiento y luego a partir de ellos se definen estrategias que son las que generan valor.
Sobre nuestra primera hipótesis específica, podemos decir que la determinación
y posterior uso de los patrones de venta, si influyen en el valor del ticket promedio de ventas
para Boticas Amberfarma E.I.R.L. en el año 2018, al utilizar técnicamente y
estratégicamente este conocimiento se puede condicionar el incremento del ticket
promedio en las diferentes sucursales.
Después del análisis minucioso del comportamiento de los patrones de ventas,
confirmamos la validez de nuestra segunda hipótesis específica, los patrones de ventas
afectan positivamente a la rentabilidad para Boticas Amberfarma E.I.R.L. en el año 2018,
se concluye que afectan positivamente, debido a que el conocimiento generado pueden
ser utilizado en favor del incremento en la venta un producto o por el contrario para retirar
de comercialización algún producto que se identifique como no rentable.
122
En el caso de nuestra tercera hipótesis específica, los patrones de ventas
influyen directamente sobre el abastecimiento de productos para Boticas Amberfarma
E.I.R.L. en el año 2018, se afirma categóricamente que si influye directamente sobre el
abastecimiento. El incremento o disminución en la demanda de productos, hará que este
genere mayores costos operativos y de inventario, o en su defecto hará que el stock se
minimice rápidamente en los anaqueles.
Por último, la cuarta hipótesis específica, los patrones de ventas influyen
directamente sobre las ofertas de venta para Boticas Amberfarma E.I.R.L. en el año 2018,
esta hipótesis es también aceptada y afirmada como verdadera, se demuestra en las
diferentes etapas del estudio, que si influye directamente. Para hacer una oferta por lo
general los empresarios o emprendedores pequeños, usualmente consideran ciertos
criterios para hacer una oferta, estas son las siguientes: nivel de demanda, riesgo de
vencimiento, sobre stock, temporada, precio, entre otros. Por ejemplo un producto de alta
demanda muchas veces no es conveniente ponerlo en oferta.
Los patrones identificados como resultado del trabajo de investigación, son la
consecuencia del análisis de información realizado en un periodo de tiempo determinado,
existen factores externos que van a modificar los patrones y por tanto los resultados
variarán en el tiempo. Debido a esto, será de necesidad de la empresa realizar este análisis
de manera periódica, donde la frecuencia deberá ser determinada por los expertos del
negocio de la empresa que conocen el mercado farmacéutico. El procedimiento planteado
para el análisis consta de varias herramientas que ejecutan sus tareas de forma manual,
donde lo ideal en el escenario de tener una mayor frecuencia de ejecución, la solución
deberá contemplar la automatización del procedimiento, esta mejora sale del alcance
actual del trabajo de investigación, donde se buscaba la obtención de los patrones de
venta, pero la automatización será planificada como un siguiente paso para la mejora de
esta propuesta.
123
Discusión
De acuerdo a las conclusiones de Grández (2017), al utilizar minería de datos la selección
de la metodología a usar es muy importante ya que esto determina la forma de análisis de
la información. Con nuestro trabajo coincidimos en que la metodología aporta de gran
importancia al éxito de la aplicación de minería de datos y al igual que Mejía (2015), los
tres trabajamos coincidimos en utilizar a CRISP-DM. Para el caso de Grández, utilizó reglas
de asociación para determinar patrones de consumo, con este trabajado nosotros
coincidimos que ese modelo aplica para la determinación de patrones, pero a diferencia
del trabajo de Grández utilizar árboles de regresión también aporta a la determinación de
patrones en base a las variables que se desean analizar.
De acuerdo a Obando (2017), las técnicas de minería de datos representan un gran
potencial para la optimización de procesos y ventaja competitiva, con referencia a nuestro
trabajo nosotros debemos agregar que dependiendo del tipo de mercado, las técnicas de
minería de datos son una oportunidad de mejora para la permanencia en el mercado de
las pequeñas empresas contra las corporaciones.
En relación al trabajo realizado por Vásquez (2015), muestra la importancia de la minería
de datos en la toma de decisiones y realiza una evaluación de herramientas para utilizar
las diferentes técnicas de minería de datos, evidenciando el creciente uso de R como
preferido por el mercado. Con nuestro trabajo confirmamos la mayor acogida por los
profesionales con referencia a esta herramienta, punto de los cuales fueron empleados en
la evaluación de la herramienta para escogerla en el desarrollo de nuestro trabajo de
investigación.
De acuerdo al trabajo realizado por Raorane y Kulkarni (2016), evidencian que en las
tiendas retail, la aplicación de minería de datos es útil para la administración. Con nuestro
trabajo a diferencia de ellos no sólo consideramos que se aplique a la administración en
los negocios retail, como es el caso de las farmacias. Las técnicas de minería de datos
permiten su aplicación para este tipo de negocios en aumento de ventas y
comercialización.
124
Conclusiones
Se identificaron los patrones de ventas para Boticas Amberfarma a través de las técnicas
de reglas de asociación y árboles de regresión, concluyendo que la determinación de estos
patrones influye positivamente sobre las ventas, validando así nuestra hipótesis general,
debido a que los patrones permiten la elaboración de estrategias comerciales en la
dispensación y compra de productos en base al comportamiento identificado en estos
patrones, con el fin de aumentar la rentabilidad, el ticket promedio y principalmente las
ventas.
El impacto de los patrones de venta sobre el valor promedio del ticket es directo,
el cual fue determinado en base a los árboles de regresión tanto en temporada de verano
e invierno, donde se valida nuestra hipótesis específica en relación al aumento del ticket
promedio. Debido a que el análisis nos muestra que para realizar el incremento en verano
de S/ 8.90 a S/ 10.00 se deben cumplir las condiciones que el monto promedio por ítem
sea mayor o igual a S/ 5.90 y que la rentabilidad promedio por comprobante mayor o igual
a S/ 2.10. De la misma forma, para el incremento en invierno de S/ 8.40 a S/ 9.50 se debe
cumplir que el monto promedio por ítem sea mayor o igual a S/5.10 y que la rentabilidad
promedio por comprobante sea mayor a S/ 2.00.
Los patrones de venta, determinados en los árboles de regresión en temporadas
de verano e invierno, afectan positivamente a la rentabilidad confirmando nuestra hipótesis
específica, ya que el análisis muestra que la rentabilidad aumenta si se cumplen las
condiciones identificadas. Para el caso de verano el monto promedio por ítem debe ser
mayor o igual a S/ 5.60 pasando de una rentabilidad de S/ 2.20 a S/ 2.50 por comprobante
y en el caso de invierno cumpliendo que el monto promedio por ítem sea mayor o igual a
S/ 5.10 logrando mejorar la rentabilidad de S/ 2.00 a S/ 2.40 por comprobante.
Los patrones de venta determinados en las reglas de asociación influyen
directamente sobre el abastecimiento de productos, confirmando la hipótesis especifica en
relación al abastecimiento, esto debido a que a mayor cantidad de reglas identificadas y
relacionadas a productos de alta rotación como jeringas, papel higiénico, agujas,
preservativos o envases estériles permiten definir un mayor abastecimiento de estos
productos para contar siempre con un stock de acuerdo al comportamiento identificado en
los patrones.
Se evidencia influencia directa de los patrones de ventas sobre las ofertas fue
identificada a través de las reglas de asociación, donde se valida la hipótesis específica
125
que los patrones de ventas influyen directamente, debido a que la determinación de mayor
cantidad de relaciones entre productos como guantes quirúrgicos, preservativos clásicos
y papel higiénico en la sucursal Chorrillos, o el control de glucosa y el Diabeteglin en Riva
Agüero, o las jeringas y el Climonin Ampolla, permiten aumentar la determinación de
ofertas de estos productos con el fin que sea definido en la estrategia comercial.
De acuerdo al análisis realizado a la información histórica de las transacciones de
Boticas Amberfama con base a técnicas de minería de datos para la determinación de
patrones de ventas, podemos concluir que se pueden establecer estrategias para aumentar
las ventas, teniendo como base el conocimiento que se obtiene como resultado de aplicar
técnicas de minería de datos de reglas de asociación y árboles de regresión, las cuales
nos permiten enfocarnos en productos relacionados y en las transacciones más
representativas para las ventas.
Recomendaciones
Se recomienda definir estrategias de ventas teniendo como base el resultado obtenido con
el análisis de minería de datos, realizar ofertas de productos relacionados por sucursal y
estrategias de ventas relacionadas al ofrecimiento de productos adicionales en base al
comportamiento determinado en los árboles de regresión.
Se recomienda tener en cuenta al ticket promedio como un indicador del
consumo de los clientes como capacidad de compra, y no utilizar al ticket promedio como
indicador de rentabilidad.
Se recomienda utilizar las reglas de asociación para la elaboración de
promociones y ofertas de productos. El conocimiento que se obtiene de las reglas permite
relacionar productos que los clientes compran en conjunto.
Se recomienda utilizar los patrones identificados para la definición de las
estrategias de venta que tengan como objetivo el aumento de rentabilidad y aumento del
ticket promedio así como la venta general.
126
Durante el aprovisionamiento se recomienda considerar aquellos productos
que se encuentren dentro de las reglas de asociación y con mayor rotación para que sean
incluidos dentro del plan de compra y contar con stock disponible.
Recomendamos el uso de técnicas de minería de datos para aprovechar la
información que las empresas farmacéuticas vienen registrando, con el objetivo de tener
mayor conocimiento para su toma de decisiones y contar con una herramienta de ventaja
competitiva en el mercado.
127
Referencias
Amores, B. & Cruz, D. (2008). Aplicación de Data Mining para establecer patrones de
comportamiento de datos meteorológicos para la ciudad de Quito, (Tesis de
Pregrado) Escuela Politécnica Nacional, Medillín Colombia.
Recuperado el 09 de abril, en:
http://bibdigital.epn.edu.ec/handle/15000/1041
Azevedo, A. & Santos, M. (2008). KDD, SEMMA and CRISP-DM: A Parallel Overview IADIS
European Conference Data Mining 2008.
Recuperado el 06 de agosto, en:
https://pdfs.semanticscholar.org/7dfe/3bc6035da527deaa72007a27cef94047a7f9.
Díaz Sepúlveda, J. (2012). Comparación entre árboles de regresión CART y Regresión
Lineal, (Tesis de Magister) Universidad Nacional de Colombia, Quito Ecuador.
Recuperado el 08 de agosto, en:
http://www.bdigital.unal.edu.co/9474/1/71269839.2013.pdf
Beltrán Martínez, B.(2013). Minería de Datos, Benemérita Universidad Autónoma de
Puebla.
Recuperado el 15 de marzo, en:
http://bbeltran.cs.buap.mx/NotasMD.pdf
Eckert, K. & Suénaga R. (2013). Aplicación de técnicas de Minería de Datos al análisis de
situación y comportamiento académico de los alumnos de la UGD, Universidad
Gastón Dachary, Misiones Argentina.
Recuperado el 08 de agosto, en:
http://sedici.unlp.edu.ar/bitstream/handle/10915/27103/Aplicaci%F3n+de+t%E9cni
cas+de+Miner%Eda+de+Datos.pdf?sequence=1
Galán, V. (2015). Aplicación de la metodología CRISP-DM a un proyecto de minería de
datos en el entorno universitario, (Tesis de Pregrado) Universidad Carlos III de
Madrid, España.
Recuperado el 12 de abril, en:
https://earchivo.uc3m.es/bitstream/handle/10016/22198/PFC_Victor_Galan_Cortin
a.pdf
128
Gallardo Arancibia, J. (2010). Metodología para la definición de requisitos en proyectos
Data Mining.
Recuperado el 01 de junio, en:
http://www.oldemarrodriguez.com/yahoo_site_admin/assets/docs/Documento_CRI
SP-DM.2385037.pdf
Grández Márquez, M.A. (2017). Aplicación de minería de datos para determinar patrones
de consumo futuro en clientes de una distribuidora de suplementos nutricionales,
(Tesis de Pregrado) Universidad San Ignacio de Loyola, Lima Perú.
Recuperado el 13 de marzo, en:
http://repositorio.usil.edu.pe/bitstream/USIL/2763/1/2017_Granda_Aplicacion-de-
mineria-datos.pdf
Hernández Sampieri, R. (2014). Metodología de la Investigación 6ª Edición, McGraw-Hill
Interamericana Editores, S.A. de C.V.
IBM (2012). IBM SPSS Modeler 15 User’s Guide.
Recuperado el 29 de octubre, en:
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/modeler/15.0/en/U
sersGuide.pdf
IBM Knowledge Center (2018). Características de una regla de asociación.
Recuperado el 10 de junio, en:
https://www.ibm.com/support/knowledgecenter/es/SSEPGG_8.2.0/com.ibm.im.vis
ual.doc/idmu0mst25.html
L. Muñoz, J. N. Mazón & J. Trujillo (2013). ETL Process Modeling Conceptual for Data
Warehouses: A Systematic Mapping Studdy.
Recuperado el 10 de junio, en:
https://rua.ua.es/dspace/bitstream/10045/21179/1/9TLA3_18Munoz.pdf
Mejia Segura, M. H. (2015). Desarrollo de un sistema de proyecciones de ventas con
minería de datos para el apoyo en la toma de decisiones en Boticas Arcangel de la
Ciudad de Chiclayo, (Tesis de Pregrado) Universidad Señor de Sipan, Pimentel
Perú.
Recuperado el 15 de marzo, en:
129
http://repositorio.uss.edu.pe/bitstream/uss/337/1/FACULTAD%20DE%20INGENIE
R%C3%8DA.pdf
Ministerio de la Producción Perú (2015). Anuario Estadístico Industrial, Mipyme y
Comercio Interno 2015.
Recuperado el 06 de marzo, en:
https://www.produce.gob.pe/documentos/estadisticas/anuarios/anuario-
estadistico-mype-2015.pdf
Ministerio de la Producción Perú (2015). Estudio de Investigación Sectorial Industria
Farmacéutica.
Recuperado el 07 de marzo, en:
http://demi.produce.gob.pe/images/publicaciones/publi383012709c344d4b5_16.pd
f
Moine, J. & Aedo, A. & Gordillo, S. (2011). Estudio comparativo de metodologías para
minería de datos, Universidad Nacional de la Plata.
Recuperado el 20 de junio, en:
http://sedici.unlp.edu.ar/handle/10915/20034
Nigro, H. & Xodo, D. & Corti,G.& Terren, D. (2010). KDD (Knowledge Discovery in
Databases): Un proceso centrado en el usuario, Universidad Nacional del Centro,
Buenos Aires Argentina.
Recuperado el 20 de junio, en:
http://sedici.unlp.edu.ar/bitstream/handle/10915/21220/Documento_completo.pdf?
sequence=1
Obando Velásquez, D.A. (2017). Estudio y análisis de entornos comerciales mediante la
evaluación, comparación y experimentación de algoritmos de minería de datos,
(Tesis de Pregrado) Universidad Católica de Santa María, Arequipa Perú.
Recuperado el 18 de marzo, en:
http://tesis.ucsm.edu.pe/repositorio/bitstream/handle/UCSM/6027/71.0578.IS.pdf?
sequence=1&isAllowed=y
Pérez López, C. (2007). Minería de Datos: Técnicas y Herramientas
Recuperado el 09 de mayo, en:
http://www.gustavovalencia.com/app/webroot/img/Documents/BI/Actividades/001/
Articulo%20DM.pdf
130
Proquest (2015). Minería de datos: Qué es y 5 consejos para aprovecharla en las
grandes empresas.
Recuperado el 08 de junio, en:
https://search.proquest.com/docview/1686968835?accountid=43847
Pulla, C. (2011). Técnicas de minería de datos para identificar patrones de colaboración
de los estudiantes que hacen uso del EVA de la UTPL,(Tesis de Pregrado)
Universidad Técnica Particular de Loja, Ecuador.
Recuperado el 20 de marzo, en:
http://dspace.utpl.edu.ec/bitstream/123456789/1013/3/Pulla%20Elizalde%20Cinthi
a%20Elizabeth.pdf
Raorane, A. & Kulkarni, R.V. (2016). Técnicas de Minería de Datos: Una fuente para el
análisis del comportamiento del consumidor, (Paper) Vivekanand College & Chh.
Shahua Intitute of Business Education. Kolhapur, India.
Recuperado el 23 de mayo, en:
https://arxiv.org/ftp/arxiv/papers/1109/1109.1202.pdf
Rivero Sarmiento, C.A. (2012). Clasificación de clientes mediante técnicas de minería de
datos para la empresa Comertex.S.A.,(Tesis de Pregrado) Universidad Industrial
de Santander, Colombia.
Recuperado el 22 de marzo, en:
http://tangara.uis.edu.co/biblioweb/tesis/2012/146524.pdf
Roque Montalvo, I.L. (2016). Análisis comparativo de técnicas de minería de datos para la
predicción de ventas, (Tesis de Pregrado) Universidad Señor de Sipan, Pimentel
Perú.
Recuperado el 23 de marzo, en:
http://repositorio.uss.edu.pe/bitstream/uss/2695/1/Tesis_Roque_Montalvo_Irene.p
df
Vásquez Valles, E. (2015). Minería de datos para la inteligencia de negocios, (Tesis de
Pregrado) Universidad Nacional de La Amazonia Peruana, Iquitos Perú.
Recuperado el 26 de marzo, en:
http://repositorio.unapiquitos.edu.pe/handle/UNAP/4899
131
Anexo 1
FICHA DE ENTREVISTA
OBJETIVO: Determinar patrones de ventas de medicamentos y
problemas en común, en boticas independientes.
MOTIVO DE LA ENTREVISTA: La presente entrevista se realiza
como parte de una investigación de tesis, el objetivo es conocer la
realidad de las oficinas farmacéuticas y su perspectiva a futuro
frente a la dura competencia.
BACHILLERES RESPONSABLES DE LA ENTREVISTA:
Juan Francisco Mendoza Bernedo. DNI°43977334
Wilder Raul Anchiraico Bernaola. DNI° 42134851
DATOS GENERALES DEL ENTREVISTADO:
Nombre y Apellido / razón
Social:……………………………………..……………………………………..………
Nombre comercial del establecimiento:…………………………………………………………
Dirección: ……………………….………Distrito:………….… Departamento:……………….....
Área promedio de sus establecimientos:………metros cuadrados.
Cargo dentro de la organización/ ocupación:……………………………………..………………
Sexo:……….……teléfono:……….………..Correo electrónico:…………………………………
CUESTIONARIO
1. ¿Cómo cree usted que impactará la fusión de Inkafarma y Mifarma en el desarrollo
comercial de su establecimiento farmacéutico?
Negativamente Positivamente
………………………………………………………………………………………………………
2. ¿Utiliza usted algún software para la optimización comercial de su oficina farmacéutica?
(algún sistema en particular).
Si No
……………………………………………………………………………………
132
3. Marque con un aspa el tipo de medicamentos de mayor rotación en su establecimiento
farmacéutico.
Genérico Marca
4. ¿Cuál es el valor de la compra promedio por ticket?
Rango Marque
Menor de 5 Soles.
Entre 5 y 10 Soles.
Entre 10 y 18 Soles.
Mayor a 18 Soles
………………………………………………………………………………………………………
5. ¿Cómo determina el abastecimiento / reposición?
Variable Marque
Viendo faltante de stock
Viendo rotación
Considerando temporada.
Otros.
………………………………………………………………………………………………………
6. ¿Qué temporada es más rentable?
Verano Invierno
………………………………………………………………………………………………………
7. ¿Mide la evolución del ticket promedio de su (s) botica(s) / Farmacia(s)?
Si No
………………………………………………………………………………………………………
133
8. ¿Qué variables considera al momento de realizar ofertas? Ejemplo: sobre stock, precio, etc.
Variable Marque
Sobre stock
Precio de compra.
Temporada.
Otros.
………………………………………………………………………………………………………
9. ¿En cuál de estas 2 temporadas realiza más ofertas?
Verano Invierno
………………………………………………………………………………………………………
10. ¿Realiza registro de sus operaciones de ventas?
Si No
11. ¿Analiza detalladamente los registros de ventas?
Si No
………………………………………………………………………………………………………
12. ¿Tiene políticas de marketing?
Si No
…………………………………………………………………………………………………
13. ¿Realiza comparación de precios al momento de comprar a sus proveedores?
Si No
………………………………………………………………………………………………………
14. ¿Cuál es la temporada (verano / invierno) que tiene mayor incidencia de patologías?
¿Cómo lo determina?
Verano Invierno
134
15. ¿Cuál es la temporada donde tiene mayores ventas?
Invierno Verano
……………………………………………………………………………………………………………
…………………………………………………………………………………………………
16. ¿Con que frecuencia capacita a sus colaboradores?
1 veces al año. 2 veces al año. 6 veces al año. Más de 6 veces
al año.
17. ¿Conoce los productos de baja y alta rotación?
Si No
………………………………………………………………………………………………………
18. ¿Qué productos considera de mayor rentabilidad?
Genérico Marca Otros
………………………………………………………………………………………………………
Fecha en que se realiza la entrevista: / / 2018
LA UNIVERSIDAD SAN IGNACIO DE LOYOLA Y LOS BACHILLERES ANTES
MENCIONADOS AGRADECEN SU GENTIL COLABORACION.
135
Anexo 2
CORREO DIGEMID
De: ERIKA MALDONADO MALPICA <[email protected]>
Fecha: 10 de julio de 2018, 17:26
Asunto: Re: SOLICITUD DE ESTADO DE TRAMITE
Para: wilder raul anchiraico bernaola <[email protected]>
Cc: ALFREDO ANGEL ASPILCUETA FLORES <[email protected]>
Estimado Sr. Anchiraico,
Reciba un cordial saludo, respecto a su solicitud, le informamos que en el siguiente Link: http://www.digemid.minsa.gob.pe/Main.asp?Seccion=768, puede usted acceder a la Base de datos de establecimientos farmacéuticos, cuya data es hasta marzo del presente. Es preciso señalar que esta información se encuentra en permanente actualización en nuestro Sistema, toda vez que el registro es simultaneo a nivel nacional. Asimismo, los establecimientos en el caso de Oficinas farmacéuticas, se encuentran clasificados en Boticas, Farmacias y Farmacias de establecimientos de Salud, no en cadenas de boticas. Para obtener la información que desea puede utilizar los filtros, ubicandolos por razón social.
Estamos encargando al Área de Informática, actualizar la información disponible en la página web.
En el caso de las sanciones, no contamos con información procesada a nivel nacional, acerca de este requerimiento, toda vez que, estas son generadas por cada Entidad Descentralizada de acuerdo a su competencia: DIRIS (Oficinas Farmacéuticas), en Lima Metropolitana y DIRESAs o GERESAs (Oficinas Farmacéuticas, Droguerias y Almacenes especilaizados) en las diferentes Regiones del Perú, siendo competencia de DIGEMID las Droguerías de Lima Metropolitana y los Laboratorios a nivel nacional.
Atte.
Q.F. ERIKA MALDONADO MALPICA
ÁREA DE DESCENTRALIZACIÓN DICER-DIGEMID
Av. Parque de las Leyendas Cdra. 1, Lote 2, Mz. 1-3, Urb. Pando San Miguel
Telefono: 631-4300 Anexo 6209
136
Anexo 3
137
Anexo 4
138
Anexo 5
139
Anexo 6
ANALISIS DE RESULTADOS DE LA ENTREVISTA
DATOS GENERALES:
Total de entrevistados: 67
Mes y Año : Junio del 2018
1.¿Cómo cree usted que impactará la fusión de Inkafarma y Mifarma en el desarrollo comercial de su establecimiento farmacéutico?
Negativamente A 52 77.61%
Positivamente B 15 22.39%
2. ¿Utiliza usted algún software para la optimización comercial de su oficina farmacéutica? (algún sistema en particular).
Si A 41 61.19%
No B 26 38.81%
3.Marque con un aspa el tipo de medicamentos de mayor rotación en su establecimiento farmacéutico.
Genérico A 35 52.24%
Marca B 32 47.76%
4.¿Cuál es el valor de la compra promedio por ticket?
Menor de 5 Soles. A 25 37.31%
Entre 5 y 10 Soles. B 35 52.24%
Entre 10 y 18 Soles. C 5 7.46%
Mayor a 18 Soles D 2 2.99%
5.¿Cómo determina el abastecimiento / reposición?
Viendo faltante de stock A 25 37.31%
Viendo rotación B 36 53.73%
Considerando temporada. C 4 5.97%
Otros. D 2 2.99%
6.¿Qué temporada es más rentable?
Verano A 28 41.79%
Invierno B 39 58.21%
7.¿Mide la evolución del ticket promedio de su (s) botica(s) / Farmacia(s)?
Sí A 37 55.22%
No B 30 44.78%
8.¿Qué variables considera al momento de realizar ofertas? Ejemplo: sobre stock, precio, etc.
Sobre stock A 17 25.37%
Precio de compra B 32 47.76%
Temporada C 14 20.90%
Otros D 4 5.97%
9.¿En cuál de estas 2 temporadas realiza más ofertas?
Verano A 40 59.70%
Invierno B 27 40.30%
10.¿Realiza registro de sus operaciones de ventas?
140
Sí A 52 77.61%
No B 15 22.39%
11.¿Analiza detalladamente los registros de ventas?
Sí A 43 64.18%
No B 24 35.82%
12.¿Tiene políticas de marketing?
Sí A 26 38.81%
No B 41 61.19%
13.¿Realiza comparación de precios al momento de comprar a sus proveedores? ¿Con qué frecuencia?
Sí A 62 92.54%
No B 5 7.46%
14.¿Cuál es la temporada (verano / invierno) que tiene mayor incidencia de patologías? ¿Cómo lo determina?
Verano A 22 32.84%
Invierno B 45 67.16%
15.¿Cuál es la temporada donde tiene mayores ventas? ¿Cómo lo determina?
Verano A 42 62.69%
Invierno B 25 37.31%
16.¿Con que frecuencia capacita a sus colaboradores?
1 vez al año A 22 32.84%
2 veces al año B 20 29.85%
6 veces al año C 10 14.93%
Más de 6 veces al año D 15 22.39%
17.¿Conoce los productos de baja y alta rotación?
Sí A 60 89.55%
No B 7 10.45%
18.¿Qué productos considera de mayor rentabilidad?
Genérico A 33 49.25%
Marca B 23 34.33%
Otros C 11 16.42%
141
Anexo 7
Análisis VAN y TIR
MES 1 MES 2 MES 3 MES 4 MES 5 MES 6 MES 7 MES 8 MES 9 MES 10 MES 11 MES 12
INGRESOS DE EFECTIVO
Ingresos por aumento de rentabilidad por comprobante
2,057 2,057 2,057 2,057 2,057 2,057 2,057 2,057 2,057
Ahorros por reducción de vencimiento
500 500 500 500 500 500 500 500 500
TOTAL DE INGRESOS DE EFECTIVO
0 0 0 2,557 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09
EGRESOS DE EFECTIVO
Pago Fase 1 1,990
Pago Fase 2 2,025
Pago Fase 3 930
Pago Fase 4 1,500
Pago Fase 5 920
Pago Fase 6 1,670
Servicios y viáticos 1,512 312 312
TOTAL DE EFECTIVO PAGADO 5,527.00 2,742.00 2,902.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
EFECTIVO MENSUAL -5,527.00 -2,742.00 -2,902.00 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09 2,557.09
ACUMULADO-PAYBACK -5,527.00 -8,269.00 -11,171.00 -8,613.91 -6,056.82 -3,499.74 -942.65 1,614.44 4,171.53 6,728.62 9,285.70 11,842.79
Tasa Mensual % 0.4074% VAN - MES 8 1,391.99 TIR - MES 8 13%
142
Anexo 8
Cronograma de actividades
MES 1 MES 2 MES 3
N° Tarea Actividad SEM
1 SEM
2 SEM
3 SEM
4 SEM
5 SEM
6 SEM
7 SEM
8 SEM
9 SEM 10
SEM 11
SEM 12
FASE 1: Comprensión del Negocio
1.1 Determinar los objetivos del negocio
1.2 Evaluar la situación
1.3 Determinar el objetivo de minería de datos
1.4 Desarrollar el plan de proyecto
FASE 2: Comprensión de Datos
2.1 Obtener los datos iniciales
2.2 Describir los datos
2.3 Explorar los datos
2.4 Verificar la calidad de los datos
Fase 3: Preparación de Datos
3.1 Seleccionar los datos
3.2 Limpiar datos
3.3 Construir datos
3.4 Integrar datos
3.5 Dar formato a los datos
Fase 4: Modelamiento
143
4.1 Seleccionar técnica de modelamiento
4.2 Generar el diseño de prueba
4.3 Construir el modelo
4.4 Evaluar el modelo
Fase 5: Evaluación
4.1 Evaluar resultados
4.2 Revisar el proceso
4.3 Determinar los siguientes pasos
Fase 6: Despliegue
4.1 Desplegar el plan
4.2 Monitorear y mantener
4.3 Desarrollar el reporte final
4.4 Revisión del proyecto
144
Anexo 9
Riesgos del proyecto
Riesgos de la implementación
Riesgos Probabilidad Impacto
(1-5) Nivel de Riesgo
Magnitud (Días)
Riesgo (Días)
Demora en la obtención de los datos 25% 3 0.75 10 2.5
Carga de datos incompletos 10% 3 0.3 5 0.5
Demora en las validación de las pruebas por parte de la empresa 25% 2 0.5 10 2.5
Usuarios no comprometidos con el proyecto 30% 3 0.9 10 3
Eventualidad en la ejecución del modelo propuesto 5% 5 0.25 3 0.15
Aparición de nuevos requisitos por parte del usuario 20% 3 0.6 0.5 0.1
Fuente: Boticas Amberfarma Elaboración propia.
Métodos de control de riesgos
Riesgos Nivel de Riesgo Método de Control Costo (S/)
Demora en la obtención de los datos 0.75 Contar con experto en base de datos para el soporte
500
Carga de datos incompletos 0.3 Elaboración y revisión de listas para la verificación de la carga de datos
-
Demora en las validación de las pruebas por parte de la empresa
0.5 Contar con un recurso adicional por parte de la empresa para las pruebas
-
Usuarios no comprometidos con el proyecto 0.9 Charla de motivación y comunicación a todo el personal para concientización
200
Eventualidad en la ejecución del modelo propuesto 0.25 Contar con experto para apoyo remoto 500
Aparición de nuevos requisitos por parte del usuario 0.6 Comité de evaluación para nuevos requerimientos
-
TOTAL 1200
Fuente: Boticas Amberfarma Elaboración propia.
145
Anexo 10
Arquitectura y flujo de la solución planteada
Basta con seleccionar y
escribir el texto. Use
los controladores para
ajustar el interlineado.
Basta con seleccionar y
escribir el texto. Use
los controladores para
ajustar el interlineado.
Basta con seleccionar y
escribir el texto. Use
los controladores para
ajustar el interlineado.
Servidor de base de datos de registro de ventas
Terminal para análisis de minería de datos
Datos extraídos de registros de ventas
Data de registros de ventas 2017
Campos seleccionados y limpios de registros de ventas 2017
Análisis de minería de datos
Reportes de resultados del análisis de minería de datos
Basta con seleccionar y
escribir el texto. Use
los controladores para
ajustar el interlineado.
ARQUITECTURA
FLUJO DE TRABAJO
146
Anexo 11
Glosario de términos
Término Descripción
AT&T: American Telephone & Telegraph compañía estadounidense de telecomunicaciones
BETAMYCOL en crema: Medicamento en presentación crema, cuyos principios activos son betametasona y clotrimazol.
Boticas independientes: Son los establecimientos de salud privada, perteneciente a terceros, pero que no tienen aún la categoría de cadenas de farmacias.
BRAXFAR 1 g en ampolla:
Medicamento perteneciente al grupo de las cefalosporinas de tercera generación, con acción farmacológica de amplio espectro.
Cadenas de farmacias: Es el conjunto de sucursales de oficinas de farmacéuticas, de propiedad de una empresa posicionada.
Clinomin ampolla: Anticonceptivo hormonal, de uso mensual, vía de dosificación parenteral con acción farmacológica anovulatoria.
CONTROL DE GLUCOSA:
Procedimiento médico que sirve para conocer el nivel de glucosa sanguíneo.
CRISP-DM: Metodología para proyectos de minería de datos, sus siglas significan Cross Industry Standard Process for Data Mining.
CSV: Tipo de archivo de datos, utilizado para hojas de cálculo.
DIABETEGLIN 5 mg en tabletas:
Medicamento hipoglucemiante.
DIGEMID: Dirección General de Medicamentos Insumos y Drogas.
Director Técnico: Profesional Químico Farmacéutico responsable de un establecimiento farmacéutico.
DIRESAs: Dirección Regional de Salud.
Dolminex Forte en Tabletas:
Medicamento de uso múltiple perteneciente al grupo de fármacos analgésicos antiinflamatorios no esteroideos, este fármaco esta asociada a otra molécula llamada acetaminofen, con la finalidad de sinergizar fuerzas durante la acción terapéutica.
Droga: Principio activo responsable de la acción farmacológica.
E.I.R.L: Sigla que hace referencia a un tipo de empresa (Empresa Individual de responsabilidad limitada).
Equipo Venoclisis: Producto médico quirúrgico utilizado para suministrar sustancias químicas en estado líquido.
Fármaco: Es el medicamento propiamente dicho.
Flexiodic 75 mg en ampolla:
Medicamento que dentro de su composición química lleva diclofenaco sódico de 75 mg.
FLUCONAZOL 150 mg en capsulas:
Fármaco que tiene acción antimicótica o antifúngica.
GERESAs: Gerencia Regional de salud.
IBM Knowledge Center: Centro de conocimiento de la empresa IBM.
147
IBM SPSS: Software estadístico de la empresa IBM.
INDECOPI: Es un ente estatal peruano, cuyas siglas significan Instituto Nacional de Defensa de la Competencia y de la Protección de la Propiedad Intelectual.
INEI: Instituto Nacional de Estadística e Informática.
Inyectable: Conjunto de medicamentos que tienen la presentación para inyección.
Java: Lenguaje de programación.
KDD: Metología para proyectos de minería de datos, sus siglas significan Knowdlege Discovery in Databases.
Kdnuggets: Sitio en línea lider y referente en minería de datos.
KNIME: Plataforma de minería de datos.
Llave Triple Vía: Producto médico quirúrgico que sirve para controlar el suministro de medicamentos en estado líquido.
Lorafast en Tabletas: Fármaco con acción farmacológica antiinflamatorio y antihistamínico.
Mexadex 4 mg en Ampolla:
Fármaco perteneciente al grupo de medicamentos pertenecientes al grupo de corticoides.
Microempresa: Unidad económica constituida por una persona natural o jurídica (empresa) cuyas ventas anuales sean hasta 150 UIT.
Microsoft SQL Server Integration Services:
Componente que forma parte del software Microsot SQL Server.
MINSA: Ministerio de Salud.
NCR: Empresa estadounidense de tecnología.
Nodo: Elemento del árbol de decisión en minería de datos.
Nopramax de 550 mg en tabletas:
Medicamento de uso múltiple perteneciente al grupo de fármacos analgésicos antiinflamatorios no esteroideos.
Oficinas Farmacéuticas: Establecimiento de salud que comercializa y almacena medicamentos, las cuales pueden ser las siguientes: botiquín, boticas, farmacias y servicios de farmacia.
Oracle Data Mining ODM:
Componente de Oracle que permite el uso de algoritmos para minería de datos.
Patologías: Rama de la ciencia médica encargada de ver las enfermedades.
Porcentaje de confianza: Estimador en reglas de asociación para determinar la probabilidad de una relación.
Productos con Mayor Rotación:
Conjunto de productos que presentan alta demanda por parte del mercado.
Productos Rentables: Conjunto de artículos o productos farmacéuticos que generan mayor ingreso por rentabilidad.
Python: Lenguaje de programación.
Químico Farmacéutico: Profesional de la salud con conocimientos integro sobre materia de medicamentos.
R: Lenguaje para análisis de datos.
RapidMiner: Plataforma de minería de datos.
148
Rentabilidad bruta: Es el resultado de la diferencia, entre precio de venta menos precio de compra.
Rentabilidad Promedio: Es la media de la rentabilidad de los tickets emitidos.
Roxtrim Balsámico en Tabletas:
Medicamento categorizado como antibiótico, perteneciente al grupo de las sulfonamidas, la cual está asociada a moléculas de acción farmacológica expectorante.
SAS: Lenguaje de programación para tablas de datos.
SAS Base: Software que utiliza lenguaje SAS.
SEMMA: Metodología para proyectos de minería de datos, sus siglas hacen referencia a Sample, Explore, Modify, Model, and Assess
Software libre: Programa con código fuente libre para ser estudiado y modificado.
SQL: Lenguaje de consulta estructurado para bases de datos.
SQL Server: Sistema de gestión de base de datos de Microsoft.
SQL Server Analysis Services:
Herramienta de Microsoft para el procesamiento análítico y minería de datos.
SQL Server Management Studio:
Aplicación de software que se utiliza para la administración de los componentes de Microsoft SQL Server.
Patrones de Ventas: Comportamiento de las ventas en un periodo de tiempo determinado.
Stock Disponible: Es el stock que se dispone en las diferentes oficinas farmacéuticas.
Tableau: Software de inteligencia de negocios y análisis rápido.
TERBOMETASONA de 4 mg en ampolla:
Medicamento perteneciente al grupo de fármacos de los llamados corticoides.
Ticket Promedio: Es el valor en soles resultado de dividir, monto total de ventas sobre cantidad de tickets impresos.
XML: Formato universal para datos y documentos estructurados.