Post on 12-Feb-2017
MEJORANDO EL PODER PREDICTIVO DE LOS MÉTODOS DE PRONÓSTICO A TRAVÉS DE LA SEGMENTACIÓN DE LOS CLIENTES.
Darwin Amézquita, Master en EconomíaAnalytics
SOBRE MI Pregrado y maestría en Economía en la
Universidad de Los Andes.
Trabajo desde hace 2 años como jefe de Cobranzas para Decision Analytics. Directv, Gerencia de Decision Analytics.
Trabajé 3 años como Director de Modelos en la gerencia de Portafolio. Colpatria-Scotia Bank, Gerencia de Modelos.
Autor y Co-autor de 5 Papers presentados en el SAS Global Forum/Conferencia de Analytics de SAS.
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Segmentación de Clientes Selección de Variable Back Testing
Resultados Conclusiones
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
Hacer predicciones es muy difícil, especialmente cuando se trata del futuro…
(Niels Bohr)Premio Novel de física en 1922.
MoraCargue
a Gestión
DX RX
Vencimiento Factura
Día 15 de Mora
Vencimiento 2da
Factura
Día 50 de Mora
Inicio Pronóstico
Tasas de efectividad
PRONÓSTICO - ANTERIOR
Churn Neto
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
OPORTUNIDAD¿Qué
?• Mejorar el Pronóstico de
Churn• Tener un seguimiento diario
¿Por qué? • Ineficiencias • Decisiones
¿Cómo? • Usando Anaytics• Segmentación de Clientes
Resultado • Proceso diario• Mejora en la precisión• Mejora en el churn
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Segmentación de Clientes Selección de Variable Back Testing
Resultados Conclusiones
MoraCargue
a Gestión
DX RX
Vencimiento Factura
Día 15 de Mora
Vencimiento 2da
Factura
Día 50 de Mora
Inicio Pronóstico
Tasas de efectividad
PRONÓSTICO - ANTERIOR
Churn NetoInicio Pronóstico
Tasas de efectividad
por perfil de clienteClientes
DX Churn Neto
METODOLOGÍA• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables• Bining Interactivo (SAS Miner) Gini Impurity
Transformación de variables
• Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes.
Selección de variables
• A través de la POSANOVA• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias Generación de
perfiles• Si tu objetivo es pronosticar, debes buscar el
mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables• Bining Interactivo (SAS Miner) Gini Impurity
Transformación de variables
• Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes.
Selección de variables
• A través de la POSANOVA• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias Generación de
perfiles• Si tu objetivo es pronosticar, debes buscar el
mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes.
Backtesting
CATEGORIZACIÓN
METODOLOGÍA• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables• Bining Interactivo (SAS Miner) Gini Impurity
Transformación de variables
• Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes.
Selección de variables
• A través de la POSANOVA• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias Generación de
perfiles• Si tu objetivo es pronosticar, debes buscar el
mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables• Bining Interactivo (SAS Miner) Gini Impurity
Transformación de variables
• Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes.
Selección de variables
• A través de la POSANOVA• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias Generación de
perfiles• Si tu objetivo es pronosticar, debes buscar el
mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables• Bining Interactivo (SAS Miner) Gini Impurity
Transformación de variables
• Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes.
Selección de variables
• A través de la POSANOVA• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias Generación de
perfiles• Si tu objetivo es pronosticar, debes buscar el
mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes.
Backtesting
Source DF Mean Square F Value Pr > FGRP_dias_para_dx 3 138.548.699 16.85 <.0001GRP_nivel_de_riesgo_ 3 0,63452907 7.72 <.0001GRP_ANTIGUEDAD_2 3 0,29126066 3.54 0.0141perfil 2 0,48325008 5.88 0.0029GRP_Producto 5 0,03007973 0.37 0.8722MOP_ACTUAL 3 0,01519597 0.18 0.9068GRP_dias_para*perfil 6 0,24270575 2.95 0.0072GRP_dias_*GRP_Produc 15 0,06638425 0.81 0.6705GRP_nivel_de_*perfil 6 0,16194953 1.97 0.0669GRP_nivel*MOP_ACTUAL 9 0,1167049 1.42 0.1743GRP_ANTIG*MOP_ACTUAL 9 0,1654189 2.01 0.0347
METODOLOGÍA• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables• Bining Interactivo (SAS Miner) Gini Impurity
Transformación de variables
• Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes.
Selección de variables
• A través de la POSANOVA• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias Generación de
perfiles• Si tu objetivo es pronosticar, debes buscar el
mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables• Bining Interactivo (SAS Miner) Gini Impurity
Transformación de variables
• Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes.
Selección de variables
• A través de la POSANOVA• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias Generación de
perfiles• Si el objetivo es pronosticar, debes buscar el
mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes.
Backtesting
ANOVA - ANTIDESCONEXION Variables escogidas para la antidescionexión:
Pendiente de la mora Antigüedad Nivel de Riesgo Días para la DX Producto + Método de pago.
ANOVA - RECONEXIÓN Variables escogidas para la Reconexión:
Pendiente de la mora Antigüedad Nivel de Riesgo Día de la RX * Días desde la DX Tecnología.
INTRODUCCIÓN Antecedentes Oportunidad de Negocio Desarrollo
Selección de Variable Segmentación de Clientes Back Testing
Resultados Conclusiones
GANANCIAS EN LAS TASAS DE DX
1_1_1_1_2
2_2_2_1_1
2_2_1_1_1
1_2_1_1_1
4_2_2_1_1
1_1_2_1_1
1_2_1_1_2
3_2_1_1_1
2_2_1_2_1
2_1_1_1_2
2_2_1_1_2
4_2_1_1_1
1_2_2_1_2
1_1_1_1_1
2_2_2_1_2
5_2_2_1_1
3_2_1_2_1
2_2_1_2_2
3_2_1_1_2
1_2_2_2_1
1_2_1_2_1
3_2_2_2_1
2_2_2_2_1
3_1_1_1_2
3_2_2_1_2
3_2_1_2_2
2_1_1_1_1
2_2_2_2_2
5_2_1_1_1
4_2_1_1_2
4_2_2_1_2
4_2_1_2_1
4_2_2_2_1
1_1_2_1_2
3_2_2_1_1
2_1_1_2_2
2_1_1_2_1
3_2_2_2_2
1_2_1_2_2
4_2_1_2_2
3_1_2_1_2
5_1_1_2_2
5_1_1_1_2
3_1_1_1_1
4_1_1_2_2
2_1_2_1_2
4_1_2_2_2
2_1_2_2_1
5_2_1_1_2
2_1_2_2_2
4_1_2_2_1
3_1_1_2_2
3_1_1_2_1
1_2_2_2_2
5_1_2_1_1
5_2_1_2_1
1_1_1_2_2
4_1_1_2_1
4_2_2_2_2
3_1_2_2_1
1_1_1_2_1
3_1_2_2_2
5_2_1_2_2
4_1_1_1_2
1_1_2_2_1
5_2_2_2_2
4_1_1_1_1
5_2_2_1_2
5_1_2_2_2
5_1_1_1_1
4_1_2_1_1
4_1_2_1_2
1_1_2_2_2
5_1_2_1_2
5_1_1_2_1
2_1_2_1_1
3_1_2_1_1
5_1_2_2_1
5_2_2_2_1
0%10%20%30%40%
50%60%70%80%90%
100%
Tasas de DX por perfil
Tasa DX por PerfilPromedio
GANANCIAS EN LAS TASAS DE RX
1 2 3 4 5 6 7 80.0%
5.0%
10.0%
15.0%
20.0%
25.0%
30.0%
35.0%
40.0%
Tasa de Reconexión por día
Perfil 1Perfil 2Perfil 3Perfil 4Perfil 5Perfil 6Perfil 7Total
Perfil 1 Perfil 2 Perfil 3 Perfil 4 Perfil 5 Perfil 6 Perfil 7 Total
71.9% 71.2% 78.0%68.8%
81.0%100.0%
21.4%
88.8%
Tasa de ReconexiónDiferencias significativas en las tasas de eventos
PRONÓSTICO ANTERIOR01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
-1000
0
1000
2000
3000
4000
5000
6000
-1400
-1200
-1000
-800
-600
-400
-200
0
DX ForecastDX RealRX PronósticoRX RealChurners netos pronóstico Chruners netos real
PRONÓSTICO ACTUAL01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
-1000
0
1000
2000
3000
4000
5000
6000
-1500
-1000
-500
0
500
1000
1500
2000
2500
3000
DX ForecastDX RealRX PronósticoRX RealChurners netos pronóstico Chruners netos real
GANANCIAS EN LAS TASAS DE DX
1_1_1_1_2
2_2_2_1_1
2_2_1_1_1
1_2_1_1_1
4_2_2_1_1
1_1_2_1_1
1_2_1_1_2
3_2_1_1_1
2_2_1_2_1
2_1_1_1_2
2_2_1_1_2
4_2_1_1_1
1_2_2_1_2
1_1_1_1_1
2_2_2_1_2
5_2_2_1_1
3_2_1_2_1
2_2_1_2_2
3_2_1_1_2
1_2_2_2_1
1_2_1_2_1
3_2_2_2_1
2_2_2_2_1
3_1_1_1_2
3_2_2_1_2
3_2_1_2_2
2_1_1_1_1
2_2_2_2_2
5_2_1_1_1
4_2_1_1_2
4_2_2_1_2
4_2_1_2_1
4_2_2_2_1
1_1_2_1_2
3_2_2_1_1
2_1_1_2_2
2_1_1_2_1
3_2_2_2_2
1_2_1_2_2
4_2_1_2_2
3_1_2_1_2
5_1_1_2_2
5_1_1_1_2
3_1_1_1_1
4_1_1_2_2
2_1_2_1_2
4_1_2_2_2
2_1_2_2_1
5_2_1_1_2
2_1_2_2_2
4_1_2_2_1
3_1_1_2_2
3_1_1_2_1
1_2_2_2_2
5_1_2_1_1
5_2_1_2_1
1_1_1_2_2
4_1_1_2_1
4_2_2_2_2
3_1_2_2_1
1_1_1_2_1
3_1_2_2_2
5_2_1_2_2
4_1_1_1_2
1_1_2_2_1
5_2_2_2_2
4_1_1_1_1
5_2_2_1_2
5_1_2_2_2
5_1_1_1_1
4_1_2_1_1
4_1_2_1_2
1_1_2_2_2
5_1_2_1_2
5_1_1_2_1
2_1_2_1_1
3_1_2_1_1
5_1_2_2_1
5_2_2_2_1
0%10%20%30%40%
50%60%70%80%90%
100%
Tasas de DX por perfil
Tasa DX por PerfilPromedio
Perfil
Perfil-Tasa
¿Acciones?
GANANCIAAp
r-14
May
-14
Jun-
14
Jul-1
4
Aug-
14
Sep-
14
Oct
-14
Nov-
14
Dec-
14
Jan-
15
Feb-
15
Mar
-15
Apr-
15
May
-15
Jun-
15
Jul-1
5
Aug-
15
16.9%19.4%
43.2%
16.3%
45.3%
30.5%
2.9%
10.6%
14.6%
9.0%
16.4%
4.8%
11.2%
16.6%
13.0%
4.5%
14.2%
Desviación absoluta del Forecast
CONCLUSIONES Hay ganancias significativas en el poder
predictivo de los pronósticos de churn. Cada evento a pronóstico requiere un nuevo
proceso de categorización de variables, selección de variables y selección de perfiles.
En el caso presentado anteriormente las tasas de Desconexión y Reconexión son evidentemente distintos entre perfiles.
El método de selección de perfiles con la ANOVA y POST-ANOVA es un método eficiente para fines prácticos de mejorar la predicción del modelo de pronóstico.
¿PREGUNTAS?
CONTACTO Darwin Alberto Amezquita Business Partner Churn Involuntario Decision Analytics|DIRECTV Colombia Ltda Cel. (+57) 321 496 9356 Tel. 6516000 Ext. 1673 Email: alberto24d@gmail.com www.directv.com.co