SMART DATA ET DATA SCIENCE AU SERVICE DU ......1 Retour d’Expérience Optimisation d’un...
Transcript of SMART DATA ET DATA SCIENCE AU SERVICE DU ......1 Retour d’Expérience Optimisation d’un...
1
Retour d’Expérience
Optimisation d’un algorithme d’acceptation automatiquede dossiers d’octroi
SMART DATA ET DATA SCIENCE AU SERVICE DU CROWDLENDING : COMMENT ACCROÎTRE LES FINANCEMENTS TOUT EN RÉDUISANT LES RISQUES DE DÉFAILLANCE ?
2
S o m m a i r e
1) Présentation des enjeux
2) Environnement de départ, outils utilisés au départ
3) Méthodologie et outils pour atteindre la cible
4) Résultats et gains chiffrés
5) Next steps
6) Q&R
33
P R E S E N T A T I O N D E S E N J E U X
44
Credit.fr
En quelques mots
NOTRE ADN :
MANAGEMENT DU RISQUE ET AGILITÉ
Création Acquisition par
TIKEHAU CAPITAL
Mars 2015 Juin 2017
16 employées 6M€ en levée de fonds
Crédits aux TPE/PME
20 000€
à
2 500 000€
1ère
Fintech de
France à être
reliée avec la
Banque de
France (Fiben)
Taux de défaut
parmi les plus bas
d’Europe
1 min : pour ouvrir un
compte prêteur
N°1En nombre d’entreprises financées
4 jours : durée moyenne
pour obtenir le déblocage
des fonds
55
NOS
EMPRUNTEURS
Projets financés
Taux moyen
Montant financé
Durée moyenne
326
7,36%
69 942 €
43 705
22 801 050 €
Montant moyen
Demandes de prêt
Capital remboursé
Intérêts versés
4 159 769 €
1 104 703 €44 mois
66
Partenariat avec Hello Bank!
Signé en septembre 2016
8 janvier 2018 : lancement
du FPS TIKEHAU CREDIT.FR pour les
investisseurs institutionnels (30 M€)
NOS
PRÊTEURS
16 830
20 %
Prêteurs
Financés par des holdings
ou trésorerie d’entreprise
7
E n j e u x / O b j e c t i f s d u p r o j e t
dossiers reçus
dossiers étudiés
dossiers acceptés
Impayés
Profit
Enjeux
Atteindre l’objectif de croissance 2020 pour prendre la
place de leader français.
Objectifs
Augmenter le taux d’agrément automatique et
maintenir le niveau de risque pour limiter les impayés.
Retour sur investissement
Moins cher qu’un budget de Google Adwords, la
modification de l’algorithme d’octroi permettrait
d’accroître le volume d’acceptation tout en maintenant
le niveau de risque.
CYCLE ON-BOARDING
8
E n v i r o n n e m e n t d e d é p a r t , o u t i l s u t i l i s é s a u d é p a r t
9
M é t h o d o l o g i e e t o u t i l s p o u r a t t e i n d r e l a c i b l e
10
10
P O U R A T T E I N D R E L A C I B L E
Pas d’IA sans DatasciencePas de Datascience sans DATA …
Pas de science sans L’EXPERTISE des METIERS
11
11
I m p l é m e n t a t i o n
d e l a s o l u t i o n
p o u r u n e
r é p o n s e e n
t e m p s r é e l
M o d é l i s a t i o n d e
l ’ a c c e p t a t i o n
e t d u r i s q u e
S i m u l a t i o n
i t é r a t i v e d e s
R O I
M a i t r i s e r
l ’ e n s e m b l e d e s d a t a s e x i s t a n t e s
S ’ a p p u y e r s u r l e r e t o u r
d ’ e x p é r i e n c e
E v a l u e r l e p o t e n t i e l d u m a r c h é
D A T A S C I E N C E A L T A R E S
A i d e r C r e d i t . f r à o p t i m i s e r s o n a l g o r i t h m e d ’ o c t r o i
… La data, source de performance, est au cœur du projet
12
12
D A T A C O M P O R T E M E N T A L E 500 000 balises trackées
S C R A P I N G 15 millions de mots-clés
700 000 logos
700 000 pages sociales
C R O W D S O U R C I N G Catalogue de 4 000 produits
10.000 pages entreprises
D A T A D I G I T A L E 1,8 millions de sites web
2, 5 millions d’e-mails
D A T A H I S T O R I Q U E 15 millions d’entreprises (RNCS, INSEE)
15 millions de comptes annuels
10 millions d’entrées au BodaccD A T A O N B O A R D I N G 3,2 millions de cookies
C O L E C T E E T
T R A I T E M E N T D E
D O N N E E S
BtoB
N O T R E L E G I T I M I T E D A T A , B I G D A T A
3 0 a n s d e s a v o i r f a i r e
D A T A I N T E R N A T I O N A L E 255 millions d’établissements
18 millions de liens capitalistiques
228 millions de dirigeants
O P E N D A T A4,2 millions de marques déposées,
designs et brevets…
D A T A P R I V É E 3,6 milliards d’éléments de bilan
500 000 mises à jour quotidiennes
40 millions de paydex
*
*
*
* Sources utilisées dans le cadre de ce REX
*
131313
Ensemble desdemandes
100%
75% des demandessont en rejet automatique
25% des demandessont acceptées automatique
demandesen rejet manuel
1% dossiers
financés
1. L’algorithme initial, au démarrage de la plateforme digital de Credit.fr, repose sur de l’expertise et sur un ensemble de règles qui utilise largement le score de
défaillance Altares
2. Après 3 ans de fonctionnement, les données récoltées permettent de
d’avoir une base de connaissancepour faire évoluer l’algorithme et de conserver le niveau de risque actuel en augmentant le nombre de dossiers acceptés et donc d’optimiser le travail
de l’arbre de décision
No Go GoALGO
Niveau de Risque +++
Risque -Risque +
O P T I M I S A T I O N D E L ’ A L G O R I T H M E D ’
A C C E P T A T I O N T E M P S R E E L
Analyse manuelle
des dossiers
141414
Ensemble desdemandes
demandesen rejet automatique
Demandesacceptées en automatique
demandesen rejet manuel
1% de dossiers financés
No Go GoALGO
Risque -Risque +
Niveau de Risque +++
Majoritairement
Mais il reste des
entreprises avec un
Niveau de risque + ou un
niveau de risque -
Solution :Identifier et reclasser automatiquement les dossiers à
faible risque
O P T I M I S A T I O N D E L ’ A L G O R I T H M E D ’ A C C E P T A T I O N
Analyse manuelle des
dossiers
ISO Impayé
Mesure du risque
151515
La solution consiste à déplacer la mesure du risque de l’ensemble des dossiers déposés auprès de Crédit.fr vers 3 millions d’entreprises qui reflètent le marché potentiel de la plateforme
Une base de 3 millions d’entreprises permet une mesure/observation précise du risque sur les segments à l’origine des règles de l’algorithme
Tandis les « seuls » dossiers déposés pendant 2 ans permettent seulement une approximation imprécise du risque
On peut ainsi mettre en œuvre une technique statistique simple et fiable, de test de moyenne, sur un grand nombre de critères (plus d’un millier) et la base des 3 millions d’entreprise pondérés pour être représentative de l’ensemble des dossiers
O P T I M I S A T I O N D E L ’ A L G O R I T H M E D ’ A C C E P T A T I O N
161616
Ensemble desdemandes
Baisse des demandes en rejet automatique
Augmentation de 50% des
demandesacceptées en automatique
demandesen rejet manuel
+50% de dossiers financés
No Go GoNEW ALGO
Risque –Risque +
O P T I M I S A T I O N D E L ’ A L G O R I T H M E D ’ A C C E P T A T I O N
+ 50 %ISO IMPAYÉ
AVANT/APRÈS : objectif rester à
1%
17
R é s u l t a t s e t g a i n s c h i f f r é s
18
S I M U L A T I O N D U R O I : s u i v a n t l e s h y p o t h è s e s d é d u i t e s d e l ’ h i s t o r i q u e
+ 50 %
Retour sur investissement
Moins cher qu’un budget de Google Adwords la modification de l’algorithme
d’octroi permet d’accroitre le volume d’acceptation tout en maintenant le
niveau de risque.
43 705 dossiers reçus
10 926 dossiers étudiés
326 dossiers acceptés22.8 M€
2 à 4 Impayés
Profit
43 705 dossiers reçus
16 390 dossiers étudiés
489 dossiers acceptés34.2 M€
4 à 6 Impayés
Profit
19
N E X T S T E P S
2020
PROCHAINES
ETAPES
Mise en place du nouvel algorithme avec les équipes d’Altares
Intégration des données non conventionnelles suite au programme de R&D avec le labo Rexfi (CNAM / ESCP / ENA)
Travail avec LINXO pour l’accès aux relevés de comptes bancaires dans le processus octroi
Intégration des Fiben dans le score Credit.fr
1
2
3
4
21
Q u e s t i o n s R é p o n s e s
# b e d a t a
F R A N C E
55, avenue des Champs-
Pierreux
92000 NANTERRE
+33 (0)825 80 58 02
P A Y S - B A S
Otto Reuchlinweg 1032,
3072 MD ROTTERDAM
MANAGEO
290 avenue Galilée
13594 Aix en Provence
B E L G I Q U E
Avenue Charles-Quint 576,
1082 BRUXELLES,
M A G H R E B
Inforisk Altares Africa
42 Bd Abdelmoumen
CASABLANCA
w w w . a l t a r e s . c o m