Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
-
Upload
stephane-chappellier -
Category
Data & Analytics
-
view
640 -
download
1
Transcript of Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Convictions des cabinets Solucom et solvINSLaurence Al Neimi – Stéphane Chappellier
Données pour la Data Science :Opérer une sélection ou se lancertous azimuts ?
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
IntroductionBig Data : une alchimie à trouver pour transformerla donnée en mine d’or…
Le BIG DATA ouvre un large champ despossibles…
§ Sources de données en nombrecroissant§ Evolution exponentielle des volumes de
données§ L’identification des signaux faibles
devient de plus en plus crédible
Mais plusieurs contraintes à l’exploitationde cette manne d’informations…
§ Techniques
§ Financières
§ Opérationnelles
…nécessitent de trouverun compromis
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Données pour la Data Science :Opérer une sélection ou se lancer tous azimuts ?
3
1 L’utilisation des sources de données dans lachaîne de valeur de l’Assurance
Notre approche : « Think Big, Try Small » 2La démarche en rupture au service de
la valorisation de la donnéeRetour d’expérience EDF
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Reconsidérer l’assurance à l’aune desnouvelles connaissances
ü Identifier les comportements anormauxü Identifier les informations déclaratives falsifiéesü Réduire le coût de la fraude
ü Affiner les modèlesü Proposer une tarification personnalisée et interactiveü Proposer une offre adossée aux usages et parcours de vie
ü Réduire les taux d’attritionü Cibler l’effort de prospectionü Individualiser la proposition client
ü Mettre en adéquation les moyensü Estimer le degré d’urgence afin de prioriser les traitements
ü Accompagner le client de manière globaleü Restituer aux clients des informations sur eux-mêmes
L’impact du Big Data est une opportunité pour plusieurs fonctionstout au long de la chaîne de valeur.
Concevoir des produitsConstruire une tarification
1
Connaître ses clientsson marché
2
Lutter contre la fraude
3
Gérer les sinistres
4
Proposer des services
5
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
S’investir dans une démarche DataPourquoi ?
1Repenser son Business Model
Repenser son Business Model& Entreprendre la bonne démarche
Le secteur de l’Assurance entreprend un virage sans précédentpour opérer un repositionnement. Le secteur est en recherche desolutions en rupture.
4 L’Assurance a besoin de nouveaux relais de croissance4 La Data va être au cœur de la solution et sera le vecteur de la
nécessaire transformation. 2Entreprendre la bonne démarcheLa construction d’une démarche expérimentale sans conscience
des opportunités va limiter les repositionnements et la portée desexpérimentations.
4 Une prise de conscience des opportunités offertes par la Data permetde servir la vision stratégique.
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Sortir du cadreMettre le Big Data au service de l’expérience client
THE CLIMATE CORPORATION :Le Big Data conduit à intégrer l’assurance
météo agricole dans une démarche servicielle
§ Une entreprise fondée en 2006§ Par David Frieberg, un vétéran de
Google§ Rachetée par Monsanto
§ Un nouveau modèle de serviced’assurance en ligne
§ Destiné au monde agricole§ Prévention des risques
météorologiques
§ Optimiser la sélection des semences§ Optimiser l’organisation des semis§ Optimiser les conditions de récolte
Qui
PLUS VALUE
§ La plateforme technologique développée par The Climate Corporationpermet de réaliser une combinaison des trois techniques suivantes :
§ La surveillance et le recueil hyper-local des conditionsmétéorologiques, ce grâce à l’utilisation de capteurs implantés dansles champs
§ La modélisation des données agricoles§ Des simulations météo en haute résolution
§ …Afin de mettre à disposition des agriculteurs, via le site « climate.com »,une solution visant à améliorer leur activité.
§ Le dédommagement de l’agriculteur est automatisé en cas d’événementmal anticipé.
Quoi
Pourquoi
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Données pour la Data Science :Opérer une sélection ou se lancer tous azimuts ?
3
1 L’utilisation des sources de données dans lachaîne de valeur de l’Assurance
Notre approche : « Think Big, Try Small » 2La démarche en rupture au service de
la valorisation de la donnéeRetour d’expérience EDF
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Ouvrir le champ des possiblesComment ?
Chercherl’inspiration
Qualifier lafaisabilité
Développer desinnovations
Recenser et prioriser lessources de données possibles
Analyse des sources prioritaires
Idéation sur les cas d’usage possibles
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Les sources du Big Datasont nombreuses et de natures différentes
DonnéesPartenaires
Donnéesinternes
DonnéesSemi -
Publiques
Donnéescollectées
Sources
Dat
a.go
uv.fr
INSE
ESI
V
Prog
ram
me
TV
AGIRA
Calendrier scolaire
Ope
nD
ata
RéférentielsPostaux
Base ARGOSVéhicules volés
Crim
inal
ité(C
arto
cim
e)ORIAS
Comparateurs
Rés
eaux
depr
esta
taire
s
Déclarationssociales desentreprises
Rapports d’expertise Acteursde
l’achatm
édia
RéseauxProfessionnelsde Santé Q
ualificateursd’audience
Annonceurs
Expe
rts,
Car
ross
iers
…
CRM
:Co
ntac
ts,
Dem
ande
s,Ac
tions
Aven
ants
Démographie desentreprises
Constats
CaractéristiquesclientsDevis
Garanties
Produits
Déclarations desinistres
Cont
rats
Prestations
Obj
ets
conn
ecté
s
Cookies
denavigation
Capteurs de laSmart City
Google MapGoogle trend
Boitier OBD-I Véhicule
Boitier Habitation/ Domotique
Réseaux sociaux
Bracelet / Balance/ Tensiomètre
PollutionTraficMétéo
Compteur et BoxIntelligents
L’analyse du degré d’exploitabilité et du degré d’intérêtdes données est un prérequis.
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Favoriser l’idéationLes éléments clefs
Émergence des idées
Management des idées
> Cartographier :quelles sources de
données ?
> Cibler :à quelles sources de
données avoir recours ?
> Analyser : quels usagesenvisager pour ces
sources de données ?
Insp
iratio
nId
éatio
n
> Élaborer : quels casd’usage pour ces sources
de données ?
Expé
rimen
tatio
n Management des projets
Identifi-cation
descas
d’usage
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
La proposition de 4 étapes clefs conciliantcréativité et pragmatisme
Hiérarchiser lessources de données
• Réalisation d’unematrice SWOT pourchacune des sources etcibler l’étude
• Validation des sourcescibles à analyser
CIBLER ANALYSER
Obtenir une notationd’exploitabilité et
d’intérêt des sourcesciblées
• Analyse des sourcesretenues sur la based’un jeu de données
• Qualificationfonctionnelle ettechnique des sources
ELABORER
Cadrer des casd’usages au regard
des étapes 2 et 3
• Définition des casd’usage possibles
• Proposition d’une feuillede route
Obj
ectif
s Ouvrir le champ despossibles en terme
de sources dedonnées,
sans a priori
• Cartographie la plusexhaustive possible dessources de données
• Catégorisation selonles branchesd’assurance etles usages
CARTOGRAPHIER
Rés
ulta
ts
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
CARTOGRAPHIERUne première étape cleflaissant entrevoir le champ des possibles
UsageProduits
Conception et PricingCRM
Interactif et PrédictifFraudes
DétectionSinistres
GestionServices
Développement
Conduite
Habitation
Santé &Bien-être
BienVieillir
PrévoyanceEmprunteur
RetraiteAssur. Vie
Entreprises
Données CRM & avenantsBoitier OBD-IISIV, INSEE, CartocrimeDonnées partenaires (DARVA),comparateurs Pass-navigo - VelibDonnées CRM, PrestationsBox Domotique/Compteur intelligentINSEE, Cartocrime, GéolocalisationDonnées Smart City, Météo FranceDonnées partenaires, comparateurs
Données CRM, PrestationsObjets connectés : bracelets,balances, tensiomètres…SNIIRAM, INSEE,Données partenaires, comparateurs
Données CRM / Boitier OBD-IITraces internet : changement devéhicules, mutation professionnelle…Données comparateurs
Données CRMAGIRA, ArgosBoitier OBD-IIRéseaux sociaux
Données CRMSIV, INSEE, CartocrimeDonnées partenairesBoitier OBD-II
Données CRMRéseaux sociaux / Traces internetDonnées partenaires, comparateursBoitier OBD-II
Données CRM / Box / CompteurTraces internet : changement delogement, mutation professionnelle…Données comparateursDonnées Smart City
Données CRMBox domotique/Compteur intelligentRéseaux sociauxMétéo, Google Map…
Données CRM,Géolocalisation, Météo, BdD CCRDonnées partenaires, comparateursBox Domotique/Compteur intelligentDonnées Smart City
Données CRMRéseaux sociaux / Traces internetDonnées partenaires, comparateursBox Domotique/Compteur intelligentDonnées Smart City
Données CRM / Objets connectésTraces internet : nutrition, sport,loisirs…Données comparateursSNIIRAM, INSEE…
Données CRMRéseaux sociauxObjets connectés
Données CRM, analyse prestationsSNIIRAM, INSEE,Données partenaires, comparateursObjets connectés : bracelets,balances, tensiomètres…
Données CRM,Objets connectésSNIIRAM, INSEE,Données partenaires, comparateursDonnées SmartCity
Données CRM, analyse prestationsBox domotique/Compteur intelligentObjets connectésSNIIRAM, INSEE,Données SmartCity
Données CRM,Box domotique/Compteur intelligentObjets connectésTraces internet : centre d’intérêtsDonnées SmartCity
Données CRMBox domotique/Compteur intelligentObjets connectésRéseaux sociaux
Données CRM, analyse prestationsSNIIRAM, INSEE,Box domotique/Compteur intelligentObjets connectésDonnées SmartCity
Données CRMBox domotique/Compteur intelligentObjets connectésRéseauDonnées SmartCity
Données CRM/GestionObjets connectés : bracelets,balances, tensiomètres…SNIIRAM, INSEE,Données partenaires, comparateursAdministration : permis véhicule
Données on-linePole emploiNet-entreprises-fr (DSN)(Géolocalisation )
Données CRM – INSEE – Googlemap
Données CRM – Données on-lineAbonnements Presse spécialiséenumérique : Ex : Capital)
Données on-linePole emploiNet-entreprises-fr (DSN)
INSEE – AGIRA – FICOVIE –AGIRC-ARCO (+ caissescatégorielles)
Données CRM / BdD Euler, Coface…Boitier OBD-II pour flotteObjets connectés « domotique » et« santé » adaptésDonnées Smart City
Données CRMBdD Euler, Coface…Boitier OBD-II et Objets connectésDonnées Smart CityRéseaux sociaux
Données CRMBoitier OBD-II et Objets connectésRéseaux sociaux
Données CRMBoitier OBD-II et Objets connectésRéseaux sociaux
Données CRMBdD Euler, Coface…Boitier OBD-II et Objets connectésRéseaux sociaux
Associé à Santé
AGIRC-ARCO (+caissescatégorielles)Associé à Santé
Données CRM – Données on-lineAbonnements Presse spécialiséenumérique : Ex : Capital)INSEE,
Fonction
Usage
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
CIBLERUn travail de hiérarchisation des donnéesà travers l’analyse SWOT
Une première analyse SWOT (Force, Faiblesse, Opportunité, Menace) parsource de données permet de cibler celles à analyser plus finement.
Données disponibles auprès d’acteurs tiers du secteur Données disponibles (gratuit ou non) auprès de partenaires
Données collectées via internet ou les objets connectés
DONNÉES SEMI-PUBLIQUES DONNÉES PARTENAIRES
DONNÉES COLLECTÉESDONNÉES INTERNES
Données internes à l’entreprise (clients, gestion)
DonnéesPartenaires
Donnéesinternes
DonnéesSemi -
Publiques
Donnéescollectées
Sources
Accès libre
S W
O T
Accès libre Travail à fournir pour yaccéder et l’exploiter
Donnéessous-exploitéesDifférenciationconcurrentielle
Donnéesnon-exclusives
Timing important
S W
O T
Données propriétairesAccessibilité facile
Données parfoisnon structuréesnon conservées
Données exclusivesAccès impossible
pour les concurrents-
S W
T
Donnéespointues/spécialisées
Potentiel fort pourcontextualiser
Temps et coûtsde négociation avec
les partenaires
O Données trèssous-exploitéesDifférenciationconcurrentielle
Exclusivité parfoispossible à négocier
SAccès aux donnéescomportementales
WCoût et durée dela mise en œuvre
T Acquisitionproblématique -Intrusion dans la
« vie privée »
ODonnées très
sous-exploitéesDifférenciationconcurrentielle
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
ANALYSERL’identification du degré d’exploitabilité et dudegré d’intérêt de chaque source
Intérêt absolu de la donnée : quel est l’intérêt de la donnée utilisée seule ?
Intérêt relatif de la donnée : quel est le degré d’intérêt de la donnée enfonction des données avec lesquels on peut la croiser ?
Coût d’acquisition : Faut-il payer (et combien) pour obtenir la donnée?
#2Degré
d’intérêt
#1Degré
d’exploitabilité
Accès : Comment accède-t-on à la donnée ?- Donnée interne- Par partenariat- En mettant en place des objets connectés- Solution technique d’accès à la donnée (EDI, interface…)
Structure : La donnée est-elle structurée ?
Fiabilité : Quel est le degré de fiabilité de la donnée récoltée ?
Image : Quel est l’impact en terme d’image lié à l’utilisation de cette donnée ?
Technologie : Quelles sont les technologies à mettre en place pourcollecter/analyser/valoriser la donnée ?
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
ELABORERProposition de cas d’usage et cadrage
Investissement pour se positionnerà la source de la donnée
Les cas d’usage et lesdonnées s’avèrent-ils
pertinents ?
OK ?
Quels cas d’usage et quellesdonnées pourraient être
pertinents ?
QUOI ?
Comment collecte-t-on etexploite-t-on ces données ?
COMMENT ?
Que cherche-t-onà connaître ?
POURQUOI ?
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Données pour la Data Science :Opérer une sélection ou se lancer tous azimuts ?
3
1 L’utilisation des sources de données dans lachaîne de valeur de l’Assurance
Notre approche : « Think Big, Try Small » 2La démarche en rupture au service de
la valorisation de la donnéeRetour d’expérience EDF
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
#PrincipeFondateur @SmartData
§ Exploiter, croiser les donnéesinternes
§ Intégrer des données externes
§ En veillant au respect desdonnées clients
§ Co-construire avec leséquipes opérationnelles
Au-delà du BIG,le SMART
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Retour d’expérience EDFRésumé de la saison 1
Instance POC BOARD top Direction
Fréquence mensuellePassage en 30 minutes chrono
Présentations concrètes, mini démo,« donner à voir »
POC SmartData
Cadrage de ladémarcheSmart Data
Identification dethématiques dePOC et choix en
ateliers
Novembre Janvier
Réalisation des 5 POC
Juin
Préparation de la saison 2
Appel à idées sur laplateforme Com’In
Une sélectionTop-down & Bottom-up
+
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Retour d’expérience EDFÉtapes clefs d’un POC Smart Data
ACCOMPAGNEMENT UTILISATEUR
EXPLORATION DATA
Constructiond’une base dedonnées
Etude des donnéesModélisation
Construction d’unoutil/prototype
Expérimentation
REX etcadragepost POC
Cadrage d’expérimentationEtude d’un besoin utilisateur
Ajustements…
Cadrage
Définir les étapes etobjectifs
Durées à titre indicatif sur un POC de 6 mois
2 semaines 2,5 mois 1 mois2,5 mois
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Retour d’expérience EDFLes Facteurs Clefs de Succès
« Être rigide sur l’agilité »« Être rigide sur l’agilité » Un esprit start-up pour plus d’efficacitéUn esprit start-up pour plus d’efficacité
Prévoir l’après POCet les scenarii de poursuite
Favoriser l’esprit start-up
Garder le capet rester mobilisé sur l’objectif du POC (éviter uneplanification trop chronophage, ne pas embarquerdes sujets annexes…)
Data Board(3-4 personnes)
Fixe, décide etporte l’ambition
Data OpComOriente,
Coordonne,Priorise
Incube et réaliseles POC
Se réunit toutesles 2 semaines
Se réunit toutesles 2 semaines
Data Team
…
Durée d’un POC :environ 6 mois
++
+
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
ConclusionBig Data,nouveau vecteur de création de valeur…
Un Projet Big Data est avant tout un projet de transformation
Les clés du succès d’un tel projet :« Think big, try small » & « Test and Learn »
Travailler avec des petites équipes pluridisciplinaires en modeAgile / « start-up » est plus adapté aux itérations
La magie du Big Data n’existe pas…
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com
Contacts
Laurence AL NEIMIest Manager chez Solucom, en charge du pôled’expertise Assurance avec plus de 15 ansd’expérience sur ce secteur. Elle a dirigé et faitaboutir de nombreux programmes detransformation sur les différentes branchesd’assurance et environnements du secteur(courtage international, bancassureur, assureur,mutuelle).
Stéphane CHAPPELLIERest Associé fondateur de solvINS, spécialisé dansles données issues des objets connectés. Actuairecertifié. Après un début de carrière en compagnie,il a exercé des responsabilités en conseil(notamment, associé-fondateur d’EMB Franceracheté par Towers Watson). Il a encadré desmissions en tarification, provisionnement,modélisation financière et fusion-acquisition enFrance et à l’international.
Mobile : +33 (0)6 13 49 07 92Mail : [email protected]
www.solucom.frwww.solvins.fr
Mobile : +33 (0)6 07 34 98 23Mail : [email protected]