Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril -...

118
Mémoire présenté devant l’Université Paris Dauphine pour l’obtention du diplôme du Master Actuariat et l’admission à l’Institut des Actuaires le _____________________ Par : Houda Afailal Titre: Modélisation de la valeur contrat pour le pilotage du portefeuille moto Confidentialité : X NON OUI (Durée : 1 an 2 ans) Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus Membre présent du jury de l’Institut des Actuaires : Signature : Entreprise : Nom : Run Services /AXA France Signature : Directeur de mémoire en entreprise : Membres présents du jury du Master Actuariat de Dauphine : Nom : Thomas Gauthron (Manageur) Vanessa Roger (Maître de stage) Signature : Autorisation de publication et de mise en ligne sur un site de diffusion de documents actuariels (après expiration de l’éventuel délai de confidentialité) Signature du responsable entreprise : Secrétariat : Bibliothèque : Signature du candidat : Université Paris-Dauphine, Place du Maréchal de Lattre de Tassigny, 75775 PARIS Cedex 16 Master Actuariat de Dauphine

Transcript of Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril -...

Page 1: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Mémoire présenté devant l’Université Paris Dauphine

pour l’obtention du diplôme du Master Actuariat

et l’admission à l’Institut des Actuaires

le _____________________

Par : Houda Afailal

Titre: Modélisation de la valeur contrat pour le pilotage du portefeuille moto

Confidentialité : X NON OUI (Durée : 1 an 2 ans)

Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus

Membre présent du jury de l’Institut

des Actuaires : Signature :

Entreprise :

Nom : Run Services /AXA France

Signature :

Directeur de mémoire en entreprise :

Membres présents du jury du Master

Actuariat de Dauphine :

Nom : Thomas Gauthron (Manageur)

Vanessa Roger (Maître de stage)

Signature :

Autorisation de publication et de mise en ligne sur un site de diffusion de documents

actuariels (après expiration de l’éventuel délai de confidentialité)

Signature du responsable entreprise :

Secrétariat :

Bibliothèque : Signature du candidat :

Université Paris-Dauphine, Place du Maréchal de Lattre de Tassigny,75775 PARIS Cedex 16

Master Actuariat de Dauphine

Page 2: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Remerciements

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 2

Page 3: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Remerciements

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 3

Remerciements Bien qu’étant chargée d’études actuarielles stagiaire au sein de la société Run Services, ce stage a

eu la particularité de se dérouler dans les locaux d’AXA France, au sein de la Direction de Marché IARD,

dans le service « Auto Particuliers ». Avant toute chose, j’aimerai remercier toutes les personnes ayant eu

un rôle concernant la réalisation de ce mémoire. La richesse de cette expérience se manifeste autant sur le

plan professionnel que sur le plan humain. J’y ai construit mon intégration dans le monde de l’Actuariat,

développé des compétences telles que la rigueur du raisonnement et enfin réalisé que « tous les modèles

sont faux, mais certains sont utiles », (George Box).

Je souhaiterais d’abord remercier Hervé Gicquel, directeur général de Club 14 pour m’avoir

accueillie au sein de son entreprise.

Je remercie également Delphine Maisonneuve, directrice du marché IARD Particuliers d’Axa

France, et Bruno Foubert, directeur de la branche automobile du marché IARD d’ Axa France pour leur

accueil au sein de la direction de marché IARD.

Je remercie mon manageur Thomas Gauthron, pour m’avoir reçue au sein du service « Auto

Particuliers » et pour la confiance qu’il m’a témoignée.

Je remercie tout particulièrement Vanessa Roger, pour son encadrement durant ce stage, la

formation professionnelle qu’elle m’a apportée, ainsi que pour la richesse des conseils qu’elle a pu me

donner.

Je remercie l’ensemble de l’équipe Auto, dont mes voisins de bureau, pour leur bonne humeur

quotidienne ainsi que Claire Lafosse Marin et Valérie Robinet pour leur bienveillance et contribution au

bon déroulement de ce stage.

Je remercie enfin l’équipe pédagogique de l’université Paris Dauphine pour m’avoir fourni la

connaissance nécessaire au déroulement de cette expérience : Marc Hoffmann, responsable du Master 2

Actuariat de l’université Paris Dauphine pour son écoute, et Emmanuel Lépinette, maître de conférences à

l’université Paris Dauphine, pour son aide quant à la rédaction de ce mémoire.

Page 4: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 4

Sommaire Remerciements .................................................................................................................................................. 3

Sommaire........................................................................................................................................................... 4

Résumé .............................................................................................................................................................. 6

Abstract ............................................................................................................................................................. 6

Synthèse ............................................................................................................................................................ 7

Summary .......................................................................................................................................................... 11

Cadre de l’étude et problématique ................................................................................................................. 15

Présentation institutionnelle ....................................................................................................................... 15

La valeur contrat : un outil de pilotage en marketing devant être modélisé .............................................. 17

Partie 0 : Extraction des données et établissement du périmètre .................................................................. 20

0.1 Choix de la base ..................................................................................................................................... 20

0.2 Structure des données ........................................................................................................................... 20

0.3 Périmètre de l’étude .............................................................................................................................. 25

Partie 1 : Modélisation de la prime pure ......................................................................................................... 26

I. Analyse descriptive pour la modélisation de la prime pure ..................................................................... 27

I.1 Analyse uni variée ............................................................................................................................... 27

I.2. Etude des corrélations ....................................................................................................................... 29

I.3. Tests de significativité d’ANOVA (Analyse de la variance) ................................................................ 32

I.4. Analyse en composantes multiples : une confrontation des résultats précédents .......................... 33

II. Construction du modèle de prime pure .................................................................................................. 36

II.1 Choix de l’approche et application de la théorie des modèles linéaires généralisés ........................ 36

II.2 Obtention d’un modèle de segmentation et d’explication de la prime pure ................................... 41

II.3. Validation du modèle de prime pure ............................................................................................... 43

III. Conclusion .............................................................................................................................................. 57

Partie 2 : Modélisation de la prime commerciale ........................................................................................... 58

I. Analyse descriptive pour la modélisation de la prime commerciale .................................................. 59

I.1 Analyse uni variée ............................................................................................................................... 59

I.2 Etude des corrélations entre la prime commerciale et l’ensemble des variables du support ......... 61

I.3 Tests de significativité des variables par analyse de la variance ........................................................ 62

II. Construction du modèle de prime commerciale ..................................................................................... 62

II.1 Modèle de segmentation et de prédiction de la prime commerciale ............................................... 64

II.2 Validation du modèle de prime commerciale ................................................................................... 65

III. Conclusion ....................................................................................................................................... 70

Partie 3 : Modélisation de la probabilité de résiliation ................................................................................... 72

I. Intérêt et cadre de la modélisation de la probabilité de résiliation ......................................................... 72

Page 5: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 5

II. Analyse descriptive pour la modélisation de la probabilité de résiliation .......................................... 74

II.1 Analyse uni variée ............................................................................................................................. 74

II.2 Corrélations entre la variable de résiliation et le support ................................................................ 76

II.3 Analyse en composantes multiples ................................................................................................... 77

III. Construction du modèle de résiliation ................................................................................................... 78

III.1 Théorie sur la régression choisie ...................................................................................................... 78

III.2 Résultats de la sélection ................................................................................................................... 79

III.3 Analyse du pouvoir discriminant ...................................................................................................... 80

III.4 Les rapports de chance ..................................................................................................................... 82

III.5 Résultats obtenus sur la base de test et conclusion......................................................................... 84

Partie 4 : Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle .......................... 86

Conclusion de l’étude ...................................................................................................................................... 89

Bibliographie .................................................................................................................................................... 90

Table des illustrations ...................................................................................................................................... 91

Figures ......................................................................................................................................................... 91

Tableaux ...................................................................................................................................................... 93

Annexes : ......................................................................................................................................................... 95

Annexe 1 : Résultats et interprétations du tri à plat pour la prime pure .................................................... 95

Annexe 2 : Matrice des corrélations entre les variables du support et la prime pure .............................. 104

Annexe 3 : Coordonnées et contribution des modalités de l’ACM sur la sinistralité ................................ 105

Annexe 4 : Procédure itérative de Newton Raphson ................................................................................ 107

Annexe 5 : Pseudo Code de l’algorithme de sélection -segmentation ..................................................... 108

Annexe 6 : Code SAS de la procédure « Genmod » pour les modèles de fréquence et coût moyen ....... 110

Annexe 7 : Résultats du tri à plat pour la prime commerciale .................................................................. 112

Annexe 8 : Résultat du tri à plat pour la probabilité de résiliation .......................................................... 114

Annexe 9 : Matrice de corrélation entre les facteurs du support de la probabilité de résiliation ............ 117

Annexe 10 : Coordonnées et contribution des modalités de l’ACM sur la résiliation .............................. 118

Page 6: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Résumé / Abstract

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 6

Résumé Mots-Clés : Assurance moto, Analyse descriptive, GLM (Modèles linéaires généralisés), Résiliation,

Rentabilité, Segmentation, Valeur contrat.

La valeur contrat en assurance moto est un indicateur de rentabilité du contrat, correspondant à la

somme actualisée des résultats probables générés par le contrat sur un certain nombre d’années. Ce

mémoire met en place une méthodologie de calcul de cette dernière, ainsi que les limites que celle-ci

possède. Trois modèles seront mis en place :

Un modèle de segmentation et prédiction de la prime pure ayant un pouvoir explicatif moyen de

84%.

Un modèle de segmentation et prédiction de la prime commerciale dont le pouvoir explicatif est de

75%.

Un modèle d’évaluation de la probabilité de résiliation de l’assuré dont le taux de bon reclassement

est de 58%.

La dernière partie de ce mémoire établit une méthodologie de calcul de la valeur contrat et

débouche sur des pistes d’amélioration du modèle.

Cet outil de pilotage en marketing s’inscrit dans un cadre innovant dans la mesure où, peu utilisé en

assurance IARD, il permet d’avoir une vision de la rentabilité du portefeuille. Sa mise en place est

cependant complexe, et nécessite la prise en compte de l’ensemble des particularités du portefeuille.

Abstract Key - Words: Motorcycle insurance, Descriptive Statistics, GLM (Generalized Linear models), Termination,

Profitability, Segmentation, Policy value.

The value of a motorcycle policy indicates the contract profitability, and corresponds to the discounted

sum of the likely outcomes generated by the contract for a certain number of years. This thesis establishes

a methodology for calculating the latter, as well as its limitations. Three models were built:

A model of segmentation and prediction of the pure premium with an average explanatory power

of 84 %

A model of segmentation and prediction of the commercial premium with an explanatory power

of 75%.

A model that evaluates the probability of the contract termination of the insured with a rate of

correct reclassification of 58%.

The last part of this thesis establishes a methodology for calculating the contract value and leads

to ways to improve the model.

This portfolio management tool is part of an innovative framework because it is not very used in property

and casualty insurance. It enables to forecast the profitability of the policies but its establishment is

complex and requires taking into account the whole specificities of the portfolio.

Page 7: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Synthèse /Summary

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 7

Synthèse

Afin d’améliorer la politique de souscription et la fidélisation de ses clients, AXA a construit un indice client.

Ce dernier est une note comprise entre 1 et 5, allant de « client standard » à « très bon client ».

L’établissement de cet indice est réalisé, entre autres, à partir de la valeur des contrats en auto.

La valeur contrat en assurance moto est un indicateur de rentabilité du contrat, correspondant à la

somme actualisée des résultats probables générés par ce contrat sur un certain nombre d’années

Aujourd’hui, un détenteur d’automobiles et de motos assurées chez AXA possède un indice client au sein

duquel seule la valeur de ses contrats automobile est intégrée, et non celle de ses contrats moto.

L’utilité de cette étude réside dans le fait de faire entrer la valeur contrat moto dans cet indice, et au-delà

de cet objectif, faire en sorte que celle-ci devienne un outil de pilotage de portefeuilles en marketing. La

valeur contrat dépend de la prime pure du contrat, de sa prime commerciale ainsi que de sa probabilité de

présence dans le portefeuille, comme le montre la formule ci-dessous :

Équation 1 Formule de la valeur contrat

Les trois paramètres cités précédemment seront modélisées dans ce mémoire, constitué de cinq parties.

La première partie consiste en la description de la méthode d’extraction de l’échantillon servant de support

à la modélisation. Les trois parties suivantes illustrent respectivement comment les modèles de prime pure,

prime commerciale et probabilité de résiliation du contrat ont été construits. Enfin, la cinquième partie

dresse une méthodologie de calcul de la valeur contrat.

1. Extraction des données et établissement d’un périmètre

La partie préliminaire à la modélisation décrit comment les données ont été extraites : elle réside

principalement en une étude du degré de fiabilité des données concernant l’assuré. Le caractère prédictif

de la problématique fait qu’il est utile de disposer d’une « marge » dans le passé pour pouvoir tester la

stabilité du modèle, pour cela l’échantillon de support à la modélisation est celui de l’année 2011. Enfin, un

périmètre est dressé dans un souci d’homogénéité des données : l’étude ne prend en compte que les

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

Prime commerciale de l’année k

Prime pure de l’année k

Produits financiers de l’année k

Frais d’acquisition et de gestion de l’année k

Taux d’actualisation entre l’année 0 et l’année k

Taux d’inflation de l’année k

( ) Probabilité de résiliation entre l’année 0 et l’année k.

Page 8: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 8

contrats à tacite reconduction, exclut les motos de collection, ainsi que deux niveaux de garanties du

produit moto Club 14, qui sont des cas dérogatoires.

2. Modélisation

Les trois parties suivantes du mémoire ont une structure similaire. Elles consistent d’abord en une analyse

descriptive de la variable réponse en question. Elles débouchent par la suite sur la construction d’un

modèle de segmentation et de prédiction (prime pure et la prime commerciale) ou uniquement d’un

modèle de prédiction (probabilité de résiliation). Les modélisations font toutes appel à la théorie des

modèles linéaires généralisés.

Construction d’un modèle de segmentation et de prédiction de la prime pure

L’ensemble des facteurs qui seraient des potentiels éléments de la modélisation de la prime pure sont des

variables essentiellement tarifaires. Les « meilleurs » candidats ont été repérés par plusieurs outils qui sont

les suivants :

Une analyse uni-variée consistant en la représentation graphique de la prime pure en fonction du

facteur en question

Une étude des corrélations entre les facteurs ainsi qu’entre la prime pure et les facteurs

Une analyse de la variance confirmant la significativité de certains facteurs à un seuil de 5 %

Une analyse en composante multiples sur les individus sinistrés et ceux qui ne l’étaient pas a

permis de confronter les résultats précédents.

La modélisation a été effectuée selon une démarche fréquence/coût moyen. La sélection des meilleurs

éléments de prédiction et de segmentation de la prime pure a été réalisée grâce à une procédure

recherchant l’ensemble de variables qui maximise l’information de l’échantillon des primes pures, tout en

minimisant l’effectif de cet ensemble.

Il en résulte que les facteurs par lesquels la prime pure a été segmentée et prédite sont les suivants :

Modèle de fréquence : zone, formule de souscription, ancienneté de la carte grise, groupe (facteur

indiquant les caractéristiques techniques de la moto), ancienneté du permis.

Modèle de coût moyen : Niveau de prix du véhicule et formule de souscription.

Les deux modèles expliquent en moyenne 84 % de la variance de l’échantillon, ce qui est selon la

littérature un bon indicateur de qualité. Les plus grands écarts de prédiction sont observés pour les risques

peu exposés ou ayant eu peu de sinistres.

D’éventuelles pistes d’amélioration de ce modèle seraient :

Tester une paramétrisation du coût moyen selon la loi de Weibull

Prédire non pas le coût moyen mais la variation du coût moyen par rapport à un coût moyen

minimal.

Choisir une autre méthode de détermination de la meilleure segmentation, notamment celle

basées sur l’analyse de la variance.

Construction d’un modèle de segmentation et de prédiction de la prime commerciale

La prime commerciale n’est pas déterministe et pour cela il faut la modéliser: elle change en fonction des

modifications que l’assuré a décidé d’apporter à son contrat. Les mêmes outils que ceux utilisés lors de la

partie précédente sont utilisés (analyse uni variée, étude des corrélations, tests de significativité,

algorithme de sélection des facteurs).

Page 9: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 9

Les «meilleurs » facteurs par lesquels la prime commerciale est segmentée puis prédite sont les suivants :

la formule de souscription, le groupe, l’ancienneté de permis ainsi que le coefficient technique. Les facteurs

sont globalement identiques à ceux utilisés dans le modèle de prime pure. L’ajustement de cette prime

commerciale prédite par rapport à l’individu est d’une bonne qualité, et en moyenne, cette dernière sera

pratiquement égale à celle évaluée par le modèle. Les erreurs de prédiction du modèle de prime

commerciale sont les plus élevées sur les cases tarifaires ayant peu d’effectif.

Construction d’un modèle de prédiction de la probabilité de résiliation

Probabiliser le flux du contrat l’année passe par la détermination de la probabilité de résiliation de

chaque assuré entre l’année 0 et l’année k. Le modèle d’explication de la probabilité de résiliation est basé

sur la projection d’une variable réponse binaire (Résiliation: Oui/ Non) via une régression logistique.

Les facteurs permettant de prédire la probabilité de résiliation sont les suivants : l’âge du conducteur, la

durée de détention du véhicule, l’ancienneté du contrat, la formule de souscription, le fractionnement de

ses cotisations, ainsi que le coefficient technique.

Ce modèle à un taux de bon reclassement de 58 %. Les rapports de chance ont permit d’isoler l’impact de

chaque variable du modèle et de cerner les groupes qui avaient plus de chances de perdurer dans le

portefeuille. Les résultats du modèle de résiliation sont assez corrects dans la mesure où l’objectif n’est pas

de prédire un acte de résiliation mais de calculer une probabilité de présence dans le portefeuille.

3. Méthodologie de calcul de la valeur contrat

L’ensemble des paramètres du modèle est à présent disponible et permettra de déterminer une valeur

contrat. La formule suivante explicite l’évaluation de la valeur contrat.

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

∑∏

( )

( ) ( ∏ (

))

( ) ∏ (

) ∏

(

)

(

)

(

)

(

)

Page 10: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 10

Sous réserve de stabilité sur les années 2011, 2012 et 2013, ces modèles seront implémentés dans un

programme SAS déroulant la méthodologie de calcul de la valeur contrat moto.

Conclusion Les différents facteurs entrant en compte dans ce modèle de valorisation sont plutôt classiques et

incorporent des variables autant liées à l’assuré lui même qu’à la politique de tarification de l’entreprise.

Les résultats montrent que la formule de souscription agit de façon prépondérante dans l’établissement de

la valeur contrat.

Par ailleurs, la valeur du contrat est évaluée en faisant abstraction des sinistres graves, leur intégration

consisterait probablement en une des pistes d’amélioration les plus notables. Le modèle en question

pourrait également être complexifié de part l’intégration de modèles de prédictifs pour d’autres facteurs,

ou par exemple la détention d’une formule de souscription deviendrait un évènement aléatoire à prédire

sur un horizon de temps à venir.

Le fait que les indicateurs de rentabilité prospectifs ne soient pas très utilisés en assurance non vie inscrit

cette étude dans un cadre novateur. Dans un contexte où la concurrence au sein du marché de l’assurance

moto devient de plus en plus importante, il est essentiel de développer cette typologie d’outils de pilotage

des portefeuilles. La valeur contrat peut, à terme, être une alternative au S/C ou encore être intégrée

comme facteur dans l’évaluation du tarif de l’assuré.

Page 11: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Synthèse /Summary

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 11

Summary In order to improve its customers underwriting policy and their loyalty, AXA has built a “customer index”.

This index is a score which can range from 1 ( standard customer) to 5 (great customer). Its establishment

depends on the customer’s car insurance policy value.

The value of a car insurance policy indicates the contract profitability, and it corresponds to the

discounted sum of the likely outcomes generated by the contracts for a certain number of years Now, the customer index of a car insurance policyholder , who has also insured its motorcycle within AXA,

is estimated on the basis of the value of its car insurance contracts and not its motorcycle insurance

contracts.

The main utility of this study relies on integrating motorcycle contract values in the customer index.

Beyond this, also make the motorcycle policy value become a management tool for motorcycle portfolios.

This policy value depends on the contract’s pure and commercial premiums, and the probability of the

contract termination. It is defined in a more mathematical approach in the formula below:

Equation 2 Policy value formula

The three previous parameters are going to be modeled in this thesis, which consists of five parts.

The first part of this study describes the extraction method used in order to collect the data on which the

model has been built. The three next steps respectively illustrate how the pure premium model, the

commercial premium model and the termination probability model have been set up. The last part

establishes a technical for the computation of the policy value.

Extracting the data and building the scope of the study

The preliminary part to the modeling describes how the data has been extracted. It mainly lies on analyzing

the level of reliability of the available information about the policy holder.

The predictive aspect of the problem requires that stability of the model in the future has to be tested. This

is why the sample on which the study is built is taken from 2011 data.

In order to have a homogeneous sample, a scope of the study is set up. It excludes the contracts which

aren’t evergreen, vintage motorcycles and two types of guarantees offered by Club 14’s motorcycle

insurance product.

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

Commercial premium at year k

Pure premium at year k

Financial incomes at year k

Acquisition and management expenses at year k

Discount rate between instant 0 and instant k

Inflation at year k

( ) Probability of termination between 0 and instant k.

Page 12: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 12

Modeling

The next three parts of this thesis have a similar structure. They primarily consist in a descripttive analysis

of response variable. They lead to the construction of a prediction and segmentation model (pure premium

and commercial premium) or only a prediction model (termination probability). All these models use the

generalized linear models theory.

Building a pure premium model of segmentation and prediction

All the factors that are candidate to modeling and segmenting the pure premium are tariff variables. The

best candidates for forecasting the pure premium have been highlighted with the next tools :

A univariate analysis consisting of the graphical representation of the pure premium based on the

factor in question

A study of correlations between factors as well as between the pure premium and factors

An analysis of variance confirmed the significance of certain factors with a threshold of 5%

The modeling was conducted using a frequency / medium cost approach. The selection of the the best

predictors and the segmentation of the pure premium has been achieved through a procedure looking for

the set of variables that maximizes the information from the sample of pure premiums , while minimizing

the size of this set.

It follows that the factors by which the premium was pure segmented and are predicted :

• Frequency model: Area , subscription form , length of the logbook, group ( factor of the technical features

of the bike ) , length of the drivers license.

• Average cost model : price level of the vehicle and subscription form .

Both models explain on average 84% of the sample variance, which is according to the literature a good

indicator of quality. The greatest differences were observed for predicting risk or have had little exposure

little claims.

Possible ways of improving this model are :

• Test a parameterization of the average cost using the Weibull

• Predict not the average cost but the change in the average cost over a minimum average cost.

• Select another method for determining the best segmentation , including that based on the analysis of

variance.

Building a model of segmentation and prediction of the commercial premium

The commercial premium is not deterministic and for that you need to model: it changes according to the

changes that the insured has decided to make to his contract. The same tools as those used in the previous

section are used (univariate analysis , correlation study , tests of significance, algorithm selection factors).

The "best” factors by which the commercial premium is then segmented and predicted are: the

subscription form, group, driving license maturity, and technical coefficient. The factors are essentially

identical to those used in the model of pure premium. The adjustment of the policy premium predicted

relative to the individual is of good quality, and on average, it will be nearly equal to that estimated by the

model. The prediction errors of the model commercial premium are highest within the groups with less

people.

Page 13: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 13

Building a model to predict the probability of termination

Probabilize the flow of the contract of year k involves determining the probability of termination of each

insured between year 0 and year k . The model explaining the probability of termination is based on the

projection of a binary response variable (Termination : Yes / No) via logistic regression. Factors that predict

the probability of termination are: driver's age , the length of detention of the vehicle , length of contract,

subscription form , his contributions, as well as technical coefficient.

This model has a good reclassification rate of 58%. The odds ratios were allowed to isolate the impact of

each variable in the model and identify the groups that were more likely to persist in the portfolio. The

termination model results are quite correct to the extent that the objective is not to predict an act of

termination but to calculate a probability of presence in the portfolio.

Methodology for calculating the contract value

All parameters of the model are now available and will determine a value contract. The formula below

highlights the valuation of a contract value .

Subject to stability on the years 2011, 2012 and 2011, these models will be implemented in a SAS program

implementing the methodology of calculation of the motorcycle contract value.

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

∑∏

( )

( ) ( ∏ (

))

( ) ∏ (

) ∏

(

)

(

)

(

)

(

)

Page 14: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Sommaire

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 14

Conclusion

The different factors that came into account in this valuation model are rather conventional and

incorporate variables related to the insured himself as well as to the pricing policy of the company. The

results show that the subscription form is predominant in the establishment of the contract value .

Furthermore, the contract value is estimated by ignoring serious claims , integration would probably be an

important improvement. The model in question could also be complicated by the integration of predictive

models for other factors, where a detention of a subscription formula would be a random event to predict

over a future period of time.

The fact that profitability indicators are not very used in non-life insurance places this study in an

innovative setting. In an environment where competition in the market for motorcycle insurance is

becoming increasingly important, it is essential to develop this type of portfolio management tools . The

contract value may eventually be an alternative to loss ratio or even be integrated as a factor in assessing

the rate of the insured.

Page 15: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 15

Cadre de l’étude et problématique Cette partie du mémoire a pour vocation d’apporter des explications concernant le contexte au sein

duquel l’étude a été réalisée. Dans un premier temps, elle présentera les institutions impliquées ainsi que

le produit moto de Club 14, puis établira clairement la problématique liée à cette étude.

Présentation institutionnelle

Club 14 est une association loi 1901 créée en 1981 par Bruno Mier, Hervé Gicquel et Michel

Guenton. Un de ses principaux objectifs développés était de proposer des tarifs abordables et une offre

adaptée aux besoins des pratiquants de la moto. Pour faciliter la réalisation de ses idées, Club 14 s'est

associé avec un acteur majeur du monde de l'assurance : Axa France. Dans le cadre de ce partenariat

assurance / association, les motards assurant leur moto chez AXA bénéficient de l’adhésion à l’association

Club14. En 2012, Club 14 est le premier moto club de France. Pour l’anecdote, le nom Club 14 vient de la

populaire clé de 14, utilisée par les motards des années 80.

Le produit d’assurance moto Club 14 est constitué de quatre formules de souscription différentes,

numérotées de 1 à 4. Chaque formule est constituée de garanties de base et de garanties optionnelles.

Il existe une formule principale, « l’Essentiel » à partir de laquelle les autres formules sont obtenues en

élargissant le nombre de garanties.

Formule Garanties de base Garanties optionnelles

Formule 1

L’essentiel

Responsabilité civile : Imposée par la loi, assurance minimale du véhicule. Garantit la responsabilité civile de toutes les personnes assurées lorsque les dommages matériels ou corporels sont subis par un tiers lors de l’accident au sein duquel le véhicule assuré est impliqué.

Défense pénale et recours suite à un accident : Garantit l’exercice du recours de

l’assuré ainsi que la réparation des dommages subits par le véhicule assuré et ses occupants au cours de l’accident.

Décès du conducteur : Capital versé au conjoint survivant, concubin, ou héritier en cas de décès du conducteur.

Protection juridique : Assistance de la part des juristes de Juridica, entité d’AXA spécialisée dans la protection juridique.

Sécurité du conducteur : Indemnisation des dommages corporel du conducteur pour un montant s’élevant jusqu’à 15 000 €

Assistance 0 km : Dépannage, remorquage, poursuite de voyage, rapatriement en cas de panne, crevaison ou accident.

Casque du conducteur : Indemnisation du casque endommagé du conducteur dans la limite de 300 €.

Sécurité du conducteur étendue jusqu’à 200 000 €

Protection juridique confort : Intervention juridique à l’amiable et prise en charge des frais correspondants

Page 16: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 16

Gilet Airbag : Indemnisation ou remise en état du gilet airbag du conducteur.

Formule 2

Le confort

Toutes les garanties de la formule 1 Incendie Vol Bris d’optique Remboursement des vêtements et

accessoires jusqu’ 450 € Valeur à neuf 1 ans :

Remboursement s’élevant au prix d’achat en cas de vol, destruction d’une moto ayant moins de 12 mois d’ancienneté

Toutes les garanties optionnelles de la formule 1

Vêtements et accessoires remboursés jusqu’à 12 000 €.

Formule 3

L’étendu

Toutes les garanties de la formule 2 Catastrophes naturelles, évènements

climatiques, catastrophes technologiques faisant l’objet d’un arrêté publié au journal officiel

Dommage collision : garantie des

dommages résultant d’une collision.

Toutes les garanties optionnelles de la formule 2

Formule 4

Le sur-mesure

Toutes les garanties de la formule 3 Tous dommages : garantie des dommages

résultant de la collision avec un ou plusieurs autres véhicules, choc entre le véhicule et un corps fixe ou mobile, acte de vandalisme etc.

Toutes les garanties optionnelles de la formule 3

Valeur à neuf étendue à deux ans

Véhicule de remplacement pour une période de huit jours en cas d’accident, 30 jours en cas de vol.

Tableau 1 Récapitulatif des garanties proposées dans le produit moto. Source : www.club14.com

En 2011, AXA /Club14 détient 15% des parts sur la marché moto, ce qui la place au deuxième rang.

Selon une publication de la Fédération Française de la société d’assurance, le parc des deux et trois roues

se présente comme suit au 31 décembre 2012.

Figure 1 Structure du parc deux roues à fin 2013. Source : FFSA

25%

24%

45%

6%

Total cyclomoteurs (scooters et mobilettes)

Motos légères

Motos 125 cm3

Autres deux/ trois roues

Page 17: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 17

Le contexte au sein duquel l’étude a été réalisée ayant été établit, il s’agit à présent de définir la

problématique de l’étude.

La valeur contrat : un outil de pilotage en marketing devant être modélisé

Le projet CVM (« Customer Value Measurement ») consiste en une démarche marketing fondée sur la

valeur du client et non uniquement sur celle des contrats qu’il détient. Son objectif principal est

l’amélioration de la politique de souscription et la fidélisation des clients. Cette valeur se matérialise par le

concept de l’indice client. Le CRM, (Customer Relationship Management) octroie à chaque client un indice,

compris entre 1 et 5. L’indice vaut 1 si le client est considéré comme standard, 5 s’il s’agit d’un très bon

client. Cette note reflète deux éléments :

le taux de multi détention des contrats du client

la valeur de ces contrats

Dans cette étude, l’attention est portée sur la valeur contrat. Jusqu’ à présent, l’indice client est

actuellement uniquement construit à partir de la valeur des contrats auto. En effet, un client détenteur

d’une auto et d’une moto possède un indice client ne révélant que la valeur de ses contrats automobile et

non moto. L’objectif principal de la mission est d’intégrer la valeur des contrats motos dans l’indice.

L’enjeu consistera donc à trouver une procédure qui permette de valoriser les contrats deux et trois roues.

L’approche se base sur le résultat probable que génèrera ce contrat sur un certain nombre d’années : la

« Policy Net Present Value ». La PNPV est la somme actualisée des flux générés par le contrat. C’est un

indicateur de rentabilité qui dépend notamment de la prime pure, de la prime commerciale et du taux de

résiliation du contrat. Elle sera notée tout au long de l’étude.

Indice Client

Valeur Contrat Taux de multi détention

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

Prime commerciale de l’année k

Prime pure de l’année k

Produits financiers de l’année k

Frais d’acquisition et de gestion de l’année k

Taux d’actualisation entre l’année 0 et l’année k

Taux d’inflation de l’année k

Page 18: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 18

Au vu de cette formule, il faudra donc simuler sur N années la prime pure, la prime commerciale et la

probabilité de résiliation. Les autres paramètres en dehors des trois cités sont donnés. Ces simulations

reposent sur un effet vieillissement du contrat et du client via des variables temporelles (Exemple :

anciennetés de permis, de contrat et du véhicule).

Ainsi, divers modèles seront mis en place pour l’obtention de la PNPV.

- Un modèle de prime pure

- Un modèle de prime commerciale

- Un modèle de résiliation.

Le schéma ci-dessous résume la démarche d’obtention de la valeur contrat.

Figure 2 Schéma d’obtention de la valeur contrat

L’objectif de l’étude réside en trouver les meilleurs facteurs de prédiction pour chacun des modèles

mentionnés ci-dessus. Ce mémoire déroulera la méthodologie employée pour les déterminer. Une étape

préliminaire au cours de la quelle les techniques utilisées pour l’extraction et la fiabilisation des données

sera effectuée. Ensuite, la prime pure sera modélisée dans un premier temps : elle reflète le coût réel du

risque. Dans un second temps, la prime commerciale sera expliquée : elle est en partie constituée de cette

prime pure, à laquelle s’ajoutent des coûts opérationnels, une marge bénéficiaire ainsi que des taxes. En

troisième partie, la probabilité de résiliation de l’assuré sera prédite par l’intermédiaire de ses facteurs les

plus représentatifs. En dernier point, sera établie une méthodologie de calcul de la valeur contrat et les

limites du modèle ainsi obtenu seront abordées.

( ) Probabilité de résiliation entre l’année 0 et l’année k.

Page 19: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 19

Page 20: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 20

Partie 0 : Extraction des données et établissement du périmètre Une description des données sur lesquelles se base l’étude sera effectuée : elle exposera les raisons

du choix de l’échantillon, sa structure, la manière dont il a été fiabilisé et mettra en place périmètre de

l’étude.

0.1 Choix de la base La base de support de l’étude est celle du résultat technique à fin 2011. Elle correspond aux

contrats en cours entre le 1er janvier et le 31 décembre 2011. Constituée en mars 2012, elle a l’avantage de

prendre en compte les sinistres tardifs à fin 2011. Comme le calcul de la valeur contrat fait appel à la

projection des résultats du contrat dans le futur, il est utile de disposer d’une « marge » dans le passé pour

pouvoir tester la stabilité du modèle. Ainsi, la stabilité de ce modèle est testée sur les échantillons des

années 2011, 2012, 2013.

0.2 Structure des données Chaque ligne de la base est une image de contrat (représentation de l’exposition au risque d’un

contrat), présentée comme suit.

N° contrat Date de début d’image

Date de fin d’image

Année police

Montant de la cotisation

Données risque : Âge, sexe de l’assuré, marque du véhicule…

Données sinistres : Nombre de sinistres, charge

des sinistres

1

1

2

3

Figure 3 Structure de la base de données

Comme le montre le tableau ci-dessus, un même numéro de contrat peut figurer sur plusieurs lignes de la

base : il dispose de plusieurs images. La création des différentes images d’un contrat s’effectue de la

manière suivante. Pour un contrat donné, une image est créée en début de période d’observation, en

général au 1/1/N. A chaque modification du contrat (mise en demeure, remplacement de véhicule,

résiliation, échéance anniversaire du contrat…), une nouvelle image est créée. La dernière image d’un

contrat pour une année fixée prend toujours fin le 31/12/N. Une année police correspond à la durée

d’exposition comprise entre deux images du contrat, prenant des valeurs entre 0 et 1.

Un exemple concret sur la manière dont sont construites les images d’un contrat est donné. Il est supposé

qu’un assuré souscrit à un contrat moto le 5 septembre 2010. Sur la base du résultat technique en 2011,

une image débutant le 1/1/2011 est systématiquement créée. L’assuré remplace son véhicule le

16/4/2011 : la première image prend fin et une nouvelle image du contrat débute. Si aucun autre

changement n’a lieu pour ce contrat, elle prendra fin à sa date anniversaire du contrat (voir schéma ci-

dessous).

Page 21: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 21

Image 1 Image 2 Image 3

----------------|-----------------|-----------------------|------------------------|--------------------------|------------------>

Affaire nouvelle : 5/9/2010 1/1/2011 Remplacement : 16/4/2011 Anniversaire : 5/9/2011 31/11/2011

Figure 4 Création des images d’un contrat

Les informations sur le risque ont du être collectées dans un premier temps, et fiabilisées par la suite. Il a

été jugé pertinent de prendre en compte des variables en majeure partie tarifaires, étant donné que la

prime pure, la prime commerciale en dépendent. La probabilité de résiliation d’un contrat est également

fortement liée au tarif appliqué. L’ensemble des données risques a été regroupé en catégories dans le

tableau ci-dessous.

Conducteur

Variable Signification Modalités

Âge du conducteur <21 ans / [21 ; 25 ans [/ [25 ; 30 ans [ /

[30 ; 35 ans [ / [40 ; 50 ans[ / >=50 ans

Sexe du conducteur Homme / Femme

Segment marketing

(Seg_Mkt)

Catégorie de personnes à laquelle

appartient le conducteur du

véhicule, caractérisée par son

âge, son statut marital, sa

profession ...

Etudiants / Jeunes CSP- / Jeunes CSP+ / Début de

carrière /Âge Mur / Célibataires CSP- / Familles

CSP-/ Agriculteurs / Artisans-Commerçants /

Professions Libérales /Chômeurs /Rentiers

/Seniors du quatrième âge / Seniors retraités /

Non renseigné

Ancienneté du

permis (ACP)

[0 ; 1 an[ / [1;2 ans [ / [2;3 ans [ / [3;4 ans [ / [5;9

ans[ / [10;14 ans [ / [15 ; 19 ans [ /[20 ; 29ans[ /

>= 29 ans

Antécédents (ANT) Révèle si le conducteur a été

assuré auparavant

Avec / Sans

Expérience (EXP) Indique si le conducteur à

l’habitude de conduire le

véhicule assuré.

Avec / Sans

Sinistralité

antérieure

Indique le nombre de sinistres

que le conducteur a eu sur les

trois dernières années

0 sinistres / 1 sinistre /2 sinistres /Plus de trois

sinistres

Non assuré sur la période (NA)

Véhicule

Ancienneté de la

carte grise (ANCCG)

<1an / 1an / 2ans / 3ans / 4ans / 5ans / 6-7ans / 8-

9ans /+10ans

Ancienneté du

véhicule (ACV)

<1 an / 1 an /2 ans /3 ans /4 ans /5 ans / 6-7 ans

/8-9 ans /10-14 ans / 15-19 ans /20-24 ans

/25-39ans

Durée de détention

du véhicule (DDV)

<1an /1an /2ans /3ans /4ans /5ans /6-7ans / 8-

9ans /10 ans et plus / Ancien produit /Non

renseigné

Page 22: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 22

Type d’usage Motifs d’utilisation du véhicule :

déplacement pour la vie privée,

professionnelle … La modalité

« tournées » concerne les

personnes réalisant des visites

de clientèle, agences, chantiers

dans le cadre de leur profession

ou activité principale.

Privé / Privé et trajet domicile-lieu de travail/

Professionnel /Tournées

Marque de la moto

Aprilia/ BMW/Daelim/Ducati /Harley Davidson

/Honda /KTM /Kawasaki /Kymco /MBK /Peugeot

/Piaggio /Suzuki /Triumph /Yamaha /Autres

Genre de la moto

Indique la catégorie de la moto Trial / Cross / Enduro Immatriculé (END IM)

/Enduro non Immatriculé (END non IM) / Quad

Immatriculé (QUA IM) / Quad non Immatriculé

(QUA non IM) /Custom (CUS) /Trail (TRA) /Basique

(BAS) /Routière (ROU) /Sportive (SPO) /Hyper

sportive (HYP) / Super motard (SMO) /Grand

Tourisme (GTO) / Roadster (ROA) /Scooter (SCO)/

Scooter 3 roues (SC3)/Exotiques (EXO)

Groupe

Numéro compris entre 1 et 40,

indiquant les caractéristiques

techniques de la moto. Les

véhicules du groupe 40 sont des

risques refusés.

1 /2/3/4/5/6/30/31/32/33/34/35/36/37/38/39/40

Classe

Lettre indiquant le niveau de

prix du véhicule.

J/ K /L / M /N /O /P/Q/R

Cylindrée

Volume d’air balayé par le

piston lors d’un cycle,

caractérisant la puissance de la

moto

Moins de 125 cm3 / 125 cm3 / 126 à 500 cm3 /501

à 750 cm3 /Plus de 750 cm3.

Véhicule tout terrain

Indique si le véhicule est tout

terrain

Oui /Non

Type de roues

Indiqué seulement pour les

motos du genre scooter pour un

assuré ayant souscrit au

nouveau produit.

Petites / Grandes / Scooter Ancien produit /Non

scooter

Contrôle technique Indique si le conducteur a

réalisé un contrôle technique

pour son véhicule.

Oui/ Non

Géographie

Département du

portefeuille

Département du portefeuille

client auquel le conducteur

appartient.

1 à 98

Page 23: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 23

Département du

risque

Département du lieu de

résidence du conducteur

1 à 98

Région du

portefeuille

Région du portefeuille client à

laquelle le conducteur

appartient

Ile de France/Nord Est /Ouest/Sud Est/Sud Ouest /

Natio / MSC /Axa part

Région du risque Région du lieu de garage du

propriétaire du véhicule.

Ile de France / Nord Est /Ouest/ Sud Est /Sud

Ouest / EOM

Zone Numéro indiquant le niveau de

danger de la zone de lieu de

garage du véhicule.

Zone 1 / Zone 2/ Zone 3 / Zone 4/Zone 5/ Zone

6/Zone 7/

Zone 8 /Zone 9 /Zone 10 /Zone 11 /Zone 12 /Zone

13

Contrat

Formule Différents niveaux de garanties

aux quelles le contrat a souscrit.

Elles ont été décrites

précédemment.

RC : Responsabilité Civile /RC+IV : Responsabilité

civile + Incendie Vol /RC+DC : Responsabilité civile

+ Dommages collisions /RC+TD : Responsabilité

civile + Tous dommages /RC+IV+DC /RC+IV+TD

Fractionnement Mode de paiement de la prime Mensuel /Trimestriel / Semestriel /Annuel

Réseau Réseau de distribution du

produit

Agent /Courtier / Salarie / Direct Assurances /

CCAS /Michelin /Natio / Run Services

Coefficient

technique (CT)

Rapport entre la prime issue de

la tarification et la prime

commerciale payée par l’assuré.

Moins de 0,50 / 0,50 à 0,69 /0,70 à 0,79 /0,80 à

0,89 /0,90 à 0,94 /0,95 à 0,99 /1,00 /1,01 à 1,05 /

1,06 à 1,10 / Plus de 1,10

Ancienneté du

contrat (ANCC)

<1an /1an/ 2ans /3ans /4ans /5ans /6-8ans /

9-13ans / plus de14ans Tableau 2 Informations sur le risque

Une fois ces dernières collectées, il s’agit de rendre fiable cette information. Cela passe soit :

- Par la non prise en compte de certaines variables du support car elles ne concernent qu’une part des

contrats de la base.par exemple, les variables de sinistralité antérieure : globale, RC (responsable et non

responsable), Incendie/ Vol, Bris de Glace ne prennent en compte que la sinistralité antérieure des

contrats dont la date d’effet est inférieure à 2010. Comme dans la base figurent des contrats dont la date

d’effet est postérieure à 2010, il n’est pas possible de s’en servir.

- Par la suppression des données ayant des modalités non renseignées (NR), lorsque leur proportion en

termes d’exposition est négligeable

Page 24: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 24

.

La perte de données en nombre d’images ou en exposition serait élevée en cas de suppression des lignes

dont la durée de détention de véhicule n’est pas renseignée (près de 1/3 de la base). Il s’avère que les

contrats ou cette durée n’est pas renseignée sont concernés par l’ancien produit.

Le raisonnement est similaire pour le segment marketing (mais avec une perte moindre).Ces deux variables

continueront donc à faire partie du support, avec une modalité « Non renseigné ». Les autres modalités

non renseignées ne seront pas prises en compte pour le reste de l’étude.

Perte d’exposition en %

Ancienneté du permis -0,64%

Ancienneté du véhicule -0,40%

Âge -0,01%

Classe -1,08%

Seg.marketing NR -4,92%

Durée de détention -30,36%

Genre -3,74%

Groupe -0,53%

Sexe -0,17%

Type roue scooter -0,01%

Usage -3,72%

Zone -1,46%

Anc. Carte Grise -0,77%

Antécédents -0,51%

Expérience -0,52%

Tableau 3 Pertes d’expositions lors d’une suppression des données non renseignées

Conducteur Géographie

Age du conducteur Sexe du conducteur Segment marketing Ancienneté du permis Antécédents Expérience Sinistralité antérieure globale (sur 3 ans) Sinistralité antérieure (sur 3 ans) par garantie : (responsabilité civile, incendie vol, bris de glaces)

Zone Région Axa Région Axa du risque Département Département du Portefeuille

Véhicule Contrat

Ancienneté de la carte grise Marque de la moto Genre de la moto Groupe Classe Cylindrée Véhicule tout terrain Type de roues Contrôle technique Durée de détention du véhicule Ancienneté du véhicule Type d’usage

Formules Fractionnement Réseau de distribution Ancienneté du contrat Coefficient technique

Tableau 4 Support des variables après fiabilisation des données

Page 25: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 0 : Cadre de l’étude et établissement du périmètre

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 25

Enfin, les données sinistres comprennent :

le nombre de sinistres par image ainsi que le nombre de sinistres graves. Un sinistre est considéré

comme grave s’il est supérieur à un seuil

la charge de ces sinistres, par image, ainsi que la charge des sinistres graves.

0.3 Périmètre de l’étude

L’établissement d’un périmètre permet de mettre en place une certaine homogénéité au sein de la

population à étudier. Les risques suivants ne seront pas pris en compte dans l’étude.

les motos de collection, risques devant être traités par une approche différente de celle utilisée ici.

les formules RC+ TD, RC+ DC qui sont des cas dérogatoires. .

les contrats qui ne sont pas à tacite reconduction, minoritairement présents en France.

les véhicules du groupe 40, qui représentent des risques refusés.

Enfin, un échantillon d’apprentissage correspondant à 70% des données de la base du résultat technique

à fin 2011 est tiré aléatoirement, selon une loi uniforme : les modèles de prime pure, prime commerciale et

résiliation seront construits à partir de celui-ci. Les 30% restants constitueront notre base de « test « sur

laquelle les résultats obtenus seront testés.

Page 26: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 26

Partie 1 : Modélisation de la prime pure

La valeur du contrat que l’on cherche à modéliser est donnée par

Le résultat de l’année k dépendant de la prime pure, le premier volet de l’étude consiste en la modélisation

de cette dernière. Soit le nombre de sinistres survenus au sein d’un groupe, leurs coûts

respectifs, indépendants et identiquement distribués. est également indépendante de . Soit la

charge totale ∑ . La prime pure représente la moyenne de celle-ci. Elle est notée [ ]

Par conséquent :

[ ] [∑

] [ [∑

]] ⏟

[ [∑

]]

⏟ [

∑ [ ]]

[ [ ]] [ ]⏟

[ ]⏟

La problématique réside dans le fait de trouver les meilleurs facteurs pour la prédiction de la prime pure à

partir du support des informations sur le risque, Tableau 4 : Support des variables après fiabilisation des

données. Une analyse descriptive de la prime pure sera d’abord effectuée : elle permettra de se familiariser

à la variable qui sera expliquée, mettra en lumière les liens entre les différentes variables explicatives et

fera ressortir celles d’entre elles dont le caractère discriminant est le plus prononcé.

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

Prime commerciale de l’année k

Prime pure de l’année k

Produits financiers de l’année k

Frais d’acquisition et de gestion de l’année k

Taux d’actualisation entre l’année 0 et l’année k

Taux d’inflation de l’année k

( ) Probabilité de résiliation entre l’année 0 et l’année k.

Page 27: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 27

I. Analyse descriptive pour la modélisation de la prime pure

L’ensemble des étapes de cette partie de l’étude répondent à l’interrogation suivante : existe-t-il

un lien entre la prime pure et les modalités prises par une variable donnée ? Une analyse uni-variée isolera

l’effet de chaque variable en montrant l’évolution de la prime pure par rapport à chacune d’entre elles.

Ensuite, une étude des corrélations des variables réponses et explicatives révèlera leurs interactions. Une

analyse en composantes multiples donnera un aperçu des catégories d’individus les plus sinistrés. Enfin les

meilleurs modèles de fréquence et de coût moyen seront déterminés par un algorithme de sélection de

facteurs.

I.1 Analyse uni variée L’idée est de représenter graphiquement l’évolution de la prime pure en fonction des catégories de

population, afin de déduire si la variable étudiée discrimine bien la prime pure. La prime pure [ ] est

déterminée empiriquement sur l’échantillon à partir de la relation :

[ ] [ ]⏟

[ ]⏟

Ainsi, un niveau de prime pure donné peut s’expliquer soit par le nombre de sinistres survenus ou par le

coût que ces derniers ont engendré.

Il est rappelé qu’un sinistre est considéré comme grave si sa charge excède . Par exemple, le

graphique ci-dessous représente l’évolution de la prime pure en fonction de l’âge des assurés

Figure 5 Exposition et prime pure par âge

Une décroissance de la prime pure en fonction de l’âge est constatée. Cela s’explique par un comportement

de plus en plus prudent des conducteurs de plus en plus âgés. L’âge apparait bien comme étant une

variable discriminante.

Par souci de robustesse des méthodes statistiques, toutes les modalités doivent être suffisamment

représentées (au moins 4% d’exposition par modalité). Lorsque cela est possible, des regroupements de

groupes peu exposés avec d’autres groupes sont effectués, selon un critère de proximité des primes pures

obtenues. En particulier dans cet exemple, les moins de 21 ans ont une faible exposition et un niveau de

Page 28: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 28

prime pure (Hors Graves) approximativement égal à celui des 21-25 ans: ces deux groupes sont réunis en

une seule modalité.

Figure 6 Exposition et prime pure par âge

Figure 7 Exposition et prime pure par zone, (HG : Hors graves, YG : Y compris graves)

Les niveaux de prime pure hors graves obtenus reflètent bien le niveau de dangerosité de la zone : la prime

pure croît en fonction de celui-ci, avec une légère exception pour la Zone 12 ; expliquée par la faible

exposition qu’a cette zone. La zone, comme l’âge, paraît discriminante.

Figure 8 Exposition et prime pure par groupe (HG : Hors graves, YG : Y compris graves)

J K L M N O P Q R

Exposition et Prime Pure par Classe

Exposition

Prime Pure HG

Prime Pure YG

Page 29: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 29

La classe représente le niveau de prix de la moto. La prime pure plus ou moins croissante avec le

prix (l’indemnité reversée à l’assuré est plus élevée lorsque le prix de sa moto est important). La classe

semble être une variable discriminante.

Ce raisonnement est appliqué à l’ensemble des variables du support. Par ailleurs, certaines variables ne

semblent pas être discriminantes pour la prime pure ou contiennent des modalités trop peu représentées

ce qui risque de biaiser la modélisation. Elles seront écartées pour la suite de l’étude.

L’ensemble des résultats et interprétations obtenus pour les autres variables figure en annexe 1.

Le tableau ci-dessous représente l’ensemble des variables de l’étude considérées comme impactant la

prime pure. Celles qui ne l’impactent pas ont été barrées.

Remarque : la prime pure est calculée toutes formule de souscription confondues, et non pas en fonction

de la nature du sinistre. Cette même formule est introduite comme facteur dans le support

Un tri à plat n’est pas suffisant lorsqu’il s’agit d’expliquer le comportement de la prime pure. Le

raisonnement précédent a été fait « toutes choses égales par ailleurs », et ne permet pas d’étudier les liens

entre les variables. En effet, l’influence liée à un facteur sur la prime pure n’est pas isolée et des

comportements peuvent être induits par d’autres facteurs, ce qui rend utile l’étude des corrélations.

I.2. Etude des corrélations Cette partie décrit comment l’étude des corrélations inter variables ainsi qu’entre les variables

explicatives et la prime pure a été effectuée. Elle débouche sur un bilan des transformations subies par le

support des facteurs.

Conducteur Géographie

Age du conducteur Sexe du conducteur Segment marketing Ancienneté du permis Antécédents Expérience

Zone Région Axa Région Axa du risque Département Département du Portefeuille

Véhicule Contrat

Ancienneté de la carte grise Marque de la moto Genre de la moto Groupe Classe Cylindrée Véhicule tout terrain Type de roues Contrôle technique Durée de détention du véhicule Ancienneté du véhicule Type d’usage

Formule Fractionnement Réseau de distribution Ancienneté du contrat Coefficient technique

Tableau 5 Support des variables après analyse uni variée de la prime pure

Page 30: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 30

Enjeux et outils statistiques utilisés Etudier les corrélations inter variables est important pour :

Révéler les liaisons entre les variables explicatives. Cela permet de mieux « cerner » le support dans

la mesure où le degré d’interaction entre les variables est quantifié.

Limiter des biais dans la modélisation. Dans le cadre de tout modèle de prédiction, il faudrait éviter

toute situation de colinéarité entre les variables afin d’obtenir la meilleure estimation possible des

paramètres.

La procédure est différente de celle utilisée lors du tri à plat : le raisonnement n’est pas « univarié ». En

effet, des niveaux de prime pure par sont établis pour des groupes d’individus basés non pas sur un seul

critère (variable) mais sur la combinaison de plusieurs critères. Ces groupes d’individus sont appelés cases

et ne sont autre qu’une sous-population ayant des caractéristiques communes.

Exemple :

Figure 9 Un exemple de case tarifaire

Une fréquence, un coût moyen et par conséquent une prime pure sont déterminés pour l’ensemble des cases de la base.

Pour quantifier les corrélations entre l’ensemble des variables, le coefficient de contingence est utilisé.

Un tableau de contingence est construit à partir de l’échantillon de la manière suivante : il s’agit d’une

matrice dont le coefficient est le nombre d’individus ayant à la fois une modalité donnée de la première

variable et une modalité donnée de la seconde variable. Un second tableau de contingence théorique est

construit, sous l’hypothèse que ces deux variables sont indépendantes. Le coefficient de contingence est

calculé de la manière suivante.

( )

Etude des corrélations inter variables et bilan Si une trop forte corrélation entre deux variables est observée, soit l’une d’entre elles est exclue

(l’information étant déjà restituée par l’autre variable), soit elles sont croisées. Les différents niveaux de

corrélation obtenus ont été hiérarchisés de la manière suivante :

Figure 10 Hiérarchisation des niveaux de corrélation

Conducteur Age Sexe Segment Ancienneté du permis Antécédents Expérience

moins de 30 ans H Jeunes > 29 ans Avec Avec

Géographique Région Région du risque Zone

IDF IDF Zone9

Véhicule Marque Ancienneté de la carte grise Durée de détention Ancienneté du véhicule Genre Groupe Classe Cylindrée

Honda 1an 1an 6-7 ans Scooter 32 M 126 à 500 cm3

Contrat Coefficient technique Usage Formule Fractionnement Ancienneté du contrat

moins de 0.69 prive RC+IV+TD Annuel 3 ans

Page 31: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 31

Tableau 6 Bilan de l’étude des corrélations inter variables

L’âge ne sera pas pris en compte dans le modèle : en plus de ne pas être très corrélé à la variable

explicative prime pure (27%) comme le montre le paragraphe suivant, son effet est retrouvé dans des

variables telles que l’Ancienneté de permis ou l’Ancienneté du contrat. Il en est de même pour la cylindrée :

n’étant corrélée qu’à 20% avec la prime pure, son effet est présent dans le genre, la classe et le groupe.

Dans la troisième colonne de ce tableau se trouvent des variables trop corrélées qui n’ont pas été exclues

lors de cette analyse, et pour lesquelles aucun croisement ne peut être proposé au vu du trop grand

nombre de modalités que cela engendrerait (et donc une trop faible exposition par modalité). L’outil qui

aidera à trancher entre ces variables est une méthode « forward ».

Corrélations entre les variables et la prime pure Une vérification du fait que les variables du support étaient bien corrélées à la variable à expliquer a été réalisée.

Variable Prime Pure

Zone 43%

Ancienneté du véhicule 38%

Durée de détention 34%

Marque Groupe 33%

Coefficient Technique Genre 32%

Ancienneté du contrat Région du portefeuille Classe 31%

Ancienneté du permis 30%

Ancienneté de la carte grise Cylindrée 29%

Segment marketing Âge 28%

Région du risque 24%

Antécédent*Expérience Usage 21%

Formule 20%

Fractionnement 13%

Sexe 11%

Tableau 7 Corrélations entre la prime pure et les variables du support

En rose apparaissent les variables les plus corrélées à la prime pure, variable à expliquer. Les liens entre les

variables ayant été étudiées, des outils sont déployés pour confirmer la significativité des variables vis-à-vis

de la variable réponse.

Variables exclues (corrélées avec de nombreuses variables)

Variables Groupées

Variables conservées en fonction de la qualité du modèle retenu (sélection « forward » )

Age Cylindrée

Antécédents-Expérience Groupe /Classe/Genre

Région du portefeuille /Région du risque/Zone

Anc. du véhicule/ Anc. de la carte grise/Durée de détention. / Anc. du contrat

Page 32: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 32

I.3. Tests de significativité d’ANOVA (Analyse de la variance)

Ces tests ont été réalisés pour l’ensemble des variables du support grâce à la procédure « Anova » du

logiciel SAS.

Principe du test d’ANOVA Ce test est réalisé pour corroborer le fait que la variable est significative par rapport à la prime pure. Il se

base sur une égalité des moyennes. Ses hypothèses sont les suivantes.

Les quantités SCE, SCE résiduel et SCE Facteur (obtenu par différence des deux quantités précédentes) sont

déterminées.

∑ ∑(

) ⏟

( ) ⏟

∑∑(

) ⏟

Où p est le nombre de modalités prises par une variable, l’effectif par groupes.

Sous H0,

suit une loi de Fisher de paramètres F (p-1, n-p).

On se donne un seuil de significativité qui correspond à la probabilité d’erreur de première espèce. Si p-value ≤ , l’hypothèse H0 est rejeté en faveur de H1 et le résultat du test est statistiquement significatif. Si p-value > l’hypothèse nulle n’est pas rejetée et il n’est pas possible de conclure.

Résultats obtenus P-value <=5% P-value >5%

Sexe

Segment marketing Région

Ancienneté du permis Marque

Ancienneté de la carte grise Usage

Antécédent*Expérience Coefficient technique

Région du risque

Zone

Genre

Groupe

Classe

Durée de détention du véhicule

Ancienneté du véhicule

Formule

Fractionnement

Ancienneté du contrat Tableau 8 Résultats des tests de significativité par analyse de la variance

La colonne de gauche contient l’ensemble des variables dont la p-value du test d’Anova est inférieure à 5%.

Pour celles-ci, l’hypothèse nulle est rejetée avec un seuil de significativité de 5%. Il y a donc de fortes

Page 33: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 33

chances que celles-ci discriminent la prime pure. La colonne de droite contient la région, la marque, l’usage

et le coefficient technique. Pour ces facteurs, le résultat du test n’est pas statistiquement significatif, il n’est

pas possible de se prononcer quant à leur caractère discriminant vis-à-vis de la prime pure.

Les études précédentes ont donné lieu a de nombreux résultats qu’il est utile de confronte par une analyse

en composantes multiples.

I.4. Analyse en composantes multiples : une confrontation des résultats précédents

Principe et éléments de théorie L’objectif d’une analyse en composantes multiples est de rassembler les individus au vu de leurs

caractéristiques (modalités prises par les variables). Cet outil, généralisation de l’analyse factorielle des

correspondances a permis :

De grouper ou opposer des individus

D’émettre une hypothèse sur les classes d’individus qui seront sinistrés

D’identifier les variables qui seront significatives dans la suite de l’étude.

L’analyse en composantes multiples est réalisée à partir d’un tableau disjonctif complet (TDC)

[ ]

matrice dont le coefficient vaut 1 si l’individu i possède la modalité j, 0 sinon.

Cette matrice est de taille n X m ou m représente le total des modalités des variables de l’étude. A partir

du TDC, une autre matrice est construite, appelée tableau de Burt [ ]

, dont le coefficient

est l’effectif des individus possédant à la fois les modalités i et j. Cette matrice est symétrique et de taille

m x m. Par conséquent , . Soit p le nombre total de variables et la matrice diagonale de . Les

axes factoriels de l’analyse ont pour vecteur directeur les vecteurs propres de la matrice

.

Ainsi, une représentation des individus dans un repère constituée des axes précédents est obtenue. Il s’agit

par la suite de choisir la dimension dans laquelle il faut les représenter : combien faut-il retenir d’axes ?

Pour cela, est définie la notion d’inertie associée à l’axe k. valeur propre associée au k-ème

vecteur propre. L’ACM a été effectué ici selon la méthode de J.P Benzécri. Elle consiste en considérer non

pas l’inertie associée à un axe mais son inertie ajustée, donnée par la formule : (

)

.

Comme l’objectif de cette étape de l’étude est d’expliquer la prime pure, il s’agira de déterminer le type

d’individus qui sera sinistré. Pour cela, une variable « Sinistre » a été créée : elle vaut 1 si l’individu a été

sinistré, 0 sinon. Cette variable est créée en tant que variable supplémentaire : elle n’influence pas la

construction des axes.

Résultats obtenus et interprétation Les résultats suivants ont été obtenus grâce à la procédure « Corresp » du logiciel SAS.

Page 34: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 34

Figure 11 Inertie ajustée sur les 10 premiers axes

Le critère du coude consiste à retenir le nombre d’axes tel que l’apport en inertie n’augmente plus

considérablement.

L’application de ce critère aboutit à la considération des trois premiers axes, cumulant au total 72,66% de

l’inertie.

Il s’agit ensuite de repérer les variables significatives de l’analyse, c’est-à-dire celles ayant participé à la

constitution de ces axes. Pour cela, les contributions des modalités de chaque variable sont considérées. La

contribution d’une modalité à un axe explique l’intensité de la présence de cette modalité sur cet axe.

Une modalité participe à la constitution d’un axe si sa contribution à l’axe en question est supérieure ou

égale à l’inertie moyenne

. Les trois premiers axes de l’analyse sont analysés.

Exemple : Significativité de la variable « genre » sur les trois premiers axes.

Tableau 9 Significativité de la variable « genre » sur les trois premiers axes

La troisième colonne du tableau donne les taux d’inertie de chaque modalité, les quatrième, cinquième et

sixième colonnes les coordonnées des modalités sur chaque axe. Les trois dernières colonnes donnent les

niveaux de contributions sur chaque axe : en rouge, les modalités significatives sur l’axe 1, en violet celles

sur l’axe 2, en orange celles sur l’axe 3.

Variable Modalités Inertie Axe 1 Axe 2 Axe 3 Axe 1 Axe 2 Axe 3

Genre BAS 1% 0,583 -0,228 -0,120 0,012 0,002 0,001

CUS 1% 0,452 -0,072 -0,811 0,002 0,000 0,010

GTO 1% -0,661 1,426 2,017 0,008 0,046 0,101

QUA IM/EXO 1% -0,301 0,352 -0,911 0,004 0,007 0,050

ROA 1% 0,751 0,027 -0,366 0,006 0,000 0,002

ROU 1% -0,969 -1,190 0,301 0,049 0,090 0,006

SCO 1% 0,370 0,574 -0,985 0,002 0,007 0,022

SPO/HYP 1% 0,789 0,020 0,124 0,026 0,000 0,001

TRA/SMO 1% -0,423 1,295 2,006 0,002 0,020 0,053

TT 1% 0,904 0,091 0,232 0,045 0,001 0,004

Inertie moyenne 0,011

Coordonnées Contributions

Significatif AXE1

Significatif AXE2

Significatif AXE3

Page 35: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 35

Quelques remarques avant l’interprétation des résultats de l’analyse:

Le sexe est la seule variable qui ne participe à la construction d’aucun des trois premiers axes (voir

Annexe 3). Avec une quasi-totalité de conducteurs de sexe masculin dans la base, il est normal que

cette variable n’apparaisse pas dans l’analyse.

Quel que soit l’axe sur lequel l’analyse est faite, il est visible sur les graphes N° que la modalité « 0 »

de la variable supplémentaire sinistres se situe en plein centre du repère : cela s’explique par le fait

que 98% des individus de la base utilisée n’a jamais eu de sinistre auparavant.

Figure 12 Représentation des groupes d’individus sur les deux premiers axes

L’axe 1 fait ressortir une opposition entre les variables d’ancienneté (encadré rose). -Celles concernant le conducteur et son contrat : à gauche se situent les jeunes, dont l’ancienneté du

permis est inférieure à 4 ans et l’ancienneté du contrat inférieure à un an. A droite se situent les personnes

dont le contrat possède entre 4 et 13 ans d’ancienneté. Ces derniers correspondent aux individus les plus

sinistrés.

-Celles concernant son véhicule : à gauche se situent les anciennetés du véhicule et de la carte grise de

moins d’un an, durée de détention comprise entre 0 et 3 ans. A droite de l’axe se situent les anciennetés de

véhicule supérieur à 10 ans et les anciennetés de carte grise supérieure à 4 ans.

L’axe 2 fait ressortir une opposition au sein de la situation géographique du risque (encadré violet):

-En bas de l’axe se trouvent les zones 7 à 13, l’Ile de France, le Sud Est (Régions du risque et du

portefeuille), ce sont les caractéristiques géographiques des individus les plus sinistrés.

-En haut de l’axe se trouvent le Nord Est et l’Ouest ainsi que les zones 1 à 3.

Page 36: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 36

Figure 13 Représentation des groupes d’individus sur le troisième axe

L’axe 3 oppose notamment les catégories de véhicules et les formules :

A gauche de l’axe se trouve la formule RC+IV+TD (tout risque) ainsi que les motos sportives, hyper

sportives et les roadsters, détenues par des jeunes conducteurs. Ces véhiculessont également caractérisés

par un niveau de prix élevé (classes P à R) . Ces groupes d’individus correspondent à ceux qui seront

sinistrés.

A droite de l’axe se trouve la formule RC (tiers) ainsi que les véhicules du genre tout terrain (groupe

inférieur à 6), les quads immatriculés et les exotiques.

Un bilan sur les thématiques de chaque axe ainsi que sur les variables les plus significatives de l’analyse en

composantes multiples peut donc être établit :

Axe 1 : Caractéristiques d’ancienneté

Axe 2 : Situation du risque Axe 3 : Catégories du véhicule& formules

Segment Ancienneté du permis Ancienneté du contrat Ancienneté de la carte grise Ancienneté du véhicule et durée de détention

Région Région du risque Zone

Genre Classe Formule

Tableau 10 Bilan des variables significatives et thématiques des axes

II. Construction du modèle de prime pure

Le cœur du sujet est maintenant abordé dans la mesure où cette partie révèlera le groupe de

facteurs parmi ceux analysés dans la partie précédente qui serviront de support pour la prédiction de la

prime pure. Dans un premier temps, l’approche choisie et la manière dont la théorie des modèles linéaires

généralisés a été appliquée seront décrites. Ensuite, une explication de la démarche d’obtention d’un

modèle de segmentation et de prédiction de la prime pure sera fournie. Enfin, le dernier paragraphe de

cette sous partie révèlera la mesure dans laquelle le modèle de segmentation et prédiction de la prime

pure obtenu à partir des facteurs sélectionnés a été validé.

II.1 Choix de l’approche et application de la théorie des modèles linéaires

généralisés Il s’agit à présent de sélectionner parmi le support de variables en question, le groupe de

variables le plus enrichissant en terme d’information sur la variable à expliquer : la prime pure.

Choix de l’approche

La prédiction de la prime pure peut être réalisée par deux approches différentes :

Page 37: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 37

Une approche directe : les montants de prime pure sont calculés pour chaque case, puis prédits.

L’approche retenue : Fréquence * Coût moyen. Elle repose sur la modélisation de la fréquence

d’une part et sur celle du coût moyen d’autre part. Pour chaque case tarifaire, fréquence et coût moyen

sont calculés. Sont alors obtenus deux échantillons de données à expliquer (pour ce faire, la théorie de

modèles linéaires généralisées est appliquée). Cette approche permet de repérer les variables le plus

représentatives de la fréquence celles les plus représentatives du coût.

Il est démontrable qu’il y a équivalence entre ces deux approches.

Application de la théorie des modèles linéaires généralisés Il s’agit de prédire la fréquence et le coût moyen d’une case tarifaire, via des modèles linéaires généralisés.

Deux hypothèses sont émises.

H1 : Indépendance entre les niveaux de fréquence et de coût moyen de l’ensemble des cases.

H2 : Les niveaux de fréquence par case sont identiquement distribués. Les niveaux de coût moyen par case

sont identiquement distribués.

Les distributions en question font partie de la famille exponentielle. (Voir le paragraphe ci-dessous « Les

variables réponses »).

Un modèle linéaire généralisé est composé de trois composantes :

la variable à expliquer (le nombre de sinistres ou le coût moyen) : il s’agit de la composante

aléatoire

les variables explicatives : composantes déterministes

la fonction de lien retenue.

Les variables réponses

Soient { les observations de la variable à expliquer.

Cas du modèle de fréquence : la prédiction de la fréquence passe par celle du nombre de sinistres

. La durée d’exposition de la case sera mise en paramètre dans le modèle

(« offset ») afin que la fréquence puisse être obtenue (voir partie II.3 Modèle de prime pure).

Pour choisir la loi de la variable réponse, un test d’adéquation est réalisé sur les données en brut (nombre

de sinistres par individus).

Figure 14 Résultats des tests d’adéquations des données en brut (rouge)pour la loi binomiale négative (bleu) et la loi de poisson(vert)

Page 38: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 38

Ces tests ont été réalisés de la manière suivante : par une méthode des moments, à partir de l’échantillon

constituée du nombre de sinistres, les paramètres d’une loi de poisson et d’une loi binomiale sont estimés.

Ensuite, un échantillon indépendant et identiquement distribué est simulé sur le logiciel SAS pour chacune

des deux lois précitées. L’histogramme ci-dessus montre en rouge, la distribution du nombre de sinistres :

ce sont les données en brut, il est visible est constituée de personnes ayant eu 0 (98%), 1, 2 ou 3(2%

restants) sinistres. En bleu et en vert, les distributions respectives de poisson et binomiale négative sont

rajoutées.

L’ensemble des lois choisies adhère d’une manière assez bonne. Il y a indifférence pour le choix de la loi.

Remarque : Estimation des paramètres par une méthode des moments.

( ) [ ] ( )

( )

( )

( ) [ ]

On suppose donc que le nombre de sinistres suit une loi de poisson : ( )

,

Cas du modèle de coût moyen:

.

Figure 15 Résultats des tests d’adéquations du coût moyen brut aux lois Gamma (vert) Log normale (rouge) et Weibull (bleu)

Les paramètres de ces loin sont obtenus par maximum de vraisemblance. Les deux lois adhérant le mieux

aux données sont les lois gamma et les lois de Weibull, inexistant sur SAS. Le coût moyen sera modélisé par

une loi gamma.

Le coût moyen suit donc une loi gamma : ( )

( )

, ( )

.

Page 39: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 39

Remarque : Les charges de sinistres calculées au sein de chaque case ne prennent pas en compte les

charges de sinistres graves .Il en est de même pour le nombre de sinistres de chaque case. Ce choix repose

sur un souci de modélisation : la loi gamma est à queue fine et ne prend par conséquent que très rarement

des valeurs élevées. Par souci de temps, les sinistres graves n’ont pas été pris en compte dans la

modélisation de la valeur contrat.

Rappel sur la famille exponentielle : suit une loi de la famille exponentielle signifie que sa densité est sous

la forme

( ) ( )

( ) ( )

( ) , le plus souvent.

Paramètre canonique, Paramètre de dispersion.

( )définie sur , deux fois dérivable, de dérivée inversible. Cette fonction est à choisir selon la loi

retenue pour la variable à expliquer.

( ) ( ) une fonction définie sur .

Il est démontrable que les lois de poisson et gamma font partie de la famille exponentielle.

Les variables explicatives :

Pour chaque un p-uplet de variables explicatives est définit ( ). L’ensemble des variables

utilisées dans cette étude sont catégorielles et sont codées de la manière suivante.

Si m est le nombre de modalités d’une variable parmi celles qui figurent ci-dessus, alors cette variable est

codée en m-1 variables indicatrices. La modalité restante est appelée modalité de référence. Elle est choisie

de manière à ce qu’elle soit la modalité la plus représentée dans la base.

En notant = (

), β=(

), la quantité = est appelée prédicteur linéaire.

La fonction de lien

Elle est la relation entre les variables explicatives et le prédicteur linéaire, et notée . (Elle est définie sur ,

strictement monotone, dérivable).

Le modèle est donc : ( [ ]) β.

L’inverse de la dérivée de est appelé lien canonique.

Cas des modèles de fréquence et de coût moyen : La fonction de lien est la fonction ( ). Par

conséquent ( ). Ce choix de lien résulte du fait que l’on est sous la contrainte d’un modèle

multiplicatif (produit des exponentielles de chaque coefficient).

Estimation des paramètres

Rappel : .

β= ( ) est estimé par maximum de vraisemblance.

Page 40: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 40

Soient ( ) ( )la vraisemblance de l’échantillon, et ( ) ( ) sa log-vraisemblance.

( ( ) ) ∏ ( ) ,

( ( ) ) ( ( ( ) )) ∑ ( ( ))

( )

( ) ( ) ∑

(

)

( ) ( )

Le problème d’optimisation devient le suivant :

( )

( ) ( )

Cette fonction admet un maximum qui est un point critique de la log vraisemblance. Il annule donc son

gradient

( ( ) ) ( ( ) )

( ( ) )

∑ ( ( ))

( ( ))

( )

On pose ( ) . ( )

( ( ))

( )

( )

( )

( )

( )

( )

( )

( )

Or ( ) et on prouve que ( ) ( ) ( ) donc

( ( ))

( )

( )

( )

( )

( )

( ) Réalise le maximum de la vraisemblance

( ( ) )

( )

( )

Analytiquement, les p+1 équations de vraisemblance ne peuvent être résolues, mais leur solution peut

être approximée numériquement. La procédure utilisée pour l’estimation des paramètres du modèle est la

procédure « Genmod » du logiciel « SAS ». Cette dernière estime les solutions des équations de

vraisemblance en utilisant la procédure itérative de Newton-Raphson (voir annexe 4 : Procédure itérative

de Newton Raphson)

Page 41: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 41

II.2 Obtention d’un modèle de segmentation et d’explication de la prime pure

Cette partie illustre comment la segmentation et l’explication de la prime pure par les facteurs a été

réalisée. Divers paramètres entrent en compte dans une méthode de sélection pas à pas :

-le modèle de régression choisi, détaillé dans les parties précédentes

-le chemin selon lequel la sélection est effectuée.

Implémentation de la sélection Il existe différentes manières de sélectionner un modèle statistique, qui s’effectuent soit :

En partant du modèle avec l’intégralité les variables à disposition et en les retirant une à une : il

s’agit du principe d’une sélection « Backward ».

En partant d’un modèle à 0 variables et en les ajoutant une à une : il s’agit du principe d’une

sélection « Forward ».

En partant d’un modèle à 0 variables et à chaque étape, ajouter ou retrancher des variables du

modèle : il s’agit du principe d’une sélection « Stepwise ».

La méthode implémentée dans la suite est la méthode « Forward ».

Pour mesurer la qualité du modèle, le critère Akaike d’information (AIC) est utilisé. En augmentant le

nombre de facteurs d’un modèle, il est possible d'augmenter la vraisemblance de l’échantillon. Cela dit, il

est nécessaire de décrire la variable réponse avec parcimonie, c’est-à-dire en sélectionnant le plus petit

nombre de paramètres possible. Le critère AIC établit un compromis entre ces deux éléments. Il est donné

par :

( ) ( )

Ainsi, il s’agit de trouver l’ensemble de variables qui maximise l’information de l’échantillon tout en

minimisant l’effectif de cet ensemble. Cela revient à opter pour le modèle qui possède le plus petit critère

AIC. Techniquement, la sélection des variables a été réalisée selon des macros codées sur SAS, dont le

fonctionnement est détaillé en Annexe 5. Ci-dessous se trouve un résumé de leur fonctionnement.

Etape 0 :

Aucune variable dans le modèle.

Etape k :

Recherche parmi les variables ne faisant pas partie du modèle de celle engendrant la plus

forte baisse du critère d’information d’Akaïke par rapport au modèle précédent.

Ajout de cette variable dans le modèle.

Obtention d’un modèle à k variables.

Arrêt de la recherche si :

Intégralité des variables incorporées au modèle ou diminution de l’AIC non significative à

partir d’un certain rang .

Page 42: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 42

Résultats obtenus pour les modèles de fréquence et de coût moyen

Ci-dessous se trouvent les résultats obtenus pour la sélection « forward » pour le modèle du nombre de

sinistres.

Figure 16 Résultats de la sélection « forward »pour le modèle de fréquence

La courbe bleue représente les niveaux de l’AIC obtenus au fur et à mesure qu’une variable est ajoutée. La

courbe rouge détermine la variation relative (VR) de l’AIC d’un modèle à l’autre

Le graphique ci-dessous montre qu’à partir d’un modèle comprenant la zone, la formule, l’ancienneté de la

carte grise, le groupe et l’ancienneté du permis, l’ajout d’une variable supplémentaire n’augmente plus

l’information.

Pertinence des résultats : La zone apparait en premier lieu dans la sélection : hormis le fait que celle-ci soit

révélatrice du niveau de danger, l’étude des corrélations avait révélé que cette variable était la plus

corrélée à la prime pure. La formule apparait en second lieu : la prime pure augmente avec le nombre de

garanties souscrites ; plus la formule est « large », plus il est probable que le nombre de sinistres

s’accroisse. Il est aussi rappelé que le tri à plat avait montré un sens de variation de la prime pure en

fonction des variables d’ancienneté : celle de la carte grise et celle du permis. Il a été part ailleurs vérifié

qu’au sein de cet ensemble, il n’existait aucune forte corrélation entre les variables.

Page 43: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 43

Figure 17 Résultats de la sélection « forward »pour le modèle de coût moyen

Les résultats ci-dessous inciteraient à retenir comme variables explicatives du coût moyen la classe, la

formule, le genre et l’ancienneté du permis. Seulement, l’étude des corrélations a montré que la classe et

le genre étaient corrélés à plus de 80%, et que leur grand nombre de modalités empêchait un croisement

de ces deux derniers. Il a donc été décidé de ne retenir que la classe et la formule pour le modèle de coût

moyen. .

Pertinence des résultats : La classe est révélatrice du niveau de prix de la moto : le montant du

remboursement d’un sinistre directement lié à cette variable. Le tri à plat avait également montré une

croissance de la prime pure par rapport à cette variable. Il est cohérent que cette dernière entre dans le

modèle en première position. Par ailleurs, le caractère fortement discriminant de la formule a été expliqué

lors du tri à plat. Les résultats de la sélection semblent être en accord avec ceux obtenus au préalable dans

cette étude.

Le tableau ci-dessous établit un bilan de la manière selon laquelle la prime pure sera segmentée et

expliquée. Cela signifie que les cases tarifaires seront établies à partir des variables ci-dessous et que les

coefficients obtenus lors de la régression correspondront aux modalités de ces mêmes variables.

Prime pure

Fréquence (Nombre de sinistres) Coût moyen

Zone

Formule

Ancienneté de la carte grise

Groupe

Ancienneté du permis

Classe

Formule

Tableau 10 : Bilan des variables retenues pour segmenter et expliquer la prime pure

II.3. Validation du modèle de prime pure

Implémentation de la régression pour la fréquence

Rappel :

Page 44: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 44

Les coefficients du modèle sont estimés à partir d’un échantillon dont les différentes réalisations sont le

nombre de sinistres d’une case tarifaire.

Ainsi on note le nombre de sinistre observé pour la case i,

le nombre de sinistres

prédits par le modèle pour la case i, l’exposition de la case i (qui n’est autre que la somme des

années polices des individus faisant partie de la case en question).

Les cases permettant le calcul du nombre de sinistres sont segmentées de la manière suivante (voir II.2

Résultats obtenus pour les modèles de fréquence et de coût moyen.)

Tableau 11 : Variables retenues pour segmenter et expliquer la fréquence

Si est le nombre de modalités de la variable , alors le nombre total de cases obtenu sera

égal à ∏ .

Le modèle linéaire généralisé utilisé est un modèle Log-Poisson. On rappelle que les estimateurs des

coefficients ( ∑ ) sont déterminés par maximum de

vraisemblance. Le modèle s’écrit sous la forme :

{ ∏

} ( ) ( ) ∑

Ce qui revient à prédire

( ( ) ∑

)

( ∑

)

Le calcul des coefficients est réalisé grâce au logiciel SAS (procédure « Genmod). Le code correspondant

ainsi que les explications de ce dernier figurent en annexe 6.

Analyse des résultats du modèle de fréquence

Significativité des variables et des modalités Un test du rapport de vraisemblance a été effectué afin de tester la significativité du

modèle par variable ou par modalité. Ses hypothèses sont les suivantes :

S’il s’agit d’un test de significativité de la variable dont les coefficients des modalités

sont(

) alors :

( )

S’il s’agit d’un test de significativité de la modalité de la variable alors :

( )

Est alors calculé le rapport de log vraisemblance correspondant au rapport entre la vraisemblance du

modèle non contraint et celle du modèle contraint

Zone Formule Ancienneté de la carte grise Groupe Ancienneté de permis

Page 45: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 45

( ( ) ( ))

( ) ( )

{

( ) .

Si la « p-value » est inférieure au seuil , la modalité ou la variable en question est significative dans

le modèle.

Les résultats du test pour le modèle de fréquence sont les suivants :

Variable Zone Formule

Ancienneté de la carte

grise Groupe

Ancienneté

de permis

« P-Value » du test de

significativité <0,0001 <0, 0001 <0, 0001 <0, 0001 <0, 0001

Tableau 11 Résultats des tests de rapport de vraisemblance par variable du modèle de fréquence

Les « p-values » sont inférieures à 5%.L’hypothèse de non significativité des variables dans le modèle est

rejetée avec un seuil 5%.

Tableau 12 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence

En dépit du fait que l’ensemble des variables est significatif dans le modèle, les résultats des tests ci-dessus

montrent que certaines modalités ne sont pas significatives. Des regroupements doivent alors être

effectués pour augmenter la significativité de ces modalités.

P-Value P-Value P-Value P-Value P-Value

Zone1 0,15% RC <1an 0,00% <=6 0,00% 0-2 ans 0,00%

Zone2 0,46% RC+IV 0,00% 1an 0,00% 30 0,00% 3-4 ans 4,26%

Zone3 85,23% RC+IV+DC 0,00% 2ans 56,12% 31 0,00% 5-9ans 6,89%

Zone4 RC+IV+TD 0,00% 3ans 32 51,53% 10-14ans

Zone5 8,50% 4ans 4,07% 33 0,00% 15-19ans 14,39%

Zone6 0,00% 5ans 0,03% 34 91,07% 20-29ans 0,00%

Zone7 0,00% 6-7ans 0,00% 35 82,18% > 29 ans 0,00%

Zone8 0,00% 8-9ans 0,00% 36

Zone9 0,00% +10ans 0,00% 37 40,76%

Zone10 0,00% 38,39 0,00%

Zone11 0,00%

Zone12 0,00%

Zone13 0,00%

Zone Ancienneté carte grise Groupe Ancienneté permisFormule

"P- value" 5% "P- value" 5% Modalité de référence

Page 46: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 46

Tableau 13 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence

Ainsi, les zones 3 et 4 sont regroupées d’une part, les anciennetés de permis des 10-14 ans et des 15-19

ans d’autre part. Cela engendre la significativité de l’ensemble des modalités de ces deux variables. Les

groupes 34 et 35 sont regroupés et deviennent la modalité de référence. En dépit de ces changements la

significativité de la variable groupe évolue peu.

Qualité d’ajustement du modèle de fréquence Deux types d’écarts, représentatifs de la qualité du modèle, seront analysés.

-les résidus bruts issus du modèle : écart simple entre la valeur prédite et la valeur observée

- la différence entre le nombre de sinistres d’un individu et le nombre de sinistre moyen que lui affecte le

modèle. Cet écart mesure la qualité d’ajustement du modèle à l’individu.

Pour des raisons de confidentialité, certains chiffres du tableau suivant ont été notés et .

L’erreur brute totale du modèle est de l’ordre de .

Par ailleurs, un autre outil révélateur de la qualité du modèle est le pourcentage d’explication de la variable

réponse par le modèle. L’indicateur utilisé est le R². Ce dernier se définit comme étant le rapport entre la

somme des carrés expliquée (SCE) et la somme des carrés totale (SCT).

∑ ( )

∑ (

)

"P- value" 5% "P- value" 5% Modalité de référence

Nb cases

Exposition

(AP)

Nb sinistres

HG total observé

Nb sinistres

HG

total prédit

Erreur

brute

totale

Fréquence

globale

observée

Fréquence

globale

prédite

24459 247614 ,000018 -1,77E-05 % %

Tableau 14 Erreur brute totale pour le modèle de fréquence

Page 47: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 47

Le modèle en question possède un R² de 88%. Cela signifie que ce dernier explique 88% du nombre de

sinistres, ce résultat est très correct selon la littérature.

A présent les résidus bruts sont analysés. Ils correspondent à la quantité

{ ∏

}

Figure 18 Résidus bruts du modèle de fréquence : à gauche, valeur obtenues par années police, à droite, leurs distributions

Près de 75% des résidus sont centrés en 0.

Toujours dans une optique d’analyse de la qualité du modèle, il est utile de connaître l’allure de la

distribution des résidus bruts. Pour cela, les statistiques suivantes sont calculées.

Statistique Formule Valeur obtenue

pour les résidus

bruts centrés

réduits

Moyenne ∑

0

Ecart type

( ∑ (

) )

1

Skewness

0,59

Kurtosis

(

)

34

Tableau 15 Valeurs de la moyenne, écart type, Skewness et Kurtosis obtenus sur l’échantillon des résidus centré réduits

Page 48: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 48

Les résidus sont nuls en moyenne et possèdent un petit écart-type : cela confirme leur concentration

autour de 0. Les coefficients de Skewness et Kurtosis obtenus permettent de rejeter l’hypothèse du modèle

affirmant la normalité des résidus. Le Skewness vaut 0,59, ceci témoigne d’une distribution légèrement

décalée vers la gauche de la médiane et donc légèrement asymétrique, ce qui n’est pas le cas de la loi

normale. Le Kurtosis est plus grand que 3, ce qui suggère que les queues de distributions sont plus épaisses

que celle d’une loi normale.

Le test QQ plot réalisé ci-dessous confirme davantage que les queues de distributions des résidus bruts ne

s’ajustent pas correctement pas à celles d’une loi normale centrée réduite.

Figure 19 Test QQ plot sur l’échantillon des résidus centrés réduits

Enfin, un bon modèle ajuste bien l’écart entre le nombre de sinistres d’un individu et le nombre de sinistre

moyen que lui affecte le modèle. Le nombre de sinistre moyen affecté par le modèle dépend de la case

tarifaire à laquelle le risque appartient. Pour un risque , cet écart est noté . La base

d’apprentissage possède n=544 338 risques.

: Nombre de sinistres du risque

Nombre de sinistres prédit pour la case tarifaire à laquelle appartient le risque

: Exposition de la case tarifaire à laquelle appartient l’individu, qui n’est autre que la somme des

années polices des risques constituant cette case.

Exposition du risque.

Ainsi, le terme

n’est autre que le nombre de sinistres prédit pour un risque . Ce

terme peut être vu comme nombre de sinistres prédit pour la case à laquelle ce risque appartient pondéré

de la part d’exposition que possède l’individu au sein de cette case.

Moyenne 0,00003

Variance 0,01768

Ecart type 0,13295

Page 49: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 49

Tableau 16 Moyenne, variance et écart type sur l’échantillon des ENS

En moyenne, le modèle ajuste bien par rapport à l’individu : ( ) est une variable centrée et peu

dispersée.

Ce graphe en figure 16 montre l’écart entre le nombre de sinistres observé pour un individu et le nombre

de sinistres prédit en fonction du nombre de sinistres observés. Le modèle ajuste de moins en moins bien

avec un nombre de sinistres croissant.

Figure 20 Boîte à moustache représentant ENS en fonction du nombre de sinistres par individu

Rappel de la formule de l’écart calculé

Le graphe en boîte à moustaches montre que l’écart se présente comme suit :

-Il est pratiquement nul pour les nombres de sinistres nuls. Sa distribution est condensée autour de 0 (1 er

quartile, médiane, troisième quartile, dernier déciles confondus en 0).

-Il est proche de 1 pour les individus qui ont eu 1 sinistre. De manière générale il est proche de x si l’individu

a eu x sinistres. Le nombre de sinistres prédits pour un risque est donc globalement nul.

Le modèle ajuste donc bien les personnes qui n’ont eu aucun sinistre. Cela s’explique au vu de l’échantillon

de départ en notre possession, avec 98 % des données qui n’avaient eu aucun sinistre.

Validation du modèle de fréquence sur la base de test Les valeurs des nombres de sinistres prédits sont obtenues sur la base de test en appliquant la formule :

( ( ) ∑

)

Les quantités et

sont analysées sur la base de test

Page 50: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 50

Figure 21 Distribution des résidus bruts et statistiques obtenues pour les résidus bruts sur la base de test

Les résidus bruts sont concentrés à près de 85% autour de 0, nul en moyenne et peu dispersés.

Quant à l’ajustement du modèle par rapport à l’individu, un constat similaire à celui effectué sur

l’échantillon d’apprentissage peut être fait.

Figure 22 Boîte à moustache des ENS en fonction du nombre de sinistres par individu, et statistiques obtenues

Les ( ) sont nuls en moyenne et concentrés autour de 0. Selon l’allure des boîtes à moustache

obtenues, un contat similaire à celui effectué pour la base d’apprentissage peut être fait.

Conclusion pour le modèle de fréquence

Le modèle de fréquence est validé car il fournit globalement de bons ajustements.

Implémentation de la régression pour le coût moyen

Rappel :

Page 51: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 51

Les coefficients du modèle sont estimés à partir d’un échantillon dont les différentes réalisations sont le

nombre de sinistres d’une case tarifaire. Ains , est noté le coût moyen observé pour la case i, note

coût moyen prédit par le modèle pour la case i, le nombre de sinistres de la case i Les

cases permettant le calcul du coût moyen sont segmentées selon les variables suivantes (cf. II.6.2 Résultats

obtenus pour les modèles de fréquence et de coût moyen).

Tableau 17 Variables retenues pour segmenter et expliquer le coût moyen

Si est le nombre de modalités de la variable , alors le nombre total de cases obtenu sera

égal à .

Le modèle linéaire généralisé utilisé est un modèle Log-Gamma. On rappelle que les estimateurs des

coefficients ∑ sont déterminés par maximum de

vraisemblance. Le modèle s’écrit sous la forme :

( ) ∑

Ce qui revient à prédire

( ∑

)

On suppose que le coût moyen suit une loi gamma.

Les codes sas ayant permit d’implémenter cette régression figurent en annexe 6.

Analyse des résultats du modèle de coût moyen

Significativité des variables et des modalités Un test de rapport de vraisemblance a également été effectué dans la cadre de la modélisation du

coût moyen. Dans ce cas aussi, la significativité des variables ainsi que celles des modalités est

Les résultats du test sont les suivants :

Tableau 18 Résultats des tests de rapport de vraisemblance par variable du modèle de coût moyen

Les « p-values » sont inférieures à 5%.L’hypothèse de non significativité des variables dans le modèle est

rejetée avec un seuil 5%.

Par ailleurs comme le montre la table ci-dessous, certaines modalités ne sont pas significatives. Etant

donné que l’échantillon sur lequel le modèle de coût moyen a été mis en place est de petite taille (36

cases), on se contentera de la significativité globale des variables. Aucun regroupement de modalités ne

sera effectué pu le faible nombre de modalités impliquées.

Classe Formule

Variable Classe Formule

« P-Value » <0,0001 <0, 0001

Page 52: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 52

Figure 23Résultats des tests de rapport de vraisemblance par modalité du modèle de coût moyen

Qualité d’ajustement du modèle de coût moyen Un écart de 1,5 € (soit 0,06 %) est observé entre les coûts moyens observés et prédit sur l’ensemble de

l’échantillon.

Comme pour le nombre de sinistres, le R² est à nouveau calculé.

∑( )

∑(

)

∑ ( )

∑ (

)

Le modèle en question explique 80,9 % du coût moyen des sinistres.

Les erreurs brutes sont analysées,

, ainsi que les erreurs

brutes relatives,

.

Figure 24 Résidus bruts du modèle de coût moyen à gauche, et distribution des résidus relatifs à droite

P-Value P-Value

J 50,25% RC

K 28,44% RC+IV 85%

L 28,79% RC+IV+DC 0,01%

M RC+IV+TD 0,01%

N 0,02%

O 0,01%

P 0,01%

Q 0,01%

R 0,01%

Classe Formule

"P- value" 5% "P- value" 5% Modalité de référence

Page 53: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 53

Comme le montre la partie droite de la figure 19, les résidus relatifs sont concentrés à près de 70% entre -

10% et 10%. La variation relative moyenne est de 4%.

Le coût moyen prédit est en moyenne supérieur de 51 € supérieur au coût moyen observé : les résidus

bruts ne sont pas nuls en moyenne et assez dispersés étant donnée la valeur de leur écart type.

La valeur du coefficient d Skewness est proche de 0 : elle témoigne d’une distribution légèrement

asymétrique. Le Kurtosis est inférieur à 3, les queues de distribution des résidus sont un peu plus fines que

celle d’une loi normale.

Les valeurs obtenues ci-dessus ne permettent pas cette fois-ci d’exclure l’hypothèse de normalité des

résidus, contrairement au modèle de fréquence.

Figure 26 Résultat du QQ plot sur l’échantillon de résidus bruts

Un test d’adéquation QQ plot a donc été réalisé. Ce dernier montre une assez bonne adéquation à la loi

normale dont les paramètres sont la moyenne et l’écart type mentionnés ci-dessus. Les points sont

pratiquement alignés sur la première bissectrice. Il est possible d’en déduire que l’erreur du modèle de

coût moyen est imputable à une erreur de mesure.

Un autre constat peut être effectué grâce au graphique ci-dessous.

Statistique Valeur obtenue

pour les résidus

bruts

Valeur

obtenue pour

les résidus

relatifs

Moyenne -51,35034 0,04

Ecart type

477,817893

0,22

Skewness

-0,344096

Kurtosis 1,29471854

Figure 25 Statistiques obtenues sur l’échantillon des résidus bruts et des résidus bruts relatifs

Page 54: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 54

Figure 27 Résidus bruts relatifs du modèle de coût moyen représentés en fonction du nombre de sinistres par cases tarifaires.

En valeur absolue, la variation relative des résidus est la plus élevée pour les cases dont le nombre de

sinistres est faible : moins les sinistres sont nombreux au sein d’une certaine catégorie de personnes, moins

bien le modèle ajuste le coût moyen.

Par ailleurs, un bon modèle ajuste bien l’écart entre la charge des sinistres d’un individu et la charge de

sinistres que lui affecte le modèle. La charge affectée par le modèle dépend de la case tarifaire à laquelle

l’individu appartient. Pour un risque , cet écart est noté . La base d’apprentissage possède

n=544 338 risques.

}

: Charge de sinistres du risque

Charge de sinistres prédite pour la case tarifaire à laquelle appartient le risque . Elle

correspond au produit

.

Nombre de sinistres du risque

: Nombre de sinistres de la case à laquelle appartient le risque .

Ainsi, le terme

n’est autre que la charge de sinistres prédite pour un risque . Il

s’agit d’une pondération de la charge de sinistres de la case à laquelle l’individu appartient pondérée de la

part du nombre de sinistres que le risque a au sein de cette case.

Sur l’ensemble des données Sur les données sinistrées

Moyenne 0,02 1,5

Ecart type 456,37 3528

Tableau 19 Moyenne, variance et écart type sur l’échantillon des EC

Cet écart de charge est plus important et plus dispersé sur les données sinistrées.

Validation du modèle de coût moyen sur la base de test

Page 55: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 55

Figure 28 Résidus relatifs du modèle de coût moyeneprésentés en fonction du nombre de sinistres par cases tarifaires sur la base de test

En valeur absolue, la variation relative des résidus est la plus élevée pour les cases dont le nombre de

sinistres est faible : ce phénomène avait également été observé sur la base de test.

En moyenne, le coût moyen observé est de 150 € inférieur au coût moyen prédit.

La charge prédite est en moyenne supérieure de 2,2 € à la charge observée sur l’ensemble des données, et

de 130€ supérieure sur les données sinistrées.

Conclusion pour le modèle de coût moyen

Le modèle obtenu est moins stable que le modèle de fréquence. D’éventuelles pistes d’amélioration de ce

modèle seraient : - Tester une paramétrisation selon la loi de Weibull étant donné que cette dernière adhérait mieux

aux données en question.

- Prédire non pas le coût moyen mais la variation du coût moyen par rapport à un coût moyen

minimal de la base en cases tarifaires.

Sans perdre de vue l’objectif de cette étude, il est à présent temps de tester les résultats des modèles de

fréquence et de coût moyen sur celui de la prime pure.

Calcul de la prime pure sur les échantillons de test et d’apprentissage

Rappel :

La procédure adoptée est la même pour les bases de test et les bases d’apprentissage. Pour chaque case

tarifaire construite à partir des modèles de segmentation du coût moyen et de la fréquence précédents,

sont calculés

La fréquence et le coût moyens observés

La fréquence et les coûts moyens prédits à partir des coefficients obtenus par le biais des deux

modélisations précédentes :

Page 56: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 56

( ∑

)

(

)

{ }

{ }

Les primes pures observées et prédites sont obtenues

Le delta observé –prédit est calculé

Figure 29 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition par cases tarifaires (à droite) sur la base d’apprentissage

Figure 30 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition par cases tarifaires (à droite) sur la base de test

Sur la base d’apprentissage, une différence moyenne de 60 centimes d’euros entre les primes pures

observées et prédites est observée ( [ ] ). Cela dit, la figure 22 ci-dessus montre que la valeur du

Page 57: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 1 : Modélisation de la prime pure

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 57

delta est élevée lorsque le nombre de sinistres est faible ou lorsque la durée d’exposition l’est. Sur la base

de test, une différence moyenne de 23 € entre la prime pure observée et la prime pure prédite est

présente. Comme le montre la figure 23, le même type d’erreur de prédictions est observé sur la base de

test.

III. Conclusion Cette partie a dressé un modèle de segmentation et de prédiction de la prime pure. Comme vu

précédemment, ce dernier trouve ses limites lorsque le risque n’est pas très bien connu, en raison du fait

qu’il soit peu exposé au risque ou que la probabilité d’occurrence de ses sinistres soit faible.

En dehors des pistes d’amélioration du modèle de coût moyen (Partie II.3 Validation du modèle de

prime pure/Analyse des résultats du modèle de coût moyen /Conclusion pour le modèle de coût moyen),

d’autres éléments peuvent être proposés pour améliorer celui de la prime pure. Il est rappelé que les

facteurs en présence de la modélisation ont été obtenus par l’intermédiaire d’une méthode de sélection

pas à pas « forward » où les modèles de prédiction et de segmentation sont identiques. Ceci est un choix

qui a été fait lors de cette étude, et il aurait été possible de choisir d’autres techniques de segmentation

(notamment celles basées sur l’analyse de la variance), ou une procédure de sélection différente de la

procédure « forward ».

La première modélisation ayant à présent été effectuée, il est temps d’aborder la seconde partie de

l’étude concernant la modélisation de la prime commerciale.

Page 58: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 58

Partie 2 : Modélisation de la prime commerciale Il est rappelé que l’objectif de l’étude est de modéliser la valeur contrat.

La prime pure ayant été modélisée en première partie, il s’agit à présent de modéliser la prime

commerciale, c’est-à-dire trouver les facteurs qui permettront de segmenter et prédire cette prime.

La prime commerciale est le montant de la cotisation que paie au final le client. Elle correspond à au coût

du risque, augmenté de frais opérationnels, d’une marge bénéficiaire, de taxes et se décompose de la

manière suivante :

La problématique est similaire à celle dans la partie « modélisation de la prime pure ». Il s’agit de

trouver l’ensemble des variables par lesquelles la prime commerciale sera dans un premier temps

segmentée, puis expliquée. En effet, cette dernière n’est pas déterministe : elle change en fonction des

modifications que l’assuré a décidé d’apporter à son contrat (remplacement etc..).

Une préparation des données est faite au préalable : chaque montant de prime commerciale est

annualisé : en effet, à chaque ligne (chaque image de contrat) est associé le montant de la prime

commerciale correspondant à la durée de l’image de contra t (Partie 0 / 0.2 Structure des données, figure

3). Ces derniers sont donc divisés par la durée d’exposition de l’image pour être annualisés. La prime

commerciale d’une case tarifaire correspondra à la prime commerciale annuelle moyenne reversée par

l’ensemble des membres de la case. Cela est résumé par la formule suivante.

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

Prime commerciale de l’année k

Prime pure de l’année k

Produits financiers de l’année k

Frais d’acquisition et de gestion de l’année k

Taux d’actualisation entre l’année 0 et l’année k

Taux d’inflation de l’année k

( ) Probabilité de résiliation entre l’année 0 et l’année k.

Page 59: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 59

Une démarche similaire à celle adoptée lors de la partie 1 une sera entreprise. D’abord, une

analyse descriptive de la prime commerciale et des potentiels facteurs qui participeront à sa modélisation

sera réalisée, à partir d’outils similaires à ceux utilisés pour la prime pure. Une fois cette analyse effectuée,

la même démarche segmentation/prédiction que celle utilisée précédemment sera utilisée pour la

construction du modèle de prime commerciale, dont la validité sera étudiée.

Au départ de cette seconde partie de l’étude, le support des facteurs est globalement identique à

celui-utilisé pour la prime pure.

I. Analyse descriptive pour la modélisation de la prime commerciale

I.1 Analyse uni variée L’objectif est de repérer un lien entre le niveau de prime commerciale et les modalités prises par

une variable donnée. Le raisonnement s’effectue en uni varié : pour une modalité donnée, la moyenne des

primes commerciales est calculée. Les différents niveaux de prime commerciale sur chaque graphe sont

calculés de la manière suivante :

Conducteur Géographie

Age

Sexe du conducteur

Segment marketing

Ancienneté du permis

Antécédents *Expérience

Zone

Région Axa

Région Axa du risque

Véhicule Contrat

Ancienneté de la carte grise

Marque de la moto

Genre de la moto

Groupe

Classe

Cylindrée

Durée de détention du véhicule

Ancienneté du véhicule

Type d’usage

Formule

Fractionnement

Ancienneté du contrat

Coefficient technique

Réseau

Tableau 20 Support des variables candidates à la modélisation de la prime commerciale

Page 60: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 60

Figure 31 Part des images et niveaux de prime commerciale par coefficient technique

Il est rappelé que le coefficient technique correspond au rapport entre la prime commerciale et la prime

issue de la mécanique tarifaire AXA. A niveaux de primes machines égales, la prime commerciale est

croissante par rapport au CT, ce qui semble naturel et explique la croissance globale de la courbe obtenue

ci-dessus. Globalement, l’ensemble des variables semblent être utilisables pour la segmentation de la prime

commerciale.

Figure 32 Part des images et niveaux de prime commerciale par ancienneté de permis

Il est logique qu’un conducteur ayant eu son permis depuis longtemps paye en moyenne plus qu’un

autre l’ayant eu récemment.

Figure 33 Part des images et niveaux de prime commerciale par formule

Il est également naturel que la prime payée augmente avec la largeur de la formule de souscription.

En annexe « Résultats du tri à plat pour la prime commerciale » figurent les graphiques obtenus pour les

autres variables.

moins de 0.69

0.70 A 0.79

0.80 A 0.89

0.90 A 0.94

0.95 A 0.99

1.00 1.01 A 1.05

1.06 A 1.10

PLUS DE 1.10

Coefficient technique

Part des images

Prime commerciale moyenne

0-2 ans 3-4 ans 5-9ans 10-19ans 20-29ans > 29 ans

Ancienneté du permis

Part des images

Prime commerciale moyenne

RC RC+IV RC+IV+DC RC+IV+TD

Formule

Part des images

Prime commerciale moyenne

Page 61: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 61

I.2 Etude des corrélations entre la prime commerciale et l’ensemble des variables

du support Pour chaque case tarifaire constituée des variables prises en compte lors du tri à plat, est

déterminé un niveau de prime commerciale moyen, comme expliqué dans le paragraphe d’introduction de

cette partie de l’étude. Les corrélations entre chaque variable et les niveaux de prime commerciales sont

ici aussi établies à partir du coefficient de contingence, utilisé dans la partie 1 /Modélisation de la prime

pure/Etude des corrélations. Les résultats apparaissent ci-dessous.

Tableau 21 Corrélations entre la prime commerciale et les variables du support

Les résultats obtenus pour la prime pure sont rappelés ci-dessous.

Variable Prime Pure

Zone 43%

Ancienneté du véhicule 38%

Durée de détention 34%

Marque Groupe 33%

Coefficient Technique Genre 32%

Ancienneté du contrat Région du portefeuille Classe 31%

Ancienneté du permis 30%

Ancienneté de la carte grise Cylindrée 29%

Segment marketing Âge 28%

Région du risque 24%

Antécédent*Expérience Usage 21%

Formule 20%

Fractionnement 13%

Sexe 11%

Tableau 22 Corrélations entre la prime pure et les variables du support.

En rose, figurent les variables respectivement les plus corrélées à la prime pure et à la prime commerciale.

Le constat suivant peut être fait : dans la première moitié des variables les plus corrélées à la prime

commerciale, se trouvent l’ensemble des variables les plus corrélées à la prime pure. Ceci semble naturel,

étant donné que la prime commerciale dépend directement de la prime pure.

Par ailleurs, les niveaux de corrélations des facteurs avec la prime commerciale sont élevés : ils varient

entre 93 % et 60%. Cela est rassurant vis- à-vis du degré de représentation de la prime commerciale par ces

facteurs.

PC

93%

92%

Classe Marque Groupe Durée de dét. Anc. Contrat CT Anc CG 91%

Ancienneté du permis Âge Région du portefeuille 87%

84%

81%

77%

76%

74%

65%

60%

Réseau

Fractionnement

Sexe

Variable

Ancienneté du véhicule

CylindréeRégion du risque

Formule

Antécédents* Expérience

Usage

Zone

Genre

Segment Marketing

Page 62: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 62

L’étude des corrélations entre les facteurs réalisée précédemment avait montré que l’âge était corrélé à

l’ancienneté de permis. Ces deux facteurs sont par ailleurs corrélés de manière identique à la prime

commerciale. Cela dit, comme l’ancienneté de permis figure dans le modèle établit en partie 1, il est

préférable de garder cette dernière. D’autre part, la cylindrée est corrélée avec le groupe, le genre et la

classe, mais parmi ces dernières, il s’agit de la variable la moins corrélée à la prime commerciale. Elle ne

sera pas prise en compte dans le reste de l’étude vu que son effet est retrouvé dans les trois variables

précédentes.

Le paragraphe suivant traite des tests de significativité des variables vis-à-vis de la prime commerciale.

I.3 Tests de significativité des variables par analyse de la variance

Le principe de ce test a été expliqué dans la section I.3 de la partie 1. Il est tout de même rappelé

que l’hypothèse nulle du test stipule que les moyennes entre les groupes sont égales : un rejet de cette

dernière consiste à reconnaitre le caractère discriminant de la variable avec un seuil de 5 %. Il en résulte

que l’ensemble des tests d’ANOVA réalisés pour la prime commerciale renvoient une p-value inférieure à

5%. Les variables apparaissent comme étant toutes significatives par rapport à la prime commerciale.

II. Construction du modèle de prime commerciale L’échantillon sur lequel la sélection est effectuée correspond aux primes commerciales moyennes annuelles

sur chaque case tarifaire.

Il faut à présent expliquer le choix du modèle linéaire généralisé utilisé dans la méthode de sélection. Il est

nécessaire d’émettre l’hypothèse suivante afin de pouvoir appliquer la théorie des modèles linéaires

généralisés.

Ainsi, le modèle utilisé dans l’algorithme de sélection des variables est le suivant :

( ) ∑

La fonction de lien « log » est encore une fois retenue car l’on est sous la contrainte d’un modèle

multiplicatif. est supposé être un échantillon indépendant et identiquement distribué

de loi gamma dont les paramètres sont estimés par maximum de vraisemblance. Un histogramme de ces

observations montre que cette loi semble appropriée à ces dernières. En effet, le graphique ci-dessous

illustre les tests d’adéquation de la prime commerciale à trois lois de la famille exponentielle : en rouge, la

loi Gamma, en bleu, la loi exponentielle, en vert, la loi de Weibull et en rose la loi log normale.

Page 63: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 63

Figure 34 Tests d’adéquation de la prime commerciale aux lois de Weibull, Gamma, Lognormale et Exponentielle sur l’échantillon

segmenté par l’ensemble des variables

Les lois qui semblent le mieux ajuster la prime commerciale semblent être la log-normale et la loi gamma.

Le choix de la loi gamma a été retenu.

Remarque : La loi retenue est une loi gamma. En affinant ou épaississant la segmentation, la loi de

l’échantillon est peu perturbée, seulement les paramètres. Plus précisément, d’une segmentation à l’autre,

les niveaux de prime commerciales obtenus sont des moyennes pondérées des niveaux de prime

commerciales précédents. Ces derniers sont également indépendants. Or une moyenne pondérée de

variables aléatoires indépendantes ayant une loi gamma possède une loi gamma. Ceci est visible sur le la

figure ci-dessous.

Figure 35 Figure 28 : Tests d’adéquation de la prime commerciale à la loi Gamma sur l’échantillon sur une

segmentation plus fine que la figure 27

Page 64: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 64

II.1 Modèle de segmentation et de prédiction de la prime commerciale La procédure « Forward détaillée en annexe 5 est adaptée au modèle de prime commerciale afin

de renvoyer les résultats ci-dessous. Elle est appliquée à l’échantillon des primes commerciales annuelles

moyennes par cases tarifaires. Les résultats de la sélection apparaissent dans le graphe ci-dessous.

Figure 36 Résultats de la sélection « forward » sur l’échantillon

Les résultats obtenus laissent entendre qu’il y a intérêt à retenir dans la segmentation de la prime

commerciale: la formule, le groupe, la zone, l’ancienneté du permis, le coefficient technique.

Pertinence des résultats obtenus par rapport aux informations collectées précédemment :

La pertinence des résultats obtenus est validée dans un premier temps par le fait que globalement,

l’ensemble des variables apparaissant dans la modélisation de la prime pure apparaissent dans celle de la

prime commerciale. La composante « commerciale » de la prime est mise en avant par l’entrée du

coefficient technique dans le modèle.

Position d’entrée

dans le modèle

Prime pure Prime Commerciale

Fréquence Coût moyen

1 Zone Formule Formule

2 Formule Classe Groupe

3 Anc. Carte grise Zone

4 Groupe Ancienneté. permis

5 Anc. du permis Coefficient technique

Tableau 23 Mise en parallèle des résultats obtenus pour la sélection de facteurs pour la modélisation de la prime pure et celle de la prime commerciale

Par ailleurs, les graphes obtenus lors du tri à plat et les niveaux de corrélation déterminés dans les points

I.1 et I.2 de cette partie viennent appuyer les résultats de la sélection « forward ». La formule est la

Page 65: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 65

première variable à entrer dans le processus de sélection, son caractère discriminant avait été révélé lors

du tri à plat. De plus, elle est corrélée à 81% avec la variable réponse.

Figure 37 Prime commerciale moyenne en fonction du groupe

Le groupe représente les caractéristiques techniques de la moto. La prime commerciale augmente avec ce

dernier. Il est très corrélé (73%) avec la variable réponse.

Figure 38 Prime commerciale moyenne en fonction de la zone

La zone est la variable la plus corrélée à la prime commerciale. Révélatrice du niveau de danger, il parait

naturel que la prime commerciale augmente avec cette dernière.

Une forte décroissance de la prime commerciale est observable par rapport à l’ancienneté du permis, qui

est corrélée à 87 % avec la variable réponse. Enfin, le coefficient technique est corrélé à plus de 70% avec la

prime commerciale.

Maintenant que les variables du modèle ont été définies, il faudra mesurer son degré de validité.

II.2 Validation du modèle de prime commerciale Soient

la prime commerciale moyenne observée pour la case , la prime

commerciale prédite le modèle pour la case . Les cases permettant le calcul des primes commerciales sont

segmentées de la manière suivante (II.1 Modèle de segmentation et de prédiction de la prime

commerciale)

<=6 30 31 32 33 34-35 36 37 38,39Groupe

Part des images

Prime commerciale moyenne

Zone

Part des images

Prime commerciale moyenne

Page 66: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 66

Formule Groupe Zone Anc. du permis Coefficient technique

Tableau 24 Variables retenues pour segmenter et expliquer la prime commerciale

Si est le nombre de modalités de la variable , alors le nombre total de cases

obtenu sera égal à ∏ .

Le modèle linéaire généralisé utilisé est un modèle Log-Gamma. On rappelle que les estimateurs

des coefficients ∑ sont déterminés par maximum de

vraisemblance. Le modèle s’écrit sous la forme :

{ ∏

} ( ) ∑

On suppose que la prime commerciale suit une loi gamma. Ici également, la procédure « Genmod » de Sas est utilisée.

Significativité des variables et des modalités Ici encore, des tests du rapport de vraisemblance sont effectués, dont le principe est expliqué en Partie 1

Modélisation de la prime pure/II.3 Validation du modèle de prime pure/Analyse des résultats du modèle de

fréquence. Ses hypothèses sont rappelées ci-dessous. Si la « p-value » est inférieure au niveau , la

modalité ou la variable en question est significative dans le modèle. Les résultats du test sont les suivants :

Significativité des variables:

Variable Formule Groupe Zone Anc. du permis Coefficient technique

« P-Value » <0,0001 <0, 0001 <0, 0001 <0, 0001 <0,0001

Tableau 25 Résultats des tests de rapport de vraisemblance par variable du modèle de prime commerciale

Significativité des modalités :

Tableau 26 Résultats des tests de rapport de vraisemblance par modalité du modèle de prime commerciale

Quelle que soit la variable et quelle que soit la modalité de cette variable, l’hypothèse de sa non

significativité peut être rejetée avec un seuil de 5%.

Qualité d’ajustement du modèle de prime commerciale Les résidus bruts issus du modèle ainsi que la différence entre la prime commerciale annuelle versée par

un individu et la prime commerciale prédite par le modèle sont étudiés. Cet écart mesure la qualité

"P-value" "P-value" "P-value" "P-value" "P-value"

RC <0,0001 <=6 <0,0001 Zone1 <0,0001 0-2 ans 0,01% moins de 0.69<0,0001

RC+IV <0,0001 30 <0,0001 Zone2 <0,0001 3-4 ans 0,01% 0.70 A 0.79 <0,0001

RC+IV+DC <0,0001 31 <0,0001 Zones 3-4 , 5-9ans 0,01% 0.80 A 0.89 <0,0001

RC+IV+TD 32 <0,0001 Zone5 <0,0001 10-19ans , 0.90 A 0.94 <0,0001

33 <0,0001 Zone6 <0,0001 20-29ans <0,0001 0.95 A 0.99 <0,0001

34-35 , Zone7 <0,0001 > 29 ans <0,0001 1.01 A 1.05 <0,0001

36 <0,0001 Zone8 <0,0001 1.06 A 1.10 ,

37 <0,0001 Zone9 <0,0001 1.00 <0,0001

38,39 <0,0001 Zone10 <0,0001 PLUS DE 1.10 <0,0001

Zone11 <0,0001

Zone12 <0,0001

Zone13 <0,0001

Coefficient techniqueFormule Groupe Zone Ancienneté du permis

"P- value" 5% "P- value" 5% Modalité de référence

Page 67: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 67

d’ajustement du modèle à l’individu. Pour des raisons de confidentialité, certains chiffres du tableau

suivant ont été notés et .

Tableau 27 Erreur brute totale pour le modèle de prime commerciale

La variation relative entre la somme des primes commerciales prédites observées est nulle.

Le R² est également déterminé.

∑ ( )

∑ (

)

= 75%

75% de la prime commerciale est expliquée par la formule, le groupe, la zone, l’ancienneté du permis et le

coefficient technique.

Etude de l’erreur centrée réduite

(

) { ∏

} correspond à l’erreur brute,

correspond à

l’erreur brute centrée réduite.

Figure 39 Résidus bruts centré réduits du modèle de prime commerciale et test du QQ plot sur ces derniers

Cette distribution a l’air plus ou moins symétrique : la normalité des résidus est testée. Si le modèle est

correct, alors les écarts entre l’observé et le prédit sont entièrement imputables à des erreurs de mesure.

Les résidus doivent posséder les propriétés classiques d’une distribution normale : courbe « en cloche»,

symétrique autour de la valeur prédite, avec un aplatissement régulier des extrémités. Le test QQ plot

réalisé ci-dessus montre que les queues de distributions des résidus bruts ne s’ajustent pas correctement

pas à celles d’une loi normale centrée réduite.

Nb cases

Somme des Primes

commerciales observées

Somme des Primes

commerciale prédite ( ) ⁄

Variation

19172 0%

Page 68: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 68

Cela dit, la figure 40 montre que 2% des valeurs des résidus s’écarte des queues de distribution : ils sont

inférieurs à -2,5 ou supérieurs à 2,5.

Figure 40 des résidus bruts centrés réduits sur trois intervalles ]-∞,-2,5[; [-2,5,2,5] ;]2,5 ,+∞[ .

Figure 41 Boite à moustaches représentant le nombre d’individus pas case en fonction des trois catégories de résidus centrés réduits définies précédemment

La boîte à moustache ci-dessous identifie les valeurs s’écartant des queues de distribution : elles

correspondent aux primes commerciales moyennes calculées sur des cases ayant peu d’individus.

La ou les individus par case sont peu nombreux, la prédiction de la prime commerciale versée s’ajuste mal.

Par ailleurs, pour un risque , l’écart entre la prime commerciale annuelle d’un individu et la prime

commerciale moyenne que lui affecte le modèle (qui dépend de la case tarifaire à laquelle le risque

appartient) est noté . La base d’apprentissage possède n=544 338 risques.

}

: Montant de la cotisation payée par le risque

Prime commerciale moyenne prédite pour la case

Moyenne 0,62

Ecart type 112

Tableau 28 Moyenne, écart type sur l’échantillon des ( )

Page 69: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 69

En moyenne, le modèle la prime commerciale payée par l’individu est de 62 centimes supérieure à celle

que lui attribue le modèle ( ) .

Figure 42 Distribution des (

)

Cette distribution est plus ou moins symétrique : globalement sur l’ensemble des risques, la prime

commerciale affectée par le modèle est autant surestimée qu’elle est sous estimée

Validation du modèle sur la base de test Les valeurs des primes commerciales prédites sont obtenues en appliquant la formule :

( ( ) ∑

)

,

les résidus bruts centrés réduits associés à .

Page 70: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 70

Figure 43 Les mêmes phénomènes sont constatés sur l’échantillon de test

La figure 43 montre que le même type de phénomènes est observé sur les échantillons de test et

d’apprentissage : la difficulté à bien prédire de ce modèle réside dans les cases tarifaires constituées de peu

d’individus.

Figure 44 Distribution des (

)sur l’échantillon de test

La distribution des ( ) sur la base de test est symétrique : globalement sur l’ensemble des risques, la

prime commerciale affectée par le modèle est autant surestimée qu’elle est sous estimée. En moyenne,

l’écart entre la prime annuelle payée par un individu et celle affectée par le modèle est de 28 centimes

d’euros sur la base de test.

III. Conclusion

Cette partie a déterminé un modèle de segmentation et de prédiction de la prime commerciale, dont les

facteurs sont globalement identiques à ceux utilisés dans le modèle de prime pure, déterminé en partie 1.

Les erreurs de prédiction du modèle de prime commerciale sont les plus élevées sur les cases tarifaires

ayant peu d’effectif. Cela dit, l’ajustement de cette prime commerciale prédite par rapport à l’individu est

d’une bonne qualité, et en moyenne, la prime commerciale reversée par un individu sera pratiquement

égale à celle que lui octroie le modèle. Les coefficients qui permettront de projeter le résultat sur les N

années à venir sont donc à présent disponibles. Ils doivent cependant être probabilisés via par la

détermination d’une probabilité de présence de l’assuré dans le portefeuille. Il s’agit de l’objet de la

troisième partie de ce mémoire.

Page 71: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 2: Modélisation de la prime commerciale

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 71

Page 72: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 72

Partie 3 : Modélisation de la probabilité de résiliation Cette partie a pour objectif de construire une probabilité de présence de l’assuré dans le

portefeuille. Sa structure est globalement similaire aux deux précédentes, une analyse descriptive de la

résiliation sera d’abord effectuée, puis un modèle de prédiction de la probabilité de résiliation d’un contrat

sera construit.

I. Intérêt et cadre de la modélisation de la probabilité de résiliation Il est rappelé que l’objectif de l’étude est de modéliser la valeur contrat.

Probabiliser le flux du contrat l’année passe donc par la détermination de la probabilité de

résiliation de chaque assuré entre l’année 0 et l’année k.

Lors de l’établissement du périmètre de l’étude, seuls les contrats à tacite reconduction ont été conservés:

ces derniers sont automatiquement renouvelés pour un an lors de leur échéance anniversaire.

L’assuré souhaitant résilier son contrat effectue cette demande via l’envoi d’un courrier de résiliation. Les

principaux motifs de résiliation de la part de l’assuré sont la vente de son véhicule, l’arrivée à échéance de

son contrat, la suspension de son permis de conduire … L’assureur peut également mettre fin au contrat de

l’assuré s’il y a défaut de paiement par exemple.

Par ailleurs, la probabilité de résiliation prédite par le modèle est la probabilité de résilier son

contrat sur une année, et non pas celle de la formule, ( ), qui correspond à la probabilité de résiliation

entre l’instant 0 et l’instant k. Ainsi, le terme ( ( )) de la formule ci-dessus peut se réécrire. En fait,

la probabilité d’ être présent dans le portefeuille à l’instant est égale au produit des probabilités d’être

présent dans le portefeuille entre l’instant et l’instant pour .

L’évaluation de la probabilité de résiliation s’effectuera par la mise en place d’une variable réponse

indicatrice « Résiliation» (R=1 ou R=0). La variable « nature de fin d’image » est extraite pour ce faire. Elle

prend les modalités suivantes :

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

Prime commerciale de l’année k

Prime pure de l’année k

Produits financiers de l’année k

Frais d’acquisition et de gestion de l’année k

Taux d’actualisation entre l’année 0 et l’année k

Taux d’inflation de l’année k

( ) Probabilité de résiliation entre l’année 0 et l’année k.

Page 73: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 73

Ainsi, s’il existe une image à la fin de laquelle le contrat a été résilié , sinon.

La base de résiliation est constituée de la manière suivante :

Numéro du contrat Données du contrat à la première image R

1 ou 0

Tableau 30 Structure des données dans la base de résiliation

Les données du contrat sont constituées des variables collectées précédemment, la résiliation étant en

partie sensible au tarif.

En notant , les différentes réalisations de la variable aléatoire sur toute la base, le taux de

résiliation peut être définit par

Nature de fin d’image

Modalités Résiliation

Suspension

Remplacement

Echéance principale

Pas d’image suivante Tableau 29 Modalités de la variable nature de fin d’image

Conducteur Géographie

Âge

Sexe du conducteur

Segment marketing (Seg_Mkt)

Ancienneté du permis (Acp)

Antécédents* Expérience (Ant_exp)

Zone

Région du portefeuille

Région du risque

Véhicule Contrat

Marque de la moto

Genre de la moto

Groupe

Classe

Ancienneté de la carte grise (Anccg)

Durée de détention du véhicule (Ddv)

Ancienneté du véhicule (Acv)

Type d’usage

Cylindrée

Formules

Fractionnement

Réseau de distribution

Ancienneté du contrat (Ancc)

Coefficient technique (CT)

Tableau 31 Support des variables explicatives pour la modélisation de la probabilité de résiliation de chaque assuré.

Page 74: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 74

Deux bases obtenues aléatoirement sont créées à partir de cette dernière : une base d’apprentissage à

partir de laquelle le modèle de résiliation sera élaboré (sur laquelle figurent 70% des contrats), et une base

de test sur laquelle ce dernier sera testé (sur laquelle figurent les 30% restants). Le périmètre de l’étude

reste inchangé.

II. Analyse descriptive pour la modélisation de la probabilité de résiliation

II.1 Analyse uni variée Comme effectué pour la prime pure ainsi que pour la prime commerciale, le but est de visualiser les

variables qui pourraient avoir un impact sur le taux de résiliation, et tenter de comprendre leur évolution

d’un groupe à l’autre. Pour l’ensemble des variables mentionnées en partie 1, le taux de résiliation de

chaque groupe est représenté sur un graphique. Certains résultats sont présentés ci-dessous.

Figure 45 Part des contrats et taux de résiliation par âge et par ancienneté de contrat

Le taux de résiliation a tendance à décroitre avec l’âge: les jeunes, plus susceptibles d’étudier les offres

concurrentes que les personnes plus âgées, auront tendance à davantage résilier leurs contrats.

Un constat similaire peut être fait vis-à-vis de l’ancienneté du contrat : le taux de résiliation décroit avec

cette dernière. Cela s’explique par l’enclenchement d’un mécanisme de fidélisation de la part de l’assuré :

plus le contrat est ancien, moindre est la propension à le résilier.

<25ans <30ans <35ans <40ans <50ans 50ans et +

Âge

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Ancienneté du contrat

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Page 75: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 75

Figure 46 Part des contrats et taux de résiliation par sexe

En revanche, le taux de résiliation semble être indépendant du fait d’être un homme ou une femme : il

est pratiquement identique pour les deux sexes.

Figure 47 Part des contrats et taux de résiliation par région du contrat (région du risque)

L’appartenance à une région semble également peu influer sur le fait de résilier (de manière générale, la

plupart des variable géographiques impactent peu le taux de résiliation).

Les résultats obtenus pour les autres variables figurent en annexe « Résultat du tri à plat pour la

probabilité de résiliation ». Le tableau ci-dessous retrace le bilan de l’analyse uni variée de la probabilité de

résiliation : il s’agit de celles dont le caractère discriminant a été jugé le plus prononcé. Les facteurs qui ne

semblaient pas avoir un impact significatif ont été barrés.

F H

Sexe

Part de contrats %

Taux de résiliation

Taux de résiliation moyen

Ancienneté du contrat

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Page 76: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 76

Tableau 32 Bilan de l’analyse uni variée pour la modélisation de la probabilité de résiliation

II.2 Corrélations entre la variable de résiliation et le support

Une matrice de corrélation entre les variables du support a été construite : vu que l’étude de la résiliation

repose sur un échantillon différent, (la base en question est une base contrats et non pas une base en

cases tarifaires), il a été nécessaire de réévaluer les corrélations entre les variables. Les mêmes résultats

que l’étude des corrélations pour la prime pure et la prime commerciale sont obtenus. La matrice de

corrélation correspondante figure en annexe 9.

Par ailleurs, le degré de liaison des variables du support avec l’acte de résiliation des assurés ( et donc avec

leur probabilité de résilier) est maintenant étudié. Les corrélations sont mesurées grâce au coefficient de

contingence sur l’échantillon des ou n est le nombre de contrats figurant dans le résultat

technique de 2011.

Variable Résiliation

Âge 11%

Durée de détention du véhicule 9%

Ancienneté du permis Segment Marketing 8%

Ancienneté du contrat Ancienneté de la carte grise 7%

Fractionnement 6%

Genre Marque Formule Classe Cylindrée 4%

Ancienneté du véhicule Coefficient technique Groupe 3%

Réseau Antécédents*Expérience Zone 2%

Région du risque Région du portefeuille Usage Sexe 1%

Tableau 33 Corrélations entre la variable R et le support

L’évaluation des corrélations ne semble pas mettre en place une visibilité sur les facteurs qui auront le plus

de lien avec l’acte de résilier. En effet, l’ensemble des corrélations varient entre 1 % et 11 %, ce qui

représente un faible niveau.

Conducteur Géographie

Sexe du conducteur

Segment marketing (Seg_Mkt)

Ancienneté du permis (Acp)

Antécédents (Ant)*Expérience (Exp)

Zone

Région du portefeuille

Région du risque

Véhicule Contrat

Marque de la moto

Genre de la moto

Groupe

Classe

Cylindrée

Ancienneté de la carte grise (Anccg)

Durée de détention du véhicule (Ddv)

Ancienneté du véhicule (Acv)

Type d’usage

Formules

Fractionnement

Réseau de distribution

Ancienneté du contrat (Ancc)

Coefficient technique (CT)

Page 77: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 77

II.3 Analyse en composantes multiples Afin de mieux visualiser les catégories de personnes qui résilient le plus ou le moins et de confronter les

résultats obtenus précédemment, une analyse en composantes multiples incluant la variable de résiliation

est effectuée. La théorie portant sur les techniques utilisées a été décrite en partie 1 / I.4 Analyse en

composantes multiples. La variable de résiliation aura le statut de variable supplémentaire dans cette

analyse, et n’influera donc pas sur la construction des axes. Les résultats suivants sont encore une fois

obtenus grâce à la procédure « Corresp » de Sas.

Figure 48 Inertie ajustée sur les 10 premiers axes

Le critère du coude consiste à retenir le nombre d’axes tel que l’apport en inertie n’augmente plus

considérablement. L’application de ce critère aboutit à la considération du premier axe, possédant près de

40% de l’inertie.

Il s’agit de se pencher à présent sur les variables ayant joué un rôle significatif dans cette analyse. Comme

pour l’ACM précédente, les modalités contribuant à chaque axe sont repérées.

Rappel : Une modalité participe à la constitution d’un axe si sa contribution à l’axe en question est

supérieure ou égale à l’inertie moyenne

, p étant le nombre total de modalités.

Figure 49 Représentation des catégories d’individus sur le premier axe.

<25ans<30ans

acp+20

acp0-4 anccg0-3anccg4-7 anccg8-10

Autres

Autres asi.

CUSQUA IM/EXO

ROA

SCO

TRA/SMO

TT

30-3134-36

37-39

<=6 j à l

m à o

p à r

NR

ddv+8

ddv0-3acv0-3 acv10-19

acv20-39

ancc 4 à 8

Ancc 9-13Plus de 1.10Annuel

Moins de 0.79

NON

OUI

-1,5 -1 -0,5 0 0,5 1 1,5 2

AXE 1

Modalités des facteurs

Resiliation

Page 78: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 78

La confrontation des résultats obtenus précédemment va s’effectuer de la manière suivante.

L’axe 1 possède comme thématique dominante l’ancienneté : une opposition temporelle (du point de vue

des contrats, des personnes ou des véhicules) peut être mise en place.

A gauche de l’axe se situent :

-Les moins de 30 ans, moins de 4 ans d’ancienneté de permis, moins de trois ans d’ancienneté de contrat,

avec des véhicules moins de trois ans d’ancienneté de la carte grise, de durée de détention et d’ancienneté

de véhicule. Leur coefficient technique est inférieur à 0,79 et sont détenteurs de motos urbaines (scooter

par exemple) ou tout terrain (groupe inférieur ou égal à 6).

Ces personnes auraient, selon les résultats obtenus, tendance à résilier (l’acte de résilier se situe du coté

gauche de l’axe). D’ailleurs, l’analyse uni variée avait montré que les catégories citées précédemment

avaient de forts taux de résiliation.

A droite de l’axe, se trouve la catégorie complémentaire de celles citées précédemment :

-Une ancienneté de contrat allant de 4 à 13 ans, plus de 20 ans d’ancienneté de permis, ayant de vieux

véhicules (plus de 20 ans d’ancienneté) et des coefficients techniques élevés.

Les coordonnées des modalités sur l’axe 1 figurent en annexe 10.

Cette analyse en composantes multiples a surtout confirmé les résultats obtenus lors de l’analyse uni variée

du taux de résiliation.

La section suivante a pour objectif de construire un modèle permettant la détermination de la probabilité

de résiliation d’un contrat.

III. Construction du modèle de résiliation

Le but de cette sélection est de voir quelles variables sont les plus significatives vis-à-vis de la probabilité de

résiliation. Comme précédemment, il s’agit de choisir un modèle de régression ainsi qu’une méthode de

sélection des variables. Les notions nécessaires à la compréhension d’un modèle linéaire avaient été

abordées en Partie 1 Modélisation de la prime pure/ II Construction du modèle de prime pure/ II.1 Choix de

l’approche et application de la théorie des modèles linéaires généralisés « Méthodologie adoptée pour la

modélisation de la prime pure ».

III.1 Théorie sur la régression choisie Rappel :

La probabilité de résiliation pour un assuré est la probabilité que la variable R vaille 1, conditionnellement

au fait que l’assuré ait les propriétés X. De manière mathématique cela se reformule de la manière

suivante :

( ) ( )

étant une indicatrice, cette variable suit une loi de Bernoulli. La probabilité de résilier n’est autre que

l’espérance de la variable aléatoire , conditionnellement au fait que l’assuré ait les propriétés X. Une

régression logistique permet d’estimer cette probabilité.

En effet : [ ] = ( )

Le modèle linéaire utilisé pour le calcul de ( ) ne peut être un modèle linéaire simple, c’est-à-

dire [ ] . peut prendre des valeurs sur tout et non exclusivement sur l’intervalle [0 ; 1],

alors que l’on cherche à estimer une probabilité.

Pour contourner cela, un modèle linéaire généralisé dont le lien est la fonction logit

( )

(et la loi une Bernoulli comme mentionné précédemment). Pour un individu de la base

ayant les propriétés X, (une ligne), on a :

Page 79: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 79

( [ ])= [ ]= ( ) ( )

, qui prend bien des valeurs

comprises entre 0 et 1.

En notant les différentes réalisations de la variable aléatoire étant le nombre de contrats

dans la base d’apprentissage, (

) le vecteur des modalités codées façon binaire de chaque

contrat de la base, (

) le vecteur des coefficients de la régression, la régression logistique est formulée

de la manière suivante :

= ( )

Ainsi, pour chaque ligne de la base une probabilité de résiliation est estimée et sera égale à la quantité

suivante

.

Dans ce cas de figure également, une sélection « forward » est réalisée : elle permet de visualiser les

variables du support qui auront le plus d’impact sur l’acte de résiliation et la probabilité de résiliation des

assurés.

III.2 Résultats de la sélection La sélection des variables a été réalisée grâce à la même macro « forward » figurant en annexe 5. Des

modifications ont été apportées de manière à ce que la procédure de sélection soit adaptée aux données

(utilisation de la procédure « Logistic » de SAS notamment).

Figure 50 Résultats de la sélection « forward » pour le modèle de résiliation

La courbe bleue représente les niveaux de l’AIC obtenus au fur et à mesure qu’une variable est ajoutée. La

courbe rouge détermine la variation relative de ces niveaux d’AIC. Les résultats incitent à retenir les cinq

premières variables dans la sélection: l’âge, la durée de détention du véhicule, l’ancienneté du contrat, la

-0,014

-0,012

-0,01

-0,008

-0,006

-0,004

-0,002

0

0,002

250000

252000

254000

256000

258000

260000

262000

AIC

Variation relative

Page 80: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 80

formule, le fractionnement, ainsi que le coefficient technique. Les variables entrant dans le modèle après le

coefficient technique n’apportent plus d’information de manière significative.

Deux « warnings » doivent être émis quant aux résultats de la sélection effectuée:

- La durée de détention est non renseignée sur le nouveau produit soit sur près d’un tiers des données.

-La durée de détention est corrélée à 75% avec l’ancienneté des contrats, ce qui risque de biaiser la

modélisation.

En raison des deux éléments cités précédemment, la modèle de résiliation comprendra donc : l’âge,

l’ancienneté du contrat, la formule, le fractionnement ainsi que le coefficient technique.

La pertinence des résultats obtenus est notable de part la nature de la thématique de ces variables. Elles

font pratiquement toutes partie de la famille de variables « contrat ». Cette fois- ci, les niveaux de

corrélations obtenus pour analyser la pertinence des résultats ne sont pas vraiment utilisables, car les

facteurs étaient très peu corrélés à la variable « résiliation ». Par ailleurs, la plupart des variables du

modèle en question avaient participé à la construction de l’axe selon lequel l’acte de résiliation avait été

représenté. A présent, le pouvoir discriminant du modèle mis en place doit être étudié.

III.3 Analyse du pouvoir discriminant

Les facteurs sélectionnés précédemment apparaissent comme étant les meilleurs. Il est tout de même

nécessaire de tester la qualité de discrimination du modèle par d’autres méthodes.

Concernant les chiffres obtenus, la probabilité de résiliation moyenne prédite pour l’ensemble des contrats

est bien égale au taux de résiliation déterminé au début de l’étude, ce qui est rassurant vis-à vis de la

vraisemblance du modèle.

L’aire sous la courbe ROC (« Receiver Operating Characteristic») est un indicateur de la qualité de la

régression logistique, et par conséquent sur la bonne estimation des probabilités de résiliation issues du

modèle. Elle se base sur la notion de sensibilité et de spécificité du modèle. Avant tout, un vocabulaire

essentiel à la compréhension de la démarche doit être définit.

Vrai positif : Prédiction d’une résiliation sachant que la personne a résilié.

Vrai négatif : Prédiction d’une non résiliation sachant que la personne n’a pas résilié.

Faux positif : Prédiction d’une résiliation sachant que la personne n’a pas résilié.

Faux négatif : Prédiction d’une non résiliation sachant que la personne a résilié.

Il est maintenant possible de définir les notions de sensibilité et spécificité

Il s’agit de la probabilité évaluée par le modèle, de résilier son contrat sachant qu’il a été résilié.

Plus est proche de 1, plus le modèle est dit sensible : il manque rarement de de prédire des résiliations.

Il s’agit de la probabilité évaluée par le modèle, de ne pas résilier son contrat sachant qu’il n’a pas été

résilié. Plus est proche de 1 et plus le modèle est dit spécifique : il manque rarement les non résiliations.

Un bon modèle maximise la sensibilité et la spécificité. Cela dit, ces deux maximisations ne peuvent se faire

de manière simultanée.

En effet, soit s la probabilité de résiliation à partir de laquelle l’individu est considéré comme étant dans le

groupe 1. Prenons des cas extrêmes :

Page 81: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 81

s=0 : « Tout le monde résilie »

,

s=1 : « Personne ne résilie »

Il n’est donc pas possible d’augmenter la sensibilité sans baisser la spécificité, et inversement.

Le graphique ci-dessous montre qu’un compromis est établit en choisissant un seuil qui égalise ces deux

dernières.

Figure 51 Egalisation de la sensibilité et spécificité du modèle

Le graphique estime le seuil de probabilités de résiliations La sensibilité et la spécificité associées

sont appelées taux de bon reclassement. Cela veut dire qu’une proportion =58% des contrats

résiliés sont prédits comme étant résiliés et des contrats non résiliés sont prédits comme non résiliés. Ce

chiffre n’est pas excellent : une attention particulière à ce taux devrait être portée s’il s’agissait de prédire

l’acte de résiliation, mais l’objectif de l’étude se limite à estimer ses probabilités.

La courbe ROC (« Receiving Characteristic Operating ») va représenter en fonction de en faisant

varier le seuil évoqué précédemment. Idéalement, il faudrait avoir le plus proche de 1 et le plus

proche de 0, ce qui dans le meilleur des cas donnerait une aire sous la courbe égale à 1.

Dans le contexte présent cette aire vaut 0,609, ce qui selon la littérature est considéré comme étant un

modèle dont le pouvoir discriminant acceptable.

0

0,2

0,4

0,6

0,8

1

1,2

0,0

6

0,1

0

0,1

1

0,1

1

0,1

2

0,1

3

0,1

3

0,1

4

0,1

4

0,1

5

0,1

5

0,1

6

0,1

6

0,1

7

0,1

7

0,1

8

0,1

8

0,1

9

0,1

9

0,2

0

0,2

1

0,2

1

0,2

2

0,2

3

0,2

4

0,2

5

0,2

6

0,2

8

Seuil s égalisant la sensibilité et la spécificité

Seuil s

Spécificité

Sensibilité

Page 82: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 82

Figure 52 Courbe Roc issue du modèle de résiliation

Dans le cadre en question, il s’agit de prédire la valeur contrat et non pas l’acte de résiliation ; le résultat

obtenu pour l’aire sous la courbe ROC est donc satisfaisant.

Le taux de paires concordantes est calculé de la manière suivante. Selon le groupe auquel l’individu

appartient (groupe 1 s’il a résilié, groupe 0 sinon), sa probabilité de résiliation est comparée à toutes celles

des individus du groupe opposé. Si la probabilité de résiliation d’un individu de groupe 1 est supérieure à

celle d’un individu du groupe 0, la paire est concordante. Sinon, elle est dite discordante.

Remarque : Par conséquent, la probabilité de ne pas résilier pour un individu du groupe 0 est supérieure à

la probabilité de ne pas résilier pour un individu du groupe 1. En notant la variable aléatoire

représentant le groupe auquel a été affecté le groupe après la régression,

( | ) ( | ) ⏟

( | ) ( | )

.

Ce taux doit être le plus proche possible de 1. Un taux de paires concordantes acceptable doit être

supérieur à 60 %, dans le contexte présent il vaut 60%.

Le de Somers est également révélateur de la qualité de la discrimination, d’une manière plus ou moins

similaire à celle du taux de paires concordantes.

.

Idéalement, il vaut 1, dans le pire des cas il vaut -1. Les résultats fournissent un égal à 0,198. Il est

conséquent plus proche de 1 que de -1.

III.4 Les rapports de chance L’avantage majeur des « odds ratio » est qu’ils permettent d’isoler l’influence d’une modalité sur la variable

réponse. Pour les définir, il est nécessaire de définir la notion d’ « odds ». L’ « odds » d’une modalité est le

rapport entre la probabilité de résiliation d’un individu qui possède la modalité en question ainsi que toutes

les autres modalités de référence, et la probabilité de non résiliation de ce même individu. Soit le

Page 83: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 83

vecteur contenant les coordonnées (binaires) d’un individu possédant la modalité d’une variable donnée

ainsi que les modalités de référence des autres variables.

(

)

Soit le coefficient associé à cette modalité.

( ) (

)

( )

Si cet « Odds » vaut , cela signifie chez les individus ayant la modalité i les chances de résilier sont plus

élevées que celles de ne pas résilier.

L’ « Odds ratio » d’une modalité est le rapport entre l’ « Odds » de la modalité d’une variable et celui

de la modalité de référence associée à cette variable.

( ) ( )

( )

Si ( ) vaut , cela signifie que les chances de résilier contre celles de ne pas le faire d’un

individu ayant la modalité i sont plus élevées que celles d’un individu de référence.

Ainsi un « Odds ratio » plus grand que 1 (respectivement plus petit que 1) manifeste un fort

(respectivement faible) comportement de résiliation au sein du groupe en question par rapport au groupe

majoritairement présent dans l’échantillon. Un « Odds ratio » égal à 1 laisse entendre que le fait de résilier

ne dépend pas de la modalité en question.

Ci-dessous figure le calcul des Odds Ratio pour les variables formule et coefficient technique.

Figure 53 Odds ratios calculés pour la variable formule, modalité de référence RC+IV+TD

Relativement aux personnes qui détiennent la formule RC+IV+TD, les chances de résilier sont égales pour

les formules RC+IV, RC+IV+DC. La valeur des « Odds ratios » correspondants est cela dit proche de 1 : cela

révèle que la probabilité de résilier son contrat est pratiquement indépendante du fait que ces formules

1,05

1,1

1,15

1,2

1,25

1,3

formule RC vs RC+IV+TD formule RC+IV vs RC+IV+TD

formule RC+IV+DC vs RC+IV+TD

Formule

Page 84: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 84

soient détenues par l’assuré. Il n’est pas possible d’en dire autant du groupe possédant la formule RC, dont

la valeur de l’ « Odds Ratio » révélatrice une tendance à résilier.

Figure 54 Odds ratios calculés pour la variable coefficient technique, modalité de référence 0,70 A 0,79

Relativement aux personnes dont le coefficient technique est plus élevé que 1,10, un coefficient technique

qui augmente fait croître la probabilité de résilier. Mis à part ceux qui ont un CT égal à 1,00, l’ensemble des

groupes sont moins susceptibles de résilier leurs contrats. Une explication potentielle du phénomène

observé au niveau du groupe « CT=1,00 » est que ce groupe, n’étant pas sous-tarifé, considèrerait que le

niveau de cotisations payé est trop élevé par rapport à sa charge de sinistres, ce qui l’inciterait à résilier

plus que les autres.

Cette technique a permis de voir quels étaient les groupes qui avaient le plus de chance de perdurer dans le

portefeuille.

III.5 Résultats obtenus sur la base de test et conclusion

La base de test correspondant aux 30% restants de l’échantillon est utilisée pour valider la modèle de

résiliation. Sur l’ensemble des graphes ci-dessous figurent, en rouge, le taux de résiliation observé au sein

de chaque catégorie

En bleu, la probabilité de résiliation moyenne prédite pour chaque catégorie. Pour un contrat donné, la

probabilité de résiliation prédite est obtenue par la formule suivante

Ou est le vecteur des coefficients qui ont été estimés précédemment, (

) le vecteur des

modalités du contrat, codées façon binaire.

0

0,2

0,4

0,6

0,8

1

1,2

1,4

ct moins de 0,69 vs 0,70 A

0,79

ct 0,80 A 0,89 vs 0,70 A 0,79

ct 0,90 A 0,94 vs 0,70 A 0,79

ct 0,95 A 0,99 vs 0,70 A 0,79

ct 1,00 vs 0,70 A 0,79

ct 1,01 A 1,05 vs 0,70 A 0,79

ct 1,06 A 1,10 vs 0,70 A 0,79

ct PLUS DE 1,10 vs 0,70 A 0,79

Coefficient technique

Page 85: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 3: Modélisation de la probabilité de résiliation

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 85

Figure 55 Taux de résiliation observés et prédits sur la base de test à par fractionnement et formule

Figure 56 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique formule

Figure 57 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique

Conclusion

Globalement, les courbes taux de résiliation observé/ taux de résiliation prédit adhèrent. Les résultats du

modèle de résiliation sont assez corrects dans la mesure ou l’objectif n’est pas de prédire un acte de

résiliation mais de calculer une probabilité de présence dans le portefeuille.

L’ensemble des paramètres du modèle est à présent disponible et permettra de déterminer une valeur

contrat. La prochaine partie du mémoire déroule une méthodologie quant au calcul de cette dernière.

Annuel Autres

Taux de résilation observé

Probabilité de résilation moyenne prédite

RC RC+IV RC+IV+DC RC+IV+TD

Taux de résilation observé

Probabilité de résilation moyenne prédite

0

0,05

0,1

0,15

0,2

0,25

0,3

<25ans <30ans <35ans <40ans <50ans 50ans et +

Taux de résilation observé

Probabilité de résilation moyenne prédite

moins de

0.69

0.70 A

0.79

0.80 A

0.89

0.90 A

0.94

0.95 A

0.99

1.00 1.01 A

1.05

1.06 A

1.10

PLUS DE

1.10

Taux de résilation observé

Probabilité de résilation moyenne prédite

Taux de résilation observé

Probabilité de résilation moyenne prédite

Page 86: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 4: Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 86

Partie 4 : Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle Cette partie dresse une méthodologie du calcul de la valeur contrat et propose des pistes d’amélioration de ce modèle. Il est rappelé que la méthode de projection des flux repose sur un vieillissement des variables temporelles :

Figure 58 Schéma d’obtention de la valeur contrat

Le tableau ci-dessus fait un récapitulatif des facteurs obtenus pour l’ensemble des modèles.

Prime pure Prime

Commerciale

Résiliation

Fréquence Coût moyen

Zone Formule Formule Age

Formule Classe Groupe Anc. COntrat

Anc. Carte grise Zone Formule

Groupe Ancienneté.

permis

Fractionnement

Anc. du permis Coefficient

technique

Coefficient technique

Tableau 34 Récapitulatif du modèle de la valeur contrat

Les variables surlignées correspondent à celles dont les modalités évoluent d’une année à l’autre, et qui

expliqueront en partie l’évolution du résultat du contrat. L’idée du fait que la probabilité de résilier à une

année fixée est égale au produit des probabilités entre cette même année et les années ultérieure est

rappelée (Partie 3, Intérêt et cadre de la modélisation de la probabilité de résiliation).

La formule exacte du calcul de la valeur contrat devient :

Page 87: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 4: Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 87

Figure 59 Formule finale de la valeur contrat

En guise de fin à ce mémoire, les limites et pistes d’amélioration qui sont proposées pour ce modèle sont

les suivantes :

Comme précisé en partie 1 dans le cadre du modèle de coût moyen, un optique intéressante serait

de modéliser la variation du coût moyen plus tôt que le coût moyen ou essayer de le modéliser par

une loi de Weibull .

∑ ⏞

( ) ⏟

( )⏞

( ( ))⏞

∑∏

( )

( ) ( ∏ (

))

(

)

(

)

(

)

(

)

Prime commerciale de l’année k

Prime pure de l’année k

Produits financiers de l’année k

Frais d’acquisition et de gestion de l’année k

Taux d’actualisation entre l’année 0 et l’année k

Taux d’inflation de l’année k

( ) Probabilité de résiliation entre l’année 0 et l’année k, de manière plus précise

( ) ∏ ( ) ∏

Page 88: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Partie 4: Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 88

Il faut traîter avec une attention particulière les populations peu exposées aux risques, autrement

dit peu nombreuses ou ayant eu peu de sinistres. En effet, des erreurs de prédiction se creusent

pour ces catégories de personnes.

Incorporer les sinistres graves dans la modélisation rendrait plus vraisemblable l’évaluation de la

valeur contrat. Par souci de temps, cela n’a pas été effectué.

Le modèle de la valeur contrat en pourrait être complexifié par la mise en place de la projection

d’une variable aléatoire dans le futur, indiquant si le contrat détient toujours un niveau de garantie

donné

Page 89: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Conclusion

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 89

Conclusion de l’étude

L’objectif de cette étude était de développer une méthodologie permettant d’évaluer la valeur contrat

Dans cette perspective, trois modèles différents ont été mis en place :

Un modèle de segmentation et prédiction de la prime pure dont les facteurs sont la zone, la

formule de souscription, le groupe, la classe du véhicule, l’ancienneté de la carte grise et

l’ancienneté du permis.

Un modèle de segmentation et prédiction de la prime commerciale dont les facteurs sont la

formule, le groupe, la zone, l’ancienneté de permis et le coefficient technique.

Un modèle d’évaluation de la probabilité de présence de l’assuré dans le portefeuille, construit à

partir de l’âge du détenteur du contrat, de sa formule de souscription, du fractionnement de ses

cotisations ainsi que de son coefficient technique.

Les différents facteurs entrant en compte dans ce modèle de valorisation sont plutôt classiques et

incorporent des variables autant liées à l’assuré lui même qu’à la politique de tarification de l’entreprise.

Une particularité de cette étude résulte du fait que la modélisation de la prime pure n’a pas été réalisée

selon une catégorie de sinistres, mais toutes garanties confondues, en intégrant la formule de souscription

comme un élément de modélisation. Les résultats montrent que cette dernière agit de façon

prépondérante dans l’établissement de la valeur contrat.

De manière générale, ces modèles mis en place s’écartent de la réalité pour des risques peu connus. Par

ailleurs, la valeur du contrat est évaluée en faisant abstraction des sinistres graves, leur intégration

consisterait probablement en une des pistes d’amélioration les plus notables. Le modèle en question

pourrait également être complexifié de part l’intégration de modèles de prédictifs pour d’autres facteurs,

ou par exemple la détention d’une formule de souscription deviendrait un évènement aléatoire à prédire

sur un horizon de temps à venir.

Un des avantages de ce mémoire est issu du fait de l’absence d’un modèle de ce type, ce qui a présenté

peu de contraintes techniques. Sous réserve de stabilité sur les années 2011, 2012 et 2013, ces modèles

seront implémentés dans un programme SAS déroulant la méthodologie de calcul de la valeur contrat

moto.

Cette étude s’inscrit dans un cadre novateur, dans la mesure où les indicateurs de rentabilité prospectifs

ne sont pas très utilisés en assurance non vie, et en particulier dans la branche automobile. Dans un

contexte où la concurrence au sein du marché de l’assurance moto devient de plus en plus importante, il

est essentiel de développer cette typologie d’outils de pilotage des portefeuilles. La valeur contrat trouve

son atout majeur dans l’évaluation de la rentabilité future des affaires nouvelles et peut, à terme, être une

alternative au S/C ou encore être intégrée comme facteur dans l’évaluation du tarif de l’assuré.

Page 90: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Bibliographie

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 90

Bibliographie

Ouvrages :

DENUIT M., CHARPENTIER A. [2004] Mathématiques de l’assurance non-vie, Tome I : Principes

fondamentaux de théorie du risque, Economica.

DENUIT M., CHARPENTIER A. [2005] Mathématiques de l’assurance non-vie, Tome II :Tarification et

Provisionnement, collection « Economie et statistiques avancées », Economica.

Cours :

CHARPENTIER A. [2010-2011] Statistiques de l’assurance, Université de Rennes 1 et Université de

Montréal.

MONBET V. [2011] Analyse de données, Université de Rennes 1.

JACQUES J. Modélisation statistique, Poly Tech Lille.

SURU A. [2013-2014] Principes de base de l’assurance dommage, Université Paris Dauphine.

Mémoires :

DA SILVA L. [2013] Refonte de la structure tarifaire de la garantie assistance en assurance automobile.

Mémoire de fin d’études, Axa France.

PASQUINELLI S. [2014] Prédiction de l’acte de résiliation, Mémoire de fin d’études, Axa France.

VANNEAUX JC. [2009] Modélisation de la valeur contrat pour le pilotage du portefeuille automobile

particulier. Mémoire IA, Axa France.

Sites internet et références :

http://www.ffsa.fr/sites/jcms/p1_1264960/fr/lassurance-des-deux-roues-a-moteur-en-2012?cc=fn_7355

site consulté le 29 septembre 2014

https://www.club14.com/association/presentation/partenariat-club-14-axa.html (produit moto d’AXA

France Club 14, Dates clé de l’entreprise), site consulté le 2 octobre 2014

http://support.sas.com/documentation/, (utilisation des procédures su le logiciel SAS) site consulté sur une

base hebdomadaire

http://www.institutdesactuaires.com/

Page 91: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Table des illustrations

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 91

Table des illustrations

Figures

Figure 1 Structure du parc deux roues à fin 2013. Source : FFSA ................................................................... 16

Figure 2 Schéma d’obtention de la valeur contrat .......................................................................................... 18

Figure 3 Structure de la base de données ....................................................................................................... 20

Figure 4 Création des images d’un contrat ..................................................................................................... 21

Figure 5 Exposition et prime pure par âge ...................................................................................................... 27

Figure 6 Exposition et prime pure par âge ...................................................................................................... 28

Figure 7 Exposition et prime pure par zone, (HG : Hors graves, YG : Y compris graves) ................................. 28

Figure 8 Exposition et prime pure par groupe (HG : Hors graves, YG : Y compris graves) .............................. 28

Figure 9 Un exemple de case tarifaire ............................................................................................................. 30

Figure 10 Hiérarchisation des niveaux de corrélation ..................................................................................... 30

Figure 11 Inertie ajustée sur les 10 premiers axes .......................................................................................... 34

Figure 12 Représentation des groupes d’individus sur les deux premiers axes ............................................. 35

Figure 13 Représentation des groupes d’individus sur le troisième axe ........................................................ 36

Figure 14 Résultats des tests d’adéquations des données en brut (rouge)pour la loi binomiale négative

(bleu) et la loi de poisson(vert) ....................................................................................................................... 37

Figure 15 Résultats des tests d’adéquations du coût moyen brut aux lois Gamma (vert) Log normale (rouge)

et Weibull (bleu) .............................................................................................................................................. 38

Figure 16 Résultats de la sélection « forward »pour le modèle de fréquence ............................................... 42

Figure 17 Résultats de la sélection « forward »pour le modèle de coût moyen............................................. 43

Figure 18 Résidus bruts du modèle de fréquence : à gauche, valeur obtenues par années police, à droite,

leurs distributions ............................................................................................................................................ 47

Figure 19 Test QQ plot sur l’échantillon des résidus centrés réduits .............................................................. 48

Figure 20 Boîte à moustache représentant ENS en fonction du nombre de sinistres par individu ................ 49

Figure 21 Distribution des résidus bruts et statistiques obtenues pour les résidus bruts sur la base de test 50

Figure 22 Boîte à moustache des ENS en fonction du nombre de sinistres par individu, et statistiques

obtenues .......................................................................................................................................................... 50

Figure 23Résultats des tests de rapport de vraisemblance par modalité du modèle de coût moyen ........... 52

Figure 24 Résidus bruts du modèle de coût moyen à gauche, et distribution des résidus relatifs à droite ... 52

Figure 25 Statistiques obtenues sur l’échantillon des résidus bruts et des résidus bruts relatifs .................. 53

Figure 26 Résultat du QQ plot sur l’échantillon de résidus bruts ................................................................... 53

Figure 27 Résidus bruts relatifs du modèle de coût moyen représentés en fonction du nombre de sinistres

par cases tarifaires. .......................................................................................................................................... 54

Figure 28 Résidus relatifs du modèle de coût moyeneprésentés en fonction du nombre de sinistres par

cases tarifaires sur la base de test ................................................................................................................... 55

Figure 29 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition

par cases tarifaires (à droite) sur la base d’apprentissage .............................................................................. 56

Figure 30 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition

par cases tarifaires (à droite) sur la base de test ............................................................................................ 56

Figure 31 Part des images et niveaux de prime commerciale par coefficient technique ............................... 60

Figure 32 Part des images et niveaux de prime commerciale par ancienneté de permis ............................. 60

Figure 33 Part des images et niveaux de prime commerciale par formule .................................................... 60

Page 92: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Table des illustrations

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 92

Figure 34 Tests d’adéquation de la prime commerciale aux lois de Weibull, Gamma, Lognormale et

Exponentielle sur l’échantillon segmenté par l’ensemble des variables ................ 63

Figure 35 Figure 28 : Tests d’adéquation de la prime commerciale à la loi Gamma sur l’échantillon

sur une segmentation plus fine que la figure 27 ..................................................... 63

Figure 36 Résultats de la sélection « forward » sur l’échantillon .......................... 64

Figure 37 Prime commerciale moyenne en fonction du groupe ..................................................................... 65

Figure 38 Prime commerciale moyenne en fonction de la zone ..................................................................... 65

Figure 39 Résidus bruts centré réduits du modèle de prime commerciale et test du QQ plot sur ces derniers

......................................................................................................................................................................... 67

Figure 40 des résidus bruts centrés réduits sur trois intervalles ]-∞,-2,5[; [-2,5,2,5] ;]2,5 ,+∞[ . ................. 68

Figure 41 Boite à moustaches représentant le nombre d’individus pas case en fonction des trois catégories

de résidus centrés réduits définies précédemment ........................................................................................ 68

Figure 42 Distribution des ( ) ........................................................................................................... 69

Figure 43 Les mêmes phénomènes sont constatés sur l’échantillon de test .................................................. 70

Figure 44 Distribution des ( )sur l’échantillon de test .................................................................... 70

Figure 45 Part des contrats et taux de résiliation par âge et par ancienneté de contrat ............................... 74

Figure 46 Part des contrats et taux de résiliation par sexe ............................................................................. 75

Figure 47 Part des contrats et taux de résiliation par région du contrat (région du risque) .......................... 75

Figure 48 Inertie ajustée sur les 10 premiers axes .......................................................................................... 77

Figure 49 Représentation des catégories d’individus sur le premier axe. ...................................................... 77

Figure 50 Résultats de la sélection « forward » pour le modèle de résiliation ............................................... 79

Figure 51 Egalisation de la sensibilité et spécificité du modèle ...................................................................... 81

Figure 52 Courbe Roc issue du modèle de résiliation ..................................................................................... 82

Figure 53 Odds ratios calculés pour la variable formule, modalité de référence RC+IV+TD .......................... 83

Figure 54 Odds ratios calculés pour la variable formule, modalité de référence 0,70 A 0,79 ........................ 84

Figure 55 Taux de résiliation observés et prédits sur la base de test à par fractionnement et formule ........ 85

Figure 56 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique

formule ............................................................................................................................................................ 85

Figure 57 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique ...... 85

Figure 58 Schéma d’obtention de la valeur contrat ........................................................................................ 86

Figure 59 Formule finale de la valeur contrat ................................................................................................. 87

Figure 60 Exposition et prime pure par sexe ................................................................................................... 95

Figure 61 Exposition et prime pure par segment marketing........................................................................... 95

Figure 62 Exposition et prime pure par ancienneté de permis ....................................................................... 96

Figure 63 Exposition et prime pure par antécédents (à gauche) et par expérience (à droite) ....................... 96

Figure 64 Exposition et prime pure par département du portefeuille (à gauche) et du risque (à droite) ...... 97

Figure 65 Exposition et prime pure par région du portefeuille (en haut) et du risque (en bas) .................... 97

Figure 66 Exposition et prime pure par genre de la moto ............................................................................. 98

Figure 67 Exposition et prime pure par cylindrée ........................................................................................... 98

Figure 68 Exposition et prime pure par ancienneté de la carte grise ............................................................. 98

Figure 69 Exposition et prime pure par ancienneté du véhicule .................................................................... 99

Figure 70 Exposition et prime pure par marque ............................................................................................. 99

Figure 71 Exposition et prime pure par contrôle technique et véhicule tout terrain ................................... 100

Figure 72 Exposition et prime pure par durée de détention du véhicule ..................................................... 100

Figure 73 Exposition et prime pure par type de roues .................................................................................. 101

Figure 74 Exposition et prime pure par type d’usage ................................................................................... 101

Page 93: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Table des illustrations

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 93

Figure 75 Exposition et prime pure par formule de souscription ................................................................. 101

Figure 76 Exposition et prime pure par type de fractionnement.................................................................. 102

Figure 77 Exposition et prime pure par ancienneté du contrat .................................................................... 102

Figure 78 Exposition et prime pure par coefficient technique ...................................................................... 103

Figure 79 Exposition et prime pure par réseau ............................................................................................. 103

Figure 80 Matrice des corrélations entre la prime pure et la variable du support ....................................... 104

Figure 81 Hiérarchisation des niveaux de corrélations ................................................................................. 104

Figure 82: Part des images et niveaux de prime commerciale par âge et par sexe ..................................... 112

Figure 83 Part des images et niveaux de prime commerciale par segment marketing et par

antécédents/expérience ................................................................................................................................ 112

Figure 84 Figure : Part des images et niveaux de prime commerciale par région du portefeuille et du risque

....................................................................................................................................................................... 112

Figure 85Part des images et niveaux de prime commerciale par zone et par marque ................................ 112

Figure 86 Part des images et niveaux de prime commerciale par genre et par groupe .............................. 113

Figure 87 Part des images et niveaux de prime commerciale par classe et par durée de détention .......... 113

Figure 88 Part des images et niveaux de prime commerciale par ancienneté du véhicule et de carte grise 113

Figure 89 Part des images et niveaux de prime commerciale par type d’usage et par type de fractionnement

....................................................................................................................................................................... 113

Figure 90: Part des images et niveaux de prime commerciale par réseau de distribution et par ancienneté

de contrat ...................................................................................................................................................... 114

Figure 91 Part des images et taux de résiliation par segment marketing et ancienneté de permis ............. 114

Figure 92 Part des images et taux de résiliation par antécédents/ expérience et région du portefeuille ... 114

Figure 93 Part des images et taux de résiliation zone et ancienneté de la carte grise ................................. 114

Figure 94 Part des images et taux de résiliation par marque et par classe du véhicule ............................... 115

Figure 95Part des images et taux de résiliation par genre et groupe du véhicule ........................................ 115

Figure 96 Part des images et taux de résiliation en fonction de la durée de détention du véhicule et de

l’ancienneté du véhicule ................................................................................................................................ 115

Figure 97Part des images et taux de résiliation en fonction de la cylindrée et l’usage du véhicule............. 115

Figure 98 Part des images et taux de résiliation en fonction du réseau de distribution et de la formule de

souscription ................................................................................................................................................... 116

Figure 99 Part des images et taux de résiliation en fonction du coefficient technique et du fractionnement

de la prime commerciale ............................................................................................................................... 116

Figure 100 Hiérarchisation des corrélations .................................................................................................. 117

Figure 101 Matrice de corrélations entre les facteurs pour la modélisation de la probabilité de résiliation117

Tableaux

Tableau 1: Récapitulatif des garanties proposées dans le produit moto. Source : www.club14.com............ 16

Tableau 2 Informations sur le risque ............................................................................................................... 23

Tableau 3 Pertes d’expositions lors d’une suppression des données non renseignées ................................. 24

Tableau 4 Support des variables après fiabilisation des données ................................................................... 24

Tableau 5 Support des variables après analyse uni variée de la prime pure .................................................. 29

Tableau 6 Bilan de l’étude des corrélations inter variables ............................................................................ 31

Tableau 7 Corrélations entre la prime pure et les variables du support ......................................................... 31

Tableau 8 Résultats des tests de significativité par analyse de la variance .................................................... 32

Page 94: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Table des illustrations

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 94

Tableau 9 Significativité de la variable « genre » sur les trois premiers axes ................................................. 34

Tableau 10 Bilan des variables significatives et thématiques des axes .......................................................... 36

Tableau 11 Résultats des tests de rapport de vraisemblance par variable du modèle de fréquence ............ 45

Tableau 12 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence .......... 45

Tableau 13 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence .......... 46

Tableau 14 Erreur brute totale pour le modèle de fréquence ........................................................................ 46

Tableau 15 Valeurs de la moyenne, écart type, Skewness et Kurtosis obtenus sur l’échantillon des résidus

centré réduits .................................................................................................................................................. 47

Tableau 16 Moyenne, variance et écart type sur l’échantillon des ENS ......................................................... 49

Tableau 17 Variables retenues pour segmenter et expliquer le coût moyen ................................................. 51

Tableau 18 Résultats des tests de rapport de vraisemblance par variable du modèle de coût moyen ......... 51

Tableau 19 Moyenne, variance et écart type sur l’échantillon des EC ........................................................... 54

Tableau 20 Support des variables candidates à la modélisation de la prime commerciale ........................... 59

Tableau 21 Corrélations entre la prime commerciale et les variables du support ......................................... 61

Tableau 22 Corrélations entre la prime pure et les variables du support....................................................... 61

Tableau 23 Mise en parallèle des résultats obtenus pour la sélection de facteurs pour la modélisation de la

prime pure et celle de la prime commerciale ................................................................................................ 64

Tableau 24 Variables retenues pour segmenter et expliquer la prime commerciale ..................................... 66

Tableau 25 Résultats des tests de rapport de vraisemblance par variable du modèle de prime commerciale

......................................................................................................................................................................... 66

Tableau 26 Résultats des tests de rapport de vraisemblance par modalité du modèle de prime commerciale

......................................................................................................................................................................... 66

Tableau 27 Erreur brute totale pour le modèle de prime commerciale ......................................................... 67

Tableau 28 Moyenne, écart type sur l’échantillon des ( ) ............................................................... 68

Tableau 29 Modalités de la variable nature de fin d’image ............................................................................ 73

Tableau 30 Structure des données dans la base de résiliation ....................................................................... 73

Tableau 31 Support des variables explicatives pour la modélisation de la probabilité de résiliation de chaque

assuré. ............................................................................................................................................................. 73

Tableau 32 Bilan de l’analyse uni variée pour la modélisation de la probabilité de résiliation ...................... 76

Tableau 33 Corrélations entre la variable R et le support ............................................................................... 76

Tableau 34 Récapitulatif du modèle de la valeur contrat ............................................................................... 86

Tableau 35 Coordonnées et contribution des modalités de l’analyse en composantes multiples ............... 107

Tableau 36 Coordonnées et contribution des modalités de l'ACM sur la résiliation .................................... 118

Page 95: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 95

Annexes :

Annexe 1 : Résultats et interprétations du tri à plat pour la prime pure

Partie I, Paragraphe I.1

Les significations de chaque variable ont été décrites en partie 0 dans le paragraphe « Structure des

données ». Pour des raisons de confidentialités, les chiffres ne figurent pas sur les graphiques suivants.

Abréviations :

YG : Y compris graves / HG : Hors graves

Sexe :

Figure 60 Exposition et prime pure par sexe

Le sexe semble avoir une influence sur la prime pure.

Segment marketing :

Figure 61 Exposition et prime pure par segment marketing

Cette variable n’est pas renseignée pour l’intégralité de la base. Près de la moitié de l’exposition est

constituée de familles. Des niveaux de prime pure globalement différents sont obtenus d’un segment à

F H

Exposition et Prime pure par Sexe

Exposition

Prime Pure HG

Prime Pure YG

étu

dia

nts

jeu

ne

s C

SP-

jeu

ne

s C

SP+

b c

arri

ère

(CSP

+)

age

mu

r (C

SP+

)

célib

atai

res

CSP

-

fam

ille

s C

SP-

agri

cult

eu

rs

arti

san

s/co

mm

erç

ants

pro

fess

ion

s lib

chô

me

urs

ren

tie

rs

sen

iors

re

trai

tés

sen

iors

me

age NR

Exposition et Prime pure par Segment Marketing

Exposition

Prime pure HG

Prime Pure YG

Exposition et Prime pure par Segment Marketing: regroupé

Exposition

Prime Pure HG

Prime Pure YG

Page 96: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 96

l’autre, ce dernier semble donc avoir une influence sur la prime pure. Les regroupements suivants ont été

effectués.

Jeunes (CSP- et +) : Etudiants, jeunes CSP+, jeunes CSP-

Début de carrière et âge mur

Célibataires et familles : Célibataires (CSP-), familles (CSP-)

Artisans, commerçants, Professions libérales, Agriculteurs

Inactifs : Chômeurs, Rentiers, Seniors (retraités, quatrième âge).

Ancienneté du permis :

Figure 62 Exposition et prime pure par ancienneté de permis

L’exposition augmente avec l’ancienneté du permis. La prime pure diminue avec cette dernière. Cela

s’explique par le fait que l’ancienneté du permis est aussi liée à l’âge du conducteur, par conséquent des

comportements similaires de la prime pure sont observés. Les trois premières tranches d’ancienneté sont

regroupées en une seule tranche : 0-3ans. L’ancienneté du permis parait discriminante.

Antécédents et expérience :

Figure 63 Exposition et prime pure par antécédents (à gauche) et par expérience (à droite)

La majorité des contrats possède de l’expérience et des antécédents. Il est logique que la prime pure soit

plus élevée pour les personnes sans expérience de conduite. Il en est de même pour les sans antécédents

qui de manière générale sont des populations jeunes. A vue d’œil, la prime pure semble varier de manière

significative d’un groupe à l’autre, ces deux variables seront donc retenues.

Départements du risque et du portefeuille :

Page 97: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 97

Figure 64 Exposition et prime pure par département du portefeuille (à gauche) et du risque (à droite)

Ces deux variables ne seront pas retenues : elles ne peuvent pas être exploitées car vu le nombre élevé de

modalités, l’ensemble des modalités présentent trop peu d’exposition au risque.

Région du portefeuille et région du risque :

Figure 65 Exposition et prime pure par région du portefeuille (en haut) et du risque (en bas)

Les régions du portefeuille Natio et MSC sont regroupées avec AXA Part. Un pic de prime pure est observé

pour ces régions. Il est proche du niveau de prime pure en Ile de France. Concernant la région du risque,

un pic de prime pure est observé en Ile de France. Des niveaux de primes pure assez différents en fonction

des groupes sont obtenus pour les deux variables de régions.

Genre :

Page 98: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 98

Figure 66 Exposition et prime pure par genre de la moto

Les regroupements suivants son fait en terme de proximité de prime pure et de genre.

les motos tout terrain (trial, cross, enduros, quads non immatriculés)

les quads immatriculés et les exotiques

les motos sportives, hyper sportives

les scooters et les scooters à 3 roues

les super motards et les trails.

Le genre apparait comme étant une variable discriminante.

Figure 67 Exposition et prime pure par cylindrée

La cylindrée témoignant de la puissance de la moto, il est cohérent d’avoir une prime pure croissante en

fonction de cette ci : la charge d’un sinistre s’accroit lorsque la cylindrée est grande. Cette variable apparait

comme étant discriminante.

Ancienneté de la carte grise :

Figure 68 Exposition et prime pure par ancienneté de la carte grise

Page 99: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 99

La prime pure décroit avec l’ancienneté de la carte grise. Elle révèle un comportement de plus en plus

prudent du conducteur avec un véhicule dont la carte grise est de plus en plus ancienne.

Ancienneté du véhicule :

Figure 69 Exposition et prime pure par ancienneté du véhicule

La décroissance de la prime pure s’explique par le fait que la charge du sinistre est moins élevée sur les

vieilles motos. Un autre axe d’interprétation serait celui de la fréquence des sinistres : une personne qui

détient un vieux véhicule a moins de chances de s’en servir.

Marque du véhicule:

Figure 70 Exposition et prime pure par marque

Page 100: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 100

De nombreuses modalités sont sous représentées. Des regroupements sont effectués en conciliant l’origine

de la marque ainsi que le niveau de prime pure engendré par celle-ci.

Kymko, Daelim et MBK : « autres asiatiques »

Peugeot, Triumph et KTM : regroupées avec « autres »

Aprilia, Piaggio et Ducati : « italiennes ».

La marque apparait comme étant discriminante.

Contrôle technique et véhicules tout terrain:

Figure 71 Exposition et prime pure par contrôle technique et véhicule tout terrain

La modalité « Oui » de ces deux variables n’est pas suffisamment représentée, aucun regroupement ne

peut être réalisé. Ces variables ne seront pas prises en compte dans la suite.

Durée de détention du véhicule :

Figure 72 Exposition et prime pure par durée de détention du véhicule

Rappel : Près d’un tiers de l’exposition possède une durée de détention de véhicule non renseignée. Ce

graphe est interprété sans prendre en compte les contrats ou la durée de détention concerne l’ancien

produit. La prime pure décroit avec la durée de détention vu que plus celle-ci augmente, plus le conducteur

est habitué à conduire son véhicule, ce qui limiterait sa probabilité d’avoir un sinistre.

Cette variable semble être discriminante. Cela dit, un warning doit être fait sur le fait que la durée de

détention n’est pas renseignée sur 28% de l’exposition, tous les résultats relatifs à cette variable obtenus

par la suite doivent être traités avec précaution.

Type de roues si le véhicule est un scooter :

Page 101: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 101

Figure 73 Exposition et prime pure par type de roues

Parmi les scooters, le type de roue n’est renseigné que s’il s’agit d’un scooter ancien produit. Une trop

faible exposition des grandes roues peut être constatée, pour lesquelles aucun regroupement ne peut être

proposé, la variable ne sera pas prise en compte.

Usage :

Entre un usage privé et un usage pour le trajet du travail, la prime pure est plus élevée pour le trajet du

travail. (Comme le trajet du travail est quotidien, la fréquence des sinistres y est de manière générale plus

élevée). Les usages privés/professionnels et tournées sont regroupés dans la modalité « autres ».

Trois groupes distincts sont obtenus. L’usage apparait comme étant discriminant.

Figure 74 Exposition et prime pure par type d’usage

Formule :

Figure 75 Exposition et prime pure par formule de souscription

Page 102: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 102

Plus le nombre de garanties souscrites augmente, plus la fréquence des sinistres par garantie est élevée, ce

qui explique la croissance des deux courbes. La formule apparait comme étant discriminante.

Rappel : Non prise en compte des formules RC+TD, RC+DC dans le périmètre.

Fractionnement :

Figure 76 Exposition et prime pure par type de fractionnement

Le fractionnement des cotisations pourrait témoigner d’un manque d’entretien du véhicule, ce qui

expliquerait que la prime pure pour le fractionnement annuel soit plus basse que pour les autres

fractionnements. Les fractionnements sont regroupés en deux catégories, annuel et autres.

Deux groupes paraissant distincts sont obtenus, le fractionnement est retenu.

Ancienneté du contrat :

Figure 77 Exposition et prime pure par ancienneté du contrat

La décroissance de cette courbe peut s’expliquer par le fait que l’ancienneté du contrat est liée à l’âge de

l’assuré. L’ancienneté moyenne des contrats de la population est de 4,5 ans. La variable semble

discriminante et sera retenue.

Coefficient technique :

Le Coefficient Technique reflète une sur ou sous tarification dans la mesure où il se définit comme le

rapport entre la prime commerciale payée par l’assuré et la prime issue de la tarification.

Ainsi, il y a sous tarification si CT<1, sur-tarification si CT>1.

Page 103: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 103

Figure 78 Exposition et prime pure par coefficient technique

Un pic de prime pure est observé pour la classe ou l’on n’est ni sur tarifé ni sous tarifé (CT=1). Les tranches

qui ont un CT strictement inférieur à 0.50 et un CT compris entre 0,50 et 0,69 sont regroupées. Le CT

semble être discriminant.

Réseau :

Run Service et Direct Assurance étant des courtiers, ils sont regroupés avec les courtiers. Les réseaux

salariés, Michelin et Natio sont regroupés en une seule modalité. Les groupes obtenus se distinguent peu

par leur niveau de prime pure. La variable réseau n’apparait pas comme étant discriminante.

Figure 79 Exposition et prime pure par réseau

Page 104: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 104

Annexe 2 : Matrice des corrélations entre les variables du support et la prime pure

.

Partie 1, Paragraphe I.2

Figure 80 Matrice des corrélations entre la prime pure et la variable du support

Figure 81 Hiérarchisation des niveaux de corrélations

i age sexe seg_mkt acp anccg ant exp region regionrisquezone marque genre groupe classe cylindree ddv acv usage formule fractionnementancc ct

age 100%

sexe 10% 100%

seg_mkt 65% 5% 100%

acp 75% 9% 48% 100%

anccg 25% 3% 18% 31% 100%

ant 27% 2% 15% 29% 37% 100%

exp 24% 0% 14% 31% 44% 62% 100%

region 10% 1% 18% 11% 5% 3% 3% 100%

regionrisque 10% 1% 23% 10% 7% 4% 3% 85% 100%

zone 9% 2% 21% 7% 9% 4% 4% 51% 61% 100%

marque 24% 8% 21% 26% 17% 9% 8% 15% 19% 23% 100%

genre 34% 15% 29% 38% 26% 17% 16% 26% 32% 42% 73% 100%

groupe 21% 15% 18% 36% 22% 21% 20% 22% 27% 38% 68% 86% 100%

classe 24% 16% 17% 25% 15% 14% 16% 15% 18% 27% 61% 80% 83% 100%

cylindree 24% 14% 22% 36% 12% 20% 21% 14% 16% 23% 56% 71% 78% 72% 100%

ddv 31% 4% 22% 35% 83% 53% 49% 5% 6% 9% 17% 27% 26% 21% 18% 100%

acv 10% 5% 14% 14% 72% 11% 17% 11% 15% 17% 35% 50% 42% 36% 24% 54% 100%

usage 15% 4% 29% 14% 4% 5% 3% 16% 19% 21% 21% 34% 31% 18% 19% 5% 12% 100%

formule 17% 5% 12% 9% 18% 11% 7% 9% 10% 8% 27% 40% 37% 29% 27% 15% 43% 15% 100%

fractionnement 25% 3% 22% 24% 14% 7% 8% 7% 4% 5% 12% 19% 15% 11% 11% 16% 5% 14% 11% 100%

ancc 30% 5% 23% 32% 79% 45% 42% 4% 4% 6% 15% 22% 18% 14% 16% 75% 46% 8% 9% 13% 100%

ct 13% 4% 11% 15% 36% 21% 22% 10% 9% 9% 9% 19% 19% 17% 14% 40% 16% 6% 9% 6% 47% 100%

Légende

0% 25% 50% 70% 1

indépendant peu corrélé corrélé dépendant

Page 105: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 105

Annexe 3 : Coordonnées et contribution des modalités de l’ACM sur la sinistralité

Partie 1, paragraphe I.4.

En rose : modalités significatives sur l’axe 1

En violet : modalités significatives sur l’axe 2

En jaune: modalités significatives sur l’axe 3

Inertie moyenne 0,01149 Coordonnées sur les axes Contributions aux axes

Variable Modalité Dim1 Dim2 Dim3 Contr1 Contr2 Contr3

Sexe F 1% -0,132 -0,109 -0,088 0,000 0,000 0,000

H 0% 0,014 0,012 0,009 0,000 0,000 0,000

Segment marketing Dcarr+Agemur 1% -0,109 -0,582 0,058 0,000 0,010 0,000

NR 1% -0,665 -0,626 0,237 0,005 0,005 0,001

agr+art+com+plib 1% 0,066 -0,018 0,328 0,000 0,000 0,006

cel+fam 1% 0,181 0,027 -0,074 0,005 0,000 0,001

inactif 1% 0,072 -0,299 0,557 0,000 0,002 0,008

jeunes 1% -0,705 0,851 -0,619 0,014 0,025 0,014

Anc. permis acp0-4 1% -0,804 0,697 -0,834 0,021 0,019 0,030

acp+20 1% 0,197 -0,213 0,401 0,005 0,006 0,025

acp10-19 1% 0,090 -0,100 -0,063 0,001 0,001 0,000

acp5-9 1% -0,115 0,289 -0,425 0,000 0,004 0,008

Anc. carte grise anccg+8 1% 1,291 -0,250 0,029 0,055 0,003 0,000

anccg1-3 1% -0,295 -0,040 -0,037 0,009 0,000 0,000

anccg4-7 1% 0,700 -0,287 0,344 0,029 0,006 0,009

anccg<1 1% -0,801 0,439 -0,261 0,043 0,016 0,006

Ant/Exp Avec-avec 0% 0,112 -0,111 0,059 0,003 0,004 0,001

Avec-sans 1% -0,741 0,524 -1,239 0,005 0,003 0,018

Sans-sans 1% -1,231 1,318 -0,200 0,025 0,035 0,001

Région Portefeuille Autres RP 1% -0,397 -0,814 -0,058 0,000 0,003 0,000

IDF RP 1% -0,476 -1,068 -0,061 0,006 0,038 0,000

NordEst RP 1% 0,266 0,490 -0,140 0,004 0,016 0,001

Ouest RP 1% 0,138 0,360 -0,379 0,001 0,011 0,013

SudEst RP 1% -0,240 -0,465 0,344 0,004 0,019 0,011

SudOuest RP 1% 0,175 0,318 0,288 0,001 0,005 0,004

Région Risque IdF RR 1% -0,535 -1,090 -0,130 0,011 0,055 0,001

NordEst RR 1% 0,308 0,582 -0,139 0,005 0,021 0,001

Ouest RR 1% 0,267 0,551 -0,418 0,004 0,021 0,013

SO/EOM RR 1% 0,164 0,279 0,285 0,001 0,004 0,005

SudEst RR 1% -0,239 -0,430 0,321 0,004 0,017 0,010

Zone z1-3 1% 0,294 0,636 -0,039 0,006 0,034 0,000

z10-13 1% -0,662 -1,172 0,143 0,017 0,067 0,001

z4-6 1% 0,188 0,305 -0,018 0,003 0,011 0,000

z7-9 1% -0,197 -0,434 -0,022 0,002 0,014 0,000

Page 106: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 106

Marque Autres 1% -0,549 0,582 1,127 0,013 0,018 0,073

Autres asiat 1% -0,390 -0,136 1,034 0,002 0,000 0,018

BMW 1% 0,402 -0,203 -0,678 0,002 0,001 0,008

HarleyDavidson 1% 0,225 -0,495 -0,385 0,001 0,004 0,003

italiennes 1% -0,841 -1,221 0,033 0,015 0,040 0,000

japonaises 1% 0,247 0,079 -0,310 0,010 0,001 0,020

Groupe 30/31 1% 0,925 0,050 0,312 0,037 0,000 0,006

32/34 1% -0,549 -0,660 -0,040 0,028 0,050 0,000

356 1% 0,379 0,061 -0,487 0,009 0,000 0,020

37-39 1% 0,118 0,463 -1,010 0,001 0,009 0,049

<=6 1% -0,604 1,409 2,034 0,010 0,068 0,153

Genre BAS 1% 0,340 0,199 -0,155 0,002 0,001 0,001

CUS 1% 0,583 -0,228 -0,120 0,012 0,002 0,001

GTO 1% 0,452 -0,072 -0,811 0,002 0,000 0,010

QUA IM/EXO 1% -0,661 1,426 2,017 0,008 0,046 0,101

ROA 1% -0,301 0,352 -0,911 0,004 0,007 0,050

ROU 1% 0,751 0,027 -0,366 0,006 0,000 0,002

SCO 1% -0,969 -1,190 0,301 0,049 0,090 0,006

SPO/SMO/HY 1% 0,370 0,574 -0,985 0,002 0,007 0,022

TRA/SMO 1% 0,789 0,020 0,124 0,026 0,000 0,001

TT 1% -0,423 1,295 2,006 0,002 0,020 0,053

Classe J 1% 0,904 0,091 0,232 0,045 0,001 0,004

M 1% -0,426 -0,114 0,128 0,027 0,002 0,003

P 1% 0,229 0,199 -0,527 0,003 0,003 0,022

Durée de détention NR 1% 0,943 -0,295 0,405 0,059 0,007 0,014

ddv0-3 1% -0,613 0,226 -0,148 0,053 0,009 0,004

ddv10+ 1% 0,977 -0,167 -0,161 0,010 0,000 0,000

ddv4-5 1% 0,138 -0,248 -0,045 0,000 0,002 0,000

ddv6-9 1% 0,514 -0,243 -0,152 0,005 0,001 0,001

Anc. véhicule acv+20 1% 0,969 0,098 0,143 0,022 0,000 0,001

acv1-3 1% -0,759 -0,104 0,082 0,033 0,001 0,001

acv10-19 1% 0,622 0,083 -0,245 0,028 0,001 0,006

acv4-9 1% -0,062 -0,054 0,123 0,000 0,000 0,002

acv<1 1% -1,157 0,150 -0,076 0,022 0,000 0,000

Usage autres:Pri-Pro/tour 1% -0,749 -1,489 0,118 0,005 0,026 0,000

prive 1% 0,012 0,306 0,368 0,000 0,014 0,022

trajet-travail 1% 0,042 -0,171 -0,340 0,000 0,005 0,020

Formule RC 1% 0,224 0,176 0,444 0,005 0,004 0,024

RC+IV 1% 0,214 0,237 -0,283 0,001 0,002 0,003

RC+IV+DC 1% -0,421 0,309 0,479 0,005 0,003 0,008

RC+IV+TD 1% -0,141 -0,280 -0,400 0,002 0,011 0,024

Fractionnement Annuel 1% 0,130 -0,074 0,267 0,003 0,001 0,015

Autres 1% -0,201 0,115 -0,412 0,004 0,002 0,023

Anc. du contrat ancc1-3 1% -0,305 0,034 -0,083 0,010 0,000 0,001

Page 107: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 107

ancc14+ 1% 1,025 -0,455 0,011 0,009 0,002 0,000

ancc4-8 1% 0,623 -0,273 0,291 0,028 0,007 0,008

ancc9-13 1% 0,978 -0,362 -0,059 0,022 0,004 0,000

ancc<1 1% -0,864 0,556 -0,219 0,038 0,020 0,003

Coefficient technique +1.10 1% 0,399 -0,538 0,011 0,008 0,019 0,000

0.90-0.99 1% 0,175 -0,121 0,044 0,001 0,001 0,000

1.00 1% -0,550 0,295 0,055 0,005 0,002 0,000

1.01-1.10 1% 0,413 -0,258 0,231 0,005 0,002 0,002

<=0.89 1% -0,217 0,258 -0,068 0,006 0,011 0,001

Sinistré 0 0,011 0,008 0,006

1 -0,626 -0,448 -0,328

Tableau 35 Coordonnées et contribution des modalités de l’analyse en composantes multiples

Annexe 4 : Procédure itérative de Newton Raphson

Partie 1, II.1 Choix de l’approche et application de la théorie des modèles linéaires généralisés

Rappel : β=(

) est solution des équations de vraisemblance si et seulement si

( ( ) )

( )

( )

Ces équations ne sont pas linéaires en et sont résolues par procédure itérative de Newton-Raphson dont

l’algorithme est le suivant.

Initialisation : =

Faire tant que ‖ ‖

Calcul du gradient de la log-vraisemblance ( ( ) )

Calcul de la Hessienne ( ) de la log-vraisemblance

Détermination de la valeur de

( ( ) )

( )

Fin tant que.

Page 108: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 108

Annexe 5 : Pseudo Code de l’algorithme de sélection -segmentation

Forward : Macro réalisant une sélection « Forward » pour un modèle de fréquence [hors sinistres graves] selon le

critère AIC. Cette procédure a été adaptée afin d’être réutilisée pour les explications du coût moyen, de la prime

commerciale, ainsi que l’acte de résiliation. Elle fait appel à la procédure « Genmod » de SAS ainsi qu’à une macro

exclusion, décrites ci-dessous.

Macro Genmod : Résumé du principe de la procédure « Genmod »

Genmod (base, réponse, modèle, loi, lien)

Modèle: liste des variables explicatives

Réponse : variable à expliquer

Loi : Loi de la variable réponse

Lien : Fonction de lien utilisée dans le GLM

Cette procédure calcule également l’AIC du modèle en question.

Macro Exclusion : Elle exclut un mot d’une liste de variables

Exclusion (liste , mot, nb_variable)

Entrée :

Liste : liste de mot

Mot : le mot à exclure

Nb_ variable : nombre de mots dans la liste

Sortie : Liste _nouvelle

Exclusion (liste, mot, nb_variable) /*Repérage de l’indice du mot à supprimer*/

Pour j allant de 1 à nb_variable faire

Si j-ème élément de la liste = mot faire

indice j

fin si

Fin pour /*Initialisation */

Liste_nouvelle vide

/*3 cas : mot en début, milieu ou fin de liste*/

Si (indice =1 ) faire

Pour k allant de 2 à Nb_variable faire

Liste_nouvelleListe_nouvelle + k-ème élément de la liste

Fin pour

Sinon si (indice=nb_variable) faire

Pour k allant de 1 à (Nb_variable-1 )faire

Liste_nouvelleListe_nouvelle + k-ème élément de la liste

Fin pour

Sinon

Liste_nouvelle1 vide

Liste_nouvelle2 vide

Page 109: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 109

Pour k allant de 1 à (indice-1) faire

Liste_nouvelle1 Liste_nouvelle1 + k-ème élément de la liste

Fin pour

Pour k allant de 1 à (indice+1) faire

Liste_nouvelle2Liste_nouvelle2 + k-ème élément de la liste

Fin pour

Liste_nouvelle Liste_nouvelle1 +Liste_nouvelle2

Fin si

Retourner Liste_nouvelle

Fin

Forward (base, liste, nbvar, loi, lien)

Entrée :

Base : base dans laquelle se trouve la variable fréquence (hors graves) ainsi que l’ensemble des variables

explicatives.

Liste : Liste des variables qui feront l’objet de la sélection

Nbvar : Nombre de variables dans la liste

Loi : Loi choisie pour la prime pure [hors graves]

Lien : Fonction de lien utilisée dans le GLM

Sortie : Table « résumé » dans laquelle figurent, les modèles sélectionnés à chaque étape et la valeur de l’AIC leur

correspondant.

Forward (base, liste, nbvar,loi, lien)

Calcul de la valeur de l’ « intercept »

Résumé Valeur de l’ « intercept »

Liste_nouvelle Liste

Modèle Vide

Pour k allant de 1 à Nbvar faire ;

Nbvar_listenouvelle Nbvar-k+1 /*nombre de variables de la liste de départ qui ne font pas encore partie du modèle*/

Pour p allant de 1 à Nbvar_liste nouvelle faire ;

Genmod (base, PrimePure HG, modèle+ p-ème élément de liste_nouvelle,

loi, lien)

Récupération de l’AIC de « modèle +pème » élément de la liste nouvelle

Fin pour

Création de la table AIC_ EtapeK /*AIC_Etape K : table qui contient les AIC de tous les modèles obtenus dans la boucle précédente*/

Calcul de l’AIC minimal dans la table AIC_ EtapeKEtapeK

Variable_ajoutee Variable dont l’ajout au modèle engendre l’AIC minimal

ModèleVariable_ajoutee

Page 110: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 110

Liste_nouvelle_tempListe_nouvelle

Liste_nouvelleExclusion (Liste_nouvelle_temp, variable_ajoutee,

Nbvar_listenouvelle)

RésuméRésumé + AIC_étape_k ;

Fin pour.

Fin.

Annexe 6 : Code SAS de la procédure « Genmod » pour les modèles de fréquence et coût moyen

Le calcul des coefficients est réalisé grâce au logiciel SAS (procédure « Genmod). Le code correspondant ainsi que les

explications de ce dernier figurent en annexe 6.

Modèle de fréquence :

%let modele =zone formule anccg groupe acp;

Procgenmod data=dataF order=data ;

Class&modele ;

ModelnbsinHG = &modele / offset=log_AP

dist=poisson

link=log

Predicted= nbsinHG_Pred

Resraw=nbsinHG_residus

Outputout= frequenceHG_Pred

;

run;

Quelques explications concernant ce code :

Offset=log_AP: Ajout du logarithme de l’année police à la combinaison linéaire des coefficients.

Dist = poisson : Emission de l’hypothèse que le nombre de sinistres suit une loi de Poisson.

Link=log : Choix du lien logarithmique

Predicted= nbsinHG_Pred Calcul des valeurs prédites du nombre de sinistres par case. Ce dernier est

obtenu en inversant par la formule énoncée ci-dessus.

( ( ) ∑

)

( ∑

)

Resraw=nbsinHG_residus : Calcul des résidus bruts, différence entre le nombre de sinistres observé et le

nombre de sinistres prédits.

Class &modele : Déclaration des variables qualitatives.

Page 111: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 111

Model nbsinHG = &modele Demande à ce que la régression ( ) ( ) ∑ soit

réalisée.

Modèle de coût moyen :

%let modele= classe formule;

Procgenmod data=dataC order=data ;

Class&modele;

model CMHG= &modele/dist=gamma link=log type3;

weightnbsinHG;

ODSOUTPUTParameterEstimates = cmhg_Param

Type3 = cmhg_Var

Modelfit = cmhg_InfoModele;

outputout= cmhg_PredPredicted= cmhg_Predresraw=cmhg_residus ;

run;

Quelques explications concernant ce code :

Dist = gamma: Emission de l’hypothèse que le coût moyen suit une loi gamma.

Link=log : Choix du lien logarithmique

Class &modele : Déclaration des variables qualitatives.

Model CMHG= &modele Demande à ce que la

régression ( ) ∑

soit réalisée.

Weight nbsinHG: Pondération des observations de coût moyen par le nombre de sinistres à partir desquels

elles ont été calculées.

Predicted= cmhg_PredCalcul des valeurs prédites du coût moyen par case. Ce dernier est obtenu en inversant

par la formule énoncée ci-dessus.

( ∑

)

Resraw=cmhg _residus : Calcul des résidus bruts, différence entre le coût moyen observé et le coût moyen

prédit.

Page 112: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 112

Annexe 7 : Résultats du tri à plat pour la prime commerciale

Partie 2, I.1, Analyse uni variée.

La prime commerciale moyenne reversée par la catégorie d’assurés figure en rouge, en bleu est représentée la part

des images associée à la modalité en question.

Figure 82: Part des images et niveaux de prime commerciale par âge et par sexe

Figure 83 Part des images et niveaux de prime commerciale par segment marketing et par antécédents/expérience

Figure 84 Figure : Part des images et niveaux de prime commerciale par région du portefeuille et du risque

Figure 85Part des images et niveaux de prime commerciale par zone et par marque

<25ans <30ans <35ans <40ans <50ans 50ans et +

Âge

Part des images

Prime commerciale moyenne

F H

Sexe

Part des images

Prime commerciale moyenne

Segment Marketing

Part des images

Prime commerciale moyenne

Autres IDF NordEst Ouest SudEst SudOuest

Région du portefeuille

Part des images

Prime commerciale moyenne

IdF NordEst Ouest Sud Ouest SudEst

Région du risque

Part des images

Prime commerciale moyenne

Zone

Part des images

Prime commerciale moyenne

Marque

Part des images

Prime commerciale moyenne

Page 113: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 113

Figure 86 Part des images et niveaux de prime commerciale par genre et par groupe

Figure 87 Part des images et niveaux de prime commerciale par classe et par durée de détention

Figure 88 Part des images et niveaux de prime commerciale par ancienneté du véhicule et de carte grise

Figure 89 Part des images et niveaux de prime commerciale par type d’usage et par type de fractionnement

Genre

Part des images

Prime commerciale moyenne

<=6 30 31 32 33 34-35 36 37 38,39Groupe

Part des images

Prime commerciale moyenne

Durée de détention du véhicule

Part des images

Prime commerciale moyenne

Ancienneté du véhicule

Part des images

Prime commerciale moyenne

Ancienneté de la carte grise

Part des images

Prime commerciale moyenne

autres:Pri-Pro/tour prive trajet-travail

Usage du véhicule

Part des images

Prime commerciale moyenne

Annuel Autres

Fractionnement

Part des images

Prime commerciale moyenne

Page 114: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 114

Figure 90: Part des images et niveaux de prime commerciale par réseau de distribution et par ancienneté de contrat

Annexe 8 : Résultat du tri à plat pour la probabilité de résiliation Pour une catégorie d’individus donnée, le taux de résiliation de cette dernière est donné par

En rouge apparait le taux de résiliation, en vert le taux de résiliation global sur la base, en bleu la part des contrats

associée à cette catégorie.

Figure 91 Part des images et taux de résiliation par segment marketing et ancienneté de permis

Figure 92 Part des images et taux de résiliation par antécédents/ expérience et région du portefeuille

Figure 93 Part des images et taux de résiliation zone et ancienneté de la carte grise

Segment Marketing

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Ancienneté du permis

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Avec-avec Avec-sans Sans-sans

Antécédents / Expérience

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Autres IDF NordEst Ouest SudEst SudOuest

Région du portefeuille

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Zone

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Ancienneté de la carte grise

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Page 115: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 115

Figure 94 Part des images et taux de résiliation par marque et par classe du véhicule

Figure 95Part des images et taux de résiliation par genre et groupe du véhicule

Figure 96 Part des images et taux de résiliation en fonction de la durée de détention du véhicule et de l’ancienneté du véhicule

Figure 97Part des images et taux de résiliation en fonction de la cylindrée et l’usage du véhicule

Marque

Part de contrats

Taux de résiliation

Taux de résiliation moyen

J K L M N O P Q R

Classe

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Genre du véhicule

Part de contrats

Taux de résiliation

Taux de résiliation moyen

<=6 30 31 32 33 34 35 36 37 38,39Groupe

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Durée de détention du véhicule

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Ancienneté du véhicule

Part de contrats

Taux de résiliation

Taux de résiliation moyen

<125 125 126-500 501-750 +750

Cylindree

Part de contrats

Taux de résiliation

Taux de résiliation moyen

autres:Pri-Pro/tour prive trajet-travail

Usage du véhicule

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Page 116: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 116

Figure 98 Part des images et taux de résiliation en fonction du réseau de distribution et de la formule de souscription

Figure 99 Part des images et taux de résiliation en fonction du coefficient technique et du fractionnement de la prime commerciale

Réseau

Part de contrats

Taux de résiliation

Taux de résiliation moyen

RC RC+IV RC+IV+DC RC+IV+TD

Formule

Part de contrats

Taux de résiliation

Taux de résiliation moyen

0%

5%

10%

15%

20%

25%

moins de 0.69

0.70 A 0.79

0.80 A 0.89

0.90 A 0.94

0.95 A 0.99

1.00 1.01 A 1.05

1.06 A 1.10

PLUS DE 1.10

Coefficient technique

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Annuel Autres

Fractionnement

Part de contrats

Taux de résiliation

Taux de résiliation moyen

Page 117: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 117

Annexe 9 : Matrice de corrélation entre les facteurs du support de la probabilité de résiliation

Figure 100 Hiérarchisation des corrélations

Figure 101 Matrice de corrélations entre les facteurs pour la modélisation de la probabilité de résiliation

peu corrélé ,indépendantmoyennement corrélécorrélétres corrélé

i reseau age sexe seg_mkt acp anccg ant exp region ptf regionrisque zone marque genre groupe classe cylindree ddv acv usage formule fractionnement ancc ctreseau 100%age 4% 100%sexe 1% 9% 100%seg_mkt 32% 64% 5% 100%acp 2% 75% 9% 49% 100%anccg 6% 26% 2% 19% 31% 100%ant 2% 31% 3% 17% 33% 41% 100%exp 2% 29% 1% 17% 35% 45% 64% 100%region ptf 34% 10% 1% 18% 10% 5% 4% 3% 100%regionrisque 21% 10% 1% 23% 10% 7% 5% 4% 85% 100%zone 22% 9% 2% 21% 6% 9% 6% 5% 51% 61% 100%marque 8% 24% 8% 21% 26% 18% 11% 10% 15% 19% 24% 100%genre 16% 33% 15% 29% 37% 27% 22% 20% 26% 32% 42% 73% 100%groupe 15% 21% 14% 19% 36% 23% 27% 26% 22% 27% 38% 68% 86% 100%classe 10% 24% 15% 17% 25% 15% 17% 18% 14% 18% 27% 61% 80% 83% 100%cylindree 10% 25% 14% 22% 36% 13% 26% 27% 14% 16% 23% 56% 71% 78% 72% 100%ddv 6% 32% 5% 23% 35% 80% 55% 50% 5% 6% 9% 18% 28% 28% 23% 21% 100%acv 6% 11% 5% 15% 15% 72% 12% 16% 11% 14% 17% 36% 50% 42% 36% 25% 50% 100%usage 8% 15% 4% 28% 14% 5% 7% 5% 16% 18% 21% 21% 34% 31% 19% 20% 5% 12% 100%formule 1% 18% 5% 12% 9% 18% 13% 9% 9% 10% 8% 26% 41% 37% 29% 27% 16% 43% 15% 100%fractionnement 6% 25% 3% 22% 25% 15% 9% 9% 7% 4% 5% 11% 18% 14% 11% 11% 17% 5% 14% 11% 100%ancc 10% 30% 5% 23% 31% 81% 43% 42% 5% 4% 7% 16% 23% 20% 15% 17% 73% 46% 10% 10% 14% 100%ct 14% 15% 4% 15% 17% 41% 23% 24% 12% 9% 9% 11% 19% 20% 16% 15% 44% 18% 7% 10% 7% 52% 100%

Page 118: Master Actuariat de Dauphine Mémoire présenté devant … · DM IARD Actuariat Moto Avril - Septembre 2014 Page 2. Remerciements Houda Afailal - Mémoi e d’actua iat ... responsable

Annexes

Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 118

Annexe 10 : Coordonnées et contribution des modalités de l’ACM sur la résiliation Partie 3, section II.4

En rose apparaissent les contributions des modalités des variables significatives sur l’axe 1.

Inertie Moyenne 0,013 Coordonnées sur les axes

Contributions aux axes

variable Modalités des facteurs Inertie Dim1 Contr1

Âge <25ans 0,0170082 -1,309829563 0,021243

<30ans 0,0163524 -0,827668414 0,015035

Acp acp+20 0,0100008 0,314364869 0,011324

acp0-4 0,0155421 -1,015649719 0,034832

anccg anccg0-3 0,0059914 -0,515203126 0,045939

anccg4-7 0,0140914 0,813994039 0,036393

anccg8-10 0,0156315 1,369506365 0,060885

antécédents/ expérience Avec-sans 0,0172488 -0,633798957 0,003564

Sans-sans 0,0160827 -1,215212107 0,038221

marque Autres 0,0148314 -0,640210935 0,018089

Autres asiat 0,0169531 -0,359721266 0,001706

genre CUS 0,0155351 0,708895793 0,01702

QUA IM/EXO 0,0165127 -0,935902487 0,017177

ROA 0,014888 -0,399747236 0,00692

SCO 0,0143129 -0,657438565 0,022344

TRA/SMO 0,0149577 0,723256135 0,022122

TT 0,0171709 -0,649693177 0,004225

groupe 30-31 0,0148157 0,84892192 0,03197

34-36 0,011805 0,102113023 0,00092

37-39 0,0155466 0,047438664 7,58E-05

<=6 0,0158792 -0,869662725 0,02182

classe j à l 0,0140441 0,795997353 0,035239

m à o 0,0077132 -0,402769349 0,024002

p à r 0,013957 0,269336213 0,004127

durée de détention du véhicule NR 0,0130808 0,991206215 0,068447

ddv+8 0,0167177 0,94766248 0,014925

ddv0-3 0,007979 -0,655327517 0,061876

acv acv0-3 0,0126694 -0,766592931 0,044466

acv10-19 0,0128669 0,567247679 0,02342

acv20-39 0,0162465 0,887350124 0,018498

usage prive 0,009692 -0,050959695 0,000309

trajet-travail 0,0087913 0,064911694 0,000557

formule RC 0,0114678 0,144474041 0,001945

RC+IV+TD 0,0103172 -0,033919664 0,000127

fractionnement Annuel 0,0069654 0,172497341 0,004727

Autres 0,0108917 -0,269729941 0,007392

ancienneté du contrat ancc0-3 0,0062713 -0,502563628 0,042681

ancc4-8 0,0135244 0,816141267 0,042094

ancc9-13 0,0164651 1,150383258 0,02687

PLUS DE 1.10 0,0147305 0,631453118 0,018184

ct moins de 0.79 0,0109143 -0,363982329 0,013416

non 0,011 0,036980025

oui

-0,192119159

Tableau 36 Coordonnées et contribution des modalités de l'ACM sur la résiliation