ANALYSE DE LA DEMANDE RÉSIDENTIELLE D'ÉLECTRICITÉ À …

NADEGE DESIREE YAMEOGO

ANALYSE DE LA DEMANDE RESIDENTIELLE

D’ELECTRICITE A PARTIR D’ENQUETES

INDEPENDANTES : CORRECTION DE BIAIS

DE SELECTION ET D’ENDOGENEITE DANS

UN CONTEXTE DE CLASSES LATENTES.

These presenteea la Faculte des etudes superieures de l’Universite Laval

dans le cadre du programme de doctorat Departement d’Economiquepour l’obtention du grade de Philosophiae Doctor (Ph.D)

FACULTE DES SCIENCES SOCIALESUNIVERSITE LAVAL

QUEBEC

2008

c©Nadege Desiree Yameogo, 2008

Resume

Differentes methodes sont proposees pour estimer la demande d’electricite condi-

tionnelle au mode de chauffage. Un modele logit mixte GAR(1) avec heterogeneite est

utilise pour estimation le modele de choix du mode de chauffage. Comme la tarification

de l’electricite entraıne une endogeneite du prix marginal, un modele a classes latentes

est propose et son estimation est faite selon une approche classique ou une approche

bayesienne. Puisque le menage choisit son mode de chauffage pour plusieurs annees,

nous captons l’aspect dynamique a partir de donnees d’enquetes independantes en uti-

lisant deux approches. D’abord, nous creons des pseudo-panels composes de cohortes et

nous estimons la demande d’electricite par les moindres carres quasi-generalises et par

l’algorithme de l’echantillonnage de Gibbs. Ensuite, nous creons un panel simule avec

lequel nous estimons la demande d’electricite conditionnelle en combinant l’algorithme

de l’augmentation des donnees et l’echantillonnage de Gibbs.

Resume

L’objectif de cette these est de faire une analyse de la demande residentielle d’electricite

conditionnelle au choix du mode de chauffage de l’eau et de l’espace de la province de

Quebec. Plusieurs approches sont proposees afin de corriger differents problemes qui

sont poses.

L’electricite est vendue selon une tarification en deux parties et son prix marginal

depend de la quantite demandee, entraınant une endogeneite du prix. Cette tarification

cree deux classes latentes (non observables) de menages. La methode du maximum de

vraisemblance en deux etapes dans un contexte de classes latentes est proposee tout en

corrigeant le probleme de selection du choix du mode. Le modele de choix est estime

avec un logit mixte a erreurs autoregressives generalisees d’ordre un (GAR(1)).

A partir du logit mixte, des taux d’escompte individuels ont ete estimes en supposant

de l’heterogeneite deterministe entre les menages. Le taux moyen obtenu est tres proche

du taux sur le marche financier.

Comme le choix du mode de chauffage est fait pour plusieurs annees, il est impor-

tant de pouvoir capter l’aspect dynamique dans le comportement de consommation

des menages. Seules des donnees d’enquetes independantes sont disponibles, il n’y a

pas donnees de panel. Deux approches sont alors proposees pour resoudre le probleme

d’informations manquantes.

La premiere approche consiste a creer des pseudo-panels, composes de cohortes de

menages ayant des caracteristiques communes. Dans ce cas, la demande d’electricite est

estimee d’une part, selon la methode des moindres carres quasi-generalises, et d’autre

part, en utilisant l’echantillonnage de Gibbs pour tenir compte de l’heterogeneite entre

des groupes de cohortes.

La seconde approche consiste a simuler un panel afin de garder l’information au ni-

veau des menages. La demande d’electricite conditionnelle au choix du mode de chauf-

Resume iv

fage et au choix de la classe est estimee en combinant l’algorithme de l’augmentation

des donnees (pour simuler les donnees manquantes) et celui de l’echantillonnage de

Gibbs (pour estimer les parametres du modele). Les resultats des differentes methodes

proposees sont tres satisfaisants.

Abstract

The objective of this thesis is to analyze Quebec residential electricity demand

conditional on the choice of space and water heating alternatives. Several approaches

are proposed to solve various problems.

Electricity is sold according a two part tariff, and its marginal price depends on the

quantity that the household buys. This leads to an endogeneity problem. This tariff

creates two latent (unobservable) classes of households. We propose to use a two-step

maximum likelihood method while taking into account the latent classes problem and

the selection bias coming from the choice of heating alternatives. We used a mixed logit

model with a generalized autoregressive errors of order one to estimate the choice model.

We suppose a deterministic grouped heterogeneity between households and the results

are used to mesure individual discount rates. The average discount rate turns out to be

very close to the financial market rate. Since the choice of heating alternative is made by

the household for several years, it is important to be able to get the dynamic behavior

of household electricity consumption. There is no panel data and the only available data

are independent cross-sectional surveys, . Two approaches are proposed to solve this

problem of missing information. The first approach consists in creating a pseudo-panel

data, composed by cohorts of households sharing some characteristics. In this case,

electricity demand is estimated using on the one hand, a feasible generalized least-

squares method to correct errors heteroscedasticity and autocorrelation, and using on

the other hand the Gibbs sampler algorithm to take into account random heterogeneity

between groups of cohorts. In the second approach, we simulated a panel data which

keeps information at the household level. Electricity demand conditional on the choice

of the heating alternative and the class choice is estimated by combining the data

augmentation algorithm (which simulates missing data) and the Gibbs sampling (which

estimates model parameters). Short-run and long-run elasticities are calculated for each

of our models. The results that we obtained for all our models are very satisfactory.

Avant-propos

On ne peut ecrire seul une these de doctorat sans l’appui d’autres personnes. J’ai eu

la chance d’avoir beaucoup de personnes qui m’ont soutenue durant toutes ces annees.

Je tiens d’abord a remercier mon directeur, Mr Jean-Thomas Bernard, qui m’a fait

confiance avant meme que je n’arrives ici au Canada. Je tiens a le remercier pour son

appui, ses conseils et ses encouragements dont j’ai beneficies durant toutes ces annees.

Je remercie mon co-directeur Mr Denis Bolduc, pour son aide, et particulierement dans

la conception des programmes informatiques. Par ses qualites de bon pedagogue, il m’a

donne sans le savoir la passion pour l’econometrie. Mes remerciements vont a Mme

Lynda Khalaf, pour ses conseils et encouragements qui m’ont ete tres precieux durant

ces annees, et surtout durant les moments difficiles. Je remercie tous les professeurs du

departement et particulierement ceux qui m’ont enseignee. Il m’ont permis d’approfon-

dir et d’aimer davantage l’economie et le metier d’enseignant. Mes remerciements vont

a Mme Martine Guay et tout le personnel du departement que j’ai cotoye durant toutes

ces annees.

Les etudes doctorales ne peuvent pas etre faites dans de bonnes conditions sans

aide financiere. Je remercie la Chaire de l’Energie Electrique et le Groupe de Recherche

en Economie de l’Energie, de l’Environnement et des Ressources Naturelles (GREEN)

qui ont finance mes etudes doctorales depuis le debut. Mes remerciements vont aussi

a l’Institut d’Hydro-Quebec en Environnement, Developpement et Societe (IHQEDS)

pour le financement accorde a cette recherche.

Je remercie tous les membres de ma famille, particulierement ma mere, Justine,

mon pere Paul, et ma soeur Bertille, pour leur appui inconditionnel tout au long de

mes etudes au Burkina Faso comme au Canada. Je remercie Dieudonne, qui m’a soutenu

moralement durant toutes ces annees de dur labeur. Je remercie toutes mes amies et tous

mes amis de meme que mes collegues de travail, avec qui j’ai eu des discussions parfois

fructueuses : Marie-Helene, Agnes, Guy, Chritian et Daniela, Myra, Dany, Therese et

Gerald Arbour,... Je remercie Marie, son epoux et Emanuel qui m’ont soutenue durant

ces moments difficiles passes loin de ma famille.

a Justine, Dieudonne, Bertille et Paul

Table des matieres

Resume ii

Resume iii

Abstract v

Avant-propos vi

Table des matieres viii

Liste des tableaux xii

Table des figures xiv

1 Introduction 1

2 Revue de la litterature 6

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 Le probleme de la simultaneite entre choix discret et choix continu . . . 7

2.3 Le probleme de la tarification non lineaire . . . . . . . . . . . . . . . . 10

2.4 Methodes d’estimation des modeles continus avec des panels . . . . . . 15

2.4.1 Les donnees de panel . . . . . . . . . . . . . . . . . . . . . . . . 15

2.4.2 Methodes d’estimation des donnees de panel . . . . . . . . . . . 17

2.5 Methodes d’estimation des modeles a choix discret avec des panels . . . 25

2.5.1 Estimation du logit a effets fixes et aleatoires : le maximum de

vraisemblance conditionnel . . . . . . . . . . . . . . . . . . . . . 26

2.5.2 Probit a effets aleatoires . . . . . . . . . . . . . . . . . . . . . . 27

2.5.3 Methodes d’estimation de modeles dynamiques avec des panels . 28

2.5.4 Approche semiparametrique . . . . . . . . . . . . . . . . . . . . 30

2.5.5 Correction de biais de selection de donnees de panel . . . . . . . 30

2.6 Methodes d’estimation des donnees longitudinales incompletes . . . . . 31

2.6.1 Les donnees longitudinales incompletes . . . . . . . . . . . . . . 32

2.6.2 Les pseudo-panels conventionnels . . . . . . . . . . . . . . . . . 32

2.6.3 Modeles lineaires statiques . . . . . . . . . . . . . . . . . . . . . 33

Table des matieres ix

2.6.4 Modeles lineaires dynamiques . . . . . . . . . . . . . . . . . . . 37

2.6.5 Modele de choix discret avec des pseudo-panels . . . . . . . . . 40

2.6.6 Quelques etudes empiriques ayant porte sur les pseudo-panels . 41

2.7 Autres approches pour solutionner le probleme de donnees manquantes 43

2.7.1 L’imputation multiple (IM) . . . . . . . . . . . . . . . . . . . . 43

2.7.2 L’algorithme esperance maximisation (EM) . . . . . . . . . . . . 46

2.8 Survol de quelques methodes bayesiennes . . . . . . . . . . . . . . . . . 50

2.8.1 La methodologie MCMC (markov chain monte carlo) . . . . . . 51

2.8.2 Echantillonnage de Gibbs . . . . . . . . . . . . . . . . . . . . . 52

2.8.3 L’algorithme d’augmentation des donnees (AD) . . . . . . . . . 54

Bibliographie 57

3 Estimation de la demande d’electricite avec un modele a classes la-

tentes 67

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.2 Revue de la litterature . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.3 Le modele econometrique de choix discret/continu . . . . . . . . . . . . 72

3.4 Le modele de choix du mode de chauffage : le logit mixte . . . . . . . . 73

3.5 Le modele de demande conditionnelle au choix du mode . . . . . . . . . 78

3.6 La demande d’electricite conditionnelle au choix de la tranche de consom-

mation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

3.7 Estimation par le maximum de vraisemblance en information limitee . 83

3.8 Description des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . 85

3.9 Resultats du modele de choix du mode de chauffage . . . . . . . . . . . 88

3.10 Resultats de l’estimation du modele de demande . . . . . . . . . . . . . 92

3.10.1 Interpretation des resultats du modele de choix de la classe . . . 96

3.10.2 Resultats du modele de demande conditionnelle . . . . . . . . . 97

3.10.3 Tests d’endogeneite du prix marginal . . . . . . . . . . . . . . . 102

3.11 Estimation du taux d’escompte individuel . . . . . . . . . . . . . . . . 103

3.12 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

Bibliographie 111

4 Estimation de la demande d’electricite avec des pseudo-panels de co-

hortes 116

4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

4.2 Revue des ecrits anterieurs . . . . . . . . . . . . . . . . . . . . . . . . . 117

4.3 Modeles statiques de demande d’electricite avec des pseudo-panels . . . 121

4.3.1 La construction des cohortes . . . . . . . . . . . . . . . . . . . . 122

4.3.2 Le modele a effets fixes . . . . . . . . . . . . . . . . . . . . . . . 124

Table des matieres x

4.3.3 Resultats de l’estimation du modele a effets fixes . . . . . . . . 126

4.3.4 Modele a effets fixes avec heteroscedasticite . . . . . . . . . . . 128

4.3.5 Modele a effets fixes avec heteroscedasticite et correlation serielle 131

4.3.6 Analyse de sensibilite : elasticites prix et revenu de la demande 135

4.4 Modeles dynamiques de demande d’electricite . . . . . . . . . . . . . . 136

4.4.1 Le modele dynamique . . . . . . . . . . . . . . . . . . . . . . . 137

4.4.2 Analyse de sensibilite : elasticites prix et revenu . . . . . . . . . 142

4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

Bibliographie 146

5 Estimation bayesienne de modeles a parametres aleatoires 150

5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

5.2 Revue des ecrits anterieurs . . . . . . . . . . . . . . . . . . . . . . . . . 151

5.3 Modele statique a parametres aleatoires homogenes . . . . . . . . . . . 156

5.3.1 Simulation de β . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

5.3.2 Simulation de h . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

5.3.3 Simulation de σ2θ . . . . . . . . . . . . . . . . . . . . . . . . . . 159

5.3.4 Resultats et interpretation . . . . . . . . . . . . . . . . . . . . . 159

5.4 Modele statique a parametres heterogenes . . . . . . . . . . . . . . . . 160

5.4.1 Simulation de βg . . . . . . . . . . . . . . . . . . . . . . . . . . 161

5.4.2 Simulation de hg . . . . . . . . . . . . . . . . . . . . . . . . . . 161

5.4.3 Resultats empiriques et interpretations . . . . . . . . . . . . . . 162

5.5 Modele dynamique de demande d’electricite . . . . . . . . . . . . . . . 164

5.5.1 Resultats de l’estimation du modele dynamique . . . . . . . . . 165

5.6 Analyse de sensibilite : elasticites prix et revenu de la demande . . . . . 169

5.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

Bibliographie 174

5.8 Les annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

5.8.1 Annexe A : repartition des cohortes . . . . . . . . . . . . . . . . 175

5.8.2 Annexe B : Graphiques des simulations . . . . . . . . . . . . . . 177

5.8.3 Annexe C : Tests d’hypothese de restrictions non lineaires . . . 198

6 Analyse de la demande conditionnelle : approche bayesienne 201

6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

6.2 Revue de la litterature . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

6.3 Modele de choix du mode de chauffage : le logit mixte . . . . . . . . . . 206

6.4 Methodologie bayesienne . . . . . . . . . . . . . . . . . . . . . . . . . . 211

6.4.1 Echantillonnage de Gibbs . . . . . . . . . . . . . . . . . . . . . 211

6.4.2 L’algorithme de l’augmentation des donnees . . . . . . . . . . . 212

Table des matieres xi

6.4.3 Estimation bayesienne des modeles a classes latentes . . . . . . 214

6.5 Estimation d’un modele statique de demande d’electricite . . . . . . . . 215

6.5.1 Modele de demande conditionnelle a la classe et au mode de chauf-

fage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

6.5.2 Etape de la simulation des donnees manquantes . . . . . . . . . 218

6.5.3 Etape de la simulation des parametres . . . . . . . . . . . . . . 220

6.5.4 Experience Monte Carlo sur le modele a classes latentes . . . . . 223

6.5.5 Resultats empiriques et interpretations . . . . . . . . . . . . . . 226

6.6 Estimation d’un modele de demande dynamique . . . . . . . . . . . . . 237

6.6.1 Etapes additionnelles : simulation de yt−1 et de y0 . . . . . . . . 239

6.6.2 Resultats et interpretation . . . . . . . . . . . . . . . . . . . . . 241

6.6.3 Analyse de sensibilite : elasticite prix et revenu du modele dyna-

mique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251

6.7 Conclusion et recommandations . . . . . . . . . . . . . . . . . . . . . . 255

6.8 Annexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

6.8.1 Graphiques pour la convergence des tirages . . . . . . . . . . . . 256

6.8.2 Determination de la loi a posteriori des exogenes . . . . . . . . . 261

Bibliographie 263

7 Conclusion 268

Liste des tableaux

3.1 Exemple : pourquoi deux classes latentes ? . . . . . . . . . . . . . . . . 82

3.2 Repartition echantillonnale par source d’energie . . . . . . . . . . . . . 86

3.3 Frequences echantillonnales selon le mode de chauffage . . . . . . . . . 86

3.4 Description des variables utilisees . . . . . . . . . . . . . . . . 86



3.5 Resultats modele discret (couts moyens specifiques) . . . . 89

3.6 Resultats du modele de demande conditionnelle . . . . . . . . . . . . 93



3.7 Elasticites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

3.8 Resultats du modele sans classes . . . . . . . . . . . . . . . . . . . . . . 98

3.9 Resultats du modele discret (couts moyens generiques) . . 107

3.10 Taux d’escompte estimes . . . . . . . . . . . . . . . . . . . . . . . . . . 108

4.1 Modele statique a effets fixes . . . . . . . . . . . . . . . . . . . 127

4.2 Modele avec Heteroscedasticite . . . . . . . . . . . . . . . . . 128



4.3 Erreurs heteroscedastique et AR(1) . . . . . . . . . . . . . . . . . . . . . 132



4.4 Elasticites du modele statique . . . . . . . . . . . . . . . . . . . . . . . 136

4.5 Resultats du modele dynamique a effets fixes . . . . . . . . 138

4.5 Resultats du modele dynamique a effets fixes . . . . . . . . 139

4.6 Modele dynamique avec Heteroscedasticite et AR(1) . . . . . . . . . . . . 140



4.7 Elasticites des modeles dynamiques . . . . . . . . . . . . . . . . . . . . . 144

5.1 Resultats du modele statique a parametres homogenes . . . . . . . . . . . 160

5.2 Resultats du modele statique a parametres aleatoires . . . . . . . . . . . 163

Liste des tableaux xiii

5.2 Resultats du modele statique a parametres aleatoires . . . . . . . . . . . 164

5.3 Resultats du modele dynamique a parametres homogenes . . . . . . . . . . 167

5.4 Resultats du modele dynamique a parametres aleatoires . . . . . . . . . . 167



5.5 Elasticites des modeles a parametres homogenes . . . . . . . . . . . . . . 171

5.6 Elasticites des modeles a parametres aleatoires . . . . . . . . . . . . . . 172

5.7 repartition des cohortes : base 1989 . . . . . . . . . . . . . . . . . . . . . 176




6.1 Resultats de l’experience Monte Carlo . . . . . . . . . . . . . . . . . . . 225

6.2 Resultats du modele statique de demande conditionnelle . . . . . . . . 227



6.3 Modele statique sans classes . . . . . . . . . . . . . . . . . . . . . . . . 235

6.3 Modele statique sans classes . . . . . . . . . . . . . . . . . . . . . . . . 236

6.4 Elasticites du modele statique . . . . . . . . . . . . . . . . . . . . . . . . 237

6.5 Tarif D de quelques annees . . . . . . . . . . . . . . . . . . . . . . . . . 246

6.6 Prix moyens en dollars constant . . . . . . . . . . . . . . . . . . . . . . 246

6.7 Comparaison prix de vente moyen avec pays industrialises . . . . . . . 246

6.8 Resultats du modele dynamique de demande conditionnelle . . . . . . 248



6.9 Modele dynamique sans classes . . . . . . . . . . . . . . . . . . . . . . . 252

6.10 Elasticites du modele dynamique . . . . . . . . . . . . . . . . . . . . . . 254

Table des figures

2.1 tarif de prix croissant en deux blocs . . . . . . . . . . . . . . . . . . . . 11

4.1 Manquante de vrai panel, enquetes independantes . . . . . . . . 123

5.1 estimation coefficient du prix de l’electricite du modele statique homogene177

5.2 estimation coefficient du revenu net du modele statique homogene . . . 178

5.3 estimation coefficient de hdd du modele statique homogene . . . . . . . 178

5.4 estimation coefficient de cdd du modele statique homogene . . . . . . . 178

5.5 simulation de la variance de l’erreur du modele statique homogene . . . 179

5.6 simulation effet inobservable du modele statique homogene . . . . . . . 179

5.7 estimation coefficient prix electricite du modele statique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

5.8 estimation coefficient du revenu du modele statique a parametres heterogenes180

5.9 estimation coefficient de hdd du modele statique a parametres heterogenes181

5.10 estimation coefficient de cdd du modele statique a parametres heterogenes181

5.11 simulation prix region1 du modele statique a parametres heterogenes . 181

5.12 estimation coefficient revenu region1 du modele statique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

5.13 estimation coefficient du prix region3 du modele statique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

5.14 estimation coefficient du revenu region3 du modele statique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

5.15 estimation coefficient de hdd region3 du modele statique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

5.16 moyenne des coefficients simules du prix du modele dynamique a pa-

rametres heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

5.17 moyenne des coefficients simules du revenu de l’electricite du modele

dynamique a parametres heterogenes . . . . . . . . . . . . . . . . . . . 184

5.18 moyenne des coefficients simules de la consommation passee du modele

dynamique a parametres heterogenes . . . . . . . . . . . . . . . . . . . 185

5.19 moyenne des coefficients simules de hdd du modele dynamique a pa-


Table des figures xv

5.20 moyenne des coefficients simules de cdd du modele dynamique a pa-


5.21 estimation coefficient du prix region1 du modele dynamique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

5.22 estimation coefficient du revenu net region1 du modele dynamique a pa-


5.23 estimation coefficient de la consommation passee region1 du modele dy-

namique a parametres heterogenes . . . . . . . . . . . . . . . . . . . . . 186

5.24 estimation coefficient de hdd region1 du modele dynamique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

5.25 estimation coefficient de cdd region1 du modele dynamique a parametres

heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187






heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189






heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191






heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

Table des figures xvi


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193






heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194






heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196






heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197


heterogenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

6.1 simulation du coefficient de prix electricite classe1 . . . . . . . . . . . . 256

6.2 simulation du coefficient de prix bi-energie classe1 . . . . . . . . . . . . 256

6.3 simulation du coefficient de prix gaz naturel classe1 . . . . . . . . . . . 257

6.4 simulation du coefficient de prix mazout classe1 . . . . . . . . . . . . . 257

6.5 simulation du coefficient du revenu augmente classe1 . . . . . . . . . . 257

6.6 simulation du coefficient de cdd classe1 . . . . . . . . . . . . . . . . . . 258

6.7 simulation du coefficient de hdd classe1 . . . . . . . . . . . . . . . . . . 258

6.8 simulation du coefficient de prix electricite classe2 . . . . . . . . . . . . 258

Table des figures xvii

6.9 simulation du coefficient de prix mazout classe2 . . . . . . . . . . . . . 259

6.10 simulation du coefficient du revenu augmente classe2 . . . . . . . . . . 259

6.11 simulation du coefficient de cdd classe2 . . . . . . . . . . . . . . . . . . 259

6.12 simulation du coefficient de hdd classe2 . . . . . . . . . . . . . . . . . . 260

6.13 simulation coefficient de la dependante retardee classe1 . . . . . . . . . 260

6.14 simulation coefficient de la dependante retardee classe2 . . . . . . . . . 260

Chapitre 1

Introduction

L’analyse de la demande residentielle d’energie et d’electricite en particulier, est

habituellement basee sur le principe des modeles de choix discret/continu. Le menage

n’utilise pas l’energie comme un bien final, mais il a besoin de l’energie pour satisfaire

ses besoins de chauffage de l’espace et de l’eau, l’eclairage, le fonctionnement d’appa-

reils electromenagers, comme les refrigerateurs, congelateurs, televiseurs, ordinateurs,

machine a laver,... Pour pouvoir consommer une quantite donnee d’energie, le menage

doit choisir une modalite ou alternative qui est un ensemble d’appareils utilisant soit

l’electricite, la bi-energie, le mazout, le gaz naturel, le bois, ou toute combinaison de

l’une et l’autre des formes. Dans cette these, nous nous limiterons aux besoins de chauf-

fage de l’eau et de l’espace du menage. Le choix de la quantite est relie au choix de la

modalite et le choix de la modalite depend aussi du choix de la quantite. Toute methode

d’estimation qui ignore cette interdependance donnerait des estimateurs biaises et non

convergents. Il existe deux principales approches pour l’estimation des modeles de choix

discret/continu :

– l’estimation en information complete qui consiste a estimer simultanement les

parametres du modele continu et du modele discret,

– l’estimation en information limitee consistant a estimer separement les parametres

des deux modeles.

Dubin et McFadden (1984) furent les premiers a proposer une methode d’estimation

qui prend en compte cette interdependance. L’un des objectifs poursuivis dans cette

these est d’analyser la demande d’electricite des menages quebecois tout en prenant en

compte ce probleme d’interdependance entre choix discret et choix continu ; et pour y

arriver, nous utiliserons l’approche en deux etapes ou l’approche en information limitee.

Il se trouve aussi que dans la province de Quebec, l’electricite, qui est utilisee par tous

les menages meme si pour certains, c’est uniquement pour les besoins de base, produite

Chapitre 1. Introduction 2

et distribuee par Hydro-Quebec, est tarifee selon la quantite consommee. Il existe en

effet deux blocs de prix : un premier prix p1 est fixe si la consommation journaliere ne

depasse pas le seuil des 30 kWh, et un deuxieme prix p2 > p1 est fixe si elle depasse ce

seuil. Comme on peut le constater, le prix marginal de l’electricite depend de la quantite

consommee et cette derniere depend aussi du prix. Il y a donc un probleme d’endogeneite

du prix. En plus de ce probleme, il faut savoir que la consommation journaliere du

menage n’est pas directement observable par le chercheur. Hydro-Quebec connaıt la

consommation au deux mois du menage ; seul le menage est capable de controler sa

consommation journaliere a travers son compteur. Au cours d’une annee, le menage a

six factures, soit une facture aux deux mois. Mais seule la consommation annuelle est

observable dans les bases de donnees. Il y a des moments ou le menage peut consommer

en dessous du seuil de 30 kWh et des moments ou il peut consommer au dela de ce seuil.

Un de nos objectifs consiste a inferer, a partir de ses caracteristiques socio-economiques,

la probabilite qu’un menage soit dans l’une ou l’autre tranche de consommation. La

structure tarifaire de l’electricite cree deux groupes ou classes de consommateurs qui ne

sont pas directement observables, que nous appelons classes latentes. Plusieurs auteurs

se sont interesses au probleme de l’endogeneite du prix. Mais aucun n’a essaye de

corriger ce probleme dans un contexte de classes latentes. Nous proposons dans cette

these une approche permettant de corriger a la fois le probleme de biais de selection et

le probleme d’endogeneite du prix dans un contexte de classes latentes. Les modeles a

classes latentes sont generalement utilises dans un contexte ou la variable dependante est

discrete. Ils ont ete introduits en premier par Lazarsheld (1950) pour un modele de choix

dichotomique. Par la suite, beaucoup de travaux sur les modeles a classes latentes ont

essentiellement porte sur les modeles polytomiques. Nous proposons d’etendre ce type

de modeles dans un contexte ou la variable dependante est continue, qui correspond en

fait a la demande d’electricite dans notre cas. De plus, nous estimons de facon specifique

les parametres du modele latent et implicitement les valeurs de la probabilite de choisir

une classe donnee. Les modeles a classes latentes peuvent etre estimes soit selon une

approche classique consistant a faire une estimation par le maximum de vraisemblance

ou soit selon une approche bayesienne en utilisant une methode MCMC (Markov Chain

Monte Carlo). Nous exploiterons l’une ou l’autre des deux approches dependamment

de la situation ou du probleme a resoudre.

Nous estimerons dans un premier temps un modele de demande d’electricite a partir

d’une seule base de donnees d’enquete, celle de 1989, ou nous corrigerons a la fois le

probleme de biais de selection et le probleme d’endogeneite du prix dans un contexte

de classes latentes.

La demande d’electricite implique l’usage d’appareils de chauffage (modalite) qui sont

des biens durables. Le choix d’une modalite necessite implicitement que le menage fasse

un arbitrage entre le present et le futur. Ce type d’arbitrage fait intervenir la notion


de taux d’escompte. Dans les travaux anterieurs portant sur l’estimation du taux d’es-

compte individuel, les auteurs comme Hausman (1984), Dubin et McFadden (1984),...

supposent implicitement l’hypothese d’homogeneite entre les individus. Tout se passe

comme s’ils estimaient un taux d’escompte d’un agent representatif. Winter (1995) a

souligne les limites de cette approche. L’hypothese de consommateurs homogenes est

souvent une hypothese trop forte, surtout dans le contexte de la consommation d’energie

ou les comportements des individus peuvent changer selon la modalite choisie. Lors-

qu’un menage choisit une modalite, il fait implicitement un arbitrage entre choisir un

systeme dont les couts d’achat sont eleves, mais les couts futurs d’exploitation, sur

toute la duree de vie du systeme de chauffage, sont faibles ou inversement. L’hypothese

d’homogeneite implicitement imposee dans les travaux anterieurs pourrait etre a l’ori-

gine des valeurs trop elevees des taux obtenues. En effet, les valeurs estimees du taux

d’escompte qu’ils obtiennent depassent les taux d’interet sur les cartes de credit. Nous

proposons dans cette these une methode d’estimation des taux d’escompte qui prend

en compte l’heterogeneite entre les groupes de menages, ces derniers etant definis se-

lon les modalites. Cette methode, a savoir, le logit mixte GAR(1) avec heterogeneite

(deterministe) entre les modalites, donnerait des valeurs estimees des taux d’escompte

beaucoup plus realistes.

Puisque la consommation d’energie residentielle fait intervenir des biens durables, il

est important de pouvoir prendre en compte l’aspect dynamique dans les ajustements

des menages. L’ideal serait d’avoir des donnees de panel qui permettent de suivre les

memes individus sur plusieurs annees. Cependant, il n’existe pas de donnees de pa-

nel portant sur la consommation d’energie des menages de la province de Quebec.

Il existe cependant plusieurs bases de donnees d’enquete (ou coupes transversales)

independantes menees par Hydro-Quebec. Dans ces bases, un menage present a une

periode donnee n’est plus retracable dans les autres periodes. Nous avons en fait un

probleme de manque d’information importante pour chaque menage. Deaton (1985) a

suggere d’exploiter ce type de bases de donnees pour construire, a partir de criteres

bien definis, des cohortes d’individus assez homogenes pouvant etre suivies a chaque

periode. Les moyennes des variables de ces cohortes vont constituer les unites de ce

qu’il appelle les pseudo-panels. Cette approche transforme l’information au niveau in-

dividuel en une information au niveau des groupes. Les resultats en decoulant ne sont

pas necessairement inferieurs a ceux qu’on obtiendrait si on avait de vraies donnees de

panel. Les pseudo-panels ne sont pas sujets aux problemes d’attrition ou d’apprentis-

sage. L’estimation des modeles avec des pseudo-panels se fait le plus souvent en utili-

sant la methode d’estimation a effets fixes. Tres souvent, les auteurs ne cherchent pas a

verifier s’il y a un probleme d’heteroscedasticite ou d’autocorrelation des erreurs. Or, s’il

s’averait que l’un et/ou l’autre de ces problemes existe, les tests d’hypothese et les in-

tervalles de confiance ne seraient plus valides. Cette situation implique que les decisions


de politiques economiques qui en decouleraient seraient mauvaises. Il est donc impor-

tant de verifier ces problemes surtout dans un contexte ou les donnees sont groupees

en cohortes. Nous exploiterons la methode des moindres carres quasi-generalises pour

corriger ces problemes.

Dans les travaux portant sur les pseudo-panels, les chercheurs supposent habituel-

lement que les coefficients de pente de toutes les cohortes sont identiques, meme si on

sait que les cohortes sont assez heterogenes entre elles. Cette heterogeneite est sou-

vent traduite a travers la constante du modele (modeles a effets fixes) ou le terme

d’erreur (effets aleatoires). S’il existe de l’heterogeneite entre les cohortes, elle pour-

rait probablement se manifester aussi a travers les coefficients d’interet (coefficients de

pente). Si la methode d’estimation ne la prend pas en compte, les estimateurs qui en

resulteraient pourraient etre biaises. Robertson et Symons (1992) et Pesaran et Smith

(1995), dans le cadre des donnees de panel, ont discute des biais potentiels qui pour-

raient se manifester dans l’estimation des elasticites de long-terme si l’heterogeneite des

parametres est ignoree. Nous proposons, dans le cadre des pseudo-panels, de prendre en

compte l’heterogeneite en utilisant une approche d’estimation des modeles a parametres

aleatoires. Ces modeles peuvent etre estimees de differentes manieres, pour les donnees

de panels : les moindres carres generalises, le maximum de vraisemblance, l’estima-

tion selon la regle de Stein, l’approche empirique bayesienne ou l’approche iterative

bayesienne (Maddala et al. (1997)). Nous proposons d’utiliser l’approche bayesienne

basee sur l’algorithme de l’echantillonnage de Gibbs. A notre connaissance, le modele

developpe est nouveau dans la litterature sur les pseudo-panels.

L’une des limites de l’approche de Deaton est que l’information au niveau mi-

croeconomique est transformee a un niveau macroeconomique. Il en resulte une cer-

taine perte d’efficacite et de degres de liberte. Paquet (2002) et Paquet et Bolduc

(2004) ont propose une approche alternative a celle de Deaton qui permet de garder

l’information au niveau individuel. Leur approche consiste a utiliser l’algorithme de

l’augmentation des donnees developpe par Tanner et Wong en 1987, pour simuler les

donnees manquantes, puisque nous sommes dans un contexte de donnees manquantes.

En combinant cet algorithme a l’algorithme de l’echantillonnage de Gibbs, ils ont pu

estimer les parametres de leurs modeles tout en completant les donnees manquantes.

Des donnees simulees ont ete utilisees pour fin d’illustration dans un contexte de panels

incomplets et non de coupes transversales independantes. Nous proposons d’etendre

leur demarche au probleme qui nous concerne. Nous exploiterons l’algorithme de l’aug-

mentation des donnees et celui de l’echantillonnage de Gibbs pour simuler les donnees

manquantes et estimer les parametres de nos modeles. Nous corrigerons simultanement

le probleme de selection et celui de l’endogeneite du prix dans un contexte de classes

latentes. Notre demarche est novatrice dans la litterature econometrique et elle permet


permet de corriger plusieurs problemes importants qui sont rattaches a la demande

d’electricite residentielle.

Le chapitre 2 presente une synthese des travaux anterieurs. Le chapitre (3) analy-

sera la demande d’electricite a partir d’une seule base de donnees d’enquete tout en

corrigeant le probleme de biais de selection, le probleme d’endogeneite du prix et celui

de l’heterogeneite du taux d’escompte individuel. Le chapitre (4) utilisera l’approche de

Deaton pour estimer un modele statique et dynamique de demande d’electricite avec

des effets fixes tout en corrigeant les problemes d’heteroscedasticite et d’autocorrelation

des erreurs. Le chapitre (5) developpe un modele statique et dynamique de demande

d’electricite qui tient compte de l’heterogeneite entre les cohortes. Ce chapitre utilisera

des cohortes de menages (au sens de Deaton) et les parametres seront estimes grace

a l’algorithme de l’echantillonnage de Gibbs. Dans le chapitre (6), nous tenterons de

pallier a la principale limite de l’approche de Deaton qui transforme les informations au

niveau microeconomique en information en terme de groupe. Pour pouvoir garder l’in-

formation au niveau du menage tout en corrigeant le biais de selection et d’endogeneite,

nous exploiterons l’approche proposee par Paquet et Bolduc (2004). Nous developpons

un modele a classes latentes statique et dynamique qui utilise un panel simule. Nous

terminerons au chapitre (7) par une conclusion, des recommandations de politiques

economiques et enfin par des propositions de recherches futures. Il convient de noter

que dans la presentation du travail, il y a certaines repetitions. Cela se justifie par le

fait que nous avons voulu ecrire des papiers differents, chacun constituant un ensemble

a part entiere. Dans un souci de ne pas perdre le fil des idees pour chaque papier,

certains elements juges necessaires ont ete reproduits afin de permettre une meilleure

comprehension de chacun des papiers, et dans l’eventualite de publications futures.

Chapitre 2

Revue de la litterature

2.1 Introduction

Dans ce chapitre, nous faisons une synthese des travaux anterieurs ayant porte sur

des sujets qui sont relies a nos objectifs. Nous sommes en effet interesses a analyser

la demande d’electricite des menages de la province de Quebec. Si on veut s’interesser

a la demande d’electricite residentielle, trois points importants devraient etre pris en

compte. Le premier point concerne le choix de la forme d’energie par le menage pour le

chauffage. Pour pouvoir utiliser l’electricite ou toute autre forme d’energie, le menage

doit choisir des appareils qui vont lui permettre de maximiser son utilite (besoins de

chauffage de l’eau, de l’espace, fonctionnement d’appareils electromenagers,...). Nous

appellerons modalite ou alternative toute forme d’energie ou de combinaison d’energie

permettant de faire fonctionner les appareils du menage. Le choix d’une modalite af-

fecte son utilite et de cette utilite, l’on peut deriver la quantite d’energie necessaire pour

satisfaire ses besoins. Il y a donc une interdependance entre le choix de la modalite et

la quantite d’energie qu’il consomme. Cette situation cree un probleme de selection.

Un des objectifs sera de resoudre ce probleme de selection dans le modele de demande

d’electricite. Le second point important a noter est que les menages de la province

utilisent l’electricite qui est produite et distribuee par Hydro-Quebec, societe d’Etat

mandatee a cette fin. Hydro-Quebec utilise une tarification par tranche. Elle fixe un

premier prix lorsque la consommation journaliere (qui est malheureusement non obser-

vable) du menage est inferieure ou egale a 30 kWh et un deuxieme prix superieur au

premier si sa consommation depasse ce seuil. Le prix marginal de l’electricite depend

de la quantite consommee qui depend aussi du prix. Il y a donc un probleme d’en-

dogeneite. Nous tenterons egalement de resoudre ce probleme dans notre modele. Le

dernier point est que les donnees dont nous disposons sont des donnees d’enquetes

Chapitre 2. Revue de la litterature 7

independantes. Les menages presents dans une enquete ne sont plus retracables dans

les autres enquetes. Or, le choix d’une modalite est fait pour plusieurs annees. Une

bonne analyse de la demande d’energie necessiterait d’avoir des donnees de panel qui

permettraient de suivre les memes individus durant plusieurs annees. Un autre objectif

de la these sera de resoudre ce probleme de manque de donnees de panels. La section

(2.2) donne une synthese des travaux ayant porte sur la question de la simultaneite

entre choix discret et choix continu, la section (2.3) s’interesse au probleme de la non

linearite du prix, les sections (2.4) et (2.5) portent sur les methodes de traitement des

donnees de panels. Les travaux ayant porte sur le probleme de manque de panels ou

donnees manquantes sont synthetises dans les sections (2.6), (2.7) et (2.8).

2.2 Le probleme de la simultaneite entre choix dis-

cret et choix continu

L’analyse de la demande des consommateurs nous conduit parfois a des situations

ou les choix discrets sont relies aux choix continus. Ceci s’explique par le fait que ces

deux types de choix sont derives de la meme decision de maximisation de l’utilite de

l’agent considere (consommateur ou menage). Par exemple, un consommateur peut etre

confronte a la situation suivante :

– choisir la marque d’un produit (un bien durable par exemple) et la quantite de ce

produit,

– choisir le type d’assurance et le montant a allouer a cette assurance,

– choisir une localite et le moyen de transport a utiliser pour y arriver,

– choisir le type d’energie pour les besoins de chauffage et la quantite de cette

energie,...

Dans un tel contexte, le choix discret optimal depend du choix continu et vice versa.

Les modeles qui ignorent cette interdependance produisent des estimateurs biaises et

non convergents. King (1980) fut le premier a souligner cette interdependance. Il sup-

pose que le choix du type d’habitation et la demande de services pour la maison sont

des decisions conjointes. Il propose d’estimer le modele par la methode du maximum

de vraisemblance en information complete. Dans la formulation de sa fonction de vrai-

semblance, il a considere la demande non conditionnelle plutot que la demande condi-

tionnelle au choix du type de maison.

En ce qui concerne la demande d’energie, et d’electricite en particulier, on peut dire

qu’il s’agit d’une demande derivee. L’energie ne procure pas une utilite en soit, mais

ce sont les biens ou les services qu’elle produit qui procurent de l’utilite au menage.


Le menage se sert de l’energie pour satisfaire ses besoins, notamment de chauffage de

l’espace, de l’eau, l’eclairage, le fonctionnement d’appareils electromenagers, etc. Il doit

choisir le type d’energie qu’il prefere (mazout, gaz naturel, electricite, bi-energie, bois

ou une combinaison de l’une et l’autre) et la quantite de cette energie. Notons que

le choix du type d’energie implique le choix de systemes de chauffage de l’eau et de

l’espace correspondants. La consommation d’energie peut alors etre analysee comme

un modele de choix discret (choix du type d’energie ou de systeme de chauffage) et de

choix continu (quantite ou usage de cette energie).

Apres les tentatives de King (1980), Dubin et McFadden (1984) se sont interesses a

la demande d’electricite et au choix d’appareils electromenagers des menages des Etats-

Unis. Ils furent les premiers a proposer une methode qui prend reellement en compte

l’interdependance entre choix discret et choix continu. Leur demarche se resume en

deux grandes etapes. La premiere etape consiste a estimer d’abord le modele discret

par la methode du maximum de vraisemblance et a constituer ensuite les correcteurs

de biais de selection associe l’alternative choisie. A cette etape, ils utilisent un logit

polytomique pour modeliser le choix du mode de chauffage. Dans la deuxieme etape,

ils estiment la demande conditionnelle a l’alternative choisie en ajoutant les correcteurs

de biais obtenus a la premiere etape. La methode de la forme reduite et celle des

variables instrumentales sont ensuite utilisees pour estimer les parametres du modele.

Les estimateurs obtenus sont convergents. D’autres auteurs se sont interesses par la

suite aux modeles de choix discrets/continus. Nous en donnons un bref resume.

Hanemann (1984) s’est interesse a l’estimation de la demande de produits de marques

differentes. Le consommateur doit choisir parmi plusieurs marques de produits celle qu’il

prefere et la quantite dont il a besoin. Il propose d’estimer les parametres du modele

par la methode du maximum de vraisemblance en information complete. Cependant,

il specifie la fonction de vraisemblance comme le produit de la probabilite de choisir

une marque par la densite inconditionnelle de la demande plutot que la densite condi-

tionnelle qui prendrait en compte l’interdependance entre les deux choix. Hanemann

(1984) a plutot considere la demande conditionnelle au choix de l’alternative au lieu

de la probabilite de choix de l’alternative conditionnelle a la demande. Il se retrou-

vait alors avec des integrales multiples dans les deux parties de la densite conjointe.

Cela rend l’estimation assez complexe, et en presence de plusieurs alternatives dans

le modele discret, rien ne garantit une convergence vers le maximum global. Compte

tenu de la complexite de la fonction de vraisemblance, il propose alors la methode

en deux etapes du maximum de vraisemblance en information limitee. A la premiere

etape, il propose d’estimer un modele logit polytomique. Ensuite, il fait une regression

par les moindres carres ordinaires (MCO) ou les moindres carres generalises (MCG)

du modele de demande conditionnelle (avec le correcteur de biais de selection). Les


estimes sont recuperes pour servir comme valeurs initiales pour la seconde etape. Cette

derniere consiste a estimer la fonction de vraisemblance. Les estimateurs obtenus sont

convergents.

Bernard, Bolduc et Belanger (1996) ont estime un modele de demande d’electricite

des menages quebecois. A la difference du modele de Dubin et McFadden (1984), ils

supposent un logit mixte pour le modele discret. Ce modele a l’avantage de prendre

en compte la correlation potentielle qui pourrait exister entre les neuf (9) alternatives

considerees. Le modele de demande est estime en utilisant la methode a variables ins-

trumentales et la forme reduite.

Sanga (1999) a utilise deux approches (maximum de vraisemblance en information

complete et en information limitee) pour estimer la demande d’electricite des menages

quebecois. Il introduit une certaine correlation entre les modalites du modele discret en

utilisant un modele probit polytomique. Dans l’estimation par le maximum de vraisem-

blance en information complete, l’interdependance entre choix discret et choix continu

a ete prise en compte grace a une bonne formulation de la fonction de densite conjointe.

Cette fonction est decomposee en une densite conditionnelle (probabilite de choisir une

alternative conditionnelle a la demande) et en une densite marginale (densite de la

fonction de demande) de maniere a permettre son estimation. Il a utilise l’approche par

simulation (simulateur GHK) pour evaluer la vraisemblance qui comporte des integrales

multiples. Le principal avantage de l’estimation en une seule etape est le gain en ef-

ficacite. Cette methode est cependant assez complexe, et a cause de la simultaneite

dans l’estimation des parametres du modele discret et du modele continu, une erreur

de specification sur l’une ou l’autre des composantes aurait des repercussions sur les

proprietes des estimateurs de tous les parametres. Or, en estimant les parametres de

facon separee (methode en deux etapes), une erreur qui survient dans une partie est

limitee a cette partie seulement. C’est pour cette raison de robustesse que les cher-

cheurs preferent souvent l’estimation en deux etapes que celle en une seule etape.

Dans son estimation par le maximum de vraisemblance en information limitee, Sanga

a considere l’interdependance entre choix discret et continu en introduisant des cor-

recteurs de biais de selection de type Heckman (1979) dans le modele de demande

conditionnelle d’electricite.

Vaage (2000) s’inspire des travaux d’Hanemann (1984) pour estimer la demande

residentielle d’energie des menages norvegiens. Il n’utilise pas la methode du maxi-

mum de vraisemblance en information limitee comme Hanemann. Apres avoir estime le

modele de choix discret par un logit polytomique, il construit les correcteurs de biais

de selection et estime ensuite le modele de demande conditionnelle par les MCO de la

meme facon que Dubin et McFadden (1984).


Nesbakken (2001) estime un modele de choix du systeme de chauffage de l’espace

et un modele de demande d’energie de facon simultanee en utilisant la methode du

maximum de vraisemblance en information complete. Contrairement aux autres au-

teurs, elle suppose que le choix discret et le choix continu ne sont pas des decisions

contemporaines : le choix du systeme de chauffage se fait lors de la construction de la

maison tandis que le choix de la quantite d’energie a consommer se fait a la periode cou-

rante. Cette hypothese conduit a inclure les couts fixes et les couts d’operation (couts

esperes) dans la fonction d’utilite indirecte, par contre dans la fonction de demande,

seuls les couts fixes interviennent. Elle suppose un modele logit polytomique pour la

partie discrete et une loi normale par la partie continue. Elle ne prend cependant pas en

compte de correlation potentielle entre les alternatives. L’estimation par le maximum

de vraisemblance en information complete a ete possible essentiellement parce qu’elle

n’avait pas beaucoup d’alternatives de chauffage (quatre alternativement seulement)

et elle n’a pas pris en compte la correlation qui pourrait exister entre les alternatives.

Neanmoins, les estimateurs obtenus sont plus efficaces que ceux de la methode en deux

etapes.

Liao et Chang (2002) se sont interesses a la demande d’energie pour le chauffage de

l’espace et de l’eau des personnes agees aux USA. Ils ont estimes le modele de choix

discret en utilisant un logit polytomique et la demande conditionnelle au choix par les

moindres carres ponderes. Leurs resultats indiquent que plus l’age augmente, plus les

besoins de chauffage de l’espace augmentent, mais les besoins d’eau chaude baissent.

La demande de gaz naturel et de mazout des personnes agees serait plus importante

que leur demande d’electricite.

Comme nous l’avons souligne au depart, dans ce travail, les menages qui nous

concernent sont confrontes a une tarification par tranche. Par consequent, dans la sec-

tion suivante, nous faisons une revue des travaux ayant porte sur la tarification non

lineaire ou par tranche.

2.3 Le probleme de la tarification non lineaire

Supposons que le menage fait face a un tarif de prix croissant selon la quantite

consommee et decrit par le graphique (2.1). Precisons que lorsque l’on s’interesse a la

tarification de l’energie, on s’interesse particulierement au prix marginal. Le prix moyen

de l’electricite (ou toute autre forme d’energie) est en effet egal au cout total de cette

electricite divisee par la quantite totale d’electricite consommee. Le prix marginal de

l’electricite est egale a la valeur du kilowatt-heures (kWh) marginal consommee. Donc,


dans tout le reste du chapitre, il sera essentiellement question du prix marginal.

Fig. 2.1 – tarif de prix croissant en deux blocs

x

P

P

x

1

2

*

P

Le graphique (2.1) represente la structure tarifaire d’Hydro-Quebec. La societe fixe le

prix de l’electricite selon la quantite consommee par le menage sur une periode donnee.

Si la consommation journaliere moyenne du menage est en dessous de ou egale a 30

kWh, le prix marginal est fixe a p1, et si elle depasse les 30 kWh, Hydro-Qebec fixe un

prix p2 > p1 pour toutes les quantites au dessus des 30 kWh.

Comme on peut le constater, le prix marginal est non lineaire, rendant la contrainte

budgetaire du menage non lineaire. Ainsi, lorsque le prix marginal est determine selon

la tranche d’energie consommee, il devient une variable endogene et on dira que le prix

marginal est non lineaire.

On sait depuis les travaux d’Houthakker (1951) que les prix par tranche de consom-

mation ont des implications econometriques importantes. Taylor (1975) a souligne le

biais potentiel qui resulterait de l’estimation des elasticites de la demande lorsque la

structure des prix est non lineaire. Selon Taylor (1975), la non linearite de la contrainte

budgetaire du consommateur a des consequences sur l’equilibre du consommateur, la

fonction de demande et les courbes d’Engel. Lorsque les prix sont non lineaires, on a

un probleme d’endogeneite du prix. En effet, la quantite demandee depend du prix et

le prix est fixe selon la quantite demandee. Il en resulte un biais du a l’endogeneite du

prix.

Plusieurs auteurs ont cherche a resoudre ce probleme de biais provenant de la non

linearite des prix. On peut citer pour la demande d’electricite, Acton, Mitchell et Mowill

(1976), Barnes, Gillingham et Hageman (1981), Dubin (1985a et 1985b), McFadden,

Puig et Kirshner (1977), Taylor (1975), Herrigues et al. (1994), Reiss et White (2005) ;

pour l’eau, Billings et Agthe (1980, 1981), Foster et Beattie (1985a et 1985b) ; pour le gaz

naturel, Barnes, Gillingham et Hageman (1982), Polzin (1984), etc... Dans les travaux

anterieurs, il existe une variete de methodes d’estimation des modeles de demande avec


endogeneite du prix. Herriges et al. (1994) ont fait une synthese.

Lorsqu’il y a un probleme de variable explicative endogene, les estimateurs des

MCO sont biaises. Plusieurs alternatives existent : l’estimation par la forme reduite,

les variables instrumentales, le maximum de vraisemblance structurel, le maximum de

vraisemblance structurel modifie, la methode des moments generalises (GMM),...

L’approche par la forme reduite consiste a utiliser un sous-ensemble du tarif de prix

ou une combinaison d’elements du tarif comme variables explicatives dans le modele

de demande. Taylor (1975) proposait d’utiliser a la fois le prix marginal et moyen. Mc-

Fadden (1977) a utilise trois prix differents pour capter tous les effets de la tarification.

L’estimation par la forme reduite a cependant deux limites importantes :

– un probleme d’identification des parametres peut se poser lorsqu’il n’y a pas assez

de variabilite au niveau du point de rupture : le seuil de changement de prix est

constant comme c’est le cas pour les donnees qui nous concernent. Il serait alors

difficile de passer de la forme reduite au modele original.

– la forme reduite est souvent ad hoc, donnant ainsi lieu a peu de justification quant

aux variables a inclure dans le modele.

Pour fin d’illustration, supposons le tarif decrit ci-apres :

pe = pe (x, p1, p2, x∗)

≡ p1

≡ p2

si

si

x ≤ x∗

x > x∗ ,

ou pe est le prix a l’equilibre du consommateur, x est la quantite demandee, x∗ est le

seuil de changement d’une tranche a l’autre, p1 et p2 sont les differents prix. Supposons

un modele de demande lineaire defini comme suit :

x = α0 + α1pe + α2revenu + ε.

avec ε un terme d’erreur. Substituons le prix par son expression :

x = α0 + α1pe (x, p1, p2, x∗) + α2revenu + ε.

L’estimation par la forme reduite consiste a supposer que pe est une fonction lineaire

de variables explicatives :

x = α0 + [β1p1 + β2p2 + β∗x∗] + α2revenu + ε.

On peut constater que lorsque le seuil (x∗) est une constante, un probleme d’identifi-

cation se pose puisqu’il y aura deux constantes dans le modele. Donc, le β∗ ne sera pas

identifiable. De plus, rien ne prouve que le prix d’equilibre est une fonction lineaire de

variables explicatives, on pourrait supposer une autre forme fonctionnelle.


L’estimation par variables instrumentales (VI) permet aussi de resoudre le biais du

a l’endogeneite du prix. La demarche consiste a trouver de bons instruments pour le

prix. Cette methode a ete utilisee par Barnes, Gillingham et Hagemann (1981), Haus-

man, Kinnucan et McFadden (1979), Hausman et Trimble (1984). L’estimation par va-

riables instrumentales est techniquement superieure a l’estimation par la forme reduite

parce qu’elle permet de resoudre non seulement le biais d’endogeneite du prix, mais

aussi de specifier l’equation de demande en coherence avec la theorie neoclassique de

maximisation de l’utilite. Cependant, les estimateurs obtenus ne sont pas les meilleurs.

En revenant au modele illustratif, l’estimation par VI pourrait consister a prendre

pe = P (pe = p1 |revenu) × p1 + P (pe = p2 |revenu) × p2 comme instrument pour pe.

Une autre alternative est le maximum de vraisemblance structurel (MVS) initia-

lement propose par Burtless et Hausman (1978). Cette methode a ete utilisee par

Dubin (1985b) pour estimer la demande d’electricite. Le MVS consiste a resoudre le

probleme de maximisation de l’utilite du consommateur sous une contrainte budgetaire

non lineaire. Le terme d’erreur aleatoire intervenant dans la fonction d’utilite directe

traduirait soit de l’heterogeneite aleatoire dans les preferences et/ou des erreurs de me-

sures dans les variables explicatives. La solution au probleme de maximisation est une

fonction de demande definie de facon specifique pour chaque bloc. La loi du terme d’er-

reur permet de construire la fonction de vraisemblance a maximiser. Cependant, il se

peut que les probabilites qui entrent dans la fonction de vraisemblance soient negatives.

Herriges et al. (1994) proposent la methode du maximum de vraisemblance structurel

modifie pour resoudre ce probleme. Leur methode consiste a controler les probabilites

pour eviter des valeurs negatives. Supposons que la fonction d’utilite indirecte est definie

de la facon suivante :

max U (x,G, ε)

sc

p1x + G ≤ revenu

p2x + G ≤ revenu + (p2 − p1) x∗,

ou G indique les depenses pour les autres biens. Supposons que l’equation de demande

qui en resulte est definie par :

x =

f (p1, revenu, ε)

x∗

f (p2, revenu + (p2 − p1) x∗, ε)

si ε ≤ ε1

si ε1 ≤ ε ≤ ε2

si ε > ε2.

Les probabilites negatives viennent du fait qu’il peut arriver que (ε1 > ε2) rendant

P (ε1 ≤ ε ≤ ε2) < 0. Cependant, pour la structure tarifaire qui nous concerne, ce

probleme est ecarte puisque la partie du milieu sera incluse dans la premiere de sorte

qu’on se limite a deux parties et non trois.


Reiss et White (2005) se sont interesses a l’estimation de la demande d’electricite

en supposant que la consommation totale est egale a la somme de la consommation

de chaque appareil du menage. Ils agregent la demande d’electricite a travers le temps

puisque le menage achete les appareils de chauffage et electromenagers pour plusieurs

periodes. Dans un tel contexte, la fonction de vraisemblance devient assez complexe a

maximiser de sorte que rien ne garantit que la solution obtenue correspond au maxi-

mum global. Dans leur etude, il fut impossible meme de maximiser leur fonction de

vraisemblance. Pour cette raison, ils ont utilise la methode des moments generalises

pour estimer les parametres du modele. Leur analyse leur a permis d’evaluer les effets

d’une modification de la structure de tarification non lineaire de l’electricite de l’etat

de Californie. En 2001, la structure tarifaire de l’electricite de la Californie est passee

d’un tarif de deux parties a un tarif a cinq parties non lineaires.

Il n’existe pas encore de travaux prenant en compte a la fois le probleme de la si-

multaneite entre choix discret et choix continu et le probleme de l’endogeneite du prix.

On s’interesse soit a l’un soit a l’autre des problemes, mais pas aux deux a la fois. Ce-

pendant, si nous voulons estimer la demande d’electricite des menages avec la structure

tarifaire d’Hydro-Quebec, nous devons resoudre simultanement ces deux problemes pour

obtenir des estimateurs convergents. Notre modele serait ainsi beaucoup plus adapte a

la realite. Au chapitre (3) nous utiliserons la methode du maximum de vraisemblance

a information limitee qui a l’avantage de corriger a la fois le biais de selection venant

du choix du mode de chauffage et le biais d’endogeneite du prix. Nous nous servirons

de modele a classes latentes pour prendre en compte l’heterogeneite entre les classes de

consommation et le logit mixte servira a prendre en compte la correlation potentielle

entre les alternatives. L’estimation du modele se fera avec une seule base de donnees

d’enquete, celle de 1989 d’Hydro-Quebec. Or, l’analyse de la demande d’electricite ou

d’energie en general devrait prendre en compte l’aspect intertemporel dans le compor-

tement de consommation des menages. Il serait beaucoup plus interessant de suivre les

memes menages sur plusieurs annees afin de bien comprendre leur comportement de

consommation. Pour y arriver, il faut utiliser des donnees de panel ; il s’agit de plusieurs

donnees d’enquete, menees a differentes periodes, et qui interrogent les memes individus

a chaque periode. Il existe dans la litterature des outils pour le traitement des donnees

de panel. Les sections (2.4) et (2.5) font une revue des modeles utilisant les donnees de

panel. Cependant, nous ne disposons malheureusement pas de donnees de panel. Nous

avons plutot des series de donnees d’enquete independantes : les menages d’une enquete

ne sont plus retracables dans les autres enquetes. On peut le voir comme un probleme

de donnees manquantes. Il existe aussi dans la litterature des techniques permettant de

se servir de ce type de donnees pour avoir des panels synthetiques. Les sections (2.6) et

(2.7) font une synthese des outils pour le traitement de ce type donnees. Les pseudo-

panels et les panels ont certaines proprietes en commun de sorte qu’il est important


de bien connaıtre les outils pour le traitement de vrais panel, ceci permettra de mieux

comprendre les methodes utilisees pour les pseudo-panels.

2.4 Methodes d’estimation des modeles continus avec

des panels

Nous decrivons d’abord les donnees de panel et ensuite nous nous interesserons aux

methodes utilisees pour leur traitement.

2.4.1 Les donnees de panel

Les donnees de panel sont constituees d’observations tirees de facon repetees a

differentes periodes. Ainsi, pour un meme individu, il y a plusieurs observations corres-

pondantes. Les panels ont a la fois une dimension de coupe transversale et une dimension

de serie chronologique. Contrairement aux coupes transversales, il est possible de suivre

un individu donne dans le temps avec les donnees de panel. Contrairement aux series

chronologiques, on peut observer plusieurs series (ou variables) avec les donnees panel.

En observant plusieurs coupes transversales a travers le temps, il est possible d’analyser

les aspects dynamique et statique d’un probleme donne. Les termes «longitudinal» et

«panel» sont souvent utilises pour designer la meme chose.

Hsiao (2001) et Baltagi (2005) ont fait un survol de la litterature sur les donnees

de panel. Les donnees de panel ont un certain nombre d’avantages par rapport aux

donnees purement en coupes transversales ou de series chronologiques. L’un de ces

avantages est le nombre plus important d’observations ; cela permet d’ameliorer la

precision des estimes des parametres. Les donnees de panel ont aussi l’avantage de pou-

voir resoudre le probleme de multicolinearite. Lorsque les variables explicatives varient

dans les deux dimensions (temporelle et transversale), elles ont tendance a etre moins

fortement correlees. Avec les donnees de panel, il est possible de reduire le probleme de

la multicolinearite en introduisant des differences entre les individus a travers les effets

individus. En outre, avec les panels, il est possible de mesurer des effets qui ne sont pas

facilement identifiables avec des coupes transversales ou des series chronologiques. Les

panels permettent de controler l’heterogeneite individuelle.

Les donnees panel offrent la possibilite de reduire les biais d’omission de variables

pertinentes grace a une transformation du modele en difference ; cette transformation a


pour but d’eliminer les variables specifiques aux individus mais invariantes dans le temps

et qui sont correlees avec le terme d’erreur. Soulignons aussi que les panels simplifient

l’inference statistique. Avec les series chronologiques, il est important de savoir si les

series sont stables, integrees ou explosives. Mais avec les donnees de panel, tant que

la dimension transversale approche l’infinie, la distribution limite des coefficients reste

normale, que la dimension temporelle soit fixee ( Anderson et Hsiao 1982) ou tende vers

l’infini (Levin et Lin 1993, Phillips et Moon 1999).

Avec les panels, on peut mieux analyser la dynamique d’ajustement des agents

economiques. Les coupes transversales ne permettent pas de suivre les memes individus

et de percevoir les changements dans leur comportement suite a des changements de

certains facteurs (comme le prix, le revenu,...). Un autre avantage important est que

les panels (au niveau individuel) sont des mesures plus precises que les memes panels

au niveau agrege (groupes ou cohortes d’individus). En gardant les panels au niveau

individuel, cela reduirait le biais provenant de l’agregation a travers les groupes ou

cohortes d’individus.

Les panels ont cependant certaines limites. Il y a d’abord les problemes de collecte

des donnees. Cela inclut le probleme de disponibilite de la population d’interet, les non-

reponses (les individus peuvent ne pas vouloir cooperer ou il peut y avoir des erreurs

dans les questionnaires), la frequence des interviews, l’espace entre les interviews, la

periode de reference.

Les panels peuvent avoir un probleme d’erreurs de mesure. Ces erreurs de mesure

peuvent se produire soit parce que la personne interrogee a donne une fausse reponse

(volontairement ou non), ou soit parce que la question posee n’est pas assez claire ou

precise.

Les panels souffrent aussi du probleme d’attrition. Puisque ce sont les memes indi-

vidus qui sont suivis sur plusieurs periodes, il peut arriver que certains ne soient plus

observables a partir d’une periode donnee. Les non reponses augmentent typiquement

a travers le temps. Les non reponses peuvent se produire dans les donnees de coupes

transversales comme dans les donnees de panel. Mais ce probleme est beaucoup plus

serieux avec les panels. Par exemple, les repondants peuvent disparaıtre definitivement

du panel (quitter, mourir, ou ne trouvent plus d’interet a participer aux entrevues).

L’attrition peut devenir problematique parce qu’elle peut creer un biais de selection.

Le biais de selection se produit lorsque les individus de l’echantillon ne sont plus tires

de facon aleatoire mais sont selectionnes en suivant le critere selon lequel l’individu est

observable sur toute la periode consideree. Dans un tel contexte, il peut arriver d’ex-

clure un pourcentage non negligeable d’observations de l’echantillon. Ainsi, une bonne


partie de l’information ne sera pas utilisee dans l’analyse et l’echantillon ne serait plus

le resultat d’un tirage aleatoire. Une solution a ce probleme serait d’utiliser un panel

rotatif, qui est en fait un panel ou a chaque periode, on change un pourcentage fixe des

repondants.

Il existe deux types de donnees de panel : les panels balances et les panels non

balances. Avec les panels balances, chaque individu ou observation apparaıt a chaque

periode. Par contre, avec les panels non balances, certains individus peuvent etre presents

a toutes les periodes tandis que d’autres sont presents seulement a quelques periodes.

Pour ces derniers, il manque de l’information pour certaines periodes. Le traitement de

ce type de panel necessite une approche qui permet de tenir compte de ce probleme.

Dans tout le reste du document, nous considerons uniquement le cas de panel balances

pour simplifier notre analyse. Ainsi, le terme panel sous-entendra panel balance.

Les panels s’etalent souvent sur une tres courte periode. Cela n’est pas necessairement

negatif puisqu’en s’etalant sur plusieurs periodes, le probleme d’attrition pourrait s’ag-

graver et la base de donnees pourrait etre trop lourde a manipuler.

2.4.2 Methodes d’estimation des donnees de panel

Lorsqu’on dispose de panels complets, il existe des methodes d’estimation appro-

priees pour ce type de donnees. Lorsqu’il s’agit d’un modele lineaire, on peut utiliser

les modeles a effets fixes ou a effets aleatoires.

Supposons le modele suivant comme dans Wooldridge (2003) :

yit = θi + β1xi1t + β2xi2t + .... + βkxikt + uit (2.1)

i = 1, 2, ....N t = 1, 2, ....T.

Le terme θi est parfois appele effet individuel ou heterogeneite non observee. Les hy-

potheses sur θi determinent s’il s’agit d’un modele a effets fixes ou d’un modele a effets

aleatoires. Lorsqu’il s’agit d’un modele a effets fixes, θi est alors une constante specifique

a chaque observation i. Lorsqu’il s’agit d’un modele a effets aleatoires, le terme θi est

considere comme une variable aleatoire avec une loi donnee (souvent la normale). Dans

le language de l’econometrie moderne, le terme «effets aleatoires» est synonyme d’ab-

sence de correlation entre variables explicatives observees et effet non observe (θi).

Le terme «effets fixes» signifie qu’il est possible d’avoir une certaine correlation entre

les variables explicatives observees et l’effet non observe (θi). Ainsi, lorsqu’il y a une

correlation potentielle entre les xit et l’effet non observe, le modele a effet aleatoire ne

sera pas approprie. Nous discuterons plus loin des criteres de choix entre modele a effets

fixes et modele a effets aleatoires.


Modeles a effets fixes

Dans la definition d’un modele a effets fixes, on suppose qu’il existe des facteurs non

observables et non aleatoires qui expliqueraient mieux le modele. Ces facteurs traduisent

une forme d’heterogeneite non aleatoire et peuvent etre specifiques au temps (indice par

t) ou a l’individu (indice par i).

Dans la plupart des donnees de panel, le nombre d’observations depasse le nombre

de periodes. L’heterogeneite entre les observations expliqueraient une proportion plus

grande de variabilite comparativement a l’heterogeneite entre les periodes. Ainsi, on

utiliserait souvent des variables binaires pour exprimer l’heterogeneite entre les periodes.

Dans un modele a effets fixes, on peut s’interesser soit uniquement a l’heterogeneite

entre les observations (on parlera de modele a effets fixes de base), ou soit uniquement

a l’heterogeneite entre les periodes ou enfin on pourrait s’interesser aux deux formes

d’heterogeneite a la fois. Supposons le cas d’un panel balance. L’heterogeneite entre les

observations s’ecrit de facon formelle comme suit :

yit = θi + β1xi1t + β2xi2t + .... + βkxikt + uit (2.2)

i = 1, 2, ....N

t = 1, 2, ....T.

L’heterogeneite entre les periodes se traduit par :

yit = λt + β1xi1t + β2xi2t + .... + βkxikt + uit (2.3)

i = 1, 2, ....N

t = 1, 2, ....T.

Un modele a effets fixes avec les deux formes d’heterogeneite s’ecrit :

yit = θi + λt + β1xi1t + β2xi2t + .... + βkxikt + uit (2.4)

i = 1, 2, ....N

t = 1, 2, ....T.

Le modele a effets fixes de base suppose qu’il n’existe ni correlation serielle de uit

(correlation a travers le temps) ni correlation contemporaine (correlation entre les in-

dividus). Il existe differentes methodes d’estimation des modeles a effets fixes.

Estimation en difference premiere Supposons pour simplifier que nous disposons

d’un panel a deux periodes. La generalisation se fait tres facilement lorsqu’on a plus de


deux periodes. Comme dans Woodridge (2003), supposons le modele lineaire multiple

suivant :

yit = β0 + δ0D2t + β1xi1t + β2xi2t + .... + βkxikt + θi + uit

i = 1, 2, ....N, t = 1, 2

D2t =

0

1

si t = 1

si t = 2.

La composante θi englobe tout ce qui est non observable, invariant dans le temps et

qui affecterait la variable dependante yit. Supposons que θi est fixe. Il s’agit en d’autres

termes d’un modele a effets fixes avec a la fois de l’heterogeneite entre les observations

(θi) et de l’heterogeneite entre les periodes (intercept pour chaque periode). L’estimation

en difference premiere permet de se debarrasser de θi puisqu’il est le meme entre les

deux periodes. Elle consiste a ecrire le modele pour chaque periode et a prendre la

difference :

yi1 = β0 + β1xi1 + β2xi21.... + βkxik1 + θi + ui1

yi2 = β0 + δ0 + β1xi12 + β2xi21.... + βkxik1 + θi + ui2.

En soustrayant la premiere equation de la deuxieme, on obtient :

yi2 − yi1 = δ0 + β1(xi12 − xi11) + β2(xi22 − xi21) +

.... + βk(xik2 − xik1) + (ui2 − ui1) (2.5)

4yi = δ0 + β14xi1 + β24xi2 + ................ + βk4xik + 4ui

= = δ0 + ∆X ′iβ + 4ui,

avec : 4yi = yi2 − yi1 et 4xik = xik2 − xik1.

Pour obtenir des estimateurs convergents des βk par les MCO, il faut imposer un

certain nombre d’hypotheses. Soit : Xit = (x1it, x2it, ....xkit), Xt = (X1t, X2t, ....XNt) le

vecteur des variables exogenes du modele pour la periode t et soit X = (X1, X2, ...XT ).

Soit U le vecteur des termes d’erreurs. Les hypotheses suivantes doivent etre imposees :

1. Hypothese 1 : le terme d’erreur en difference est orthogonal a toutes les va-

riables explicatives en difference, conditionnellement aux effets non observes θi :

E (∆X ′4U) = 0. ∆Z etant le vecteur contenant la variable ∆zi definie precedemment.

Ceci implique que les variables explicatives sont strictement exogenes ; en d’autres

termes. Cette hypothese rend l’estimateur en difference premiere de β non biaise

conditionnellement aux variables explicatives observees.

2. Hypothese 2 : elle concerne la condition de rang. La matrice des variables ex-

plicatives en difference est de plein rang k. Si le modele contient k variables ex-

plicatives, alors, on doit avoir : rang de E [4X ′4X] = k. Cette hypothese ecarte


les situations ou il existe des variables explicatives invariantes dans le temps de

meme que la colinearite parfaite entre les variables variant dans le temps. Ainsi,

si Xt contient une variable invariante dans le temps pour toutes les observations,

4X aura une colonne composee entierement de zero de sorte que la condition de

rang ne peut plus etre respectee. Les estimateurs MCO seront convergents s’il y

a des variations des (xit) dans le temps.

Ces deux premieres hypotheses sont essentielles pour avoir des estimateurs sans

biais de β. Les hypotheses suivantes sont posees pour avoir des estimateurs effi-

caces.

3. Hypothese 3 : la variance du terme d’erreur en difference est constante dans le

temps :

V (4uit |Xit, θi ) = σ2u ∀t. Ceci assure l’homoscedasticite des erreurs en difference.

4. Hypothese 4 : les erreurs suivent une marche aleatoire, donc, les erreurs en

difference premiere ne sont pas autocorrelees : Cov(4uit,4uis |Xit, θi ) = 0

5. Hypothese 5 : conditionnellement aux variables explicatives, les 4uit sont iden-

tiquement et independamment distribues selon une loi normale.

Appliquer les MCO au modele (2.5) donnerait des estimateurs convergents et effi-

caces de β.

L’estimation en difference premiere est une methode parmi d’autres pour eliminer

l’effet fixe θi. Une alternative serait de faire une estimation selon la transformation

«within» ou la transformation «between». Ces deux dernieres methodes constituent ce

que nous appellerons transformation a effets fixes.

Transformation «within» Soit le modele lineaire multiple a effets fixes defini par :

yit = β1xi1t + β2xi2t + ..... + βkxikt + θi + uit t = 1, 2, ....T (2.6)

= x′itβW + θi + uit,

avec βW le vecteur des coefficients de pentes de cette transformation. Prenons la moyenne

par rapport au temps des deux cotes de l’egalite :

yi = β1xi1 + β2xi2 + ..... + βkxik + θi + ui (2.7)

yi =1

T

T∑

t=1

yit xik =1

T

T∑

t=1

xikt ui =1

T

T∑

t=1

uit.

Comme θi est fixe a travers le temps, il apparaıt dans les deux equations de sorte qu’il

peut etre elimine :

yit − yi = β1 (xi1t − xi1) + β2 (xi2t − xi2) + ..... + βk (xikt − xik) + ui − uit..yit = β1

..xi1t + β2

..xi2t + ..... + βk

..xikt +

..uit. (2.8)


Cette transformation s’appelle la transformation «within». Dans l’equation (2.8), l’effet

non observe (θi) a disparu. On peut donc estimer l’equation (2.8) par les MCO empiles

sur les nouvelles variables. L’estimateur «within» est donne par :

βW =

[T∑

t=1

N∑

i=1

(xit − xi)′ (xit − xi)

]−1 [ T∑

t=1

N∑

i=1

(xit − xi)′ (yit − yi)

].

On peut recuperer les estimateurs des effets non observes de la facon suivante :

θi = yi − βW xi i = 1, 2, ....N.

Un certain nombre d’hypotheses doivent etre remplies pour que l’estimateur de βW soit

sans biais et efficace. Ces hypotheses sont :

1. Hypothese 1 : les variables explicatives sont strictement exogenes conditionnel-

lement aux effets fixes : E (uit |Xit, θi ) = 0

2. Hypothese 2 : rang(∑T

t=1 E( ..x′it

..xit

))= k. Si Xit contient un element qui ne

varie pas dans le temps, alors l’element correspondant dans..xit sera egal a zero

pour tout t et pour tout i. Cette hypothese montre explicitement pourquoi les

variables explicatives constantes dans le temps ne sont pas permises dans l’analyse

des modeles a effets fixes.

Les hypotheses suivantes sont imposees pour que l’estimateur de βW soit efficace.

3. Hypothese 3 : la variance des erreurs est constante :

V (uit |Xit, θi ) = V (uit) = σ2u ∀t

4. Hypothese 4 : ∀t 6= s, les erreurs ne sont pas autocorrelees conditionnellement

a toutes les variables explicatives et aux effets fixes : Cov(uit, uis |Xit, θi ) = 0

5. Hypothese 5 : les erreurs sont independamment et identiquement distribuees

normalement, conditionnellement a Xit et a θi : uit ∼ N (0, σ2u)

Transformation «between» Une autre alternative a l’estimation en difference premiere

serait d’utiliser la transformation «between». Cette methode consiste a appliquer les

MCO au modele (2.7) en incluant une constante.

yi = β0 + β1xi1 + β2xi2 + ..... + βkxik + θi + ui

= x′iβB + θi + ui,

avec βB le vecteur des coefficients de pentes du modele. Comme on peut facilement

le remarquer, il y a plus de parametres a estimer que d’observations1 : on a N +

K parametres a estimer tandis qu’on n’a N observations. Le modele n’est donc pas

estimable.1Habituellement, lorsqu’il n’y a pas d’effets fixes, le modele est estimable. Mais, a cause de la

presence des effets fixes, il n’y a pas suffisamment d’observations pour que le modele soit estimable.


Transformation a effets fixes ou estimation en difference premiere ?

Parmi les estimateurs a effets fixes (estimateur «within» et estimateur «between»),

lequel choisir ? Comme on peut le constater, l’estimateur «between» ignore une quantite

importante d’information sur les changements dans le temps des variables. Dans un tel

contexte, l’estimateur «within» serait preferable a l’estimateur «between».

Parmi les differentes methodes (transformation a effets fixes et methode en difference

premiere), laquelle choisir ? Lorsqu’on a un panel a deux periodes, les estimateurs a ef-

fets fixes et en difference premiere sont identiques. On choisira alors l’estimateur qui

est plus facile a implementer (estimateur en difference premiere). Si le modele com-

porte plus de deux periodes, alors les estimateurs a effets fixes et en difference premiere

ne sont plus les memes. Les deux estimateurs etant sans biais, le critere de selection

sera celui de l’efficacite. Ceci suppose l’hypothese d’homoscedasticite du terme d’er-

reur. En l’absence d’autocorrelation du terme d’erreur uit, l’estimateur a effets fixes est

superieur a l’estimateur en difference premiere. Dans beaucoup d’applications, l’esti-

mateur a effets fixes est beaucoup plus utilise que celui en difference premiere. Mais

si on a une autocorrelation serielle positive, et si uit suit une marche aleatoire, alors

4uit n’est pas seriellement correlee. Dans ce cas, l’estimateur en difference premiere est

meilleur a l’estimateur a effets fixes. Dans le cas contraire, il n’est pas souvent facile de

faire une comparaison des deux types d’estimateurs (Baltagi (1995), Woodridge (2002)

, Woodridge (2003),....). Mais si les Xis sont correles avec uit pour t 6= s, les deux types

d’estimateurs ne sont plus convergents. On peut utiliser le test de Hausman (1978) pour

verifier s’il y a effectivement une correlation entre les Xis et les uit.

Modele a effets aleatoires

Considerons le modele suivant :

yit = β0 + β1xi1t + βkxi2t + .... + β1xikt + θi + uit t = 1, 2, ....T (2.9)

= X ′itβRE + θi + uit, (2.10)

avec βRE le vecteur des coefficients de pentes du modele a effets aleatoires. On pourrait

toujours inclure des variables binaires pour prendre en compte l’heterogeneite entre les

periodes, mais par souci de simplification, nous nous limiterons au cas simple. Supposons

que l’effet inobservable θi est aleatoire et qu’il n’est pas correle avec les variables explica-

tives. Ainsi, l’effet inobservable devient un autre terme d’erreur. Posons : vit = θi +uit ;

soit le vecteur des nouveaux termes d’erreur : vi = (vi1, vi2, .....viT ). Supposons que

E (v′ivi) = Ω.


L’estimation du modele exige que les hypotheses suivantes soient satisfaites pour

avoir la convergence de de l’estimateur de βRE :

1. Hypothese d’exogeneite stricte des variables explicatives : E (uit |Xi, θi ) = 0

2. Hypothese d’orthogonalite entre l’effet inobservable et les variables explicatives

observees : E (θi |Xi ) = E (θi) = 0

3. Condition de rang : rang [E (X ′iΩXi)] = k

Ces trois conditions permettent d’avoir la convergence de l’estimateur.

4. On peut ajouter d’autres hypotheses afin d’avoir une forme particuliere pour la

matrice de variance covariance :

E(u2

it

)= σ2

u t = 1, 2, ....T

E (uiu′i |Xi, θi ) = σ2

uIT

E (uitujs) = 0 ∀ t 6= s ou i 6= j,

E(θ2

i |Xi

)= σ2

θ

V (vit) = σ2θ + σ2

u, Cov(vit, vis) = σ2θ ∀t 6= s

Cov(vit, vjs) = 0 ∀t et s si i 6= j.

Sous l’hypothese (4), nous avons une autocorrelation serielle positive et les MCO ne

sont pas appropries puisque les tests d’hypothese qui en decouleront seront invalides.

Pour eliminer la correlation serielle, on utilise les MCG. L’estimateur des MCG est

donne par :

βRE =

(N∑

i=1

X ′iΩ

−1Xi

)−1( N∑

i=1

X ′iΩ

−1yi

).

Sous ces hypotheses, l’estimateur de βRE sera convergent et efficace. Fuller et Battese

(1974) ont demontre que l’estimateur MCG peut aussi s’obtenir en deux etapes en

estimant par MCO le modele en quasi-difference. Soit λ = 1−[

σ2u

σ2u+Tσ2

θ

]1/2

(0 ≤ λ ≤ 1).

Soit vit = θi + uit. La transformation s’effectue de la facon suivante :

yit = β0 + β1xi1t + β1xi2t + .... + β1xikt + vit

yit = β0 + β1xi1t + β1xi2t + .... + β1xikt + vit

λyit = λβ0 + β1λxi1 + β1λxi2 + .... + β1λxik + λvi

yit − λyit = β0 (1 − λ) + β1 (xi1t − λxi1t) + .... + β1 (xikt − λxik) + (vit − λvi) .

On applique ensuite les MCO a la derniere equation. Le modele transforme contient les

cas limites suivants :


1. λ = 1 correspond a l’estimation a effets fixes

2. λ = 0 correspond aux MCO empiles.

Effets fixes ou effets aleatoires

Apres avoir defini les deux types d’effets (fixes et aleatoires), lequel choisir ? Si on

ne peut pas considerer les observations comme des tirages aleatoires a partir d’une

grande population (donnees sur des etats ou sur des provinces), alors les θi seraient des

parametres a estimer ; donc un modele a effets fixes serait approprie. Utiliser un modele

a effets fixes equivaut a permettre differentes constantes pour chaque observation. Dans

les situations ou le vecteur Xt ne varie pas beaucoup dans le temps, les methodes

d’estimation a effets fixes ou en difference premiere peuvent donner des estimes imprecis.

Si on decide de traiter θi comme une variable aleatoire, l’on doit savoir si les θi sont

correles ou non avec les variables explicatives. Certains auteurs croient qu’en supposant

que les θi sont aleatoires, cela signifie automatiquement qu’un modele a effets aleatoires

est approprie. Si on peut supposer que les θi ne sont pas correles avec les variables

explicatives, alors la methode a effets aleatoires est appropriee. Mais si les θi sont

correles avec une ou plusieurs variables explicatives, alors les methodes a effets fixes

ou en difference premiere sont preferables. Si l’on utilise cependant le modele a effets

aleatoires, les estimateurs des coefficients de pente ne seront pas convergents.

La comparaison des estimateurs a effets fixes ou aleatoires peut se faire par l’in-

termediaire d’un test pour savoir s’il existe une correlation entre les θi et les Xit. Il

s’agit du test d’endogeneite de Hausman (1978). Hausman a propose un test base sur la

difference entre les estimateurs a effets fixes et les estimateurs a effets aleatoires. Comme

l’estimateur a effets fixes est convergent lorsque θi et Xit sont correles, et que l’estima-

teur a effets aleatoires ne l’est pas, un test statistiquement significatif s’interpreterait

comme une evidence contre l’hypothese d’effets aleatoires.

Enfin, on peut noter que l’estimateur a effets fixes peut poser des problemes d’identi-

fication car les effets fixes sont specifiques aux individus et ils doivent tous etre estimes.

Plus il y a d’observations, plus on aura des effets fixes a estimer et plus le probleme

d’identification va se poser. Lorsqu’on suppose que les effets sont fixes, donc un intercept

specifique a chacun des N individus, plus N augmente, plus il y aura de parametres a

estimer : c’est le probleme de parametres d’incidence. Ce probleme est resolu lorsqu’on

utilise l’approche par la differenciation pour eliminer ces parametres. Cependant, si on

suppose qu’en plus des constantes, les coefficients de pentes sont fixes et specifiques aux

individus, le probleme de parametres incidents devient difficile a resoudre, rendant les


estimateurs non convergents. (Hsiao (2001), Wooldridge, (2002)).

2.5 Methodes d’estimation des modeles a choix dis-

cret avec des panels

Certains auteurs se sont interesses a l’estimation de modele a variable dependante

discrete avec des panels. Nous retenons le modele suivant de Wooldridge (2002) comme

modele illustratif :

y∗it = Xitβ + θi + εit t = 1, 2, ....T i = 1, .....N

yit =

1

0

si y∗it > 0

sinon

P (yit = 1 |Xit, θi ) = G (Xitβ + θi) ,

avec : y∗it une variable latente inobservable, Xit est un vecteur de variables exogenes. Le

terme d’erreur εit peut suivre une loi normale (standard) ou logistique. La fonction G

est une densite cumulative de la loi du terme d’erreur. Le terme θi est un effet individuel

inobservable. Comme dans le cas lineaire, l’effet inobservable peut etre fixe ou aleatoire.

S’il est suppose fixe, il devient alors un parametre a estimer en meme temps que β. Le

probleme de parametres incidents peut se poser, rendant les estimateurs parfois non

convergents (Neyman et Scott (1948), Chamberlain (1984), Arellano et Honore (2001),

Honore (2002), Wooldridge (2002)). Si le terme d’erreur εit suit une loi normale, alors la

probabilite serait P (yit = 1 |Xit, θi ) = Φ (Xitβ + θi), avec Φ(.) la densite cumulative de

la normale. Les parametres du modele peuvent etre estimes par la methode du maximum

de vraisemblance. Cependant, plus N est grand, plus il y aura de parametres a estimer.

Cela pourrait causer un probleme d’identification si N est tres grand et que T est faible

comme c’est le plus souvent le cas ; le probleme de parametres d’incidence peut alors se

produire avec les modeles discrets. Le modele probit ne semble pas approprie lorsque les

effets inobservables sont fixes mais il serait mieux indique en presence d’effets aleatoires.

Le logit est plus approprie lorsqu’il s’agit d’effets fixes. La sous-section suivante presente

l’approche proposee par Chamberlain (1984).


2.5.1 Estimation du logit a effets fixes et aleatoires : le maxi-

mum de vraisemblance conditionnel

Lorsque les effets sont fixes, la forme de la fonction de vraisemblance devient :

L =T∏

t=1

N∏

i=1

[Λ (xitβ + θi)

yit [1 − Λ (xitβ + θi)]1−yit

], (2.11)

ou Λ est la densite cumulative de la loi logistique. Andersen (1973) et plus recemment

Hsiao (2003) ont montre que pour T = 2, l’estimateur de β obtenu en maximisant le

log-vraisemblance (2.11) tend asymptotiquement vers 2β quand N −→ ∞. Donc, l’es-

timateur du maximum de vraisemblance n’est pas convergent en presence d’effets fixes.

Chamberlain (1984), Lee (2000) et Wooldrige (2002) ont estime le modele logit a effets

fixes par le maximum de vraisemblance conditionnel. Ils n’imposent aucune restriction

sur l’effet inobservable mais eliminent cet effet en se servant d’un sous ensemble des va-

leurs prises par la variable dependante. Supposons que T = 2. L’approche du maximum

de vraisemblance conditionnel consiste a trouver une statistique exhaustive pour θi2.

Lorsque yi1 + yi2 =∑

yit = 0 ou 2, la contribution a la vraisemblance de ces observa-

tions est nulle car la probabilite correspondant a ces valeurs est egale a 1 (θi = −∞ ou

∞ respectivement). (Voir Hsiao (1992) pour une demonstration detaillee). L’ensemble

des alternatives pour lesquelles yi1 + yi2 = 1 = ni (ni etant le nombre de fois dans le

temps que l’individu n a choisi la modalite i, en d’autres termes : ni =T∑

t=1

yit), a par

contre une contribution dans la fonction de vraisemblance. Cet ensemble est (0, 1) et

(1, 0). Soit :

wi = 1 si (yi1, yi2) = (0, 1)

= 0 si (yi1, yi2) = (1, 0).

Alors, les probabilites conditionnelles sont :

P (wi = d |yi1 + yi2 = 1) =exp [(xi2 − xi1) β]d

1 + exp [(xi2 − xi1) β]

d = 0, 1

P (yi2 = 1 |xi, θi, yi1 + yi2 = 1) = Λ [(xi2 − xi1) β]

P (yi1 = 1 |yi1 + yi2 = 1) = 1 − Λ [(xi2 − xi1) β] ,

avec Λ(.) la fonction de densite cumulee de la loi logistique. La fonction log-vraisemblance

est alors :

L = 1 [ni = 1] (wi log Λ [(xi2 − xi1) β] + (1 − wi) log (1 − Λ [(xi2 − xi1) β])) .

2Soit Y la matrice contenant les donnees. s(Y ) est une statistique exhaustive pour un parametre θ

si la loi conditionnelle de Y sachant s ne depend pas de θ (Gourieroux et Monford, 1996).


Comme on peut le remarquer, la fonction log-vraisemblance ne depend plus des pa-

rametres d’incidence (θi). L’approche se generalise pour tout T > 2 ; on exclut l’en-

semble des alternatives pour lesquelles∑

t yit = 0 ou∑

t yit = T , puisqu’elles ne contri-

buent pas a la vraisemblance. Pour les autres ensembles, une statistique exhaustive de

ci serait∑

t yit = ni. La log-vraisemblance serait de la forme :

L = log

exp

(T∑

t=1

yitxitβ

)[∑

a∈Ri

dtxitβ

]−1 ,

avec Ri le sous-ensemble de RT tel que dt = (0, 1) ,∑

t dt = ni.

Une limite a cette approche qui est semiparametrique est qu’il n’est pas possible

d’evaluer les effets partiels moyens qui sont pourtant important pour les modeles discrets

(Wooldridge, 2002).

2.5.2 Probit a effets aleatoires

Comme il a ete souligne auparavant, le probit a effets fixes est sujet au probleme de

parametres d’incidence. Pour cette raison, le probit est plus approprie lorsque les effets

sont aleatoires. Wooldridge (2002) a formule un modele probit bivarie a effets aleatoires

en supposant dans un premier temps que l’effet inobservable n’est pas correle avec les

variables explicatives. Il suppose plus precisement que l’effet inobservable suit une loi

normale de moyenne nulle et de variance constante : ci |xit ∼ N (0, σ2c ). La densite de

l’observation i a la periode t est definie par :

f(y1, y2, ....yT ; β, σ2

c

)=

∞∫

−∞

[T∏

t=1

(Φ (xitβ + c)yt [1 − Φ (xitβ + c)]1−yt

) 1

σc

φ

(c

σc

)dc

].

Cette densite comporte une integrale et son evaluation necessite des methodes numeriques.

Lorsqu’il s’agit d’un modele probit polytomique avec J modalites, il y aura une integrale

de dimension (J − 1). La presence d’integrales multiples rend l’estimation du probit as-

sez complexe. Une alternative serait la methode par simulation qui consiste a remplacer

les integrales par des sommes en faisant des tirages dans des lois donnees (Paquet

(2002)).

Il existe aussi dans la litterature des methodes d’estimation du modele probit avec

l’hypothese de correlation entre variables exogenes et l’effet inobservable. Chamberlain

(1980) fut le premier a proposer un tel modele. Wooldridge (2002) s’est egalement

interesse au meme modele en se basant sur l’approche de Chamberlain (1980). La


difference avec le probit a effets aleatoires et exogeneite stricte vient du fait que la loi

de l’effet aleatoire depend des exogenes du modele. Ainsi, l’esperance de l’effet aleatoire

n’est plus nulle mais depend des exogenes du modele.

2.5.3 Methodes d’estimation de modeles dynamiques avec des

panels

Comme dans le modele statique ou il a ete question de faire la distinction entre les

modeles lineaires a effets fixes et les modeles lineaires a effets aleatoires, nous faisons

ici aussi la meme distinction avec les modeles lineaires dynamiques. Un certain nombre

d’auteurs se sont interesse a l’estimation des modeles lineaires dynamiques a effets fixes.

Parmi eux, citons : Balestra et Nerlove (1966), Nickell (1981), Anderson et Hsiao (1982),

Arellano (1988), Sevestre et Trognon (1992), Arellano et Bond (1991), Wooldridge (2000

et 2002) et Lee (2000), etc... Soit le modele autoregressif d’ordre un ou AR(1) defini

par :

yit = ρyi,t−1 + x′itβ + θi + εit t = 1, 2, ....T i = 1, .....N, (2.12)

ou θi est un effet inobservable et εit un terme d’erreur. Selon Lee (2000), l’hypothese de

stationnarite (|ρ| < 1) n’est pas habituellement necessaire pour les inferences lorsque

T est fixe. Mais, l’hypothese |ρ| < 1 est pertinente pour la plupart des applications

empiriques. Lorsque les variables explicatives ne sont pas correlees avec l’effet fixe et

qu’il n’y a pas de variable endogene retardee dans le modele, alors l’estimation du

modele selon la transformation within de β est convergente. Cependant, si l’on inclut

une variable endogene retardee dans le modele, l’estimateur des MCO du modele selon

la transformation within de β n’est plus convergent lorsque T est faible (Nickell 1981).

Cependant, si T est grand, cet estimateur est convergent (Voir Lee (2000) pour plus

de details). Dans les etudes empiriques, T est souvent fixe de sorte qu’il est necessaire

de trouver un estimateur pour ce type de probleme. Pour resoudre ce probleme de

non convergence, on peut utiliser la methode a variables instrumentales (Anderson et

Hsiao (1982), Arellano (1988), Sevestre et Trognon (1992), Arellano et Bond (1991)).

Cependant, le choix des instruments n’est pas toujours facile. Il existe essentiellement

deux criteres de choix des instruments (Lee, 2000) :

- le degre de correlation serielle entre les termes d’erreurs

- l’exogeneite des variables explicatives.

La methode a variables instrumentales est assez limitee compte tenu des difficultes

liees au choix des instruments. Plusieurs auteurs se sont interesses a la recherche de

bons instruments selon les differents cas possibles, Lee (2000) en donne un resume.


En ce qui concerne les modeles a effets aleatoires dynamiques, ils peuvent etre es-

times par la methode des moindres carres generalises qui ne prend cependant pas en

compte l’information sur la premiere observation de la variable dependante (qui est yi0).

L’introduction de la variable endogene retardee necessite de prendre en consideration la

premiere observation : on parle alors de condition initiale (Heckman , 1981). Wooldridge

(2000) et Lee (2000) demontrent l’importance de yi0 sur le comportement asymptotique

de l’estimateur de β pour T fixe et N grand. Pour cette raison, on privilegie les methodes

qui prennent en compte la premiere observation. Barghava et Sargan (1983) proposent

un estimateur par maximum de vraisemblance inconditionnel qui tient compte de yi0.

Chamberlain (1984), Blundell et Smith (1991), Sevestre et Trognon (1990) adoptent

egalement l’approche par le maximum de vraisemblance inconditionnel. Arellano et

Bover (1995), Blundell et Bond (1998), Haln (1999) et Im et al. (1999) utilisent la

methode des moments generalises. Cependant, les differentes methodes proposees sont

peu flexibles et complexes surtout lorsqu’il s’agit de modeles non lineaires. Wooldridge

(2000) propose alors une methode plus flexible surtout avec les modeles non lineaires :

le maximum de vraisemblance conditionnel. Cette methode a egalement ete utilisee

par Lee (2000). La methode du maximum de vraisemblance conditionnelle proposee

consiste a definir la densite marginale de l’effet inobservable en fonction de la premiere

observation, de sorte qu’il n’est plus necessaire de definir la densite de cette derniere :

f (y1i, y2i, ....yT i; β, θ) =

∫

Rm

f (y1i, y2i, ....yT i |yi0, θ, xit ) h (c |yi0, xit, λ0 ) dθ

=

∫

Rm

T∏

t=1

f (yit |yi0, θ, xit ) h (θ |yi0, λ0 ) dθ,

ou Rm indique une integration sur tout le domaine de R avec m la dimension de c.

f (yit |yi0, c, xit ) est la densite de yit conditionnelle aux variables exogenes et a l’obser-

vation initiale yi0. h (c |yi0, λ0 ) est la densite marginale de l’effet aleatoire qui depend

de l’observation initiale. La fonction log-vraisemblance a maximiser est alors egale a :

L =N∑

i=1

log

∫

Rm

T∏

t=1

f (yit |yi0, c, xit ) h (a |yi0, λ0 ) da,

ou a est le terme d’erreur de l’equation de l’effet aleatoire. On pourrait aussi considerer

le modele (2.12) comme un modele avec de l’heteroscedasticite ou le terme d’erreur

serait : ηit = θi + εit. Cette facon de proceder permet de se debarrasser de l’integrale

lorsque m = 1.

L’estimation des modeles non lineaires est plus facile lorsqu’on utilise l’approche

du maximum de vraisemblance conditionnelle proposee par Andersen (1973) et utilisee

entre autres par Chamberlain (1984), Wooldridge (2000, 2002),... Le logit a effets fixes


semble assez complexe a estimer en presence de variable endogene retardee a cause

essentiellement du probleme de parametres d’incidence. Les modeles a effets aleatoires

semblent mieux appropries lorsqu’on inclut une variable endogene retardee dans le

modele (Lee, 2000).

2.5.4 Approche semiparametrique

L’estimation du logit a effets fixes avec donnees de panel n’impose pas de loi sur l’ef-

fet inobservable. De ce fait, le logit a effets fixes peut etre considere comme un modele

semiparametrique. L’approche semiparametrique consiste a ne pas imposer d’hypothese

sur la distribution du terme d’interet (terme d’erreur du modele ou effets inobservables).

Certains auteurs ont propose d’utiliser l’approche semiparametrique pour estimer les

modeles non lineaires avec donnees de panel : Manski (1987), Honore et Kyriazidou

(2000), Arellano et Honore (2001), Honore (2002). La plupart de ces auteurs utilisent la

regression par les noyaux. Comme l’a souligne Lee (2000), l’approche semiparametrique

est limitee essentiellement pour deux raisons : la premiere etant le probleme de la

convergence (la convergence peut ne pas se faire au rythme de√

N , on parlera de la

malediction de la dimensionnalite) ; la seconde limite vient du fait que l’approche semi-

parametrique ne permet pas de calculer les effets partiels ou les effets partiels moyens

(average partial effects) qui semblent assez importants lorsqu’il s’agit des probabilites

de choix.

2.5.5 Correction de biais de selection de donnees de panel

Quoique les modeles avec des panels soient largement utilises en economie, il existe

peu de travaux concernant l’estimation de ces modeles en presence de probleme de

selection. (Vella et Verbeek 1999). De plus, les donnees de panel permettent de traiter

le probleme d’heterogeneite entre les observations, de sorte que le probleme de selection

et la question de l’heterogeneite non observee doivent parfois etre resolus simultanement

(Hausman et Wise (1979), Nijman et Verbeek (1992), Rosholm et Smith (1994)). La

plupart des auteurs qui se sont interesses a ce probleme ont utilise soit l’estimation par

le maximum de vraisemblance en information complete ou l’estimation en deux etapes

(maximum de vraisemblance conditionnelle ou methode des moments conditionnels).

Verbeek et Nijman (1992) et Wooldridge (1995) supposent la normalite du terme d’er-

reur du modele et de l’effet inobserve (conduisant a l’estimation par le maximum de

vraisemblance) tandis que Kyriazidou (1997 et 2001) ecarte cette hypothese pour utili-

ser l’approche en deux etapes proposee par Heckman (1974 et 1976). Vella et Verbeek


(1999) utilisent aussi l’approche en deux etapes (moments conditionnels et maximum

de vraisemblance en information limitee) dans le but de contourner les difficultes liees

au maximum de vraisemblance en information complete. Wooldridge (2005) considere

un modele a effets fixes qu’il estime en utilisant les doubles moindres carres lineaires.

A notre connaissance, il n’y a pas encore eu de travaux qui aient traite simul-

tanement l’heterogeneite non observee et le probleme de selection et/ou d’endogeneite

avec donnees de panel en supposant un modele polytomique pour l’equation de selection.

Pour ce travail, nous essayerons d’estimer un modele de pseudo-panel qui prend en

compte ces problemes.

Comme nous l’avons precise auparavant, nous ne disposons pas de donnees de pa-

nel. Un des objectifs de cette these est d’exploiter les differentes donnees d’enquetes

independantes disponibles pour obtenir des panels synthetiques ou pseudo-panels. Les

menages de chaque enquete apparaissent une seule periode et ne sont plus retracables

dans les autres periodes d’enquete. Il existe dans la litterature des techniques permet-

tant d’avoir des pseudo-panels a partir de plusieurs coupes transversales independantes.

La section suivante fait la synthese des travaux portant sur ce sujet.

2.6 Methodes d’estimation des donnees longitudi-

nales incompletes

Nous avons presente dans les sections precedentes les outils pour le traitement

des donnees de panel balancees ou completes. Cela va nous permettre d’aborder le

probleme des donnees de panel incomplets. Si nous arrivons a resoudre le probleme

de donnees incompletes, alors, nous pourrons etendre certaines methodes d’estimation

des panels complets aux panels incomplets. Nous disposons en effet de quatre bases de

donnees d’enquetes independantes d’Hydro-Quebec portant toutes sur la consomma-

tion d’electricite des menages quebecois (enquete de 1989, 1994, 1999 et 2002). Nous

cherchons a capter les aspects dynamiques ou intertemporels de la consommation des

menages etant donne que ces derniers utilisent des biens durables pour satisfaire leurs

besoins en energie. A defaut de vraies donnees de panel, il est possible de creer des

pseudo-panels pour atteindre nos objectifs. Nous nous interesserons dans un premier

temps aux etudes portant sur les pseudo-panels conventionnels (selon l’approche de

Deaton (1985)) et dans un second temps, nous aborderons les etudes portant sur les

pseudo-panels obtenus par la simulation (approche bayesienne).


2.6.1 Les donnees longitudinales incompletes

Lorsque les bases de donnees disponibles comportent de l’information manquante,

on parlera alors de donnees longitudinales incompletes. L’information manquante peut

concerner soit des variables d’un certain nombre d’individus pour certaines periodes,

ou soit certaines observations de la dimension transversales ne sont pas observees a

certaines periodes. Ainsi, l’information manquante peut etre partielle ou totale pour

certaines observations a certaines periodes. Par exemple, dans les etudes empiriques,

il peut arriver que la base de donnees disponible soit composee d’individus observes

sur toutes les periodes ; cependant, il peut y avoir aussi des individus pour lesquels

certaines variables ne sont pas observables (variables explicatives et/ou dependantes).

Certains individus peuvent aussi ne pas etre observables a certaines periodes. Dans le

cas extreme, il s’agit de coupes transversales independantes ou les unites sont observees

une seule fois contrairement aux donnees de panel ou les individus sont observes a

chaque periode. On parlera alors de panel incomplets.

Les panels incomplets comportent un certain nombre d’avantages (avantages ob-

serves aussi avec les panels) : possibilite d’etudier l’aspect dynamique, richesse de

l’information concernant les variables socio-economiques, possibilite de tenir compte

de l’heterogeneite entre les individus,... Avec les panels incomplets, l’effet d’appren-

tissage est moins probable, etant donne qu’un meme menage se retrouve a moins de

periodes, voir meme une seule periode (cas extreme d’une serie de coupes transver-

sales independantes). Les donnees longitudinales comportent cependant certains in-

convenients essentiellement d’ordre methodologique. Il faut en effet developper des

techniques appropriees pour tenir compte de l’information manquante. A chaque type

d’information manquante (variables manquantes ou individus manquantes a certaines

periodes), il faut utiliser une technique appropriee.

2.6.2 Les pseudo-panels conventionnels

Dans beaucoup de pays, et surtout dans les pays en developpement, il y a tres peu

de donnees de panel ; cependant, il existe beaucoup de series de donnees d’enquete

independantes. Les donnees de panel sont souvent couteuses a collecter puisqu’il faut

suivre les memes individus sur plusieurs periodes (annee, mois, jour,...). De plus, les

panels sont sujets au probleme d’attrition. Avec les donnees en coupes transversales, les

individus qui font l’objet de l’enquete changent d’une periode a l’autre de sorte que leur

collecte est beaucoup moins contraignante. C’est pourquoi dans beaucoup de pays, les

donnees de panel sont tres rares ou parfois inexistantes alors qu’il existe d’importantes


donnees de coupes transversales. Mais les coupes transversales ne permettent pas de

suivre un individu donne dans le temps pour pouvoir capter les aspects dynamique ou

intertemporel de son comportement. Comment donc se servir de ces coupes transversales

pour pallier au manque de donnees de panel ?

Deaton (1985) fut le premier a proposer une solution a ce probleme. Il suggere de

remplacer les observations par des moyennes de cohortes. Une cohorte est definie comme

un ensemble d’individus ayant des caracteristiques communes. Si l’individu ne peut pas

etre suivi dans le temps, la cohorte peut par contre etre suivie dans le temps. Il suppose

un modele lineaire dans les parametres. Si le modele dans sa version individuelle contient

des effets fixes, alors sa version de cohortes aura aussi des effets fixes. Etant donne que

l’on dispose d’echantillon de cohortes et non de la population entiere de cohortes, les

moyennes des cohortes sont une approximation des moyennes de la population et par

consequent, sont des variables avec des erreurs de mesure. L’estimation de ce type de

modele necessite des techniques d’estimation appropriees aux variables avec erreurs de

mesure. Au lieu d’avoir de vrais panels, Deaton propose de constituer des pseudo-panels

composees de cohortes d’individus. Cela n’implique pas necessairement que les resultats

qui en decouleront seront inferieurs a ceux qu’on obtiendrait si on disposait de vraies

donnees de panel. On sait en effet que les panels souffrent frequemment de probleme

d’attrition. Il peut arriver que certains individus decident de quitter le groupe faisant

l’objet de l’enquete pour differentes raisons. Ces departs font qu’il n’est pas possible

d’observer certains individus a partir d’une periode donnee. Avec les pseudo-panels, ce

probleme est ecarte puisque les individus ne sont plus les memes d’une periode a l’autre.

Le probleme d’attrition ne se pose plus avec les pseudo-panels. De plus, on peut etendre

le nombre de periodes avec les pseudo-panels si ont dispose de coupes transversales

sur ces periodes. Dans les travaux anterieurs portant sur les pseudo-panels, on peut

distinguer les modeles lineaires et les modeles non lineaires (choix discrets) comme

dans le cas des vrais panels. Nous aborderons d’abord les methodes d’estimation des

modeles lineaires (statiques et dynamiques) et ensuite celles des modeles non lineaires.

2.6.3 Modeles lineaires statiques

Plusieurs auteurs se sont penches sur l’estimation de modeles statiques avec des

pseudo-panels. Partons du modele propose par Deaton (1985) :

yht = xhtβ + θh + vht (2.13)

ou xht est un vecteur de variables explicatives, θh est l’effet fixe et yht est la variable

dependante, l’indice h indique le menage et t indique le temps. Deaton propose de


constituer des cohortes d’individus ayant des caracteristiques communes. Le modele

sous sa version moyennes de cohortes s’ecrit :

yct = xctβ + θct + vct (2.14)

yct =1

nc

∑

h∈c

yht vct =1

nc

∑

h∈c

vht, (2.15)

avec nc la taille de la cohorte c, θct est la moyenne des effets fixes des membres de la

cohorte c. Notons que ce terme est fonction du temps contrairement aux effets fixes

non observes de la moyenne de population de cohortes. Cela s’explique par le fait qu’on

n’observe pas les memes individus d’une periode a une autre, donc, la moyenne de

la cohorte est fonction du temps. Il peut arriver que les variables explicatives soient

correlees avec θct. Il est donc important de specifier le type d’effets a inclure dans le

modele (effets fixes ou aleatoires). Nous avons vu que dans le cas de vrais panels ce

choix n’est pas souvent facile, il en est de meme avec les pseudo-panels. Les effets fixes

peuvent conduire aux problemes d’identification alors que les effets aleatoires peuvent

produire des estimateurs non convergents si la correlation potentielle entre les effets

inobservables et les variables explicatives (si elle existe) n’est pas prise en compte. Pour

ces raisons, le modele (2.14) n’est pas approprie pour avoir des estimateurs convergents,

a moins que la taille des cohortes soit suffisamment grande de sorte que θct soit une

bonne approximation de θc. Dans ce cas, le modele (2.14) peut etre estime en remplacant

les θct par des variables binaires specifiques‘aux cohortes. Deaton (1985) propose une

approche alternative a ce probleme. Lorsque le nombre d’observations dans chaque

cohorte n’est pas suffisamment grand, on peut ecrire la version du modele (2.13) avec

les vraies moyennes de la population de cohortes de la facon suivante :

y∗ct = x∗

ctβ + θc + v∗ct. (2.16)

y∗ct et x∗

ct sont les moyennes non observables de la population de la cohorte c et θc

est l’effet specifique a la cohorte c. Puisque la vraie moyenne de la population d’une

cohorte est la meme dans le temps, θc est constant dans le temps. Si les moyennes

de la population de cohortes etaient observables, l’equation (2.16) peut etre utilisee

pour estimer β en se basant sur les methodes d’estimation des donnees de panel, panel

compose de C cohortes sur T periodes. Cependant, les moyennes des cohortes yct et xct

sont des mesures imparfaites des vraies moyennes de la population de cohortes (y∗ct et

x∗ct). Donc, yct et xct sont des variables avec erreurs de mesure des vraies moyennes de

la population. Pour l’effet inobservable, Deaton suppose qu’il ne contient pas d’erreur

de mesure. Il suppose que les variables avec erreurs de mesure, yct et xct suivent une loi

normale definie comme suit :

(yct

xct

)∼ N

[(y∗

ct

x∗ct

);

(σ00 σ′

σ Σ

)].


Verbeek et Nijman (1993) definissent une classe d’estimateurs pour β indexe par un

parametre α ∈ [0, 1] comme suit :

β = (Mxx − αΣ)−1 (Mxy − ασ)

avec :

Mxx =1

CT

T∑

t=1

C∑

c=1

(xct − xc)′ (xct − xc)

Mxy =1

CT

T∑

t=1

C∑

c=1

(xct − xc)′ (yct − yc)

xc =1

T

T∑

t=1

xct et yc =1

T

T∑

t=1

yct.

L’estimateur propose par Deaton (1985) qui corrige pour la presence d’erreurs de mesure

est obtenu en fixant α = 1 :

β =

[T∑

t=1

C∑

c=1

(x′cxc − Σ)

]−1 [ T∑

t=1

C∑

c=1

(x′cyc − σ)

].

Dans la pratique cependant, les problemes d’erreurs de mesure sur les variables sont

ignores des lors que la taille de chaque cohorte est suffisamment grande ; la variation

temporelle des effets non observables est alors ignoree. L’estimateur le plus souvent

utilise est l’estimateur «within». Il est caracterise par α = 0 :

βW =

[T∑

t=1

C∑

c=1

(xct − xc)′ (xct − xc)

]−1 [ T∑

t=1

C∑

c=1

(xct − xc)′ (yct − yc)

].

Cet estimateur est connu sous le nom d’estimateur «within» car il utilise l’information

provenant de la variabilite entre les observations d’une meme cohorte. Pour que cet

estimateur converge, Verbeek et Nijman (1992) montrent qu’il faut que la taille des

cohortes soit suffisamment grande en plus des deux conditions d’orthogonalite suivantes3 :

p limnc−→∞

1

CT

T∑

t=1

C∑

c=1

(xct − xc) vct = 0

p limnc−→∞

1

CT

T∑

t=1

C∑

c=1

(xct − xc) θct = 0.

3nc provient de l’expression de la moyenne : xct = 1

nc

∑h∈c xht


Ils utilisent des donnees sur les depenses de consommation pour montrer que le biais

provenant des erreurs de mesure devient negligeable lorsque la taille des cohortes est

grande (100, 200 individus).

Collado (1997) estime plusieurs modeles avec des pseudo panels. Elle estime d’abord

un modele statique lineaire avec effets aleatoires. Son modele est le suivant :

yit = x′itβ + θi + vit (2.17)

θi ∼ iid(0, σ2

θ

)vit ∼ iid

(0, σ2

v

)

E (xitvis) = 0 ∀ t, s.

Si les effets individuels sont correles avec les variables explicatives et si on dispose de

coupes transversales independantes, le modele ne peut pas etre estime en utilisant les

techniques des donnees de panel. Supposons que l’equation (2.17) s’ecrive avec les vraies

moyennes de la population de cohortes de la facon suivante :

y∗ct = x∗′

ctβ + θ∗c + v∗ct (2.18)

θ∗c ∼ iid(0, σ2

θ∗)

vct ∼ iid(0, σ2

v∗).

Ce modele ne peut pas etre directement estime car les vraies moyennes de la po-

pulation de cohortes ne sont pas observables. Cependant, l’on observe des moyennes

d’echantillons de cohortes definies comme suit :

yct = y∗ct + ζct

xct = x∗ct + ηct,

ou ζct et ηct sont des erreurs de mesure dont la loi conjointe est :

(ζct

ηct

)∼ iid

((0

0

),

1

nc

[σ2

ζ σ′ηζ

σηζ Ση

]), (2.19)

ou nc est le nombre d’individus par cohorte ; on suppose pour simplifier, qu’il est le

meme pour toutes les cohortes. La matrice des erreurs de mesure dans l’equation (2.19)

est generalement inconnue mais peut etre estimee en se servant des donnees. L’equation

(2.18) peut se reecrire de la maniere suivante :

yct = x′ctβ + θ∗c + uct (2.20)

uct = v∗ct + ζct − η′

ctβ.

Pour estimer ce modele, Collado (1997) utilise l’estimation en difference premiere pour

eliminer les effets aleatoires :

4yc2 = 4x′c2β + 4uc2 (2.21)

.............................

4ycT = 4x′cT β + 4ucT .


Contrairement aux vraies donnees de panel, les variables explicatives du modele (2.21)

sont correlees avec le terme d’erreur a travers les erreurs de mesure. La matrice Zc

definie par :

Zc =

x′c1.....x

′cT

. . .

x′c1.....x

′cT

peut servir comme matrice d’instruments pour ce probleme. Cette matrice est ensuite

utilisee pour estimer les parametres par la methode des moments generalises corrigee

des erreurs de mesure (GMMC). Il est important de noter a ce niveau que l’estimateur

GMMC de β (note βGMMC) obtenu avec un vrai panel coıncide avec l’estimateur «wi-

thin». Cependant, ce resultat ne tient plus lorsqu’on utilise des pseudo-panels. De plus,

cet estimateur n’a pas son equivalent avec les estimateurs obtenus par Deaton (1985).

L’estimateur «within» de Deaton est base sur la restriction suivante :

E((xct − xc)

′ (uct − uc) − Aβ − a)

= 0,

A et a dependent de la matrice de covariance des erreurs de mesure. L’estimateur en

difference premiere de Deaton est base sur la restriction :

E (4xct4uct − Bβ − b) = 0

B et b dependent de la matrice de covariance des erreurs de mesure. Les estimateurs de

Deaton sont donc bases sur des combinaisons lineaires de restrictions sur les moments ;

par consequent, l’estimateur βGMMC est au moins aussi efficace que ceux de Deaton.

2.6.4 Modeles lineaires dynamiques

Moffit (1993) estime un modele dynamique et statique avec effets fixes en utilisant

des variables instrumentales. Son modele est defini comme suit :

yit = αyit−1 + X ′itβ + fi + εit, (2.22)

ou : Xit est un vecteur (K × 1) de regresseurs potentiellement correles avec l’effet fixe

note fi. Si α 6= 0, il s’agit d’un modele dynamique. Precisons que le modele est dit

dynamique des lors qu’on inclut une variable endogene retardee. Si α = 0, il s’agit d’un

modele statique.

Il suppose un vecteur Zi de dimension (L×1) de variables invariantes dans le temps

pour l’individu i. Ces variables peuvent inclure non seulement des variables binaires pour

les cohortes mais aussi des variables socio-demographiques (race, sexe, nombre d’annees


de scolarite, localisation, ...). Soit Wit un vecteur (M × 1) de variables qui varient dans

le temps mais qui ne sont pas correlees avec l’effet fixe fi. Alors, les projections lineaires

sur lesquelles la methode a variables instrumentales est basee sont les suivantes :

X ′it = δ1Wit + δ2Zi + wit (2.23)

fi = Z ′iγ + vi,

avec wit et vi etant des termes d’erreur. Soit : U = [X Z] et U =[X Z

]ou X represente

la prediction de X obtenue suite a une regression par les MCO de l’equation (2.23).

L’estimateur a variables instrumentales de β et de γ est donne par :(U

′U)−1

U′y. La

convergence de cet estimateur exige la condition suivante : p lim[

1NT

U′v]

= 0 avec plim

la probabilite limite et v le vecteur contenant les termes d’erreur vi. Cette condition

equivaut a dire que U est de plein rang (K + L), condition souvent difficile a remplir.

Quant au modele autoregressif (sans effets fixes), Moffit (1993) utilise le meme principe

de variables instrumentales mais en remplacant la variable endogene retardee par sa

valeur predite provenant d’une regression anterieure obtenue par MCO.

Collado (1997) estime un modele dynamique avec effets aleatoires defini comme

suit :

yit = αyit−1 + x′itβ + θi + vit (2.24)

θi ∼ iid(0, σ2

θ

)vit ∼ iid

(0, σ2

v

).

La version avec les vraies moyennes de la population de cohortes est :

yct = αyct−1 + x′ctβ + θ∗c + uct (2.25)

uct = v∗ct + ζct − αζct−1 − η′

ctβ

t = 2, ...T c = 1, ....C.

A la difference de Moffit (1993), Collado utilise la methode des moments generalises

pour corriger les erreurs de mesure. Elle developpe deux types d’estimateurs : l’estima-

teur «within» et l’estimateur en difference premiere. L’estimateur «within» corrige des

erreurs de mesure est convergent seulement si T −→ ∞. Cependant, dans les travaux

empiriques, on ne dispose pas toujours de donnees sur un grand nombre de periodes et

par consequent, l’estimation «within» n’est pas une technique appropriee. L’estimateur

en difference premiere serait une bonne alternative puisqu’il exige que C −→ ∞ pour

avoir la convergence.

Girma (2000) estime egalement un modele dynamique base sur des coupes trans-

versales independantes. Il utilise l’approche en quasi-difference pour deriver son modele


qu’il estime par la methode des moments generalise (GMM). L’avantage avec cette ap-

proche est qu’elle peut etre implementee avec seulement 2 coupes transversales. On

n’a pas besoin d’avoir un grand nombre de coupes transversales sur plusieurs periodes.

McKenzie (2001 et 2004) suppose specifiquement de l’heterogeneite deterministe entre

les cohortes. Le modele qu’il estime est le suivant :

yc(t),t = αc + βcyc(t),t−1 + x′c(t),tγc + wc(t) + uc(t),t (2.26)

yc(t),t = αc + βcyc(t−1),t−1 + x′c(t),tγc + εc(t),t (2.27)

εc(t),t = βc

(yc(t),t−1 − yc(t−1),t−1

)+ wc(t) + uc(t),t.

avec zc(t) = 1nc

∑nc

c=1 znt. L’indice c(t) indique qu’il s’agit de la cohorte c de la periode

t. Sa demarche consiste a etendre le modele de Moffit (1993) tout en incluant des effets

specifiques aux cohortes. Le probleme avec ce modele est que la variable dependante

retardee(yc(t),t−1

)est correlee avec le terme d’erreur. Les estimateurs des MCO sont

biaises. Il propose alors une estimation par MCO en deux etapes qui consistent d’abord

a instrumenter yc(t),t−1 par yc(t−1),t−1 et ensuite a appliquer les MCO. Ce dernier esti-

mateur contient un biais devenant negligeable a mesure que la taille de chaque cohorte

devient grande.

Verbeek et Vella (2004) apportent des critiques importantes aux estimateurs de Mof-

fit (1993), Girma (2000) et McKenzie (2004). Ces derniers utilisent implicitement ou

explicitement l’approche par variables instrumentales pour estimer un modele AR(1)

incluant des variables exogenes. Avec des pseudo-panels, ils remplacent la variable

dependante retardee par un instrument obtenu a partir d’une regression auxiliaire.

Ensuite, ils estiment le modele dynamique de differentes manieres : par la methode des

MCO, les variables instrumentales et les GMM. Le modele de Verbeek et Vella est defini

comme suit :

yc(t),t = αy∗c(t),t−1 + x′

c(t),tβ + ε∗c(t),t

ε∗c(t),t = εc(t),t + α(yc(t),t−1 − y∗

c(t),t−1

).

Une estimation convergente par les MCO exige deux conditions : d’une part que εc(t),t ne

soit pas correle avec y∗c(t),t−1 et d’autre part que l’erreur de prediction

(yc(t),t−1 − y∗

c(t),t−1

)

ne soit pas correlee avec xc(t),t. Ces deux hypotheses peuvent cependant etre problematiques

dans les applications empiriques. La premiere hypothese exclut la possibilite qu’il y ait

des effets de cohortes dans les variables inobservables. Il s’agit d’une hypothese non

raisonnable et trop restrictive pour l’analyse empirique. Pourtant, elle a ete imposee

par Moffit (1993), Girma (2000) et dans une partie des travaux de McKenzie (2004).

Selon donc Verbeek et Vella (2004), l’estimateur propose par Moffit (1993) n’est pas

convergent a moins qu’il n’y ait aucun regresseur invariant dans le temps ou que les

variables exogenes qui varient dans le temps n’aient aucune autocorrelation. Selon Ver-

beek et Vella, l’approche de Girma (2000) utilise une mauvaise approximation de la


variable endogene retardee comme instrument et on n’a aucun gain en utilisant cette

approche assez compliquee. Ils proposent alors un estimateur a variable instrumentale

augmentee en supposant le modele suivant :

yc(t),t = αy∗c(t),t−1 + x′

c(t),tβ + z′c(t)λ + ηc(t),t (2.28)

E(ηc(t),tzc(t)

)= 0,

ou λ est un vecteur de coefficients de variables invariantes dans le temps incluant un

intercept. Ils estiment l’equation (2.28) par la methode des variables instrumentales en

utilisant zc(t) en interaction avec des variables binaires comme instruments. L’estimateur

a variables instrumentales augmentees qu’ils obtiennent a partir de la transformation

«within» est convergent. Cela exige cependant des cohortes de grande taille de sorte

a reduire le biais echantillonnal de l’estimateur. Ce biais existe aussi dans l’estimateur

«within» des modeles dynamiques avec de vrais panels et est meme plus grand que le

biais de l’estimateur «within» avec des pseudo-panels.

2.6.5 Modele de choix discret avec des pseudo-panels

Collado (1998) estime, a partir d’une serie de coupes transversales independantes,

un modele de choix discret avec des effets individuels aleatoires. Elle propose deux types

d’estimateurs : un estimateur a distance minimale et un estimateur de type «within».

Son modele est le suivant :

y∗it = x′

itβ + ηit + vit

yit =

1

0

si y∗it > 0

sinon

ou y∗it est une variable latente inobservable associee a l’individu i a la periode t.

E (ηit |xi1, ..........., xiT ) = x′i1λ1 + ...............x′

iT λT .

Le modele latent sous sa forme reduite est :

y∗it = x′

i1πt1 + ...............x′iT πtT + εit

πts = λs si t 6= s πtt = β + λt si t 6= s.

Comme les donnees disponibles ne sont pas de vrais panels, il faut considerer plutot des

moyennes de cohortes contenant des erreurs de mesure :

y∗ct = x′

c1πt1 + ...............x′cT πtT + ε∗it.


Les parametres θ = (β ′, λ′)′ sont estimes en utilisant un estimateur a distance minimale

defini par :

θMD = arg min [π − π]′ W−1 [π − π] ,

ou π = (π1, ............πT ) et W est n’importe quel estimateur convergent de la variance

asymptotique de π. L’estimateur de type «within» est obtenu a partir du modele sui-

vant :

y∗ct = x∗′

ctβ + η∗ct + v∗

ct

qu’on peut ecrire de facon plus condensee comme suit :

y∗c = X∗′

c β + η∗ce + v∗

c .

Le modele en deviation par rapport aux moyennes intra-cohortes s’ecrit :

y∗c = X∗

c β + v∗c

y∗c = Qy∗

c X∗c = QX∗

c v∗c = Qv∗

c .

L’estimateur de type «within» est defini alors par :

βWG =

(C∑

c=1

X ′cXc

)−1( C∑

c=1

X ′cΠ

′xc

)

Π = (IT β′ + eλ′) .

L’avantage de l’estimateur de type «within» par rapport a l’estimateur a distance mi-

nimale est qu’il est tres facile a calculer et n’exige pas l’estimation des parametres

de nuisances λ. Mais son inconvenient est qu’il est moins efficace que l’estimateur a

distance minimale. L’approche de Collado (1998) oblige a avoir un nombre limite de

cohortes. Dans son experience Monte Carlo, elle a choisi 50 cohortes. Cette taille est

faible (perte d’information) comparativement aux donnees d’enquete pouvant contenir

des milliers d’observations.

Moffit (1993) a aussi estime un modele non lineaire a effets fixes avec des pseudo-

panels. Son modele est defini de la meme maniere que celui de Collado (1998). Mais

sa methode d’estimation est differente. Il estime un modele probit et un modele de

probabilite lineaire. Dans les deux cas, la convergence est atteinte seulement si la taille

des echantillons de coupes transversales tend vers l’infini.

2.6.6 Quelques etudes empiriques ayant porte sur les pseudo-

panels

Les pseudo-panels ont beaucoup servi dans les etudes empiriques depuis l’article de

Deaton (1985). Ils ont permis de mieux analyser la theorie du cycle de vie des agents


economiques, etant donne que cette theorie exige d’avoir de l’information au sujet des

agents sur plusieurs periodes. Browning, Deaton et Irish (1985) ont estime l’offre de

travail et la demande de biens des menages britanniques tout au long de leur cycle de

vie en utilisant des pseudo-panels. Blundell et Meghir (1991) ont estime des modeles de

cycle de vie de l’offre de travail et de la demande de biens avec des pseudo-panels. De

meme, Blundell, Browning et Meghir (1994) ont analyse le comportement des menages

britanniques, tout au long de leur cycle de vie, a partir de pseudo-panels. Alessie et

al. (1997) ont modelise la consommation de biens durables et non durables dans un

contexte intertemporel en se servant de pseudo-panels. L’equation d’Euler qu’ils ont

estime a ete definie au niveau des cohortes. Gardes et al. (1996) ont utilise des coupes

transversales et des pseudo-panels pour estimer les elasticites revenus de court et de

long terme de la consommation des canadiens. Ils ont utilise la transformation «within»

et la transformation «between» avec un modele AIDS (almost ideal demand system)

et QAIDS (quadratic almost ideal demand system) pour obtenir les elasticites. Les

elasticites obtenues par la transformation «within» different significativement de celles

obtenues par la transformation «between». De plus, les elasticites de court terme sont

differentes de celles de long terme, difference qui s’expliquerait par les erreurs de mesure

ou les erreurs de specification. Gardes et Loisy (1997) ont utilise des pseudo-panels

pour estimer l’elasticite du revenu minimum par rapport au revenu declare. Ils ont

cherche a verifier l’hypothese selon laquelle la croissance economique cree de nouveaux

besoins contribuant ainsi au maintien de l’insatisfaction des consommateurs. Ils ont

utilise la transformation «within» et la transformation «between» tout en corrigeant

l’heteroscedasticite qui survient a cause de l’aggregation des menages en cellules de

cohortes.

Gassner (1998) s’est servi de pseudo-panels pour etudier la demande d’acces au

telephone des menages britanniques. Son approche consiste a estimer les parametres

du modele de choix discret en se servant de l’estimateur de type «within». Pour cela,

il a suppose que la variable dependante binaire est une fonction lineaire des variables

explicatives. L’estimateur obtenu est biaise mais le biais s’annule a mesure que la taille

de chaque cohorte tend vers l’infini.

Beaudry et Green (2000) ont utilise aussi des pseudo-panels pour etudier l’evolution

des gains hebdomadaires des travailleurs a temps plein. Skoufias et Suryahadi (2002)

ont examine, a partir de pseudo-panels, comment les caracteristiques de la distribution

(la mediane et la dispersion) des salaires entre travailleurs sont affectees par la crois-

sance economique et la contraction de la production durant la periode 1986 a 1998 en

Indonesie. Dargay et Vythoulkas (1997) et Dargay (2002) ont utilise des pseudo-panels

pour estimer des modeles dynamiques dans le domaine des transports.


Il existe d’autres methodes pour traiter le probleme de donnees incompletes. Ces

methodes feront l’objet des sections suivantes.

2.7 Autres approches pour solutionner le probleme

de donnees manquantes

Le traitement des donnees manquantes peut se faire en suivant une approche clas-

sique ou une approche bayesienne. Nous presentons quelques techniques utilisees dans

la litterature pour contourner le probleme.

2.7.1 L’imputation multiple (IM)

L’imputation multiple a ete introduite d’abord par Rubin (1978) qui l’a ensuite

decrite en detail en 1987. L’imputation multiple est une approche Monte Carlo pour

l’analyse de bases de donnees incompletes. Dans l’IM, les donnees manquantes Ymis sont

remplacees par des valeurs simulees notees : Y 1mis, Y

2mis, ....Y

mmis. Cela revient a constituer

m bases de donnees completes. Chacune des m bases de donnees est analysee en se

servant des methodes standards pour les bases de donnees completes. L’imputation

simple consiste a se limiter a creer une seule base de donnees complete. L’analyse

de l’IM peut se faire selon l’approche classique ou selon l’approche bayesienne. Nous

presentons d’abord les grands traits de l’IM classique.

Supposons un modele de regression lineaire simple avec des donnees manquantes :

Y = X ′β + u u ∼ N(0, σ2

).

Soit θ = (β, σ2) le vecteur des parametres du modele ou une fonction des parametres du

modele. Si on a m imputations on aura θ1, ...θm estimes. Soit Wd, d = 1, ...m la variance

associee a chaque estime. Rubin (1987) donne la regle suivante pour combiner les deux

parametres. L’estimateur ponctuel de l’IM est donne par :

θm =1

m

m∑

d=1

θd.

La matrice de variance covariance associee a θm notee (T ) a deux composantes : la

variance intra-imputation (within-imputation) et la variance inter-imputation (between-


imputation). La matrice de variance covariance intra-imputation est definie par :

WD =1

m

m∑

d=1

Wd.

La matrice de variance covariance inter-imputation est :

BD =1

m − 1

m∑

d=1

(θd − θm

)(θd − θm

)′.

Ainsi, la matrice de variance-covariance de θm est donnee par :

T = WD +

(1 +

1

m

)BD.

Le terme(1 + 1

m

)joue le role de correcteur pour un nombre fini d’imputations. S’il n’y

a pas de donnees manquantes, alors les estimes des parametres sont tous identiques

et la variance inter-imputation s’annule de sorte que la variance totale est egale a la

variance intra-imputation W D.

L’IM peut aussi etre vue sous l’angle bayesien. Rubin (1978) propose de relier la

distribution a posteriori des donnees observees a la distribution a posteriori de la base

complete comme suit :

p (θ |Yobs, Ymis ) ∝ p (θ) L (θ |Yobs, Ymis )

p (θ |Yobs ) =

∫p (θ, Ymis |Yobs ) dYmis

=

∫p (θ |Ymis, Yobs ) p (Ymis |Yobs ) dYmis, (2.29)

avec Ymis le vecteur des observations manquantes et Yobs le vecteur des donnees ob-

servees. L’equation (2.29) implique que la distribution a posteriori de θ qui est p (θ |Yobs )

peut etre simulee en faisant d’abord un tirage des valeurs manquantes (Y dmis, d indique le

numero de l’imputation, d = 1, ....m) a partir de leur distribution jointe (p (Ymis |Yobs )).

Il faut ensuite imputer les valeurs manquantes pour completer la base de donnees. En-

fin, on doit faire un tirage de θ a partir de distribution a posteriori de la base complete

p(θ∣∣Y d

mis, Yobs

). L’IM approxime en fait l’integrale (2.29) sur toutes les valeurs man-

quantes comme une moyenne :

p (θ |Yobs ) ≈ 1

D

m∑

d=1

p(θ∣∣Y d

mis, Yobs

),

ou : Y dmis ∼ p (Ymis |Yobs ) sont des tirages de Ymis de la distribution a posteriori predictive

des valeurs manquantes. Si les moyenne et variance a posteriori resument adequatement


la distribution a posteriori, alors l’equation (2.29) peut etre remplacee par :

E (θ |Yobs ) = E [E (θ |Ymis, Yobs ) |Yobs ] (2.30)

V (θ |Yobs ) = E [V (θ |Ymis, Yobs ) |Yobs ] + V [E (θ |Ymis, Yobs ) |Yobs ] . (2.31)

Si D est grand, les equations (2.30) et (2.31) peuvent etre approximees en utilisant les

valeurs simulees des observations manquantes comme suit :

E (θ |Yobs ) ≈∫

1

D

m∑

d=1

p(θ∣∣Y d

mis, Yobs

)dθ = θm

V (θ |Yobs ) ≈ 1

D

m∑

d=1

Vd +1

m − 1

m∑

d=1

(θd − θm

)(θd − θm

)′,

ou : θd = E(θ∣∣Y d

mis, Yobs

)est l’estime de θ a partir de la base de donnees complete de

l’imputation d, et θm = 1D

∑md=1 θd, Vd est la variance a posteriori de la base complete(

Y dmis, Yobs

)de l’imputation d. Il y a donc une similitude avec l’approche classique de

l’IM.

L’IM presente un certain nombre d’avantages. Elle permet de creer plusieurs bases

de donnees completes. Avec ces bases completes, on peut appliquer les procedures sta-

tistiques habituelles fournies dans les logiciels statistiques. L’IM garde l’information au

niveau individuel, ceci permet de conserver une certaine efficacite contrairement a l’ap-

proche a pseudo-panels qui regroupe les individus en cohortes. Les tests statistiques qui

decoulent de l’IM sont generalement valides car l’IM incorpore l’incertitude causee par

les donnees manquantes. Mais si l’on se limite a une seule imputation, l’inference statis-

tique serait invalide. En effet, une seule valeur imputee ne peut a elle seule representer

toute l’incertitude sur la valeur manquante. Les analyses qui supposent que les donnees

d’une seule imputation sont equivalentes aux donnees observees sous-estiment en general

l’incertitude, meme si l’information manquante est correctement modelisee et des impu-

tations aleatoires sont realisees. L’induction qui decoule de l’imputation simple ne tient

pas compte de la variabilite attribuable a l’incertitude sur les donnees manquantes.

L’IM peut remedier a ce probleme tout en conservant les avantages de l’imputation

simple. Le seul desavantage de l’IM par rapport a l’imputation simple est qu’elle de-

mande beaucoup d’espace memoire et de temps de traitement. Mais avec les grands

progres au niveau informatique, ce probleme ne se pose presque pas. Enfin, l’IM a un

autre avantage du au fait qu’elle a un haut degre d’efficacite meme si m est petit. Ru-

bin (1987) montre qu’avec seulement 3 a 5 imputations, on peut obtenir d’excellents

resultats ; donc, il n’est pas necessaire que m soit tres grand pour gagner en efficacite.

L’IM est appropriee pour les cas ou le nombre d’observations manquantes n’est pas

tres grand. Par exemple, lors d’une enquete, certains individus peuvent choisir de ne


pas repondre a certaines questions soit parce qu’ils ne savent pas quoi repondre ou soit

parce qu’ils ne veulent pas divulger une information confidentielle. Si le pourcentage

de non-reponses est faible (5% ou moins), alors l’elimination de ces observations peut

etre une solution raisonnable au probleme de donnees manquantes. Cependant, dans un

ensemble multivavrie ou plusieurs variables peuvent avoir des valeurs manquantes, les

observations ayant au moins une donnee manquante represente une proportion impor-

tante de la base de donnees. Dans ce cas, une elimination des observations ayant des

donnees manquantes conduirait a une perte d’efficacite car une partie importante de

l’information est ignoree. L’IM est bien appropriee pour resoudre le probleme des non-

reponses. Mais, lorsqu’on dispose d’un ensemble de coupes transversales independantes,

les individus observes une periode donnee ne sont plus presents dans les autres periodes.

L’information manquante va concerner toutes les variables du modele pour tous les in-

dividus lorsqu’on passe d’une periode a une autre. Le probleme de donnees manquantes

est alors plus crucial et l’IM n’est pas vraiment appropriee. Gregoire (2004) utilise l’IM

pour analyser la demande d’electricite des menages Quebecois dans un contexte ou le

nombre d’observations manquantes etait important. Vidal (2006) a aussi utilise cette

technique avec deux bases de donnees d’enquetes completement independantes. Les

resultats n’ont pas ete satisfaits.

2.7.2 L’algorithme esperance maximisation (EM)

L’algorithme EM est une technique generale d’estimation par maximum de vraisem-

blance en presence de donnees manquantes. L’algorithme formalise une vieille idee ad

hoc qui consistait a : (1) remplacer les valeurs manquantes par les valeurs estimees etant

donnes les parametres, (2) estimer les parametres en supposant que les valeurs man-

quantes sont donnees par leurs valeurs estimees, (3) re-estimer les valeurs manquantes

en supposant que les nouveaux estimes des parametres sont corrects, (4) re-estimer les

parametres, et ainsi de suite jusqu’a la convergence (Little et Rubin 2002, Gelman et

al. (2000)). Bien que des cas speciaux de cet algorithme soient apparus avant les annees

1970 dans la litterature statistique, c’est seulement en 1977 que Dempster, Laird et

Rubin ont introduit le terme esperance maximisation, formalise cet algorithme et defini

ses proprietes. L’algorithme se base sur l’interdependance qui existe entre les observa-

tions manquantes et les parametres du modele. Schafer (2000) suppose que la base de

donnees comporte des donnees manquantes avec Y = Yobs+Ymis ou Yobs est le vecteur de

donnees observees et Ymis est celui des donnees manquantes. L’information manquante

peut concerner la variable dependante tout comme les variables explicatives du modele.

Soit θ le vecteur des parametres du modele a estimer. Toute l’information pertinente sur

les parametres est contenue dans la fonction de vraisemblance des donnees observees

(L (θ |Yobs )) ou dans la loi a posteriori des donnees observees P (θ |Yobs ). Dans n’importe


quelle situation ou on a des donnees manquantes, la distribution complete des donnees

(Y ) peut etre factorisee comme suit :

P (Y |θ ) = P (Yobs |θ ) P (Ymis |Yobs, θ ) . (2.32)

Le principe de l’algorithme EM est base sur l’equation (2.32). On peut constater que

les termes de l’equation sont fonction chacun du parametre inconnu et en prenant le

logarithme de (2.32), cela conduit a :

l (θ |Y ) = l (θ |Yobs ) + log P (Ymis |Yobs, θ ) + c, (2.33)

avec : l (θ |Y ) = log P (Y |θ ) la log-vraisemblance des donnees completes,

l (θ |Yobs ) = log L (θ |Yobs ) la log-vraisemblance des donnees observees, et c est une

constante arbitraire.

Le terme P (Ymis |Yobs, θ ) est appele loi predictive des donnees manquantes etant

donne θ. Ce terme joue un role central dans l’algorithme EM parce qu’il capte l’in-

terdependance qui existe entre Ymis et θ. Et comme Ymis est inconnu, on ne peut pas

calculer P (Ymis |Yobs, θ ). En prenant la moyenne par rapport a la distribution predictive

P (Ymis |Yobs, θt ) ou θt est la valeur prealablement estimee des parametres inconnus, on

obtient :

Q(θ∣∣θt)

= l (θ |Yobs ) + H(θ∣∣θt)

(2.34)

Q(θ∣∣θt)

=

∫l (θ |Y ) P

(Ymis

∣∣Yobs, θt)dYmis

H(θ∣∣θt)

=

∫P (Ymis |Yobs, θ ) P

(Ymis

∣∣Yobs, θt)dYmis.

Un resultat central de Dempster, Laird et Rubin (1977) est que si θt+1 est la valeur

de θ qui maximise le terme Q (θ |θt ), dans ce cas, θt+1 est meilleur a θt au sens que

la log-vraisemblance des donnees observees est au moins aussi grande que celle de θt.

Autrement dit :

l(θt+1 |Yobs

)≥ l(θt |Yobs

).

La log-vraisemblance ne diminue pas en passant d’une iteration a une autre. L’algo-

rithme pour une seule iteration comporte 2 grandes etapes :

1. L’etape E ou etape du calcul de l’esperance qui correspond a completer les donnees

manquantes. Dans cette etape, Q (θ |θt ) est calcule en prenant la moyenne de

la fonction log-vraisemblance de la base complete l (θ |Y ) sur toutes les valeurs

possibles de P (Ymis |Yobs, θt ). Pour la premiere iteration, on donne des valeurs de

depart aux parametres (soit θ0) et on deduit la valeur predite des observations

manquantes Ymis. Cette etape augmente les donnees en completant les donnees

manquantes.


2. l’etape M ou etape de la maximisation consiste a estimer les parametres par

maximum de vraisemblance etant donnee la base de donnees complete obtenue a

la premiere etape. En d’autres termes, θt+1 est obtenu en maximisant Q (θ |θt )

On repete ces deux etapes de maniere a obtenir une sequence de θt, t = 0, 1, 2......Sous certaines conditions donnees par Dempster, Laird et Rubin (1977) et Wu (1983),

cette sequence converge surement vers un point stationnaire de la log-vraisemblance de

la base de donnees observees. Dempster, Laird et Rubin (1977) ont montre que le taux

de convergence est determine par la fraction d’information manquante.

Prenons un exemple de l’algorithme EM lorsque la loi de probabilite du modele de

la base de donnees complete appartient a une famille particuliere de loi. On peut voir

que dans certains problemes (donnees incompletes qui sont purement categorielles),

l’etape E correspond a completer les donnees manquantes Ymis par sa moyenne ou

son esperance notee E (Ymis |Yobs, θ = θt ). Cependant, dans certains problemes, ce n’est

plus le cas. En particulier, lorsque la loi de probabilite de la base complete fait partie

de la famille exponentielle, la log vraisemblance de la base de donnees complete de n

observations iid peut s’ecrire en fonction des statistiques exhaustives comme suit :

l (θ |Y ) = η (θ)′ T (Y ) + nf (θ) + c,

ou η (θ) = [η1 (θ) , η2 (θ) , ....., ηs (θ)]′ est la forme canonique du vecteur de parametres

θ, et T (Y ) = [T1 (θ) , T2 (θ) , ....., Ts (θ)]′ est une statistique exhaustive de la base de

donnees complete. Precisons que T (Y ) est une exhaustive pour θ si la loi condition-

nelle de Y sachant T ne depend pas de θ. Toute l’information sur θ est concentree

en T (Gourieroux et Monfort, 1996). On peut constater que l (θ |Y ) est une fonction

lineaire des statistiques exhaustives et l’etape E dans ce cas remplace les Ti (θ) par

E [Ti (θ) |Yobs, θt ], pour i = 1, 2, ...s. En d’autres termes, l’etape E ne complete pas les

elements manquants de Y par sa moyenne, mais plutot complete les portions man-

quantes des statistiques exhaustives de la base de donnees complete. Lorsqu’ils s’agit

de modeles de la famille exponentielle, les elements E [Ti (θ) |Yobs, θt ] sont sous forme

explicite ce qui facilite le calcul dans l’etape E. L’etape M est aussi facile a implementer

dans beaucoup de situations. L’element Q (θ |θt ) aura la meme forme fonctionnelle que

la log-vraisemblance l (θ |Y ). Donc, il n’y aura pas de difference de calcul entre trouver

θt+1a partir de Q (θ |θt ) et trouver l’estimateur du maximum de vraisemblance a partir

de la fonction log-vraisemblance de la base complete.

Prenons un exemple de donnees d’une seule variable qui suit une loi normale iden-

tiquement et independamment distribuee (Little et Rubin(2002)) : yi ∼ iid N (µ, σ2)

ou yi pour i = 1, 2, ...., r sont observes mais yi i = r + 1, .....n sont manquantes.

L’esperance de chaque yi non observe etant donne Yobs et θ = (µ, σ2) est egale a µ.


Log-vraisemblance de la base complete est une fonction lineaire des deux statistiques

exhaustives qui sont :∑n

i=1 yi et∑n

i=1 y2i . L’etape E de l’algorithme consiste a calculer

l’esperance de chacune des statistiques exhaustives :

E

(n∑

i=1

yi

∣∣Yobs, θt

)=

r∑

i=1

yi + (n − r) µt

E

(n∑

i=1

y2i

∣∣Yobs, θt

)=

r∑

i=1

y2i + (n − r)

[(µt)2

+(σt)2]

θt =(µt, σt

).

Notons que si on n’avait aucune valeur manquante, l’estimateur du maximum de vrai-

semblance de µ serait :µ =∑n

i=1 yi/n et celui de σ2 serait : σ2 = (∑r

i=1 y2i ) /n −

(∑n

i=1 yi/n)2. L’etape M utilise les statistiques exhaustives obtenues a l’etape E pour

obtenir de nouvelles valeurs des parametres :

µt+1 = E

(n∑

i=1

yi

∣∣Yobs, θt

)/n

(σt+1

)2= E

(n∑

i=1

y2i

∣∣Yobs, θt

)−(µt+1

)2.

L’algorithme est approprie pour les situations ou il est facile d’effectuer les deux

etapes. Dans de telles situations, il permet d’atteindre le maximum global unique de la

fonction de vraisemblance. Cependant, il peut arriver que l’algorithme EM ne converge

pas vers le maximum global. D’apres Little et Rubin (2002), un inconvenient de l’algo-

rithme EM est que la convergence peut etre peniblement lente lorsqu’on a une fraction

importante de donnees manquantes. Comme d’autres algorithmes, l’algorithme EM a

aussi certaines limites :

1. EM peut converger vers differents points suivant les valeurs initiales choisies,

2. la log vraisemblance peut comporter une region plate, ce qui signifie un continuum

de solutions,

3. la convergence peut etre trop lente si la quantite d’information manquante est

tres importante : plus la quantite d’information manquante est importante, plus

lente sera la convergence.

Etant donne notre principal objectif, qui est d’estimer un modele de choix dis-

cret/continu a partir de coupes transversales independantes, la quantite d’information

manquante pour chaque coupe transversale est tres elevee et la complexite du modele

fait que ce algorithme n’est pas approprie.


Paquet (2002), Boucher (2003), Paquet et Bolduc (2004) proposent une nouvelle

approche pour estimer les modeles (lineaires et non lineaires) dans un contexte de

panels incomplets (avec le cas extreme de series de coupes transversales independantes).

Il s’agit d’une approche bayesienne qui consiste a combiner l’echantillonnage de Gibbs et

l’algorithme de l’augmentation des donnees pour completer les donnees manquantes tous

en estimant les parametres du modele. Nous nous inspirerons aussi de leur demarche

pour completer les donnees manquantes et estimer les parametres. La section suivante

fait un survol des etudes anterieures traitant de ce sujet.

2.8 Survol de quelques methodes bayesiennes

La methodologie bayesienne est essentiellement fondee sur le theoreme de Bayes

qui relie l’information a priori (information disponible avant que les donnees ne soient

observees), la nouvelle information et la distribution a posteriori. Supposons un modele

lineaire :

Y = Xβ + ε

ε ∼ N (0, Σ) .

Posons θ = (β, Σ) le vecteur des parametres du modele. Pour estimer le parametre θ

de facon conjointe, on peut se servir de la relation suivante :

f (θ,X, Y ) = f (θ |X,Y ) g (X,Y ) (2.35)

= g (X,Y |θ ) f (θ) . (2.36)

En divisant (2.35) et (2.36) par g (X,Y ), on obtient la distribution a posteriori qui est

la distribution d’interet :

f (θ |X,Y ) =g (X,Y |θ ) f (θ)

g (X,Y ).

f (θ,X, Y ) : est la distribution a posteriori des parametres d’interet.

g (X,Y |θ ) : est la fonction de vraisemblance des donnees, souvent notee L (θ |X,Y )

f (θ) : est la distribution a priori des parametres d’interets.

g (X,Y ) : est une constante de proportionnalite.

On peut alors reecrire la derniere equation comme suit :

f (θ |X,Y ) ∝ L (θ |X,Y ) × f (θ) .


L’echantillonnage de Gibbs utilise cette relation pour estimer les parametres d’interet

et l’augmentation des donnees l’utilise pour imputer les donnees manquantes dans des

contextes multivaries. Les deux techniques sont fondees essentiellement sur la methodologie

MCMC.

2.8.1 La methodologie MCMC (markov chain monte carlo)

Les MCMC (Markov Chain Monte Carlo) sont un ensemble de techniques pour

faire des tirages pseudo aleatoires a partir de distributions de probabilite. L’objectif du

MCMC est de generer une ou plusieurs valeurs d’une variable aleatoire Z habituelle-

ment multidimensionnelle. Il s’agit de faire de la simulation Monte Carlo sur une chaıne

markovienne ergodique.

Une sequence de variables aleatoires zi est une chaıne markovienne du premier ordre si

la distribution conditionnelle p (zi |zi−1, zi−2, ....) est une fonction des valeurs precedentes

zi−1 seulement :

p (zi |zi−1, zi−2, ....) = p (zi |zi−1 )

Par exemple, un processus autoregressif d’ordre 1 (AR(1)) est une chaıne markovienne

d’ordre 1. On sait que la moyenne d’un echantillon de N observations d’un processus

AR(1) est un estimateur convergent de l’esperance inconditionnelle du processus si le

processus est stationnaire. L’analyse de la convergence des chaınes markoviennes se sert

d’un concept semblable qui est l’ergodicite.

Une sequence est ergodique si on peut passer de n’importe quelle realisation A de la

chaıne a n’importe quelle realisation B , meme si la transition de z = A a z = B

exige de passer par quelques realisations intermediaires (A −→ C −→ B). Si la chaıne

markovienne est ergodique, alors la sequence des lois conditionnelles p (zi |z0 )∞i=1

converge vers la loi marginale stable p (z) pour n’importe quelle valeur de depart z0. La

dependance de la chaıne aux valeurs de depart s’estompe ainsi progressivement.

Supposons que la convergence se realise avant la realisation n. Alors, la sequence des

N prochaines realisations zin+Ni=n+1 constitue un echantillon dans lequel les observa-

tions sont correlees et ont la meme densite inconditionnelle. De plus, la moyenne

echantillonnale N−1∑n+N

i=n+1 g (zi) converge presque surement vers la moyenne de la

population E [g (z |.)].

L’analyse bayesienne s’interesse souvent aux caracteristiques de la distribution a

posteriori p (z |.) telle que l’esperance ou la variance. L’esperance est exprimee souvent

sous forme d’integrale dont la forme analytique est souvent difficile a evaluer. Les ex-

pressions analytiques des integrales de la distribution a posteriori et de la moyenne a

posteriori existent seulement pour quelques cas particuliers, tel que le modele lineaire

normal. Pour des modeles plus complexes, ces integrales exigent des techniques d’esti-


mation numeriques. Par ailleurs, si la dimension de z est grande, la tache est encore

plus ardue.

Les methodes d’echantillonnage se servant des chaınes markoviennes se sont tres vite

repandues ces annees grace aux progres rapides en informatique. Gordon et Belanger

(2003) donnent un survol des techniques d’echantillonnage de type MCMC.

2.8.2 Echantillonnage de Gibbs

L’echantillonnage de Gibbs est la technique MCMC la plus simple. Sa popularite

date de l’application faite par German et German (1984) de la distribution Gibbs pour

modeliser les images satellites. Son applicabilite s’etend cependant a un grand eventail

de problemes. L’echantillonnage de Gibbs d’apres Casella et George (1992), est une tech-

nique pour generer des variables aleatoires d’une distribution (marginale) de facon indi-

recte sans toutefois avoir a calculer la densite. Gelfand (2000) definit l’echantillonnage

de Gibbs comme un outil pour obtenir des echantillons a partir de fonctions de densites

jointes non standard. Ces echantillons proviennent en fait de distributions condition-

nelles associees a la densite jointe.

Soit : θ = (θ1, θ2, ........θJ) ou θj est un element ou un sous ensemble de θ. Si le

modele est assez complexe, la distribution marginale f (θ) = f (θ1, θ2, ........θJ) ne sera

pas standard. Par exemple, si on s’interesse a la densite marginale du premier element,

on doit integrer la densite conjointe par rapport aux autres elements de sorte a obtenir

la fonction a integrales multiples suivante :

f (θ1) =

∞∫

−∞

∞∫

−∞

.......

∞∫

−∞

f (θ1, θ2, θ3........θl) dθ2dθ3dθ4......dθl.

La presence d’integrales multiples posent de serieux problemes si on veut calculer cer-

tains moments (moyenne ou variance). Cependant, la densite conditionnelle f (θ1 |θ−1 )

est souvent facile a calculer (ou θ−1 = (θ2, ........θJ) represente les elements autres que

celui qui nous interesse, θ1). Dans le but d’eviter des calculer onereux en temps, Ger-

man et German (1984) ont propose la technique d’echantillonnage de Gibbs basee sur

la theorie des chaınes markoviennes.

Supposons une distribution conjointe P (θ) = P (θ1, θ2, ........θJ) et les distributions


conditionnelles suivantes :

θ1 ∼ P (θ1 |θ2, ........θJ )

θ2 ∼ P (θ2 |θ1, θ3........θJ )...

θJ ∼ P (θJ |θ1, θ2........θJ−1 ) .

Supposons que ces distributions conditionnelles sont plus simples et plus faciles a cal-

culer ; de plus supposons qu’il est possible de simuler des tirages artificiels de θj ∼P (θj |θ−j ) . Alors, l’algorithme de l’echantillonnage de Gibbs est defini selon les 3

etapes suivantes :

– Etape 1 : Donner des valeurs de depart aux parametres : θ01, θ

02, ........θ

0J et poser

i = 1.

– Etape 2 : Effectuer les tirages conditionnels suivants :

θi1 ∼ P

(θ1

∣∣θi−12 , ........θi−1

J

)

θi2 ∼ P

(θ2

∣∣θi1, θ

i−13 ........θi−1

J

)(2.37)

...

θiJ ∼ P

(θJ

∣∣θi1, θ

i2........θ

iJ−1

).

– Etape 3 : Poser i = i + 1 et retourner a l’etape i.

l’ensemble constitue un tour et un element dans (5.8) constitue une iteration.

Notons que cet algorithme decrit une chaıne markovienne du premier ordre parce

que la distribution conditionnelle d’un tirage depend de la realisation precedente. De

plus, si la densite P (θj |θ−j ) est positive pour toutes les valeurs possibles de θj, on

dira alors que la chaıne est ergodique. Dans ce cas, la sequence converge vers sa dis-

tribution stable P (θ) pour toute valeur de depart θ0. De plus, comme nous l’avons

souligne anterieurement, si la sequence converge avant l’iteration n, alors la moyenne


i=n+1 g (θi) est un estimateur convergent simule de la moyenne a

posteriori de la population E [g (θ |.)].L’echantillonnage de Gibbs servira donc a simuler les parametres de nos modeles dans

un context de donnees manquantes.


2.8.3 L’algorithme d’augmentation des donnees (AD)

L’algorithme de l’echantillonnage de Gibbs est tres similaire a l’algorithme de l’aug-

mentation des donnees developpe par Tanner et Wong (1987). Supposons, comme dans

Schafer (1997), qu’un vecteur aleatoire z est partitionne en deux sous vecteurs :

z = (u, v) . (2.38)

Soit P (z) la densite jointe qui n’est pas facile a simuler. Cependant, les densites condi-

tionnelles P (u |v ) = f (u |v ) et P (v |u) = h (v |u) sont faciles a simuler. Supposons

qu’a l’iteration t, on a :

Z(t) =(z

(t)1 , z

(t)2 , ............z(t)

m

)

=[(

u(t)1 , v

(t)1

),(u

(t)2 , v

(t)2

), ........

(u(t)

m , v(t)m

)].

Ceci constitue un echantillon de taille m tire de la distribution qui approxime la distri-

bution d’interet P (z).

Tanner et Wong (1987) montrent que la distribution de Z (t) converge vers P (z)

quand t −→ ∞. Ce resultat n’exige pas que m soit grand. En particulier, si m = 1, l’al-

gorithme d’augmentation des donnees se reduit a un cas particulier de l’echantillonnage

de Gibbs avec z = (u, v).

La technique d’augmentation des donnees est souvent utilisee dans les problemes avec

donnees manquantes. On cherche a rendre ces problemes plus faciles a analyser une fois

que la base de donnees est completee. L’algorithme EM est aussi un exemple d’utilisa-

tion du principe de l’augmentation des donnees dans un context classique.

Supposons que la base de donnees disponible comporte des donnees manquantes et no-

tons : Y = (Yobs, Ymis).

Ymis = yimt, ximt contient a la fois des variables endogenes et exogenes manquantes.

Yobs = yint, xint contient a la fois des variables endogenes et exogenes observees.

Dans beaucoup de problemes avec donnees manquantes, la densite a posteriori des

donnees observees P (θ |Yobs ) n’est pas facile a manipuler ni facile a simuler ; il arrive

frequemment d’ailleurs qu’elle ne soit pas connue. En effet, cette densite est sous forme

d’integrale :

P (θ |Yobs ) =

∫

Ymis

P (θ |Yobs, Ymis ) dYmis.

On utilise la technique d’augmentation des donnees pour contourner ces difficultes. En

effet, si on augmente les donnees observees par des valeurs predites de Ymis, alors, la

densite a posteriori de la base complete P (θ |Yobs, Ymis ) devient beaucoup plus facile a

manipuler. En revenant a la definition de z (2.38), on a dans ce cas particulier : z =


(Ymis, θ). L’algorithme AD utilise la dependance qui existe entre les densites P (θ |Yobs )

et P (Ymis |Yobs ) de facon a calculer P (θ |Yobs ). En effet :

P (θ |Yobs, Ymis ) P (Ymis, Yobs) = P (Ymis |Yobs, θ ) P (θ, Yobs)

P (θ |Yobs, Ymis ) P (Ymis, Yobs) = P (Ymis |Yobs, θ ) P (θ |Yobs ) P (Yobs)

P (θ |Yobs ) =P (θ |Yobs, Ymis ) P (Ymis, Yobs)

P (Ymis |Yobs, θ ) P (Yobs)

=P (θ |Yobs, Ymis ) P (Ymis |Yobs ) P (Yobs)


=P (θ |Yobs, Ymis ) P (Ymis |Yobs )

P (Ymis |Yobs, θ )

∝ P (θ |Yobs, Ymis ) P (Ymis |Yobs ) .

Donc :

P (θ |Yobs ) ∝ P (θ |Yobs, Ymis ) P (Ymis |Yobs ) .

De plus, nous avons :

P (Ymis |Yobs ) =

∫

θ

P (Ymis, θ |Yobs ) dθ

=

∫

θ

P (Ymis |Yobs, θ ) P (θ |Yobs ) dθ.

Il faut pouvoir effectuer des tirages dans les distributions conditionnelles suivantes :

P (θ |Yobs, Ymis ) et P (Ymis |Yobs, θ ). L’algorithme AD comporte en fait deux grandes

etapes :

– (etape-I ou etape de l’imputation) : conditionnellement aux parametres θt, faire

des tirages des valeurs manquantes de la densite predictive de Ymis :

Y t+1mis ∼ P

(Ymis

∣∣Yobs, θt). (2.39)

– (etape-P ou etape a posteriori) : conditionnellement aux valeurs predites obtenues

a l’etape I, faire des tirages de nouvelles valeurs des parametres a partir de la

densite a posteriori de la base complete :

θt+1 ∼ P(θ∣∣Yobs, Y

t+1mis

). (2.40)

Repeter a plusieurs reprises (2.39) et (2.40) en se donnant des valeurs de depart

θ0.

On obtient alors une sequence de valeurs θt, Y tmis : t = 1, 2...... Cette sequence

converge vers sa densite stable qui est P (θ, Ymis |Yobs, ).

Les sous-sequences θt, : t = 1, 2..... et Y tmis : t = 1, 2..... ont leurs distributions

conditionnelles stables qui sont respectivement P (θ |Yobs ) et P (Ymis |Yobs ).


On peut constater que l’algorithme EM est tres similaire a l’algorithme AD. En effet,

l’implementation de l’etape I de l’algorithme AD est tres similaire a l’implementation

de l’etape E de l’algorithme EM. Et l’etape M correspond a la maximisation de la

vraisemblance de la base complete alors que dans l’algorithme AD, l’etape P correspond

a un tirage aleatoire de la densite a posteriori de la base complete.

Paquet (2002) utilise l’algorithme d’echantillonnage de Gibbs et d’augmentation

des donnees pour estimer des modeles lineaires et discrets dans un contexte de donnees

longitudinales incompletes (panels partiellement incomplets). Deux grandes etapes ca-

racterisent l’approche utilisee : la premiere etape consiste a simuler les donnees man-

quantes en utilisant l’algorithme AD. La seconde etape consiste a simuler le vecteur

des parametres etant donne les donnees completees. Dans chacune des etapes, elle se

sert du principe des densites conditionnelles des observations ou des parametres, etant

donne l’information disponible. Pour les differents modeles (lineaires ou discrets) qui

ont fait l’objet de ses application avec donnees simulees, elle a incorpore des effets

individuelles aleatoires. L’approche conventionnelle a aussi ete utilisee pour fin de com-

paraison. L’approche proposee semblerait plus efficace que celle proposee par Deaton

(1985). Elle a l’avantage de garder l’information au niveau microeconomique contraire-

ment aux pseudo-panels conventionnels qui regroupent les individus en cohortes.

Nous comptons utiliser ces deux dans nos travaux dans le but de faire une ana-

lyse assez complete de la demande d’energie des menages de la province de Quebec.

Nous nous interesserons a la fois aux modeles statiques et aux modeles dynamiques.

Nous chercherons a resoudre les problemes de biais de selection provenant du choix des

modes de chauffage et le biais d’endogeneite provenant de la tarification non lineaire de

l’electricite.

Bibliographie

[1] Acton, J. P., Mitchell, B., M., and Mowill, R., S. (1976) : «Residential Demand

for Electricity in Los Angeles : An Econometric Study of Disaggregate Data»,

Rand-Report R-1899-NSF, Rand Corporation, Santa Monica, CA.

[2] Alessie R., Devereux M. P. et Weber G. (1997) : «Intertemporal Consumption, Du-

rables and Liquidity Constraints : a Cohort Analysis», European Economic Review,

Vol. 41, pp.27-59.

[3] Amemiya, T. (1985) : Advanced econometrics, Havard Univertsity Press, Cam-

bridge 1985

[4] Anderson, T. W. and Hsiao, C. (1982) : «Formulation and Estimation of Dynamic

Models using Panel Data», Journal of Econometrics, Vol.18, p.47-82.

[5] Arellano, M (1988) : «A Note on the Anderson-Hsiao Estimator for Panel Data»,

Mimeo Instutite of Economics, Oxford Universtity.

[6] Arellano, M and B. Honore (2001) : Panel Data Models : Some Recent Develop-

ments, Capiter 53 in J. Heckman and Leamer, eds., Handbook of Econometrics

(North-Holland Amsterdam), p.3229-3296.

[7] Arellano, M. and S. Bond (1991) : «Some Tests of Specification for Panel Data :

Monte Carlo Evidence and an Application to Employment Equations», Review of

Economic Studies, Vol.58, p.277-297.

[8] Balestra, P. and M. Nerlove (1966) : «Pooling Cross-Section and Time-Series Data

in the Estimation of a Dynamic Models : the Demand for Natural Gas», Econo-

metrica, Vol.34, p.585-612.

[9] Baltagi B. H. (1995) : Econometric Analysis of Panel Data, Wiley and Sons.

[10] Baltagi B. H. (2005) : Econometric Analysis of Panel Data, Third Ed., Wiley and

Sons.

[11] Barnes, R., Gillingham, R., and Hagemann, R. (1981) : «The Short-Run Residential

Demand for Electricity», The Review of Economics and Statistics, Vol. 62, p. 541-

551.

Bibliographie 58

[12] Beaudry P. and Green D. (2000) : «Cohort Patterns in Canadian Earnings : As-

sessing the Role of Skill Premia in Inequality Trends», Canadian Journal of Eco-

nomics, Vol.33, No.4

[13] Belanger, D. (1992) : «Estimation des Probabilites de Choix Reliees au Probleme

d’Evaluation de la Demande d’Electricite Residentielle au Quebec», These de

Maıtrise, Universite Laval.

[14] Bernard, J-T, Bolduc, D. and Belanger, D. (1996) : «Quebec Residential Electricity

Demand : A Microeconometric Aproach», The Canadian Journal of Economics,

vol. 29, No.1 , p. 92-113.

[15] Baltagi B. H. (2005) : Econometric Analysis of Panel Data, 3e ed. Wiley and Sons.

[16] Billings, R., B. (1982) : «Specification of Bolck Rate Price Variable in Demand

Models», Land Economics, Vol. 56, p. 73-84.

[17] Billings, R. B. and Agathe, D. E. (1980) : «Price Elasticities for Water : A Case

of Increasing Bloc Rates», Land Economics, Vol. 56, p.73-84.


of Increasing Bloc Rates : Reply», Land Economics, Vol. 57, p.276-278.

[19] Biron, E. (1981) : «Estimating Economic Relations from Incomplete Cross-

Section/Time-Series Data», Journal of Econometrics, Vol. 16, p.221-236.

[20] Biron, E. and Jansen, E. S. (1983) : «Individual Effects in a System of Demand

Functions», Scandinavian Journal of Economics, Vol. 85, p.461-483.

[21] Blundell, R. and R. S. Smith (1991) : «Conditions Initiales et Estimation Efficace

dans les Modeles Dynamiques sur les Donnees de Panel», Annales d’Economie et

de Statistiques, Vol.20-21, p.109-123.

[22] Blundell, R. and Bond, S. (1998) : «Initial Conditions and Moment Restrictions in

Dynamic Panel Data Models», Journal of Econometrics, Vol.87, p.117-143.

[23] Blundell R., Browing M et Meghir C. (1985) : «Consumer Demand and the Life-

Cycle Allocation of Household Expenditures», The Review of Economic Studies,

Vol. 61 No. 1, pp 57-80.

[24] Blundell R. et Meghir C. H. (1990) : «Panel Data and Life-Cycle Models», Contri-

butions to Econometrics, Vol. 192, pp. 231-252.

[25] Boucher, N. (2003) : «Predicting National Data on the Use of Private Vehicles in

Canada for the 1980-1996 Period : an Application of the Bayesian Approach of

Gibbs Sampling with Data Augmentation», PhD. thesis, Queen University

[26] Browning, M., Deaton, A. and Irish, M. (1985) : «A profitable Approach to Labor

Supply and Commodity Demands over the Life-Cycle», Econometrica, Vol. 53,

No.3 pp503-544

Bibliographie 59

[27] Burtless, G., and Hausman, J., A. (1978) : «The Effect of Taxation of Labor Sup-

ply : Evaluating the Gray Neagtive Income Taxe Experiment», Journal of Political

Economy, 86, 276-278.

[28] Carlin B. P. and Louis Thomas (2000) : «Bayes and Empirical Bayes Methods for

Data Analysis», New York, Chapman and Hill/CRC

[29] Casella G. and George E. I. (1992) : «Explaining the Gibbs Sampler», The Ame-

rican Statitician, Vol. 46, No. 3, p. 167-174.

[30] Chamberlain G. (1984) : Panel Data. Handbook of Econometrics. Vol.II, Griliches

and Introligator M. D.

[31] Chamberlain G. (1980) : «Analysis of Covariance with Qualitative Data», The

Review of Economic Studies, Vol. 47, No. 1

[32] Collado D. M. (1997) : «Estimating dynamic Models from Time Series of Inde-

pendent Cross-Sections», Journal of Econometrics, Vol,82, pp37-62

[33] Davis, L. W. (2004) : «The Role of Durables Goods in Households Water and

Energy Consumption : The Case of Front Loading Clothes Washers», Job Market

Paper, University of Wisconsin

[34] Dargay, J. (2002) : «Determinants of Cars Ownership in Rural and Urban Areas :

a Pseudo-panel Analysis», Transportation Research Part E, 38, pp. 351-366.

[35] Dargay, J. and Vythoulkas, C. (1998) : «Estimation of Dynamic Transport De-

mand Models Using Pseudo-panel Data», ESCR Transport Studies Unit Centre

for Transport Studies, University College London.

[36] Dargay J. M. et Vythoulkas P. C. (1999) : «Estimation of a dynamique car ow-

nership model : a pseudo panel approach», Journal of Transport Economics and

Policy, 33, pp. 283-302.

[37] Dargay J. M. (2002) : «Determinants of Car Ownership in Rural and Urban Areas :

a Pseudo-Panel Analysis», Tansportation Research E, 38(5), pp. 351-366.

[38] Dargay J. M. et Vythoulkas P. C. (1997) :«Estimation of a dynamique car owner-

ship model : a pseudo panel approach», ESCR Transport Studies Unit, Ref. 97/47,

University College London

[39] Deaton Angus (1985) : «Panel Data from Time Series of Cross-sections», Journal

of Econometrics, vol. 30 pp 109-126.

[40] Dempster A. P., Laird M. N. and Rubin B. D. (1977) : Maximum Likelihood from

Incomplete Data via le EM Algorithm», Journal of the Royal Statistical Society,

Series B (Methodological), Vol. 39, No. 1, pp. 1-38.

[41] Dubin J. A and Mcfadden D. L. (1984) : « Econometric Analysis of Residential

Electricity Appliance Holdings and Consumpton», Econometrica, 52(2), pp.345-

362.

Bibliographie 60

[42] Dubin, J. A. (1982) : «Econometric Theory and Estimation of the Demand for

Consumer Durable Goods and thier Utilization : Appliance Choice and the Demand

of Electricity», Report No. MIT-EL 82-035-WP, MIT Energy Laboratory, MIT,

Cambridge, MA 02139, USA

[43] Dubin, J. A. (1985a) : Consumer Durable Choice and the Demand for Electricity,

Amsterdam : North-Holland.

[44] Dubin, J. A. (1985b) : «Evidence of Block Switching in Demand Subject to De-

cling Block Rates-A New Approach», Social Science Working Paper 583, California

Institute of Technology, Dept. of Economics.

[45] Dublin, J., J. and McFadden, D. (1984) : «An Econometric Analysis of Residential

Electric Apliance Holdings and Consumption», Econometrica, Vol. 52, No. 2, p.

345-362.

[46] Foster, H., S., Jr., and Beattie, B., R. (1981a) : «Urban Residential Demand for

Water in the United Stated : Reply», Land Economics, 57, 257-265.

[47] Foster, H., S., Jr., and Beattie, B., R. (1981b) : «On the Specification of Price in

Studies of Consumer Demand Under Block Price Scheduling», Land Economics,

57, 624-629.

[48] Fuller, W. A. and Battese, G. E. (1974) : «Estimation of Linear Models with

Cross-Error Structure», Journal of Econometrics, Vol.2, p.67-78.

[49] Gardes F., Langlois S. et Richaudeau D. (1996) : «Cross-Section versus Times-

Series Income Elasticities of Canadian Consumption», Economics letters, Vol.51,

pp169-175.

[50] Gardes F. et Loisy C. (1997) : «La Pauvrete selon les Menages : une Evaluation

Subjective et Indexee sur leur Revenu», Economie et Statistique, No.308-309-310,

pp95-113.

[51] Gassner K. (1998) : «An estimaion of UK Telephone Access Demand Using Pseudo-

Panel Data», Utilities Policy, Vol.7, pp 143-154.

[52] Gately, D. (1980) : «Individual Discount Rates and the Purchase and Utilization of

the Energy-Using Durables : Comment», Bell Journal of Economics, 11, 373-374

[53] Gelman A., Carlin J. B., Stern H. B. and Rubin D. B. (2000) : Bayesian Data

Analysis, New York, Chapman and Hill/CRC.

[54] Gelfand A. E. (2000) : «Gibbs Sampling», Journal of the American Statistical

Asssociation, Vol. 95, No. 452, p. 1300-1304.

[55] German, S. and German, D. (1984) : «Stochastic Relaxation, Gibbs Distribution

and the Bayesian Restoration if Images», IEEE Transactions on Pattern Analysis

and Michine Intelligence, 6, pp. 721-741.

Bibliographie 61

[56] Girma S. (2000) : «A Quasi-Differencing Approach to dynamique Modeling from

a Time Series of Independent Cross-Sections», Journal of Econometrics, Vol.98,

pp365-383.

[57] Goett, A. (1978) : «Appliance Fuel Choice : an Application od Discrete Multivariate

Analysis», PhD. Thesis, Department of Economics, University of California, USA

[58] Goett, A. (1983) : «Household Appliance Choice : Revision of the Residential End-

Use Energy Planning System», Final Report of Research Project 1918-1, Electric

Power Research Institute, California, USA

[59] Gordon S. et Belanger, G. (2003) : «Echantillonnage de Gibbs et autres appli-

cations econometriques des chaınes markoviennes», Working Paper, Departement

d’Economique, Universite Laval.

[60] Gourieroux C. and Monfort A. (1996) : Simulation-based Econometrics Methods,

Oxford University Press, Core Lectures.

[61] Gourvernement du Quebec 1989, 1994, 1999, 2002 : Position Concurrentielle des

Formes d’energie, Ministere des Ressources Naturelles.

[62] Gregoire, C. (2004) : «L’imputation Multiple», These de Maıtrise, Uniervsite Laval.

[63] Haln, J. (1999) : «How Informative is the Initial Condition in the Dynamic Panel

Model with Fixed Effects ?», Journal of Econometrics, Vol.93, p.309-326.

[64] Hanemann, W. M. (1984) : «Discrete/Continuous Models of Consumer Demand»,

Econometrica, Vol. 52, No. 3, p. 541-562

[65] Hausman, J.A. (1978) : «Specification Tests in Econometrics», Econometrica,

Vol.46 No.6, p.1251-1271.

[66] Hausman, J.A. (1979) : «Individual Discount Rates and the Purchase and Utili-

sation of Energy-Using Durables», The Bell Journal of Economics, Vol. 10, No. 1,

p. 33-54.

[67] Hausman, J.A. (1985) : «The Econometrics of Nonlinear Budget Sets», Econome-

trica, Vol. 53, No. 6, p. 1225-1282

[68] Hausman, J.A., Kinnucan, M., and McFadden, D. (1979) : «A Two-Level Electri-

city Demand Model», Journal of Econometrics, Vol. 10, p. 263-289.

[69] Hausman, J. A. and Trimble, J. (1984) : «Appliance Purchase and Usage Adapta-

tion to a Permanent Time-of-Day Electricity Rate Schedule», Journal of Econo-

metrics, Vol. 26, p.115-139.

[70] Hausman, J. A. and D. Wise (1979) : «Attrition Bias in Experimental and Panel

Data : the Gary Income Maintenance Experiment», Econometrica, Vol.47, p.455-

473.

[71] Heckman, J. J (1978) : «Dummy endogenous variables in a simultaneous equations

system», Econometric, Vol 46, No.4, p. 931-959

Bibliographie 62

[72] Heckman, J. J (1979) : «Sample selection bias as a specification error», Econome-

trica, Vol. 47, No.1, p. 153-162

[73] Herriges, J., A. and King, K., K. (1994) : «Residential Demand for Electricity

under Inverted Block Rates : Evidence from a Controlled Experiment», Journal of

Business and Economic Statistics, Vol. 12, No. 4, p. 419-430.

[74] Honore, B. E. (2002) : «Nonlinear Models with Panel Data», Portuguese Economic

Journal, Vol.1, p.163-179.

[75] Honore, B. E. and E. Kyriazidou (2000) : «Panel Data Discrete Choice Models

with Lagged dependent Variables», Econometrica, Vol.70, p.839-874.

[76] Houthakker, H. S. (1950) : «Revealed Preference and the Utility Function», Eco-

nomica, Vol. 17, p.159-174

[77] Hsiao, C. (1992) : «Logit and Probit Models», Working Paper 9210, South Cali-

fornia, Department of Economics.

[78] Hsiao, C. (2001) : «Panel Data Models», Chapiter 16 in B. H. Baltagi, ed., A Com-

panion to Theorical Econometrics (Blackwell publishers, Massachusetts), p.349-

365.

[79] Hsing, Y. (1994) : «Estimation of Residential Demand for Electricity with the

Cross-Sectionally Correlated and Timewise Autoregressive Model», Resource and

Energy Economics, Vol. 16, p.255-263

[80] Hydro-Quebec (2005) : Comparaison des Prix de l’Electricite dans les Grandes

Villes Nord-Americaines

[81] Hydro-Quebec, 1989, 1994, 1999, 2002 : Tarifs d’Electricite

[82] Im, K. S., S. C. Ahn, P. Schmidt and J. M. Wooldridge (1999) : «Efficient Es-

timation of Panel Data Models with Strictly Exogenous Explanatory Variables»,

Journal of Econometrics, Vol.93, p.177-201.

[83] King, M. A. (1980) : «An Econometric Model of Tenure Choice and Demand for

Housing as Joint Decision», Journal of Public Economics, Vol. 14

[84] Kyriazidou, E. (1997) : «Estimation of a Panel Data Sample Selection Model»,

Econometrica, Vol.65, p.1335-1364.

[85] Kyriazidou, E. (2001) : «Estimation of Dynamic Panel Data Sample Selection

Model», Review of Economic Studies, Vol.68, p.543-572.

[86] Lee, C.-J. (2000) : «Dynamic Unobserved Effects for Continuous and Binary Pres-

ponse», Ph.D Thesis, Michigan State University.

[87] Lee, L. F.(1978) : «Unionism and Wage Rates : A Simultaneous Equations Mo-

dels with Qualitative and Limited Dependent Variables», International Economic

Review, Vol. 19, p. 415-433.

Bibliographie 63

[88] Lee, L. F. and Griffiths, W. E. (1978) : «The Prio Likelihood and Best Linear

Unbiased Prediction in Stochastic Parameter Models», Unpublished Manuscript,

Unversity of Minnesota, Dpt of Economics.

[89] Liao Hue-Chu and Chang Tsai-Feng (2002) : « Space-heating and Water-heating

Energy Demands of the Aged in the US», Energy Economics 24 , 267-284

[90] Little R. J. A. and Rubin D. B. (2002) : Statistical Analaysis with Missing Data,

second ed.Wiley Series in Probability and statistics.

[91] Levin, A., C. F. Lin and C. Chu (2002) : «Unit Root Test in Panel Data : Asymp-

totic and Finite Sample Properties», Journal of Econometrics, Vol. 108, p.1-25.

[92] Maddala, G., S., Trost, R., P., Li, H. and Joutz, F. (1997) : «Estimation of Short-

Run and Long-Run Elasticities of Energy Demand from Panel Data Shrinkage

Estimators», Journal of Business and Economic Statistics, Vol. 15, No. 1, pp. 90-

100.

[93] Manski, C. F. (1987) : «Semiparametric Analysis of Random Effects Linear Moedls

from Binary Panel Data», Econometrica, Vol.55, p.357-362.

[94] McFadden, D., Puig, C., and Kirshner, D. (1977) : «Determinants of the Long-

Run Demand for Electricity», In the Proceeding of the Business and Economic

Statistics Section, American Statistical Association, p. 109-119.

[95] McKenzie D. J. (2001) : «Dynamic Pseudo-Panel Theory and Analysis of Consump-

tion in Taiwan and Mexico». Ph.D Disservation, Yale University

[96] McKenzie D. J. (2004) : «Asymptotic Theory for heterogeneous dynamique

Pseudo-Panels», Journal of Econometrics, Vol.120, pp.235-262.

[97] Moffit R. (1993) : «Identification and Estimation of dynamique Models with a Time

Series of Repeated Cross-Sections», Journal of Econometrics, Vol.59, pp99-123.

[98] Nesbakken, R. (2001) : «Energy Consumption for Space Heating : a Discrete-

Continuous Aproach», Scandinavian Journal of Economics, Vol.103, No.1, p. 165-

184

[99] Nijman T. et Verbeek M. (1990) : «Estimation of Time-dependent Parameters in

Linear Models using Cross-Sections, Panels, or Both», Journal of Econometrics,

Vol.46, pp333-346.

[100] Neyman, J. and Scott, E. L. (1948) : «Consistent Estimation from Partillay

Consistent Observations», Econometrica, Vol.16, p.1-32.

[101] Nickell, S. (1981) : «Biases in Dynamic Models with Fixed Effects», Econometrica,

Vol.49, p.1417-1426.

[102] Paquet M-F. (2002) : «Une Approche a Simulation pour le Traitement de Donnees

Longitudinales Incompletes», These de Doctorat, Universite Laval.

Bibliographie 64

[103] Paquet M. F. and Bolduc D. (2004) : «Le Probleme des Donnees Longitudinales

Incompletes : une nouvelle Approche», L’Actualite Economique, Vol. 80, 2/3, p.

341

[104] Phillips, P. C. B. and Moon, H. (1999) : «Linear Regression Limit Theory for

Nonstationary Panel Data», Econometrica, Vol. 57, p. 1057-1111.

[105] Poyer, D. A. and Williams, M. (1993) : «Residential Energy Demand : Additional

Empirical Evidence by Minority Household type», Energy Economics, Vol. 15,

p.93-100.

[106] Polzin, P. E. (1984) : «The Specification of Price in Studies of Consumer Demand

Under Block Price Scheduling», in the Proceedings of the Business and Economic

Statistics Section, American Statictical Association, p. 109-119.

[107] Raj B. et Baltagi B. H. (1992) : «Can Cohort Data Be Treated as Genuine Panel

data ?», Studies in Empirical Economics, Vol. 17, No. 1, pp. 9-23

[108] Reiss, P. and White M.W. (2005) : «Household Electricity Demand Revisited»,

Review of Economic Studies, Vol. 72, p. 853-883.

[109] Richarson, S. and Green, P. (1997) : «On Bayesian Analysis of Mixtures with

and Unknown Number of Components» (with discussion), Journal of the Royal

Statistical Society, Ser. B, p.731-792.

[110] Robertson, D. and Symons, J. (1992) : «Some Strange Properties of Panel Data

Estimators», Journal of Applied Econometrics, Vol.7, p.175-189.

[111] Rubin D. B. (1976) : «Inference and Missing Data», Biometrika, 63, pp.581-592.

[112] Rubin D. B. (1978) : «Multiple Imputations in Sample Surveys- a Phenomenologi-

cal Bayesian Approach to Nonresponse», The Proceedings of the Survey Research

Methods Section of The American Statistical Assciation, p. 20-34.

[113] Rubin D. B. (1986) : «Statistical Matching Using File Concatenation with Ad-

justed Weight and Multiple Imputations», Journal of Business and Economic Sta-

tistics, 4, pp. 87-94.

[114] Rubin D. B. (1987) : Multiple Imputation for Nonresponse in Surveys, New York,

J. Wiley and Sons.

[115] Rubin D. B. (1996) : «Multiple Imputation after 18+ Years», Journal of the

American Statistical Association, 91, pp. 473-489.

[116] Rubin D. B. and Schenker N. (1986) : «Multiple Imputation for Interval Estima-

tion from Simple Random with Ignorable Nonresponse», Journal of the American

Statistical Association,81, pp. 366-374.

[117] Sanga, D. M. (1999) : «Estimation des Modeles Econometriques de Choix Dis-

crets/Continus avec Choix Polytomiques Interdependants : une Approche par Si-

mulation», These de Doctorat, Universite Laval

Bibliographie 65

[118] Schafer J. L. (1997) : Analysis of Incomplete Multivariate Data, New York, Chap-

man and Hill.

[119] Schafer J. L. (2000) : «Analysis of Incomplete Multivariate Data», Monographs

on Statistics and Applied Probabilities 72. Chapman and Hall/CRC.

[120] Sevestre, P. and A. Trogon (1992) : «Linear Dynamic Models», in Laszlo Matayas

eds., The Econometrics of Panel Data, Handbook of Theory and Applications,

p.97-117.

[121] Skoufias, E. and A. Suryahadi (2002) : «A Cohort Cnalysis of Wages in Indonesia»,

Applied Economics, Vol. 34, No. 13, pp. 1703-1710.

[122] Tanner M. A. and Wong Wing Hung (1987) : «The Calculation of Posteriori

Distributions by Data Augmentation», Journal of the American Statistical Assso-

ciation, Vol. 82, No. 398, p. 528-540.

[123] Taylor, L., D., (1975) : «The Demand for Electricity : A Survey», The Bell Journal

of Economics, Vol. 6, No. 1, p. 74-110.

[124] Vaage K. (2000) : «Heating Technology and Energy Use : a Discret/Continuous

Choice Approach to Norwegian Household Energy Demand», Energy Economics,

Vol.22, No.6, p. 649-666

[125] Verbeek M. et T. Nijman (1993) : «Minimum MSE Estimation of a Regression

Model with Fixed Effects frm a Series of Cross-Sections», Journal od Econometrics,

Vol.59, pp125-136.

[126] Verbeek M. et T. Nijman (1993) : «Can Cohort Data Be Treated As Genuine

Panel data ?», Empirical Economics, Vol. 17, pp. 9-23.

[127] Verbeek M. et Vella F. (2004) : «Estimating dynamique Models from Repeated

Cross-Sections», Journal of Econometrics, Vol., pp.

[128] Vidal, V. (2006) : «Echantillonnage de Gibbs avec Augmentation de Donnees et

Imputation Multiple», These de Maıtrise, Universite Laval.

[129] Winter Russel, S. (1997) : «Discounting and its Impact on Durables Buying De-

cisions», Marketing Letters, Vol. 8, No.1, p. 109-118

[130] Wooldridge, J. M. (1995) : «Selection Corrections for Panel Data Models un-

der Conditional Mean Independence Assumptions», Journal of of Econometrics,

Vol.68, p.115-132.

[131] Wooldridge, J. M. (2000) : «The Initial Conditions problem in Dynamic, Nonlinear

Panel Data Models with Unobserved Heterogeneity», Working Paper, Department

of Economics, Michigan State University

[132] Wooldridge, J. M. (2002) : Econometric Analysis of Cross-Section and Panel

Data, MIT Press, Massachusetts.

[133] Wooldridge, J. M. (2003 and 2005) : Introductory Econometrics, A Modern Ap-

proach, 2e ed., Michigan State University, Thomson South-Western.

Bibliographie 66

[134] Wu, C. F. J. (1983) : «Generalized Linear Models with Random Effects : a Gibbs

Sampling Approach», Journal of the American Statistical Association, Vol. 86, pp.

79-86.

Chapitre 3

Estimation de la demande

d’electricite avec un modele a

classes latentes

3.1 Introduction

Dans ce chapitre, nous sommes interesses a l’estimation de la demande d’electricite

conditionnelle au choix du mode de chauffage. De plus, l’electricite est tarifee selon la

quantite journaliere consommee, de sorte que le prix marginal depend de la quantite

et la quantite consommee depend aussi du prix marginal. Notons aussi que la consom-

mation journaliere n’est pas observable de sorte que cela aboutit a un modele avec

deux groupes (ou classes) de menages qui ne sont pas observables. Nous corrigeons

le probleme de biais de selection en utilisant l’approche en deux etapes proposee par

Dubin et McFadden (1984), ou dans la premiere etape, nous utilisons un modele logit

mixte avec erreurs autoregressives generalisees d’ordre un pour calculer les correcteurs

de biais, et dans la seconde etape, nous estimons, par le maximum de vraisemblance

en information limitee, la demande conditionnelle au choix du mode et de la classe en

utilisant un modele a classes latentes. Les elasticites prix directe, prix croise et revenu

de la demande d’electricite sont egalement evaluees pour chacune des deux classes. Le

modele de demande sans classes qui corrige cependant le biais de selection est estime

pour des fins de comparaisons. Etant donne que la consommation d’energie fait interve-

nir des biens durables, nous estimons aussi des taux d’escompte specifiques au systeme

de chauffage choisi. Dans les etudes anterieures, les taux d’escompte individuels sont

estimes en supposant l’hypothese d’homogeneite entre les agents economiques ; ils sont

Chapitre 3. Estimation de la demande d’electricite avec un modele a classes latentes68

cependant tres eleves (superieurs aux taux d’interet sur les cartes de credit). Une prise

en compte de l’heterogeneite entre les individus pourraient aboutir a des valeurs de taux

d’escompte beaucoup plus proches de la realite. Dans ce chapitre, nous developpons de

nouveaux outils : un modele a classes latentes tenant compte de l’endogeneite du prix

marginal et nous proposons une nouvelle facon d’estimer les taux d’escompte en sup-

posant une certaine heterogeneite entre les individus. La section (3.2) fait un resume

des travaux anterieurs, la section (3.3) presente le modele de choix discret/continu, la

section (3.4) presente le logit mixte avec erreurs GAR(1). Le modele de demande condi-

tionnelle au choix du mode de chauffage est presente a la section (3.5). La section (3.6)

presente le modele de demande conditionnelle au choix de la tranche de consommation ;

la section (3.7) decrit la methode d’estimation du maximum de vraisemblance utilisee.

Les donnees sont presentees a la section (3.8). Nous presenterons ensuite les resultats de

nos estimations aux sections (3.9 et 3.10 ). La question du taux d’escompte individuel

est traitee dans la section (3.11) et enfin nous conclurons a la section (3.12).

3.2 Revue de la litterature

Nous sommes parfois confrontes, dans le cadre de l’analyse de la demande, a des

situations ou les choix continus sont relies aux choix discrets. Cela vient du fait que les

deux types de choix sont derives de la meme decision de maximisation de l’utilite de

l’agent considere. Dans un tel contexte, toute estimation qui ignore cette simultaneite

produirait des estimateurs biaises et non convergents. King (1980) fut le premier a

souligner cette interdependance en se servant du choix du type d’habitation ou de

propriete comme exemple. Il propose d’estimer le modele par la methode du maximum

de vraisemblance en information complete ; cette methode n’a cependant pas pu corriger

le biais de selection : il a considere la demande non conditionnelle plutot que la demande

conditionnelle. Apres les tentatives de King (1980), Dubin et McFadden (1984) se sont

interesses a la demande d’electricite et au choix d’appareils electromenagers des menages

des Etats-Unis. Ils furent les premiers a proposer une methode d’estimation appropriee

aux modeles de choix discrets/continus qui corrigerait le probleme de biais de selection.

Leur demarche se resume en deux grandes etapes. La premiere etape consiste a estimer

d’abord le modele de choix par la methode du maximum de vraisemblance et a constituer

ensuite les correcteurs de biais de selection correspondant a l’alternative (ou modalite)

choisie. Dans la deuxieme etape, ils estiment la demande conditionnelle a l’alternative

choisie en ajoutant les correcteurs de biais obtenus dans la premiere etape. La demande

conditionnelle est ensuite estimee en utilisant la methode des variables instrumentales,

la forme reduite ou en introduisant directement les correcteurs. Les estimateurs obtenus

sont convergents.


Bernard, Bolduc et Belanger (1996) ont aussi estime un modele de demande d’electricite

des menages quebecois en utilisant la demarche precedente. A la difference de Dubin et

McFadden (1984) qui ont utilise un logit polytomique pour la partie discrete, eux ont

plutot suppose un logit mixte avec des erreurs autoregressives generalisees d’ordre un

ou GAR(1) ; le GAR(1) permet en effet de prendre en compte la correlation potentielle

entre les alternatives de chauffage.

Hanemann (1984) s’est interesse a l’estimation de la demande de produits de marques

differentes en se servant de la methode du maximum de vraisemblance en information

complete. Cependant, il a utilise la densite inconditionnelle (plutot que la densite condi-

tionnelle) qui ne corrige pas le biais de selection. Il propose alors la methode en deux

etapes du maximum de vraisemblance en information limitee. A la premiere etape, il

estime un modele logit polytomique. Ensuite, a la deuxieme etape, il utilise les moindres

carres ordinaires (MCO) ou les moindres carres generalises (MCG du) du modele de

demande conditionnelle (avec les correcteurs de biais de selection). Les estimes sont

recuperes pour servir comme valeurs initiales pour la seconde etape. Il n’a cependant

pas fait une application empirique de sa methode.

Sanga (1999) utilise deux approches (maximum de vraisemblance simulee en infor-

mation complete et en information limitee) pour estimer la demande d’electricite des

menages quebecois. Il utilise par contre un modele probit poltomique et non un logit

mixte comme dans Bernard, Bolduc et Belanger (1996).

Vaage (2000) aussi utilise la methode en deux etapes pour estimer la demande

d’energie des menages Norvegiens. Nesbakken (2001), comme Sanga (1999) estime la de-

mande d’energie en se servant du maximum de vraisemblance en information complete.

Liao et Chang (2002) ont estime la demande d’energie pour le chauffage de l’espace et

de l’eau des personnes agees aux USA en se servant de l’approche en deux etapes.

Tous ces travaux ont ete effectues dans un contexte de prix lineaire. Dans notre

etude, nous interessons a estimer un modele de demande d’electricite (donc un modele

de choix discret/continu) en prenant explicitement en compte la tarification d’Hydro-

Quebec, societe mandatee pour la production et la vente de l’electricite au Quebec.

Hydro-Quebec utilise en effet une tarification croissante par tranche : un premier prix

(p1) est fixe lorsque la consommation journaliere du menage ne depasse pas les 30 kilo-

watt/heures (kWh) et un autre prix (p2 > p1), pour toutes les quantites au dessus des 30

kWh. Le prix (marginal) depend donc de la demande, mais il constitue aussi une variable

explicative dans l’equation de demande. Il se pose alors un probleme d’endogeneite du

prix. En presence d’une structure de tarification par tranche, les menages doivent choisir

le mode de chauffage ainsi que la tranche ou classe de consommation d’energie. Toute


estimation du modele de demande d’electricite (avec prix non lineaire) qui ignore ce

probleme d’endogeneite produirait des estimateurs biaises et non convergents, meme si

on corrigeait pour le probleme de selection du au choix du mode de chauffage. On sait

depuis le papier d’Houthakker (1951), que les prix par tranche de consommation ont

des implications econometriques importantes. Taylor (1975) soulignait le biais potentiel

qui resulterait de l’estimation des elasticites de la demande lorsque la structure des prix

est non lineaire. Selon lui, la non linearite de la contrainte budgetaire du consommateur

a des consequences sur la fonction de demande, les courbes d’Engel et l’equilibre du

consommateur.

Plusieurs auteurs ont tente de resoudre le biais provenant de la non linearite des prix.

On peut citer pour la demande d’electricite,Taylor (1975), McFadden, Acton, Mitchell

et Mowill (1976), Puig et Kirshner (1977), Barnes, Gillingham et Hageman (1981),

Dubin (1985a et 1985b), Herrigues et King (1994), Reiss et White (2005) ; pour l’eau,

il y a les travaux de Billings et Agthe (1980, 1981), Foster et Beattie (1985a et 1985b) ;

pour le gaz naturel, Barnes, Gillingham et Hageman (1982), Polzin (1984), etc.

Il existe une variete de methodes d’estimation des modeles de demande avec en-

dogeneite du prix. Herriges et King (1994) en donnent une synthese. Lorsqu’il y a un

probleme de variable explicative endogene, les estimateurs des moindres carres ordi-

naires (MCO) sont biaises. Plusieurs methodes d’estimation peuvent alors etre utilisees

pour corriger ce biais.

L’estimation par la forme reduite fut utilisee dans les travaux de Taylor (1975), Barnes,

Gillingham et Hagemann (1981), Hausman, Kinnucan et McFadden (1979), Hausman

et Trimble (1984). Cette methode a cependant deux limites importantes : probleme

d’identification et approche ad hoc. L’estimation par les variables instrumentales est

techniquement superieure a l’estimation par la forme reduite parce qu’elle permet de

resoudre non seulement le biais d’endogeneite du prix, mais aussi elle permet de specifier

l’equation de demande en coherence avec la theorie neoclassique de maximisation de

l’utilite. Cependant, les estimateurs obtenus ne sont pas les meilleurs. L’estimation par

le maximum de vraisemblance structurel a ete utilisee dans les travaux de Burtless et

Hausman (1978) et ceux de Dubin (1985b). Cependant, il se peut que les probabilites

qui entrent dans la fonction de vraisemblance soient negatives. Herriges et King (1994)

proposent alors la methode du maximum de vraisemblance structurel modifie. Enfin,

il y a la methode des moments generalises (GMM) qui fut utilisee par Reiss et White

(2005) pour estimer un modele de demande dynamique.

Comme nous pouvons le constater, il n’existe pas encore de travaux qui aient pris

en compte a la fois le probleme de la simultaneite entre choix discret et choix continu

et le probleme de l’endogeneite du prix. On s’interesse soit a l’un soit a l’autre des


deux problemes, mais pas au deux a la fois. La structure des donnees dont nous dispo-

sons implique que si nous voulons estimer la demande d’electricite des menages avec la

structure de tarification d’Hydro-Quebec, nous devons resoudre simultanement ces deux

problemes pour obtenir des estimateurs convergents. Notre modele serait ainsi beaucoup

plus adapte a la realite. Dans cette etude, nous utiliserons la methode du maximum

de vraisemblance simule a information limitee qui a l’avantage de corriger a la fois le

biais de selection venant du choix du mode de chauffage et le biais d’endogeneite du

prix. La tarification d’Hydro-Quebec cree implicitement deux classes de menages qui

ne sont pas directement observables dans la base de donnees disponible. Nous propo-

sons d’utiliser un modele a classes latentes pour corriger le probleme d’endogeneite du

prix. Les modeles a classes latentes sont souvent utilises dans un contexte de variable

dependante discrete ; ils permettent de prendre en compte l’heterogeneite qui existe

entre differents groupes d’observations. La notion de classes latentes fut introduite en

1950 par Lazarsheld pour un modele dichotomique. Vingt ans plus tard, Goodman

(1974) rend son modele applicable en developpant un algorithme pour obtenir les esti-

mateurs du maximum de vraisemblance des parametres. Les modeles a classes latentes

peuvent s’appliquer a des variables discretes ou continues. Dans un modele a classes

latentes, les coefficients sont specifiques aux groupes. Dans notre etude, nous avons

affaire a des classes latentes puisque les deux groupes de consommateurs ne sont pas

directement observables. Cela vient du fait que la consommation journaliere du menage

n’est pas directement observable dans la base de donnees de l’etude. Nous avons uni-

quement l’information sur la consommation annuelle du menage ainsi que le nombre de

jours de consommation, et donc a la limite, nous pouvons connaıtre sa consommation

journaliere moyenne sur une annee.

La plupart des travaux portant sur les modeles a classes latentes traitent de modeles

a variables dependante discrete plutot que de modeles continus : Gopinath (1995),

Greene et Singer (2003), Vermunt et Magidson (2005), Shen et Hashinmoto (2006), etc.

Par ailleurs, les auteurs ne s’interessent pas a estimer le modele latent (modele de choix

de la classe) de facon explicite ; ils se contentent seulement d’estimer la valeur de la

probabilite. Dans ce chapitre, nous etendons les modeles a classes latentes au cas ou la

variable dependante est continue et nous developpons un modele latent qui permettra

d’estimer a la fois les parametres du modele de choix de la classe et les valeurs des

probabilites qu’un menage choisisse une classe donnee. A notre connaissance, il s’agit

d’une premiere dans la litterature.

L’analyse de la demande d’electricite nous amene a nous interesser aussi a la ques-

tion de biens durables puisque le menage utilise des equipements pour le chauffage de

l’eau et de l’espace. La decision du menage portant sur le choix du type de systeme de

chauffage fait intervenir la notion de taux d’escompte, puisqu’il est question de prendre


des decisions inter-temporelles. Les travaux anterieurs (notamment ceux de Hanneman

(1979), Goett (1980), Gately (1980), Greene (1983), Dubin (1982), Houston (1983),

Dubin et McFadden (1984)) ont souvent surestime le taux d’escompte des menages. Ils

supposent implicitement l’hypothese d’homogeneite entre les individus dans l’estimation

du taux d’escompte des menages. Winter (1997) soulignait les limites associees au fait

qu’on suppose le meme taux d’escompte pour tous les menages. Il propose plutot d’es-

timer un taux d’escompte implicite pour chaque menage ou chaque groupe de menages.

Supposer que le taux d’escompte change entre les individus uniquement a travers leur

revenu ne serait pas suffisant pour tenir compte de l’heterogeneite qui existe entre ces

derniers. Les autres comme Hanneman (1979), Dubin et McFadden (1984) ont suppose

que le taux d’escompte variait entre les menages uniquement a travers leur revenu. La

sur-estimation du taux d’escompte pourrait etre due a une mauvaise specification du

modele de choix. Nous proposons alors d’estimer un taux d’escompte pour chaque type

de consommateurs c’est-a-dire des taux d’escompte implicites par groupe de menages

qui tiennent compte de leur heterogeneite tout en etant fonction de leur revenu. Nous

considerons uniquement l’hypothese d’heterogeneite deterministe. Les taux d’escompte

peuvent egalement etre estimes en supposant de l’heterogeneite aleatoire, mais nous lais-

sons ceci pour des travaux futurs. Nous presenterons dans un premier temps le modele

discret/continu, ensuite, nous decrirons a la section (3.4) le logit mixte avec erreurs

GAR(1).

3.3 Le modele econometrique de choix discret/continu

L’agent economique qui fait l’objet de notre etude est le menage. Celui-ci est appele

a prendre trois decisions :

– choisir le mode de chauffage de l’eau et de l’espace parmi un ensemble de Cn

modalites. Soit j le mode de chauffage choisi par le menage : j ∈ Cn, avec Cn

le nombre de modalites disponible pour l’individu n. Nous indicons l’ensemble

des choix possibles par n parce qu’il peut arriver qu’un menage n’ait pas acces

a une modalite donnee (exemple : le gas naturel n’est pas disponible a tous les

menages). Le menage choisira le mode j si l’utilite procuree par ce mode est la

plus grande, comparee aux autres modes.

– choisir la tranche de consommation a laquelle il va appartenir a travers le mode

d’utilisation de l’electricite : mode d’usage intensif ou non intensif. Nous utiliserons

l’indice s pour designer la classe de consommation du menage. Dans notre etude,

s ne prendra que deux valeurs : 1 et 2.

– choisir finalement la quantite d’electricite a consommer. Ce dernier choix est relie

au choix de la tranche puisque c’est la quantite journaliere d’electricite consommee


qui va determiner la classe. Soit yjn la quantite d’electricite demandee. Cette quan-

tite est determinee a partir de l’identite de Roy appliquee a la fonction d’utilite

indirecte.

Notre objectif est de modeliser les trois choix en utilisant la methode du maximum

de vraisemblance en information limitee. Nous comptons utiliser un modele a classes

latentes qui permet de tenir compte des trois choix en meme temps. Il s’agit en d’autres

termes d’estimer la demande d’electricite conditionnelle au choix du mode de chauffage

et au choix de la classe. Les sections suivantes presentent les trois modeles de choix.

3.4 Le modele de choix du mode de chauffage : le

logit mixte

Supposons que le menage n (n = 1, ..., N) fait face a un ensemble d’alternatives

possibles Cn. Le menage doit faire un choix parmi un ensemble de systemes de chauffage

de l’eau et de l’espace. Ces systemes fonctionnent soit au gaz naturel, au mazout, a

l’electricite, au bois, ou une combinaison de l’une ou l’autre des energies. Le menage

choisit l’alternative j avec j ∈ Cn dans le but de maximiser son utilite. Nous supposons

une fonction d’utilite indirecte qui satisfait les proprietes classiques de maximisation

de l’utilite. Apres avoir choisi un mode de chauffage (ou portefeuille d’appareils), le

menage l’utilise pour produire des services dont le processus de production necessite de

l’energie.

Supposons que le menage maximise sa fonction de l’utilite (Ujn). Etant donne le

mode de chauffage choisi, le menage a une fonction d’utilite indirecte conditionnelle de

la forme :

Ujn (j, rev − rj,x, Pe, Pm, Pg, Pbie, εj, η) , (3.1)

ou Pe est le prix de l’electricite, Pm le prix du mazout, Pg le prix du gaz naturel et Pbie

le prix de la bi-energie ; εj est l’ensemble des caracteristiques non observables du mode

de chauffage, η est l’ensemble des caracteristiques non observables du menage, rj est

le cout total normalise du mode j, rev est le revenu du menage et x est un vecteur de

variables exogenes. Nous supposons comme dans Dubin et McFadden (1984) que le cout

total (rj) est compose du cout fixe et du cout moyen normalise associes a la modalite

choisie :

rj =∑

i∈Cn

Piqij + ρjrcj

ρj = ρ0j + ρ1jrevj,


avec ρj le taux d’escompte associe au systeme de chauffage j. Cn est l’ensemble des

energies disponibles pour le menage n. qij est la quantite annuelle consomme de l’energie

i du menage qui a choisi la modalite j. Les details concernant le calcul des couts fixes

et couts moyens sont dans Belanger (1992).

Le menage choisit l’alternative j si et seulement si : Ujn > Uin ∀i 6= j. Definissons

la variable binaire djn comme suit :

djn =

1 si Ujn > Uin ∀ j ∈ Cn ∧ i 6= j

0 sinon

La fonction d’utilite Ujn se decompose en 2 elements : une partie deterministe (Vjn)

et une autre aleatoire (εjn) :

Ujn = Vjn + εjn.

La partie deterministe est specifiee comme suit :

Vjn = Xjnβ,

ou X est un vecteur de toutes les variables exogenes du modele. La probabilite que le

menage n choisisse l’alternative j est :

Pn (j) = P (Ujn > Uin ∀ i 6= j)

= P (Vjn + εjn > Vin + εin ∀ i 6= j)

= P (εin − εjn < Vjn − Vin ∀ i 6= j) . (3.2)

Nous supposons un modele autoregressif generalise d’ordre un (ou GAR(1)) :

Ujn = Vjn + εjn

εjn = σjξjn + vjn

ξjn = ρ∑

i6=j

wij,nξin + ζjn ζjn ∼ N(0, 1) (3.3)

vjn ∼ iid Gumbel, (3.4)

avec : σj l’ecart-type associe a l’alternative j, ρ est un coefficient de correlation et les

wij,n sont des poids qui respectent∑i6=j

wij = 1 ∀i pour un n donne. Le parametre ρ

est un coefficient de correlation qui mesure le degre de linearite entre chaque ξin et son

”voisin” correspondant, soit ξjn pour j = 1, ...Jn. De plus, nous imposons la restriction

selon laquelle (−1 < ρ < 1) dans le but d’assurer la stabilite du processus defini dans


l’equation (3.3). Les poids wij,n sont des fonctions parametriques decrivant l’influence

de chaque erreur sur les autres erreurs. On definit ces poids de la facon suivante :

wij,n =w∗

ij,n

Jn∑j=1

w∗ij,n

, ∀i 6= j et wii,n = 0 ∀i (3.5)

w∗ij,n = g

(R1

ij,n, R2ij,n, ..., RL

ij,n, θ1, θ2, ..., θH

), ∀i 6= j et wii,n = 0 ∀i,

ou il y a H parametres θh et L variables Rlij,n.

Le modele (GAR(1)) fut introduit par Ben-Akiva et Bolduc (1991) et Bolduc (1992)

dans le contexte de l’estimation du probit polytomique. Le GAR(1) permet de reduire

le nombre de parametres de nuisance lors de l’estimation des elements de la matrice

de variance-covariance des erreurs. L’approche du GAR(1) permet de modeliser de

facon parcimonieuse la structure de correlation des erreurs avec seulement quelques

parametres. Elle peut egalement modeliser des formes tres generales de dependances

entre les erreurs. Un des avantages de cette approche est que le nombre de parametres

a estimer ne croıt pas necessairement avec le nombre de modalites. Cette hypothese

s’avere utile puisqu’elle reduit enormement les difficultes de calcul lors de l’estimation.

L’hypothese du GAR(1) a ete egalement utilisee dans les travaux de Belanger (1992)

et Bernard, Bolduc et Belanger (1996). Nous retenons la meme structure de correlation

comme dans les travaux de ces derniers auteurs, avec une legere modification au niveau

des poids. Nous avons modifie certains poids et les colonnes correspondant a la modalite

7 (electricite/electricite) ont ete modifiees. En effet, nous ne considerons pas le modele

de choix en deviation par rapport a une modalite de reference comme ce fut le cas dans

les travaux de Bernard, Bolduc et Belanger (1996). La matrice de correlation retenue

est la suivante :

0 1 0 0 0 0 0 0 0

1 0 0 0 0 0 0 0 0

0 0 0 1 0.4 0.4 0.7 0 0

0 0 1 0 0.4 0.4 1 0 0

0 0 0.4 0.4 0 1 0.4 0 0

0 0 0.4 0.4 1 0 0 0 0

0 0 0 0.7 1 0.4 0 0 0

0 0 0 0 0 0 0 0 1

0 0 0 0 0 0 0 1 0

La derniere hypothese (3.4) : vjn ∼ iid Gumbel permet d’avoir un modele logit mixte

(ou modele a noyau logistique). La particularite du logit mixte est que la partie aleatoire

du modele comporte deux elements : un terme d’erreur normal et un autre terme qui


suit une distribution Gumbel i.i.d. Le logit mixte permet de prendre en compte la

correlation potentielle qui existe entre les alternatives. S’il existe une correlation entre

les alternatives et que celle-ci n’est pas prise en compte dans la specification du modele,

les estimateurs seront biaises et non convergents. La non prise en compte de la structure

de correlation peut etre consideree comme une omission d’information pertinente dans

le modele. Le logit mixte a comme cas particulier le logit lorsqu’il n’existe aucune

correlation entre les alternatives, ceci s’obtient lorsqu’on impose que ρ = 0 et que

σj = 0 ∀j. Le logit mixte possede certains avantages par rapport au modele probit,

logit ou plus generalement les modeles GEV (generalized extreme value). En effet, le

logit mixte corrige les limites associees au logit en prenant en compte l’heterogeneite

entre les observations, des formes flexibles de substitution et la correlation entre les

facteurs non observables a travers le temps. De plus, contrairement au modele probit,

le logit mixte n’est pas contraint a avoir un terme d’erreur normalement distribue ; le

terme d’erreur peut suivre entre autre une loi triangulaire, log-normale, etc. (McFadden

et Train (2000), Train (2002) et Ben-Akiva et al. (2001)).

Le modele decrit plus haut peut aussi s’ecrire sous forme vectorielle, de facon beau-

coup plus compacte :

dn = [d1n, ...dJn

]′

(3.6)

Un = Xnβ + εn, (3.7)

ou dn, Un et εn sont des vecteurs (Jn × 1) et Xn est une matrice de dimension (Jn ×K)

avec K le nombre de parametres de la partie deterministe de l’utilite. Les hypotheses

du modele se resument dans les points suivants :

a. εn = Tnξn + vn avec Tn une matrice diagonale (Jn × Jn) qui contient les ecart-type

σj sur sa diagonale

b. ξn = ρWnξn + ζn, ζn ∼ N (0, IJn)

c. ζjn et vn sont des vecteurs (Jn × 1), Wn est une matrice (Jn × Jn) dont les elements

sont definis en (3.5) et IJnest une matrice identite de dimension Jn.

L’hypothese (b.) permet d’ecrire que : ξn = (I − ρWn)−1 ζn = P−1n ζn avec Pn =

(I − ρWn). En substituant cette derniere expression dans l’equation de l’utilite (3.7),

on obtient :

Un = Xnβ + TnP−1n ζn + vn.

Sous ces hypotheses, on a :

E (Un) = Xnβ

V (Un) = Ψn = TnP−1n P−1′

n Tn +π2

6IJn

.


Evaluons maintenant les probabilites de choix des modes de chauffage. Selon la

definition du modele, la probabilite qu’un individu n choisisse l’alternative j est une

integrale sur tout le domaine de ξn :

P (j) =

∫· · ·∫

Λn (j |ξn ) h (ξn) dξn, (3.8)

ou :

Λn (j |ξn ) =eVjn+σjξn

∑i

eVin+σiξn.

La probabilite (3.8) contient des integrales multiples et cela necessite l’utilisation des

methodes numeriques pour son evaluation. Il y aura autant d’integrales qu’il y a d’al-

ternatives. Si le nombre d’alternatives est grand (superieur a 3), l’estimation numerique

devient ardue et exigerait beaucoup de temps de calcul. Une alternative est l’approche

par simulation proposee par McFadden (1989) ainsi que Pakes et Pollard (1989). Cette

approche consiste a remplacer les probabilites ayant des integrales multiples par des

simulateurs lisses. La procedure consiste dans une premiere etape a tirer des valeurs de

ξn a partir de sa fonction de densite. Soit ξsn le seme tirage du vecteur ξn. La seconde

etape consiste a calculer la probabilite logistique associee a chacun des s tirages. La

troisieme etape consiste a repeter la premiere et deuxieme etapes plusieurs fois et a

prendre ensuite la moyenne des resultats obtenus. On obtient finalement la probabilite

simulee suivante :

P (j) =1

S

S∑

s=1

Λn (j |ξsn ) , (3.9)

avec :

Λn (j |ξsn ) =

eVjn+σjξsn

∑i

eVin+σiξsn

qui est en fait la probabilite du logit polytomique conditionnelle a une valeur donnee

ξsn du vecteur ξn. Pour S grand, la probabilite P (j) est un estimateur convergent et

asymptotiquement sans biais de P (j). Nous estimons le modele par la methode du

maximum de vraisemblance simule (MVS) (Goureroux et Monfort, 1996). Le MVS et

le maximum de vraisemblance (MV) se confondent lorsque S tend vers l’infini de sorte

que les proprietes asymptotiques du MVS sont evidemment les memes que celles du

MV. Une alternative au MVS serait la methode des moments simules (MMS) qui exige

la simulation de chaque probabilite ; le MVS exige par contre de simuler uniquement la

probabilite de l’alternative choisie. Lorsqu’il y a beaucoup d’alternatives, comme c’est le

cas dans cette etude, le MVS est alors preferable au MMS. Vekeman, Bolduc et Bernard

(2004) ont aussi utilise la methode du MVS pour estimer un modele de choix des modes

de transport. Ils ont utilise un logit mixte avec erreur composee. L’article de McFadden

et Train (2000) donnent plus de details sur le logit mixte et les methodes utilisees pour

son estimation.


3.5 Le modele de demande conditionnelle au choix

du mode

Depuis les travaux de Dubin et McFadden (1984), les praticiens realisent de plus en

plus que les choix discrets et continus sont inter-relies. Cela implique que l’esperance

conditionnelle du terme d’erreur de l’equation de demande est non nulle : E [ηjn |εjn ] 6=0. Ce dernier terme constitue un biais de selection. De ce fait, l’equation de demande

d’electricite etant donne la modalite j doit s’ecrire en tenant compte du biais de selection

du au choix du mode de chauffage :

yjn = Wjnθ + ηjn (3.10)

= Wjnθ + E (ηjn |εjn ) + ajn, (3.11)

ou ajn est un terme d’erreur que nous supposons de moyenne nulle, W est un vecteur

de variables explicatives. Pour simplifier la notation, nous ecrivons que E [ηjn |εjn ] =

E [ηjn |j ]. En nous basant sur Dubin et McFadden (1984), supposons que la distribution

de ηjn conditionnelle a (ε1n, ...., εJn

) a une moyenne egale a σ√

2/λ∑

j∈Cnρjεjn et de

variance σ2(1−∑

j∈Cnρ2

j) avec les conditions suivantes :∑

j∈Cnρjεjn = 0 et

∑j∈Cn

ρ2j <

1. La premiere condition est imposee afin que le terme d’erreur de l’equation de demande

(soit ηjn) ait une moyenne centree en zero etant donnee que la moyenne du terme

d’erreur Gumbel (soit εjn) est egale a une constante donnee 1. La deuxieme condition

est imposee afin que la moyenne du terme d’erreur ηjn soit positive. Le terme λ est un

parametre d’echelle que nous fixons a 1 comme on le fait habituellement avec le modele

logit. Le ρj traduit la correlation entre le terme d’erreur de l’equation de demande et

celui de l’equation de choix du mode de chauffage.

Il existe une autre variable aleatoire (ξjn) qui devrait etre prise en compte. En effet,

pour avoir E [ηjn |j ], il faut prendre l’integrale sur tout le domaine de ξn :

E [ηjn |j ] =

∫

An

E [ηjn |j, ξjn ] f (ξn) dξn.

Un simulateur lisse et convergent de E [ηjn |j ] propose par Vekeman et al. (2004) serait :

E [ηjn |j ] =1

S

S∑

s=1

E [ηjn |j, ξsn ] , (3.12)

1Si ε ∼ Gumbel(0, 1), cas standard, alors : E(ε) = 0.5772 et V (ε) = π2

6. Donc, l’esperance du terme

d’erreur ε n’est pas nulle. Pour que le terme d’erreur du modele de demande (η) soit de moyenne nulle,

il faut necessairement imposer la condition suivante suivante :∑

i∈Cn,j 6=i ρj + ρi = 0


ou les ξsn sont des tirages dans la loi f (ξn) qui est ici une loi normale et S le nombre

total de tirages. En adoptant la specification de Dubin et McFadden (1984), l’esperance

conditionnelle de η est definie de la facon suivante :

E [ηjn |εjn, ξn ] =σ√

2

λ

∑

i∈Cn

ρiE [εin |j, ξn ] .

Cette esperance n’est pas specifique au mode choisi (j). Pour cette raison, l’indice j

sera mis en exposant et non en indice :

E[ηj

n |εjn, ξn

]=

σ√

2

λ

∑

i∈Cn

ρiE [εin |j, ξn ]

E[εj

n |j, ξn

]=

− ln Λ (j |ξn ) × λ

√3

π............si i = j

Λ(j|ξn )1−Λ(j|ξn )

ln Λ (j |ξn ) × λ√

3π

.........si i 6= j.

Donc, on deduit que :

E[ηj

n |j, ξn

]=

√6σ

π

[ ∑

i∈Cn,i6=j

(ρi

Λ (i |ξn )

1 − Λ (i |ξn )ln Λ (i |ξn )

)− ρj

ln Λ (j |ξn )

1 − Λ (j |ξn )

]

=

√6σ

π

[∑

i∈Cn

ρiΛ (i |ξn )

1 − Λ (i |ξn )(ln Λ (i |ξn ) − dij)

],

avec dij = 1 si i = j et dij = 0 sinon. De plus, nous avons la contrainte suivante :∑i∈Cn,j 6=i ρj + ρi = 0. Il s’ensuit que :

E[ηj

n |j, ξsn

]=

√6σ

π

[ ∑

i∈Cn,j 6=i

ρi

[Λ (i |ξs

n ) ln Λ (i |ξsn )

1 − Λ (i |ξsn )

+ ln Λ (j |ξsn )

]],

Donc, (3.12) devient :

E[ηj

n |j]

=1

S

S∑

s=1

[ ∑

i∈Cn,i6=j

[Λ (i |ξs


1 − Λ (i |ξsn )

+ ln Λ (j |ξsn )

]] √6σ

πρi

Pour simplifier l’ecriture du modele, definissons l’element ω tel que l’expression suivante

soit satisfaite : ∑

i∈Cn,i6=j

(.) ≡∑

i∈Cn

ωin

(.) ,

ou :

ωin

=

1

0

si i ∈ Cn ∧ i 6= j

sinon.


L’estimateur devient :

E[ηj

n |j]

=1

S

S∑

s=1

∑

i∈Cn

ωin

[Λ (i |ξs


1 − Λ (i |ξsn )

+ ln Λ(j∣∣ξs

jn

)] √6σ

πρi

=∑

i∈Cn

ωin

[1

S

S∑

s=1

ωin

[Λ (i |ξs


1 − Λ (i |ξsn )

+ ln Λ (j |ξsn )

]] √6σ

πρi

=∑

i∈Cn

Fijn

√6σ

πρi

E[ηj

n |j]

= Fjnτj, (3.13)

avec τi =√

6σπ

ρi un parametre a estimer.

L’estimateur de E [ηjn |j ] obtenu par le maximum de vraisemblance simule du logit

mixte est E [ηin |j ] = Fjnτi. A partir de l’equation (3.11), on sait que l’esperance condi-

tionnelle est constituee en fait par le correcteur de biais de selection2. Les probabilites

simulees vont permettre de constituer ces correcteurs qui deviennent alors des variables

explicatives dans l’equation de demande (3.11).

3.6 La demande d’electricite conditionnelle au choix

de la tranche de consommation

Apres avoir choisi le mode de chauffage, le menage doit choisir la quantite d’energie

necessaire pour satisfaire ses besoins. Il choisit en meme temps sa classe de consom-

mation. A partir de l’identite de Roy, la demande d’electricite pour les menages qui

utilisent l’alternative j est derivee comme suit :

yjn = − ∂Ujn (j, rev − rj, X, Pe, Pm, Pg, Pbie, εj, η) /∂Pe

∂Ujn (j, rev − rj, X, Pe, Pm, Pg, Pbie, εj, η) /∂rev. (3.14)

2Tous les J correcteurs seront inclus dans le modele de demande, puisque nous faisons une regression

de la demande d’electricite pour toutes les modalites et non pour une seule. Pour chaque modalite, il

y a un correcteur qui est fixe a zero compte tenu de la contrainte sur les ρi. Il est possible de faire

la regression separee pour chaque modalite, mais, compte tenu du nombre tres faible d’observations

pour certaines modalites et aussi de la complexite du modele, une regression empilee pour toutes les

modalites est preferable. Dans ce cas, il faut necessairement exclure un correcteur dans chaque equation

de demande selon la modalite choisie. Ceci pourrait faire l’objet d’autres travaux futurs ou on estimera

une equation de demande d’electricite comme (3.11) pour chaque modalite.


La fonction de demande derivee a partir de l’identite de Roy est celle definie a l’equation

(3.10). Cette fonction de demande peut se decomposee de la facon suivante :

yjn = Xjnβ + Rjnλ + ηjn,

ou R est un vecteur de variables exogenes specifiques a la demande et X est un vecteur

de variables explicatives definies dans la fonction d’utilite. L’indice j est introduit pour

tenir compte de la modalite choisie par le menage. Rappelons que les couts fixes de

meme que les correcteurs de biais de selection sont specifiques a chaque modalite.

Comme nous l’avons souligne auparavant, Hydro-Quebec a une structure de tari-

fication croissante par tranche de consommation. Il existe deux classes et donc deux

prix differents. La consommation de la deuxieme tranche est plus chere que celle de la

premiere tranche. Definissons la variable y∗jn = consommation journalieren−30kWh.

Si y∗jn ≤ 0, le menage n se situe dans la premiere tranche. Si y∗

jn > 0, le menage se situe

dans la deuxieme tranche. Cependant, le chercheur ne sait pas exactement dans quelle

tranche le menage se situe puisque la consommation journaliere n’est pas directement

observable. Donc, la variable y∗jn est une variable latente, inobservable. Il existe deux

groupes de menages et chaque groupe devrait avoir des caracteristiques qui lui sont

specifiques. Ceci nous amene a introduire la notion de modele a classes latentes.

Les modeles a classes latentes sont souvent utilises pour prendre en compte l’heterogeneite

qui existe entre differents groupes d’observations. La notion de classes latentes fut in-

troduite en 1950 par Lazarsheld pour un modele dichotomique. Vingt ans plus tard,

Goodman (1974) rend son modele applicable en developpant un algorithme pour obte-

nir les estimateurs du maximum de vraisemblance des parametres du modele. Beaucoup

d’autres auteurs se sont interesses a ce type de modele et il existe des logiciels appropries

pour son estimation. Les modeles a classes latentes peuvent s’appliquer a des variables

discretes ou continues. Dans un modele a classes latentes, les coefficients sont specifiques

aux groupes ou classes. Les modeles a classes latentes seraient proches du logit mixte

(Greene et Singer (2003), Shen et al. (2006)). En effet, le logit mixte suppose que les

parametres sont specifiques aux individus (ou classes) tout en suivant une distribution

continue. Le logit mixte a aussi l’avantage de prendre en compte la correlation poten-

tielle entre les alternatives. Bien que tous les deux modeles permettent d’introduire de

l’heterogeneite entre les individus, le modele a classes latentes requiert de definir un

certain nombre de classes tandis que le logit mixte necessite qu’on definisse une loi

pour les parametres. Pour le probleme qui nous concerne, a savoir prendre en compte

les tranches de consommation dans le modele de demande, un modele a classes latentes

serait bien approprie. Precisons que dans les ecrits anterieurs, les modeles a classes la-

tentes sont utilises dans un contexte de variable dependante discrete. Dans notre etude,

nous etendons ce type de modele au cas de variable dependante continue.


Le tableau (3.1) donne un exemple illustratif pour justifier l’existence de deux classes

latentes de menages. Supposons deux menages nommes A et B. L’electricite est tarifee

aux deux mois par Hydro-Quebec, donc au cours d’une annee, chaque menage recoit 6

factures differentes. Dependamment de la periode de l’annee, un menage peut consom-

mer en dessous ou au dessus du seuil des 30 kWh. L’information disponible dans les

bases de donnees d’enquete que nous utilisons concerne uniquement la consommation

annuelle de chaque menage, et son nombre de jours de consommation. Comme on peut

le constater, la moyenne obtenue a partir de la consommation annuelle ne permet pas

de dire qu’un menage a toujours ete en dessous ou au dessus du seuil des 30 kWh. Par

exemple, le menage A a une consommation moyenne de 28 kWh, ce qui est inferieur a

30 kWh. Portant au cours de l’annee, il a parfois (2 fois sur 6) consommee au dessus

du seuil. Mais soulignons que le menage est capable de suivre sa consommation au jour

le jour a travers sont compteur. Nous tenterons d’inferer les probabilites qu’un menage

soit dans une classe ou dans une autre au cours de l’annee en nous basant sur cer-

taines de ses caracteristiques. Le modele a classes latentes qui sera developpe permettra

d’estimer la demande d’electricite en tenant compte de l’existence de ces deux classes.

Tab. 3.1 – Exemple : pourquoi deux classes latentes ?facture 1 2 3 4 5 6 Moy/an Proba. Classe1 Proba. Classe2

A 35 29* 27* 23* 22* 32 28<30 0.67 0.33

B 38 36 31 25* 36 32 33>30 0.17 0.83

Supposons que le menage appartient a une des deux classes notee par s, (s = 1, 2)

avec une certaine probabilite. Soit Q(y∗

jn ≤ 0), la probabilite que le menage appar-

tienne a la premiere classe et soit Q(y∗

jn > 0)

la probabilite qu’il appartienne a la

deuxieme classe. Supposons que la consommation journaliere (y∗jn) est fonction d’un

certain nombre de variables explicatives :

y∗jn = Mjnα + ujn ujn ∼ N

(0, σ2

u

)

Q(y∗

jn ≤ 0)

= Q

(y∗

jn − Mjnα

σu

≤ −Mjnα

σu

)

= Φ

(−Mjnα

σu

)

Q(y∗

jn > 0)

= 1 − Q(y∗

jn ≤ 0)

= 1 − Φ

(−Mjnα

σu

)

Le vecteur M contient entre autres, les correcteurs de biais de selection obtenus precedemment,

etant donne que le choix de la tranche de consommation est conditionnel au choix du

mode de chauffage3. Nous fixons σu = 1 pour que le modele soit identifiable.

3La quantite demandee d’electricite etant reliee au choix du mode de chauffage, il en resulte que la

demande journaliere non observable est aussi reliee au choix de la modalite. Il faut donc corriger pour

le biais de selection dans le modele latent de choix de la classe.


Le modele global a estimer comporte finalement trois composantes :

a. une composante pour le choix du mode de chauffage :

P (j) =1

S

S∑

s=1

eVjn+σjξs

n

∑i

eVin+σiξsn

.

b. une composante pour la demande conditionnelle au choix du mode de chauffage :

yjn = Wjnθ + Fjnτ + ajn,

avec Fjnτ la version estimee du correcteur du biais de selection du choix du mode de

chauffage definie a l’equation (3.13)

c. Enfin, nous avons la composante pour le choix de la tranche : Q(s = 1) = Φ (−M ′α)

si le menage est dans la premiere tranche et Q(s = 2) = 1 − Φ (−M ′α) s’il est

dans la deuxieme tranche.

Le modele final de demande conditionnelle peut s’ecrire :

yjn = Wjnθ1 + Fjnτ1 + ajn si y∗

jn ≤ 0

yjn = Wjnθ2 + Fjnτ2 + ajn si y∗jn > 0

.

L’approche en deux etape sera donc privilegiee compte tenu de la complexite du

modele. Nous estimerons d’abord les correcteurs de biais de selection et ensuite nous

les introduirons dans l’equation de demande pour ensuite estimer les parametres du

modele de demande.

3.7 Estimation par le maximum de vraisemblance

en information limitee

Il existe plusieurs methodes pour estimer les modeles de choix discret/continu. La

methode du maximum de vraisemblance en information complete estime simultanement

les parametres du modele de choix discret et ceux du modele continu. Cette methode

est souvent complexe et tres couteuse en temps de calcul. De plus, la loi conjointe des

modeles de choix discret/continu est souvent difficile a modeliser surtout lorsque les

variables proviennent de deux populations differentes (une discrete et l’autre continue).

Sanga (1999) et Nesbakken (2001) ont utilise cette approche pour estimer la demande

d’electricite.


Il existe aussi la methode du maximum de vraisemblance en information limitee qui

estime separement les parametres du modele discret et ceux du modele continu. De

plus, en estimant le modele en deux etapes, des chercheurs ont montre qu’une erreur

de specification sur l’une ou l’autre des deux parties aura moins de repercussions sur

la non convergence des estimateurs de tous les parametres que lorsque le modele est

estime en une seule etape. Pour ces differentes raisons, nous estimerons le modele de

choix discret/continu par la methode du maximum de vraisemblance en information

limitee.

Etant donne que nous corrigeons a la fois pour le biais de selection provenant du

choix du mode de chauffage et pour le biais d’endogeneite provenant de la non linearite

des prix, une estimation par le maximum de vraisemblance en information limitee semble

mieux appropriee. Nous estimons a la premiere etape les parametres du modele de choix

discret (le logit mixte) en utilisant la methode du maximum de vraisemblance simulee.

Ces parametres estimes serviront a calculer les valeurs predites des probabilites simulees

qui, a leur tour serviront a construire les correcteurs de biais de selection du mode. La

deuxieme etape consistera a estimer le modele continu en conditionnant la demande

sur le choix du mode. Supposons que la densite conditionnelle de la demande pour un

menage qui appartient a la classe s et utilise le mode j est f (yjn |j, s). Le modele a

classes latentes est defini de la facon suivante :

L =N∏

n=1

∏

j∈Cn

2∑

s=1

[f (yjn |j, s) Q (s)]djn

=N∏

n=1

∏

j∈Cn

[f (yjn |j, s = 1) Q (1) + f (yjn |j, s = 2) Q (2)]djn

=N∏

n=1

∏

j∈Cn

[f (yjn |j, s = 1) Q

(y∗

jn ≤ 0)

+ f (yjn |j, s = 2) Q(y∗

jn > 0)]djn .

Supposons l’hypothese de normalite du terme d’erreur de l’equation de demande :

yjn = Wjnθs + Fjnτs + ajn s = 1, 2

ajn ∼ N(0, σ2

a

).

La densite de la demande conditionnelle a la tranche choisie est :

f (yjn |j, s) = φ (ajns) ×1

σa

=1

σa

× 1√2π

exp

(yjn − Wjnθs − Fjnτs

σa

)2

,

ou Fjn est le correcteur du biais de selection du mode de chauffage obtenu lors de la


premiere etape. Par consequent, la fonction de vraisemblance est :

L =N∏

n=1

∏

j∈Cn

1σa

φ(

yjn−Wjnθ1−Fjnτ1

σa

)(1 − Φ (Mα))

+ 1σa

φ(


σa

)Φ (Mα)

djn

,

ou nous remplacons la probabilite de choix du mode de chauffage P (j) par sa valeur

simulee P (j). La fonction log-vraisemblance a maximiser prend finalement la forme

suivante :

ln L =N∑

n=1

∑

j∈Cn

djn × ln

1σa

φ(


σa

)Φ (−Mα)

+ 1σa

φ(


σa

)(1 − Φ (−Mα))

. (3.15)

L’estimation du modele de choix du mode de chauffage se fera avec le language de

programmation FORTRAN et l’estimation du modele de demande conditionnelle4 se

fera a l’aide de STATA.

3.8 Description des donnees

Nous utilisons les donnees provenant d’une enquete postale realisee par Hydro-

Quebec en 1989 et portant sur la consommation d’electricite des menages quebecois.

Le taux de reponse au questionnaire etait de 44.9 % soit 45833 menages ayant repondu

sur un total de 101977 questionnaires expedies. Nous utilisons un sous-echantillon de

2897 observations constitue de menages ayant une maison unifamiliale (detachee, semi-

detachee ou en rangees avec entrees separees). Le questionnaire comporte des infor-

mations sur les caracteristiques socio-economiques du menage. Les informations sur

la consommation d’electricite ont ete obtenues aupres d’Hydro-Quebec, alors que les

donnees sur les prix des differentes energies considerees et sur les couts d’usage et de

capital des systemes de chauffage de l’eau et de l’espace proviennent du gouvernement

du Quebec (1990). L’information sur la disponibilite du gaz naturel pour chaque menage

provient de Gaz Metropolitain.

Les tableaux ci-dessous (3.2), (3.3) et (3.4) presentent les principales informations

disponibles dans cette base de donnees. Comme on peut le constater, plus de 81% des

menages utilisent l’electricite pour le chauffage de l’eau et de l’espace. Sur les (18) com-

binaisons possibles des differentes sources d’energie pour le chauffage de l’eau et de l’es-

pace, nous avons retenu neuf (9) modalites definies comme suit (le premier terme indique

4Il faut normalement corriger le probleme d’heteroscedasticite lorsqu’on utilise l’approche en deux

etapes. Mais cela rendra davantage plus complexe le modele. Nous laissons ce point pour des travaux

futurs ou l’efficacite des estimateurs pourra etre amelioree.


le choix d’une energie pour le chauffage de l’espace et le deuxieme terme indique l’energie

choisie pour le chauffage de l’eau) : modalite (1) gaz/gaz, modalite (2) gaz/electricite,

modalite (3) bienergie/mazout, modalite (4) bienergie/electricite, modalite (5) ma-

zout/mazout, modalite (6) mazout/electricite, modalite (7) electricite/electricite, mo-

dalite (8) bois/electricite et enfin modalite (9) bois-electricite/electricite. Le tableau

(3.4) presente les principales variables utilisees dans le modele de choix du mode ou

dans le modele de demande.

Tab. 3.2 – Repartition echantillonnale par source d’energiechauffage de l’espace chauffage de l’eau

gaz naturel mazout electricite Total

gaz naturel 27 9 36

bienergie 72 201 273

mazout 12 20 32

electricite 2351 2351

bois 124 124

bois/electricite 81 81

Total 27 84 2786 2897

Tab. 3.3 – Frequences echantillonnales selon le mode de chauffageNom Pourcentage Frequence disponibilite du gaz

1. gaz/gaz 0.93 27 543

2. Gaz/electricite 0.31 9 543

3. Bienergie/mazout 2.49 72 2897

4. Bienergie/electricite 6.94 201 2897

5. Mazout/mazout 0.41 12 2897

6. Mazout/electricite 0.69 20 2897

7. Electricite/electricite 81.15 2351 2897

8. Bois/electricite 4.28 124 2897

9. bois-electricite/electricite 2.80 81 2897

Total 100 2897 21365

Tab. 3.4: Description des variables utilisees

Variable Nom Moyenne

modalites (chauffage espace-chauffage eau)

gaz/gaz (1) mode1 0.0093

Gaz/electricite (2) mode2 0.0031

Bienergie/mazout (3) mode3 0.0249

Bienergie/electricite (4) mode4 0.0694

suite a la page suivante




Mazout/mazout (5) mode5 0.0041

Mazout/electrcite (6) mode6 0.0069

electricite/electricite (7) mode7 0.8115

Bois/electricite (8) mode8 0.0428

Bois-electricite/electricite (9) mode9 0.0280

cout fixe (103) coutfix 0.3913

cout fixe×revenu (105) coutfiy 1.7985

cout moyen (103) coutm 1.4077

revenu (104) rev 4.4184

annee de construction (1920-1989) datcons 1978.09

degres jour chauffage hdd 4830

degres jour de climatisation cdd 129.71

nombre de personnes dans le menage nbre residents 3.13

secteur secteur

rural 0.2592

peu urbain 0.0307

urbain 0.1046

forte densite 0.6055

surface (103 pieds carres) surf 1.6754

age du repondant age 41.53

mode d’occupation proprietaire

proprietaire 0.9082

locataire 0.0918

systeme de chauffage principal

systeme a eau chaude systeme eau chaude 0.1042

systeme a air chaud systeme air chaud 0.0411

systeme thermopompe systeme thermopompe 0.1381

plinthes plinthes 0.6151

autres autres 0.1015

type d’habitation

individuelle detachee detachee 0.8412

individuelle avec multiples entrees entrees multiples 0.0601

jumelee ou en rangee jumelee 0.0311

piscine piscine 0.1774

disponibilite du gaz naturel 0.1874

sexe sexe





homme 0.4387

femme 0.2126

nombre de pieces (1-18) nbre pieces 6.2

prix moyen electricite prixelec 4.482

prix moyen bienergie prixbie 5.438

prix moyen gaz naturel prixgn 4.174

prix moyen mazout prixm 5.901

consommation annuelle (en kWh) consommation totale 23479

Appareils electromenagers

nombre de congelateurs nbre congelateur 0.53

nombre de refrigerateurs nbre refrigerateur 1.21

climatiseur central climatiseur central 0.0725

climatiseur fenetre climatiseur fenetre 0.0618

appoint electrique appoint electrique 0.1481

appoint non electrique appoint non electrique 0.3693

thermopompe pour piscine thermopompe piscine 0.0228

Fin du tableau

3.9 Resultats du modele de choix du mode de chauf-

fage

Nous apportons les precisions suivantes qui accompagnent le tableau (3.5). L (0)

est le log-vraisemblance du modele avec la contrainte que toutes les coefficients des

variables explicatives sont fixes a zero sauf la constante. L (c) est le log-vraisemblance

lorsqu’on suppose que le modele de choix contient uniquement les constantes specifiques

aux modalites. L(θ)

est la valeur du log-vraisemblance lorsqu’on n’impose aucune

contrainte.

Les parametres du modele de choix du mode de chauffage ont ete estimes par le

maximum de vraisemblance simule, dans lequel nous avons effectue des tirages dans

une loi normale comme decrit dans la section (3.3). Nous avons effectue 100 tirages. Le

tableau (3.5) presente les resultats de l’estimation. Nous avons procede a differents tests

de specification afin de savoir si le modele avec coefficients specifiques aux variables est


Tab. 3.5: Resultats modele discret (couts moyens

specifiques)

Variables logit mixte Logit polytomique

Estimes Ecart-type t-student Estimes Ecart-type t-student

gaz/gaz -76.817 30.748 -2.498 -13.686 3.302 -4.145

gaz/electricite -33.983 11.323 -3.001 -8.170 1.672 -4.887

bienergie/mazout -9.962 1.801 -5.533 -5.330 0.988 -5.393

bienergie/electricite -7.975 1.285 -6.206 -3.351 0.741 -4.524

mazout/mazout -27.134 3.519 -7.710 -20.237 2.559 -7.908

mazout/electricite -17.561 2.092 -8.394 -12.575 2.043 -6.155

bois/electricite -45.614 9.146 -4.987 -6.995 1.055 -6.631

bois-elec/elec -63.780 14.032 -4.545 -9.563 1.184 -8.079

coutfix -2.321 1.067 -2.176 -1.882 0.608 -3.097

coutfiy 1.052 0.232 4.536 0.745 0.135 5.519

coutm1 -11.459 6.623 -1.730 -8.468 0.843 -10.041

coutm2 -21.304 7.425 -2.869 -11.379 1.229 -9.260

coutm3 -24.356 2.668 -9.131 -11.741 0.721 -16.291

coutm4 -24.558 2.723 -9.018 -12.301 0.603 -20.394

coutm5 -20.869 2.371 -8.803 -9.105 0.935 -9.742

coutm6 -22.893 2.357 -9.714 -10.640 0.743 -14.317

coutm7 -28.056 2.901 -9.671 -13.099 0.594 -22.049

coutm8 -33.592 4.291 -7.829 -18.978 1.051 -18.057

coutm9 -23.362 3.314 -7.049 -12.822 0.726 -17.663

datcons 0.133 0.071 1.867 0.084 0.034 2.458

datconv 0.605 0.078 7.788 0.345 0.037 9.405

hdd1 6.353 3.829 1.659 1.007 0.643 1.565

hdd5 3.219 0.505 6.370 2.344 0.350 6.695

hdd6 2.150 0.290 7.410 1.552 0.320 4.843

hdd8 3.821 1.203 3.177 0.561 0.182 3.084

hdd9 5.520 1.537 3.592 0.804 0.193 4.155

nbpers1 -2.935 1.450 -2.024 -1.322 0.252 -5.239

nbpers3 0.570 0.313 1.821 0.391 0.163 2.404

nbpers4 -0.429 0.191 -2.249 -0.147 0.123 -1.200

nbpers5 0.405 0.297 1.363 0.249 0.298 0.835

y1 1.030 0.951 1.083 -0.252 0.156 -1.615

y2 -1.737 0.889 -1.954 -0.624 0.205 -3.039

y3 -0.810 0.257 -3.150 -0.664 0.156 -4.264

y4 -0.687 0.198 -3.463 -0.555 0.115 -4.817

y5 -0.694 0.296 -2.343 -0.598 0.196 -3.047

y6 -0.762 0.208 -3.662 -0.656 0.165 -3.988

y8 -2.635 0.547 -4.816 -0.528 0.075 -7.040

y9 -1.101 0.310 -3.554 -0.431 0.086 -4.990

SIG1 0.248 0.083 2.988 - - -

RHO1 -0.986 0.003 -351.159 - - -

autres statistiques

L(θ)

-1321.2854 -1465.8570

L (0) -2317.3266 -2317.3266

L (c) -2255.6268 -2256.0550


plus approprie. Suite a plusieurs tests de specification, nous avons conclu que les coeffi-

cients devraient etre specifiques (par rapport aux differentes modalites) pour un certain

nombre de variables explicatives. Pour l’interpretation des resultats, nous utiliserons

la terminologie tres significatif pour dire qu’il s’agit de la significativite statistique au

seuil de 1% et significatif pour le seuil de 5% ou 10%.

Les constantes specifiques aux modalites sont toutes tres significatives. Elles sont toutes

de signe negatif. Cela traduit une forte preference pour l’electricite. On peut dire que

la modalite de reference (electricite/electricite) apporte plus d’utilite en moyenne que

les autres modalites, toutes choses egales par ailleurs.

Le cout moyen de chauffage (specifique a chaque modalite) explique significativement le

choix du mode ; seul le cout moyen specifique a la premiere modalite (gaz/gaz) n’est pas

significatif a 5% (mais il l’est a 10%). De plus, il affecterait negativement l’utilite. Plus

les couts d’exploitation sont eleves par rapport aux couts d’exploitation de la modalite

de reference, plus le menage aura tendance a preferer la modalite de reference ( soit

electricite/electricite)

Nous avons prefere que le cout fixe soit une variable generique, c’est la meilleure

specification pour le modele. Son estime a un signe est negatif et est tres significa-

tif. Son signe negatif signifie qu’une augmentation du cout fixe (par rapport au cout

fixe de la modalite de reference) reduirait l’utilite du menage.

L’estime de la variable cout fixe multiplie par le revenu est de signe positif et est tres

significatif. L’estime du revenu specifique a chaque modalite est de signe negatif et si-

gnificatif pour la plupart des modalites. L’estime du revenu specifique a la premiere

modalite est de signe positif mais n’est significatif. On peut deduire que l’augmentation

du revenu du menage rend l’electricite plus attrayante, cela se justifierait entre autres

par des raisons de bien-etre, de souplesse du systeme de chauffage tout a l’electricite,

et ses faibles couts.

L’estime de la variable date de construction est de signe positif et significatif a 10%. Les

maisons nouvellement construites affectent positivement l’utilite des menages qui choi-

sissent une modalite autre que l’electricite. L’electricite serait donc moins attrayante

pour les nouvelles constructions contrairement aux autres modalites.

L’estime de la date de conversion a une nouvelle source est de signe positif et tres

significatif. Le signe positif indique que l’utilite augmente avec les annees, pour les

menages ayant converti leur source pour une source autre que l’electricite. cela se justifie

surtout avec la baisse du prix du mazout et les changements qui se sont produits sur le

marche du gaz naturel.

L’estime de la variable degres-jours de chauffage specifique a chaque modalite est de

signe positif et est tres significatif (sauf pour la premiere modalite). Les degres-jours

de chauffage sont la somme annuelle des degres moyens journaliers en dessous de 18 C.

En effet, si la temperature est en dessous de 18 C, le chauffage est mis en marche.


Dans cette base, nous utilisons des moyennes annuelles sur trente ans pour chaque ville

de la province de Quebec. Seuls les coefficients relatifs aux modalites 1, 5, 6, 8 et 9

sont significatifs. Pour ces dernieres modalites, le signe positif indique que plus il fait

trop froid (donc les degres jours sont eleves), plus ce systeme de chauffage choisi plutot

que l’electricite. Les menages qui utilisent le mazout ou le bois rentabilisent plus leur

investissement lorsqu’il y a une grande utilisation du systeme. Cela s’explique par le

fait que les menages qui utilisent de tels systemes doivent supporter de grosses depenses

en capital alors que le cout unitaire (par kWh) est plus faible que celui a l’electricite,

de sorte qu’une plus grande consommation rentabilise leur systeme et le rend plus

competitif que le systeme a l’electricite.

Le nombre de personnes dans le menages affecte negativement et de maniere significative

l’utilite des menages qui ont choisi les modalites 1 et 4. Pour ce groupe de menages, le

gaz et la bi-energie deviennent moins attrayants lorsque le nombre de personnes dans

le menage augmente.

Sans entrer dans les details du processus GAR(1), nous signalons simplement que ce

processus nous a permis de representer la structure de variance covariance a l’aide de

quelques parametres supplementaires qui sont SIG1 (ecart-type) et RHO1 (coefficient

de correlation). Le parametre SIG1 est un coefficient d’echelle qui est specifique a la

premiere modalite (gaz/gaz). Le RHO1 est un coefficient de correlation qui mesure

la structure de dependance entre les alternatives. Tous ces deux parametres sont tres

significatifs. cela confirme que les donnees sont biens representees par une specification

GAR(1). Le coefficient de correlation est de signe negatif et proche de l’unite. Cela

traduit l’existence d’une forte correlation negative entre les alternatives. Nous avons

aussi estime le meme modele d’utilite en supposant un modele logit polytomique, qui

est en fait un cas particulier du logit mixte GAR(1). Ceci nous a permis de constater

que le logit mixte donne des resultats superieur a ceux du logit polytomique. Le log-

vraisemblance du logit mixte est de (-1321.2854) tandis que celui du logit polytomique

est de (-1465.8570). Un test de ratio de vraisemblance (likelihood ratio test) nous donne :

LR = −2[−1321.2854 + 1465.8570] = 289.1432

Puisque la valeur de la statistique de test est tres grande, on a une evidence empirique

en faveur du modele logit mixte avec erreur GAR(1). Nous avons teste la significativite

globale de tous les parametres. Le log-vraisemblance du modele sous la contrainte que

tous les coefficients sont nuls est de (-2317.3266). La statistique de test LR est :

LR = −2[−1321.2854 + 2317.3266] = 1992.6824

Nous rejetons l’hypothese selon laquelle tous les coefficients ne seraient pas globalement

significatifs. Nous avons aussi teste la significativite globale de tous les coefficients de

pente. Le log-vraisemblance du modele avec seulement des constantes specifiques aux

modalites est de (-2255.6268). Le test LR associe est :

LR = −2[−1321.2854 + 2255.6268] = 1868.6828


Nous rejetons l’hypothese selon laquelle tous les coefficients de pente sont globalement

non significatifs.

3.10 Resultats de l’estimation du modele de demande

Le modele de demande conditionnelle au choix du mode de chauffage et au choix

de la tranche de consommation a ete estime par le maximum de vraisemblance simule

a information limitee. Nous avons constitue les correcteurs de biais de selection (3.13)

apres l’estimation du logit mixte. Ces correcteurs sont ensuite utilises comme variables

explicatives dans le modele de demande. Soulignons que cette approche n’a pas encore

ete utilisee dans la litterature pour estimer la demande d’electricite tout en corrigeant

le biais de selection et le biais d’endogeneite du prix marginal. Le modele a classes

latentes developpe ici est donc nouveau dans la litterature.

Le tableau (3.6) presente les resultats de l’estimation du modele de demande par le

maximum de vraisemblance simule en information limitee. Rappelons que la fonction

de vraisemblance a maximiser est celle donnee par l’equation (3.15).

Chapitre

3.

Estim

atio

nde

ladem

ande

d’electricite

avec

un

modele

acla

ssesla

tentes93

Tab. 3.6: Resultats du modele de demande conditionnelle

Variables Estimes Ecart-type t-Student Estimes Ecart-type t-Student

Modele latent : probabilite de choisir la classe1

revenu net -.1917011 .0317048 -6.05

surface -.1174278 .0754563 -1.56

age -.1543919 .0421416 -3.66

nbre residents .0204532 .0516707 0.40

correcteur1 -.0010977 .0503459 -0.02

correcteur2 -.048327 .0501641 -0.96

correcteur3 -.05895 .0976879 -0.60

correcteur4 -.1137387 .1358962 -0.84

correcteur5 .1108886 .2767555 0.40

correcteur6 .2329238 .1965562 1.19

correcteur7 -.1227042 .0623717 -1.97

correcteur8 -.0573548 .047196 -1.22

correcteur9 -.0767128 .0461606 -1.66

constante 2.265846 .3399132 6.67

Classe1 Classe2

Estimes Ecart-type t-Student Estimes Ecart-type t-Student

prixelec -2.949698 .5272192 -5.59 -14.70437 .6456266 -22.78

prixgn -.2897508 .265646 -1.09 .3424017 .1096837 3.12

prixm -1.893562 1.31882 -1.44 1.46366 .6201594 2.36

prixbie 2.928363 .9403879 3.11 4.319643 .4378725 9.87

surf 4.59347 .4294862 10.70 .6602728 .2144291 3.08

age .8425669 .258783 3.26 -.0210637 .1104251 -0.19

cdd .1587457 .0537172 2.96 069234 .0259578 2.67


Chapitre

3.

Estim

atio

nde

ladem

ande

d’electricite

avec

un

modele

acla

ssesla

tentes94



conversion -.0008176 .0007765 -1.05 -.0016383 .0003305 -4.96

date construction -.201937 .2603875 -0.78 -.7014036 .0940826 -7.46

hddm 2.411937 1.136881 2.12 -.6315054 .4892462 -1.29

proprietaire 4.119597 1.529893 2.69 .7216937 .5453248 1.32

systeme airChaud 4.339682 .7532762 5.76 .5430062 .4571769 1.19

systeme eauChaude 7.2547 1.547718 4.69 1.519885 .6590753 2.31

appoint electrique 2.511133 .7523501 3.34 -1.616955 .4073606 0.24

appoint non electrique 1.322084 .601317 2.20 -1.026123 .2739395 -3.52

nbre refrigerateurs 1.605707 .5238694 3.07 .6999412 .2601967 2.69

detachee 5.142528 .9446936 5.44 1.992507 .4765685 4.18

jumelee -1.190132 1.662239 -0.72 -1.66611 .6952359 -2.40

piscine 4.318836 .7342505 5.88 1.959071 .3613901 5.42

nbre residents 1.858971 .3132679 5.93 .8393588 .1238159 6.78

dispo -2.613426 .9504773 -2.75 -.9582957 .3714531 -2.58

climatiseur fenetre .6982298 1.004315 0.70 1.064917 .5521248 1.93

revenu net -.3659881 .1849701 -1.98 .2601509 .0876406 2.97

correcteur1 9.495832 2.734658 3.47 -.0399658 .0506201 -0.79

correcteur2 -10.44348 2.790428 -3.74 -.004774 .0511984 -0.09

correcteur3 14.77724 2.90015 5.10 -.989763 .2785958 -3.55

correcteur4 12.79979 3.088544 4.14 -.1688702 .2801081 -0.60

correcteur5 11.09467 3.493339 3.18 -.0132942 .3169106 -0.04

correcteur6 -68.25484 14.02259 -4.87 .0004186 .1692137 0.00

correcteur7 15.83934 2.605257 6.08 1.126817 .1820954 6.19

correcteur8 13.2636 2.488475 5.33 .1807218 .0548722 3.29

correcteur9 13.53411 2.481166 5.45 .1957813 .0537749 3.64


Chapitre

3.

Estim

atio

nde

ladem

ande

d’electricite

avec

un

modele

acla

ssesla

tentes95



constante .0694988 10.78931 0.01 54.79776 5.430179 10.09

ecart-type 1.617937 .0174602 92.66

Log likelihood = -9331.709

LogL sans correcteurs = -9393.1107

Fin du tableau


3.10.1 Interpretation des resultats du modele de choix de la

classe

Les resultats du modele latent sont presentes dans le tableau (3.6), plus precisement

le premier bloc correspondant a la probabilite d’etre dans la premiere classe (Q(s = 1)).

Comme cela a ete precise dans la section (3.6), nous associons a chaque classe, une

probabilite donnee. Les signes des coefficients sont les principaux indices qui nous per-

mettent de savoir de quelle probabilite il s’agit. Les estimes obtenus dans la partie

latente correspondent aux coefficients des variables qui sont dans la probabilite d’etre

dans la premiere classe. Pour obtenir les coefficients des variables de la probabilite d’etre

dans la deuxieme classe, il suffit d’ajouter un signe negatif aux parametres de la partie

latente du tableau, etant donne qu’il s’agit d’un modele de choix dichotomique. Comme

dans l’interpretation du modele de choix du mode de chauffage, nous adoptons ici aussi

et dans le reste du document une terminologie simplificatrice : l’expression tres signifi-

catif pour dire qu’il s’agit de la significativite statistique au seuil de 1% et significatif

pour le seuil de 5% ou 10%.

La variable revenu net des couts fixes et des couts variables explique de facon tres signi-

ficative le choix de la classe. Plus le revenu du menage est eleve, plus il a de chance d’etre

dans la deuxieme classe. La premiere classe est essentiellement composee de menages

a faibles revenus. Plus le menage est riche, plus il consommera davantage et donc il

sera dans la deuxieme classe. Cela confirme les affirmations de Dupuis et al. (2006) qui

stipulaient que la consommation d’electricite augmente avec le revenu.

La variable age explique de facon tres significative la consommation d’energie du menage.

Plus le chef de menage est age, plus sa demande d’electricite sera importante. Les per-

sonnes agees restent le plus souvent a la maison, leur besoins en electricite augmente

par consequent (principalement, ils ont besoin d’espace bien chauffe). Cela vient confir-

mer les resultats obtenus par Liao et Chang (2002). Selon leurs resultats portant sur la

demande d’energie des personnes agees aux USA, les besoins de chauffage de l’espace

augmentent avec l’age.

L’estime du nombre de personnes dans le menage n’est pas statistiquement significatif.

Nous avons aussi inclus les correcteurs de biais de selection, certains sont significatifs.

La constante est positive et significative. Cela signifie que si toutes les autres variables

du modele latent sont fixees a zero, il restera une consommation de base ou consomma-

tion minimale qui garderait le menage dans la premiere classe.

En somme, ce sont les menages riches et les menages plus agees qui sont dans la deuxieme

classe. La premiere classe est essentiellement composee de menages moins fortunes.


Tab. 3.7 – ElasticitesClasse1 Classe2 sans classe

electricite -1.274 -2.667 -1.3841

E-T 0.228 0.117 0.0858

bienergie 0.671 0.859 0.730

E-T 0.216 0.087 0.081

Gaz naturel -0.111 0.119 0.123

E-T 0.102 0.038 0.042

Mazout -1.078 0.563 0.190

E-T 0.751 0.238 0.259

Revenu -0.151 0.0472 0.1083

E-T 0.076 0.016 0.014

cdd 0.236 0.036 0.056

E-T 0.080 0.0137 0.013

hdd 1.338 -0.124 -0.031

E-T 0.631 0.096 0.106

3.10.2 Resultats du modele de demande conditionnelle

Les resultats de l’estimation sont presentes au tableau (3.6). Nous avons aussi cal-

cule les elasticites prix et revenus de la demande, elles sont presentees au tableau (3.7)5.

Nous avons egalement estime le modele de demande conditionnelle au choix du mode

sans tenir compte de l’existence des deux classes. Le tableau (3.8) presente ses resultats

et les elasticites correspondantes sont dans la derniere colonne du tableau (3.7). Le

modele de demande sans les deux classes servira pour comparaison, etant donne que

c’est ce modele qui est habituellement utilise.

Soulignons que la variable dependante du modele de demande conditionnelle est la

quantite d’electricite (en kWh). Rappelons aussi que la premiere classe est composee

de menages dont la consommation journaliere est inferieure ou egale a 30 kWh et la

deuxieme classe est composee de ceux dont la consommation journaliere depasse les 30

kWh.

Les differents prix qui sont dans le modele de demande sont les prix moyens et non mar-

ginaux. Le prix marginal de l’electricite est pris en compte de facon implicite a travers

les deux classes, etant donne qu’il s’agit d’un prix non lineaire. De plus, le prix marginal

de l’electricite n’est pas vraiment variable (une constante par classe). Par ailleurs, nous

ne disposons pas d’information sur les prix marginaux des autres energies. Pour toutes

ces raisons, nous nous sommes limites a n’utiliser que les prix moyens pour lesquels

5Le terme E-T indique l’ecart-type estime des elasticites.


Tab. 3.8 – Resultats du modele sans classesVariables Estimes Ecart-type t-Student

prixelec -7.254225 .4496326 -16.13

prixgn .335962 .1150584 2.92

prixm .4447232 .6096492 0.73

prixbie 3.672692 .4040806 9.09

surf 2.014036 .1931431 10.43

age .5805753 .1049853 5.53

cdd .1014731 .0258469 3.93

annee conversion -.0015762 .0003381 -4.66

date construction -.5578829 .0977156 -5.71

hddm -.1528255 .5163059 -0.30

proprietaire 1.555822 .567742 2.74

systeme airChaud 2.270368 .4222644 5.38

systeme eauChaude 3.485902 .6741271 5.17

appoint electrique .9110604 .394819 2.31

appoint non electrique -.5223166 .2704199 -1.93

nbre refrigerateurs .9583325 .2594234 3.69

detachee 2.919069 .4585586 6.37

jumelee -1.357923 .7173256 -1.89

piscine 2.728643 .3504739 7.79

nbre residents 1.157208 .1111428 10.41

dispo -1.173479 .3683396 -3.19

climatiseur fenetre 1.036538 .5296593 1.96

revenu net .5781204 .0724419 7.98

constante 19.56208 5.098651 3.84

ecart-type 1.907149 .0131374 145.17



l’information etait disponible.

L’estime de la variable prix moyen de l’electricite est tres significatif dans les deux

classes et est negatif. Nous constatons qu’en valeur absolue, l’effet marginal du prix

de l’electricite est plus important dans la deuxieme classe que dans la premiere. Les

elasticites prix directes sont toutes superieures a l’unite. Une augmentation de 1% du

prix de l’electricite entraınera une baisse de 1.27% de la demande d’electricite de la

premiere classe et de 2.67% de la demande de la deuxieme classe. La baisse de la

deuxieme classe est environ deux fois celle de la premiere classe. La demande d’electricite

est elastique dans les deux classes. Si on estimait le modele sans classe, l’elasticite serait

de 1.384, soit un peu plus que celle de la premiere classe mais inferieure a celle de la

deuxieme classe.

L’effet marginal du prix de la bi-energie est positif et tres significatif dans les deux

classes. L’effet marginal de la bi-energie de la deuxieme classe est presque le double de

celui de la premiere classe. Les elasticites sont egalement tres significatives. Une hausse

de 1% du prix de la bi-energie entraınera une augmentation de 0.67% de la demande de

la premiere classe des menages qui utilisent la bi-energie et de 0.86% de la demande de

la deuxieme classe. L’elasticite de la bi-energie du modele sans classe est comprise entre

celle de la premiere classe et celle de la deuxieme classe. La bi-energie et l’electricite

sont donc deux substituts.

L’estime du prix du gaz naturel n’est pas significatif dans la premiere classe mais l’est

dans la deuxieme classe. Probablement que les menages qui utilisent le gaz naturel sont

plus souvent dans la deuxieme classe. Pour cette classe, l’effet marginal du prix du gaz

est positif. Une hausse de 1% du prix du gaz naturel entraınera une hausse de la de-

mande d’electricite des menages (deuxieme classe) qui sont au gaz naturel de 0.1194%.

Le gaz naturel et l’electricite sont donc des biens substituts. L’elasticite du gaz naturel

est tres significative pour la deuxieme classe.

L’effet marginal du prix du mazout n’est pas tres significatif dans la premiere classe mais

l’est dans la deuxieme classe. Une augmentation de 1% du prix du mazout entraınera

une augmentation de 0.56% de la demande d’electricite des menages qui utilisent le

mazout et qui sont dans la deuxieme classe. Pour ces menages, le mazout et l’electricite

sont des biens substituables. Rappelons que l’effet inverse s’etait produit en 1998 : une

baisse du prix du mazout avait entraıne une forte baisse de la demande d’electricite des

menages.

En ce qui concerne l’effet marginal du revenu, nous avons obtenu des resultats sur-

prenants. L’effet marginal du revenu est negatif et significatif (a 5%) dans la premiere

classe et positif et significatif (1%) dans la deuxieme classe. Cela indique que l’electricite

est un bien inferieur pour les menages de la premiere classe tandis qu’elle est un bien

normal pour ceux de la deuxieme classe. L’elasticite revenu de la premiere classe est

de -0.15 pour la premiere classe et de 0.047 pour la deuxieme classe. Elle est de 0.11

pour le modele sans classe. Comme les resultats du modele latent indiquent que les


menages de la premiere classe sont des menages a faible revenu, donc, nous pouvons

dire qu’a mesure que le revenu du menage pauvre augmente, celui-ci achetera d’autre

biens beaucoup plus utiles que l’electricite, comme les biens alimentaires, les vetements,

les medicaments.

l’effet marginal de la variable cdd est positif et tres significatif dans les deux classes.

Il est beaucoup plus important dans la premiere classe que dans la deuxieme, ceci est

assez surprenant. Si les degres jours de climatisation augmentent de 1%, la demande

d’electricite des menages de la premiere classe augmente de 0.236% et celle des menages

de la deuxieme classe augmentera de 0.036%.

L’effet de la variable degres jours de chauffage (hdd) n’est pas significatif dans la

deuxieme classe mais l’est dans la premiere classe. Une augmentation de 1% des degres

jours de chauffage entraınera une augmentation de la demande d’electricite de 1.338%

des menages de la premiere classe.

La variable surface chauffee a un effet positif et tres significatif dans les deux classes.

Son effet est environ quatre fois plus important dans la premiere classe que dans la

deuxieme. Plus la surface a chauffer augmente, plus la demande d’electricite sera im-

portante.

L’effet de l’age est positif et significatif dans la premiere classe mais negatif et non signi-

ficatif dans la deuxieme. Plus l’age du chef de menage de la premiere classe augmente,

plus sa demande d’electricite augmente aussi.

Les effets des variables conversion de la source de chauffage et date de construction de la

maison ne sont pas significatifs dans la premiere classe, mais le sont dans la deuxieme.

Pour la deuxieme classe, une conversion de la source de chauffage permet de reduire la

demande d’electricite. Cela est assez intuitif puisque la conversion a une nouvelle source

se fait dans le but de reduire la consommation d’energie. Pour cette meme classe de

menages, les nouvelles constructions consommeraient moins d’energie.

L’effet de la variable proprietaire est positif et significatif dans la premiere classe (elle

n’est pas significative dans la deuxieme).Si le menage de la premiere classe est pro-

prietaire, cela augmente sa demande d’electricite. Implicitement, les proprietaires sont

relativement plus riches que les locataires, donc, ils auront tendance a consommer re-

lativement plus que les locataires.

Nous avons inclus des variables binaires pour certains types de systemes de chauf-

fage. L’effet de la centrale a air chaud, a eau chaude, des appoints (electriques et non

electriques) sont positifs et significatifs dans la premiere classe. L’effet de la centrale a

eau chaude est significatif et positif dans la deuxieme classe. L’appoint non electrique

a un effet negatif et significatif ; ceci a du sens car le fait d’utiliser un appareil non

electrique devrait permettre de reduire sa consommation d’electricite.

L’effet de la variable nombre de refrigerateurs est positif et tres significatif dans les

deux classes. Plus il y a de refrigerateurs dans la maison, plus les besoins en energie

augmentent.


Nous avons pris en compte le type de l’habitation dans le modele. L’effet de la variable

maison detachee est positif et significatif dans les deux classes, tandis que l’effet de la

variable maison jumelee ou en rangee est de signe negatif et significatif pour la deuxieme

classe. Cela signifie que les maisons detachees consommeraient beaucoup plus d’energie

que les maisons jumelees ou en rangee. Lorsque les maisons sont jumelees, cela permet

une certaine economie d’echelle dans la consommation d’energie, mais lorsqu’elles sont

detachees les unes des autres, il y a une certaine perte d’efficacite dans la consomma-

tion.

La presence de piscine (lorsqu’elle utilise un filtre) entraıne une augmentation de la

consommation d’electricite. L’effet de cette variable est significatif dans les deux classes,

il est beaucoup plus important dans la premiere que dans la deuxieme classe.

Le nombre de residents a un effet positif et significatif dans les deux classes. Plus il y a

de personnes dans le menages, plus les besoins en electricite augmentent.

La disponibilite du gaz naturel affecte negativement la demande d’electricite. Si le gaz

est disponible dans une zone, et comme le gaz et l’electricite sont des substituts, cer-

tains menages choisiront le gaz au detriment de l’electricite.

L’effet de la variable climatiseur fenetre est positif et significatif (a 5%) dans la deuxieme

classe, mais n’est pas significatif dans la premiere. Probablement que les menages de la

premiere classe n’utilisent pas souvent le climatiseur fenetre. Pour ceux de la deuxieme

classe, la presence de climatiseur affecte positivement la demande d’electricite.

La constante n’est pas du tout significative dans la premiere classe mais elle est tres

significative dans la deuxieme.

La correction du biais de selection provenant du choix du mode de chauffage est prise

en compte a travers les neuf correcteurs inclus dans le modele. Tous les correcteurs

sont tres significatifs dans la premiere classe, quelques uns le sont dans la deuxieme

classe. Nous avons effectue un test du ratio de vraisemblance pour savoir s’il est per-

tinent de prendre en compte les correcteurs de biais de selection dans le modele. Le

log-vraisemblance du modele sans les correcteurs est : Lc = −9393.1107 et celui du

modele avec correcteurs est : Lnc = 9331.709. La statistique de test est :

LR = −2[Lc − Lnc] = −2[−9331.709 + 9393.1107] = 122.8034

Cette statistique suit asymptotiquement une chi-deux a 27 degres de liberte. Le

point critique de la chi-deux est χ2c ∈ [44.31; 50.89]. Comme la statistique calculee est

superieure a la valeur critique a 1%, on rejette donc l’hypothese nulle selon laquelle

tous les coefficients associes aux correcteurs sont egaux a zero. Il faut donc prendre en

compte les correcteurs dans le modele.


3.10.3 Tests d’endogeneite du prix marginal

Nous avons procede a un test de specification pour justifier la pertinence de la prise

en compte des deux classes dans l’echantillon. Ceci revient a tester l’endogeneite du prix

marginal d’electricite. Rappelons que nous avons dissocie l’echantillon en deux classes

suite au fait que le prix marginal de l’electricite est une variable endogene. La non prise

en compte de l’endogeneite du prix entraınerait la non convergence et un biais dans les

estimations. Pour resoudre ce probleme, nous avons utilise un modele a classes latentes.

Nous avons donc dissocie notre echantillon en deux classes non observables directement.

Nous avons estime la demande en prenant en compte l’existence des classes non obser-

vables. Mais, comment pourrions-nous tester si notre hypothese d’endogeneite du prix

marginal est confirmee par les donnees ? Habituellement, le test d’endogeneite le plus

souvent utilise est le test de Hausmann (1978). Mais, avec le probleme de non linearite

qui est souleve ici, ce test n’est pas applicable, car le prix marginal conditionnel a la

classe est juste egal a une valeur (donc pas de variabilite). Pour contourner ce probleme,

nous avons utilise un test de ratio de vraisemblance, test beaucoup plus approprie pour

ce probleme. Nous testons l’hypothese nulle selon laquelle il n’existerait pas de classes,

contre l’hypothese alternative qui postule la presence de deux classes latentes. Sous

l’hypothese nulle, le modele a estimer est le modele de demande conditionnelle au choix

du mode sans consideration de classes. Ce modele est emboıte dans le modele sous l’hy-

pothese alternative (il existe deux classes), puisqu’il s’obtient en fixant la probabilite

d’etre dans la premiere classe egale a zero. Ainsi le modele sans classe est en fait iden-

tique au modele habituellement utilise (une seule partie). Les resultats de l’estimation

du modele sans classe sont presentes dans le tableau (3.8). Le log-vraisemblance du

modele contraint sous l’hypothese nulle est

L(θcontraint) = −9635.6764

Le modele non contraint (sous l’hypothese alternative) est le modele avec les deux

classes latentes. La vraisemblance du modele non contraint 6 est :

L(θNon−contraint) = −9331.709

La statistique de test de ratio de vraisemblance effectue sur le modele est :

LR = −2 [L(θcontraint) − L(θNon−contraint)]

= −2 (−9635.6764 + 9331.709)

= 607.93486Le modele contraint est emboıte dans le modele non contraint. Le premier s’obtient lorsque la

probabilite d’etre dans la premiere classe est nulle, et ceci se produit par exemple lorsque la constante

du modele est proche de l’infini. Il s’agit d’un emboıtage a la limite, et cela pourrait affecter le point

critique du test LR. Il serait interessant de developper dans le futur un test beaucoup plus approprie

au modele developpe.


La statistique de test LR sous l’hypothese nulle suit asympotiquement une chi-

deux a 46 degres de liberte. Le point critique a 1% de la chi-deux a 46 degres de

liberte appartient a l’intervalle [69.96; 76, 15]. Comme LRc = 607.9348 > χ2c , on rejette

l’hypothese nulle selon laquelle il n’existe pas de classes. Nous avons donc une evidence

empirique en faveur de la presence des deux classes.

3.11 Estimation du taux d’escompte individuel

L’analyse de la demande d’electricite pour le chauffage de l’eau et de l’espace nous

amene aussi a nous interesser a la question du taux d’escompte individuel. L’electricite

n’est pas un bien directement consommable par le menage. Ce dernier a besoin de

l’electricite pour satisfaire un certain nombre de besoins comme le chauffage de l’eau

et des locaux. Pour y arriver, le menage doit choisir un systeme de chauffage pour

l’eau et un autre pour le chauffage de l’espace. Mais les systemes de chauffage dont

il est question font reference a des biens durables souvent acquis lors de l’achat (ou

meme a la construction) de la maison. A chaque systeme est associe des couts fixes et

des couts moyens anticipes, les deux etant inversement relies. Le menage doit faire un

arbitrage entre des couts d’acquisition tres eleves avec des couts d’exploitation anticipes

faibles, ou inversement. Les couts d’acquisition representent des depenses a effectuer

lors de l’achat ou de la construction de la maison, tandis que les couts moyens ou

d’exploitation anticipes representent des depenses futures qui s’etaleront sur toute la

duree de vie du systeme. Ce type d’arbitrage inter-temporel fait intervenir la notion de

taux d’escompte. Marshall A. (1890, p. 120) dans son ouvrage « Principles of Economics

», faisait reference au taux d’escompte. Selon lui, les taux auxquels les gens escomptent

le futur affecteraient non seulement leur tendance a l’epargne mais aussi leur tendance

a faire des achats qui leurs procureraient du plaisir de facon durable au detriment

de depenses pour des biens qui procureraient du plaisir a tres court terme. Fisher

(1930) definissait le taux d’escompte comme le taux de preference pour le temps ou

le taux d’impatience. Selon lui, les consommateurs qui ont des taux d’escompte tres

eleves accorderaient plus de poids au present qu’au futur et de ce fait, seraient plus

impatients que les autres consommateurs. Par exemple, si une entreprise veut evaluer

un investissement risque, elle calcule la valeur presente des flux de revenus futurs que

cet investissement peut rapporter. Formellement, ceci revient a ecrire que :

P = Fn (1 + r)−n ,

avec P la valeur actualisee des flux de revenus futurs de l’investissement, Fn est le flux de

revenu genere par l’investissement a la periode n, et r est le taux d’escompte utilise par

l’entreprise. Cette maniere de presenter le taux d’escompte permet de voir l’arbitrage


effectuer par l’entreprise entre le revenu futur et les depenses courantes. Si l’entreprise

accorde plus de poids au present qu’au futur (implicitement, elle est averse au risque),

alors elle aura un taux d’escompte tres eleve. Du point de vue des consommateurs

(menages pour ce qui nous concerne), l’arbitrage entre le present et le futur se fait

de facon similaire (Davis (2004)). A la place de l’entreprise, on pourrait considerer un

menage qui doit prendre une decision quant a savoir s’il a interet a investir ou non dans

un projet.

Pour acquerir un systeme de chauffage pour l’eau et pour l’espace, le menage peut

soit prendre un credit pour acheter ces biens ou les acheter au comptant s’il dispose

de suffisamment de richesse. Les menages plus pauvres pourraient avoir des difficultes

pour obtenir des prets tandis que les menages plus riches auront plus de facilites pour

avoir acces au credit. Nous supposons que l’achat de ces systemes de chauffage se fait

a la meme periode que l’achat de la maison de sorte que le menage est plus amene a

prendre un credit hypothecaire a un taux donne pour satisfaire ses besoins.

En supposant que le menage a acces au credit, peu importe qu’il soit riche ou pauvre, il

doit comparer le taux du credit a son taux d’escompte. Le taux d’escompte individuel lui

permettra de faire un arbitrage entre les investissements au temps present et les depenses

futures anticipees. Plusieurs travaux ont porte sur l’estimation du taux d’escompte

individuel. On peut citer entre autres les travaux de Hausman (1979), Goett (1978 et

1983), Gately (1980), Greene (1983), Dubin (1982), Dubin et McFadden (1984), Houston

(1983), Winter (1997), etc... Les taux d’escompte obtenus sont tres variables d’une

etude a l’autre. Mais la plupart des auteurs obtiennent des taux assez eleves, parfois

plus eleves que les taux d’interet sur les cartes de credits (qui est d’environ 18.5%).

Par exemple, Hausman (1979) a obtenu un taux d’escompte compris entre 24% et 26%,

dependamment de la duree de vie des appareils consideree. Dubin et McFadden (1984)

ont obtenu un taux d’escompte de 20.5% (a la moyenne des donnees). Ces differentes

valeurs depassent largement le taux d’interet sur les cartes de credit.

On a souvent suppose que dans un contexte de consommateur representatif, le taux

d’escompte serait identique a tous les consommateurs et a tous les biens. Ceci est souvent

traduit (en macroeconomie surtout) par le probleme de maximisation de l’utilite du

consommateur (Olsen et Bailey (1981)) :

Max U =T∑

t=1

v (Ct)

(1 + r)t ,

avec Ct la quantite agregee de biens consommee a la date t, v (.) est l’utilite de l’individu

a la date t, r est le taux d’escompte, T est l’horizon temporel de l’individu, suppose

parfois infini. Un des inconvenients avec ce modele est qu’on suppose que tous les

individus ont le meme taux d’escompte pour tous les biens, et donc la meme impatience

pour l’achat de ces biens (Winter, 1997). Dans la litterature economique, on suppose tres


souvent que le taux d’escompte individuel est le meme (ou defini de facon homogene) peu

importe le type de l’individu. Ceci pourrait etre une hypothese tres forte qui expliquerait

pourquoi dans les travaux anterieurs, les taux d’escompte sont souvent trop eleves.

Les travaux qui se sont penches sur le choix des systemes de chauffage de l’eau

et/ou de l’espace utilisent souvent un modele logit ou un probit pour estimer le taux

d’escompte. Le taux d’escompte implicite serait obtenu a partir des parametres associes

aux couts du capital et aux couts d’exploitation anticipes. Selon Hausman (1979), le

taux d’escompte serait inversement relie au revenu. Dubin et McFadden (1984) ont

estime un taux d’escompte en se servant d’un modele logit polytomique tout en prenant

en compte la relation inverse postulee par Hausman (1979). Le taux d’escompte qui

en resulte est tres eleve et les auteurs ont tente d’avancer plusieurs arguments pour

justifier pourquoi cette valeur refleterait mal la realite. De plus, les auteurs ont suppose

implicitement l’hypothese d’homogeneite entre les menages dans la definition du taux

d’escompte. Ils n’ont pas tenu compte du fait qu’il est possible d’avoir une certaine

heterogeneite entre les menages selon le systeme de chauffage choisi.

Nous postulons l’hypothese selon laquelle le taux d’escompte implicite eleve souvent

obtenu serait une consequence de la mauvaise specification du modele de choix du

systeme de chauffage. Dans la realite en effet, les consommateurs n’ont pas la meme

preference pour le temps surtout lorsqu’il s’agit d’achat de biens durables comme les

systemes de chauffage de l’eau et de l’espace. Winter (1997) proposait d’estimer des

taux d’escompte differents pour chaque bien et pour chaque consommateur. Pour ce qui

concerne l’achat des systemes de chauffage, les couts different selon la modalite choisie

par le menage. Certains menages vont preferer investir beaucoup au depart pour un

systeme de chauffage plus efficace et avoir des couts d’exploitation plus bas dans le futur,

tandis que d’autres consommateurs prefereront reporter les grosses depenses dans le

futur et donc investir peu pour l’acquisition du systeme de chauffage. Supposer, comme

ce fut le cas dans les etudes anterieures, que ces differents types de consommateurs ont

une preference pour le temps homogene, serait une hypothese trop forte et non coherente

avec la realite. Nous estimons que les consommateurs ont des preferences pour le temps

heterogenes selon la modalite choisie, et cette heterogeneite pourrait affecter aussi leur

taux d’escompte. Beaucoup de travaux portant sur l’achat et l’utilisation des systemes

de chauffage n’ont pourtant pas suppose l’heterogeneite du taux d’escompte selon le

systeme de chauffage choisi ; nous ne citons ici que quelques auteurs importants dans

ce domaine : Hausman (1979), Dubin et McFadden (1984).

Pour justifier notre argumentation, nous avons utilise plusieurs modeles pour fins

de comparaison : un modele logit polytomique avec des coefficients de couts moyens

specifiques aux alternatives, un autre modele logit polytomique ou cette fois, le coef-


ficient du cout moyen est commun a toutes les modalites comme c’est le cas dans les

etudes anterieures. Nous avons aussi utilise un modele logit mixte avec des erreurs au-

toregressives generalisees d’ordre un (decrit a la section (3.3)). Avec le logit mixte, nous

avons suppose dans un premier temps que le coefficient du cout moyen est specifique

a chaque modalite et dans un second temps, nous avons suppose que le coefficient du

cout moyen est commun a toutes les modalites. Nous avons procede a plusieurs tests

de specification et le meilleur modele serait le modele logit mixte avec des coefficients

de cout moyen specifiques aux modalites.

Nous avons ensuite estime les differents taux d’escompte en nous appuyant sur la

demarche de Dubin et McFadden (1984), etant donne que nous avons la meme forme

de fonction d’utilite. Le taux d’escompte generique (%) est obtenu a partir des relations

suivantes :

% = ρ0 + ρ1y ou

ρ0 =βcout fixe

βcout moyen

ρ1 =βcout fixe×revenu

βcout moyen

,

avec βcout fixe l’estime du coefficient du cout fixe, βcout moyen l’estime du coefficient de

la variable cout moyen, βcout fixe×revenu l’estime du coefficient de la variable cout fixe

multiplie par le revenu, y est le revenu moyen de l’echantillon. Le taux d’escompte

specifique a la modalite choisie (%j) est defini de facon similaire comme suit :

%j = ρ0j + ρ1jyj

ρ0j =βcout fixe

βcout moyenj

ρ1j =βcout fixe×revenu

βcout moyenj

,

avec j la modalite choisie, les autres variables ayant la meme interpretation que precedemment

(une variable indicee par j lorsque c’est le cas pour indiquer que la variable est specifique

a la modalite j) ; yj est le revenu moyen du groupe de menages ayant choisi la modalite

j dans l’echantillon. Les resultats des estimations du logit mixte et du logit polyto-

mique avec cout moyen generique sont presentes dans le tableau (3.9). Le tableau (3.5)

presente ceux du logit mixte et du logit polytomique avec couts moyens specifiques aux

modalites.

Les differents taux d’escompte estimes sont presentes dans le tableau (3.10). Les

resultats de l’estimation du modele de choix confirment effectivement la relation inverse

qui existe entre le revenu et le taux d’escompte : le coefficient (ρ1 ou ρ1j) est toujours

de signe negatif peu importe le modele considere. Nous remarquons que les modeles

avec un coefficient generique du cout moyen produisent un taux d’escompte commun

qui est largement superieur aux taux d’escompte des modeles ou la meme variable est


Tab. 3.9: Resultats du modele discret (couts moyens

generiques)

Variables logit mixte Logit polytomique

Estimes Ecart-type t-student Estimes Ecart-type t-student

mode1 -47.160 19.984 -2.360 -10.255 2.870 -3.573

mode2 -21.587 5.291 -4.080 -5.008 0.958 -5.225

mode3 -5.848 1.500 -3.899 -3.688 0.819 -4.504

mode4 -4.338 1.029 -4.216 -2.319 0.609 -3.808

mode5 -20.601 3.183 -6.472 -16.775 2.441 -6.873

mode6 -11.965 1.787 -6.696 -9.486 1.903 -4.984

mode8 -40.323 5.928 -6.803 -9.818 1.052 -9.336

mode9 -46.012 7.624 -6.035 -8.893 1.103 -8.059

coutfix -3.489 0.917 -3.804 -2.330 0.589 -3.959

coutfiy 1.032 0.199 5.191 0.787 0.131 6.014

coutm -19.035 1.391 -13.689 -9.650 0.424 -22.765

datcons 0.137 0.059 2.325 0.061 0.033 1.850

datconv 0.659 0.066 10.006 0.351 0.035 9.913

hdd1 3.798 2.982 1.274 1.067 0.545 1.958

hdd5 3.007 0.434 6.928 2.296 0.356 6.446

hdd6 2.123 0.271 7.823 1.540 0.335 4.600

hdd8 3.376 0.929 3.634 0.476 0.187 2.543

hdd9 4.478 1.062 4.217 0.880 0.191 4.612

nbpers1 0.089 1.002 0.089 -0.397 0.204 -1.945

nbpers3 0.911 0.239 3.815 0.582 0.112 5.214

nbpers4 0.038 0.131 0.289 0.026 0.082 0.317

nbpers5 1.492 0.251 5.950 1.014 0.224 4.535

y1 1.213 0.775 1.566 -0.124 0.150 -0.826

y2 -0.930 0.451 -2.063 -0.553 0.194 -2.846

y3 -0.680 0.220 -3.090 -0.676 0.148 -4.579

y4 -0.581 0.177 -3.274 -0.563 0.108 -5.212

y5 -0.438 0.235 -1.866 -0.461 0.190 -2.421

y6 -0.625 0.183 -3.406 -0.609 0.159 -3.817

y8 -2.224 0.308 -7.222 -0.658 0.074 -8.876

y9 -0.842 0.239 -3.529 -0.418 0.084 -5.000

SIG1 0.252 0.080 3.167 - - -

RHO -0.982 0.003 -375.951 - - -

Log-vraisemblance L(θ)

-1380.1825 -1545.9813

Log-vraisemblance L (0) -2317.3266 -2317.3266

Log-vraisemblance L (c) -2255.6268 -2256.0550


Tab. 3.10 – Taux d’escompte estimesModalites Logit mixte Logit polytomique

Gaz/gaz (1) 0.1973 0.2172

Gaz/electricite (2) 0.1068 0.1626

Bi-energie/mazout (3) 0.0913 0.1545

Bi-energie/electricite (4) 0.0927 0.1504

Mazout/mazout (5) 0.1092 0.2035

Mazout/electricite (6) 0.0997 0.1744

Electricite/electricite (7) 0.0810 0.1411

Bois/electricite (8) 0.0681 0.0979

Bois-electricite/electricite (9) 0.0974 0.1443

moyenne ponderee 0.0835 0.1411

moyenne non ponderee 0.1048 0.1606

taux d’escompte avec couts moyens generiques 0.181 0.238

autres informations pour 1989

taux d’interet hypothecaire 0.1205

taux d’inflation 0.0447

taux de depreciation (habitation) 0.015

taux d’escompte estime sur le marche financier 0.0908' 0.091

specifique aux modalites. Cela indique un biais vers le haut du taux estime. De plus,

nous remarquons que le logit polytomique donne des taux d’escompte plus grands et

plus proches de ceux obtenus anterieurement, taux d’escompte depassant souvent le

taux d’interet sur les cartes de credit. Le modele logit mixte semble mieux representer

la realite car les taux d’escompte individuels obtenus sont plus bas et plus proches du

taux d’escompte sur le marche financier (ce taux d’escompte est d’environ 9% et est

egal au taux d’interet reel hypothecaire (7.6%) auquel on ajoute le taux de depreciation

qui est de 1.5%). Les taux sur le marche financier sont obtenus aupres de Statistique

Canada pour l’annee 1989. Le taux d’escompte moyen est de 8.35% pour le modele

logit mixte tandis qu’il est de 14.11% pour le logit polytomique avec coefficients de

cout moyen specifiques aux modalites.

Pour les modeles dont le coefficient du cout moyen est generique, le taux d’escompte

est de 18.1% pour le modele logit mixte tandis qu’il est de 23.8% pour le logit polyto-

mique. Dans le logit mixte, seuls les menages ayant choisi la premiere modalite (gaz/gaz)

ont un taux d’escompte de 19.73%, legerement superieur au taux sur les cartes de credit

(18.5%), les autres menages ont des taux d’escompte qui varient de 6.8% a 10.9%. Avec

le logit polytomique, le taux d’escompte specifiques aux alternatives varient de 9.8% a

21.9%.


Pour le modele logit mixte retenu, on peut dire que les menages qui ont choisi

la modalite gaz/gaz sont les plus impatients (taux d’escompte de 19.73%) tandis que

les moins impatients sont les menages qui ont choisi la modalite bois/electricite (taux

d’escompte de 6.8%). Les menages qui ont choisi la premiere modalite sont disposes

a investir beaucoup d’argent pour acquerir des appareils de chauffage plus efficaces

et payer des couts d’exploitation tres bas sur toute la duree de vie des appareils. Les

menages qui ont choisi la modalite 8 (bois/electricite) ont une attitude contraire a celle

des menages de la premiere modalite. Supposer que ces deux types de menages ont la

meme preference pour le temps serait donc une hypothese trop forte. Ces deux types

de menages ont des caracteristiques qui leurs sont speficiques.

On peut egalement remarquer que les menages qui ont le taux d’escompte le plus

eleve sont relativement plus vieux (age moyen de 51 ans) et plus riches (revenu moyen

de 57.500$ par annee) et ceux qui ont le plus bas taux d’escompte sont relativement

plus jeunes (39 ans en moyen) et plus pauvres (revenu moyen de 32.500$ par annee).

Rappelons que l’age moyen de l’echantillon est de 41 ans et le revenu moyen est de

44.000$ environ. L’age serait positivement relie au taux d’escompte, confirmant ainsi les

resultats de Little (1984). Cela est assez intuitif puisque l’horizon de vie des personnes

plus agees est plus court que celui des plus jeunes. Le present (contrairement au futur)

aurait beaucoup plus de poids pour un individu relativement plus age que pour un

autre relativement plus jeune. Les personnes agees auraient tendance a avoir un taux

d’escompte plus eleve que la moyenne et inversement pour les personnes plus jeunes. En

somme, une mauvaise specification du modele de choix du mode de chauffage produirait

des estimateurs du taux d’escompte biaises vers le haut.

3.12 Conclusion

Dans cette etude, nous nous sommes interesses a l’estimation d’un modele de de-

mande d’electricite qui corrige a la fois le biais de selection du au choix du mode de

chauffage mais aussi l’endogeneite du prix marginal de l’electricite. L’estimation du

modele est realisee dans un contexte de modele de choix discret/continu comme cela

fut propose par Dubin et McFadden (1984). Le modele discret a ete estime grace aux

techniques de maximisation par simulation. Nous avons estime les correcteurs de biais

de selection pour les inclure comme variables explicatives dans le modele de demande.

Les donnees utilisees pour fin d’application proviennent d’Hydro-Quebec et portent sur

la consommation d’electricite des menages de la province de Quebec. Hydro-Quebec

applique une tarification non lineaire : le prix marginal est fixe selon la consommation

journaliere du menage. Cette derniere n’est cependant pas observable. Pour resoudre


le probleme d’endogeneite du prix marginal, nous avons developpe un modele a classes

latentes puisque les classes de consommateurs ne sont pas directement observables du

point de vue du chercheur. Le modele de demande conditionnelle au choix du mode

de chauffage et au choix de la classe de consommation est finalement estime par la

methode du maximum de vraisemblance en information limitee. L’approche utilisee

semble bien representer les donnees. Un test de specification a permis de confirmer la

necessite de tenir compte de l’existence des deux classes non observables. Il est ressorti

que les menages qui sont dans la deuxieme classe (ceux qui consomment le plus) sont

des menages a revenu eleve mais aussi des menages dont le chef est relativement plus

age. Les menages de la deuxieme classe sont beaucoup plus sensibles a la hausse du

prix de l’electricite. La premiere classe serait composee de menages a faibles revenus.

L’electricite serait un bien inferieur pour les menages de la premiere classe tandis qu’il

est un bien normal pour ceux de la deuxieme classe. Il est egalement ressorti que les

autres formes d’energies sont des substituts pour l’electricite. Les correcteurs de biais

de selection sont pour la plupart statistiquement significatifs (surtout pour la premiere

classe). Certains effets marginaux sont plus importants dans dans premiere classe et

moins dans la deuxieme, et inversement pour d’autres effets marginaux. Il n’a donc pas

ete possible de tirer une tendance generale pour les deux classes.

Le fait d’avoir utilise une seule coupe transversale pourrait constituer une limite

dans notre analyse de la demande d’electricite. Par exemple, le fait d’avoir une seule

periode n’a pas permis d’avoir de la variabilite dans le prix marginal de l’electricite.

Pour cette raison, nous avons utilise le prix moyen de l’electricite a la place du prix

marginal pour calculer les elasticites prix directes. Une analyse inter-temporelle de la

demande permettrait de mieux capter le comportement de consommation d’electricite

des menages. De plus, comme l’energie fait intervenir des biens durables, il est im-

portant de suivre les menages sur une certaine periode. Les chapitres qui vont suivre

tenterons de prendre en compte l’aspect inter-temporel du comportement de consomma-

tion d’electricite des menages quebecois, a partir d’enquetes independantes. Pour cela,

nous allons creer un speudo-panel dans le but de pallier au manque de vrais donnees

de panel. Nous exploiterons l’approche conventionnelle proposee par Deaton (1985) de

meme que l’approche bayesienne qui combine les algorithmes de l’echantillonnage de

Gibbs et d’augmentation des donnees.

Bibliographie

[1] Acton, J. P., Mitchell, B., M., and Mowill, R., S. (1976) : «Residential Demand

for Electricity in Los Angeles : An Econometric Study of Disaggregate Data»,

Rand-Report R-1899-NSF, Rand Corporation, Santa Monica, CA.

[2] Amemiya, T. (1984) : Tobit models : a surveys, Journal of Econometrics, Vol.24 ,

p. 3-61.

[3] Amemiya, T. (1985) : Advanced econometrics, Havard Univertsity Press, Cam-

bridge 1985

[4] Barnes, R., Gillingham, R., and Hagemann, R. (1981) : «The Short-Run Residential

Demand for Electricity», The Review of Economics and Statistics, Vol. 62, p. 541-

551.

[5] Belanger, D. (1992) : «Estimation des Probabilites de Choix Reliees au Probleme

d’Evaluation de la Demande d’Electricite Residentielle au Quebec», These de

Maıtrise, Universite Laval.

[6] Ben-Akiva and Bolduc D. (1991) : «Multinomial Probit with Autoregressive Er-

ror Structure», Cahier de Recherche 9123, Departement d’Economique, Universite

Laval.

[7] Ben-Akiva M., Bolduc, D. and Walker, J. (2001) : «Specification, Identification

and Estimation of the Logit Kernel (or Continuous Mixed Logit) Model», Draft

[8] Bernard, J-T, Bolduc, D. and Belanger, D. (1996) : «Quebec Residential Electricity

Demand : A Microeconometric Aproach», The Canadian Journal of Economics,

vol. 29, No.1 , p. 92-113.

[9] Bolduc D. (1992) : «Generalized Autoregressive Errors in the Multinomial Probit

Model», Transportation Research-B, Vol. 26B, No. 2.

[10] Billings, R., B. (1982) : «Specification of Bolck Rate Price Variable in Demand

Models», Land Economics, Vol. 56, p. 73-84.


of Increasing Bloc Rates», Land Economics, Vol. 56, p.73-84.

Bibliographie 112


of Increasing Bloc Rates : Reply», Land Economics, Vol. 57, p.276-278.

[13] Burtless, G., and Hausman, J., A. (1978) : «The Effect of Taxation of Labor Sup-

ply : Evaluating the Gray Neagtive Income Taxe Experiment», Journal of Political

Economy, 86, 276-278.

[14] Davis, L. W. (2004) : «The Role of Durables Goods in Households Water and

Energy Consumption : The Case of Front Loading Clothes Washers», Job Market

Paper, University of Wisconsin

[15] Dubin, J. A. (1982) : «Econometric Theory and Estimation of the Demand for

Consumer Durable Goods and thier Utilization : Appliance Choice and the Demand

of Electricity», Report No. MIT-EL 82-035-WP, MIT Energy Laboratory, MIT,

Cambridge, MA 02139, USA

[16] Dubin, J. A. (1985a) : Consumer Durable Choice and the Demand for Electricity,

Amsterdam : North-Holland.

[17] Dubin, J. A. (1985b) : «Evidence of Block Switching in Demand Subject to De-

cling Block Rates-A New Approach», Social Science Working Paper 583, California

Institute of Technology, Dept. of Economics.

[18] Dubin, J., J. and McFadden, D. (1984) : «An Econometric Analysis of Residential

Electric Apliance Holdings and Consumption», Econometrica, Vol. 52, No. 2, p.

345-362.

[19] Fisher, I. (1930) : The Theory of Interest, New York : Macmillan

[20] Foster, H., S., Jr., and Beattie, B., R. (1981a) : «Urban Residential Demand for

Water in the United Stated : Reply», Land Economics, 57, 257-265.

[21] Foster, H., S., Jr., and Beattie, B., R. (1981b) : «On the Specification of Price in

Studies of Consumer Demand Under Block Price Scheduling», Land Economics,

57, 624-629.

[22] Gately, D. (1980) : «Individual Discount Rates and the Purchase and Utilization of

the Energy-Using Durables : Comment», Bell Journal of Economics, 11, 373-374

[23] Goett, A. (1978) : «Appliance Fuel Choice : an Application od Discrete Multivariate

Analysis», PhD. Thesis, Department of Economics, University of California, USA

[24] Goett, A. (1983) : «Household Appliance Choice : Revision of the Residential End-

Use Energy Planning System», Final Report of Research Project 1918-1, Electric

Power Research Institute, California, USA

[25] Goodman, L. A. (1974), «Exploratory Latent Structure Analysis Using Both Iden-

tifiable and Unidentifiable Models», Biometrika, Vol. 61 p.215-231.

[26] Gopinath D. A. (1995) : «Modeling Heterogeneity in Discrete Choice Processes :

Application to Travel Demand», Ph.D ThesisMIT

Bibliographie 113

[27] Gourieroux C. and Monfort A. (1996) : Simulation-based Econometrics Methods,

Oxford University Press, Core Lectures.

[28] Greene, D. L. (1983) : «A Note on the Implicit Consumer Discounting of Automo-

bile Fuel Economy-Reviewing Available Evidence», Transportation Research Part

B-Methodological, 17, 491-498

[29] Greene W. H. and Hensher D. (2002) : «A Latent Class Model for Discrete Choice

Analysis : Contrasts with Mixed Logit», Transportation Research Part B (37) 681-

698.

[30] Hanemann, W. M. (1984) : «Discrete/Continuous Models of Consumer Demand»,

Econometrica, Vol. 52, No. 3, p. 541-562


Vol.46 No.6, p.1251-1271.

[32] Hausman, J.A. (1979) : «Individual Discount Rates and the Purchase and Utili-

sation of Energy-Using Durables», The Bell Journal of Economics, Vol. 10, No. 1,

p. 33-54.

[33] Hausman, J.A. (1985) : «The Econometrics of Nonlinear Budget Sets», Econome-

trica, Vol. 53, No. 6, p. 1225-1282

[34] Hausman, J.A., Kinnucan, M., and McFadden, D. (1979) : «A Two-Level Electri-

city Demand Model», Journal of Econometrics, Vol. 10, p. 263-289.

[35] Hausman, J. A. and Trimble, J. (1984) : «Appliance Purchase and Usage Adapta-

tion to a Permanent Time-of-Day Electricity Rate Schedule», Journal of Econo-

metrics, Vol. 26, p.115-139.

[36] Heckman, J. J (1978) : «Dummy endogenous variables in a simultaneous equations

system», Econometrics, Vol 46, No.4, p. 931-959

[37] Heckman, J. J (1979) : «Sample selection bias as a specification error», Econome-

trica, Vol. 47, No.1, p. 153-162

[38] Herriges, J., A. and King, K., K. (1994), «Residential Demand for Electricity un-

der Inverted Block Rates : Evidence from a Controlled Experiment», Journal of

Business and Economic Statistics, Vol. 12, No. 4, p. 419-430.

[39] Houston, D. A. (1981) : «Implicit Discount Rates and the Purchase of Untried

Energy-Saving Durabes Goods», The Journal of Consumer Research, Vol. 10, No.2,

p. 236-246

[40] Houthakker, H. S. (1950) : «Revealed Preference and the Utility Function», Eco-

nomica, Vol. 17, p.159-174

[41] King, M. A. (1980) : «An Econometric Model of Tenure Choice and Demand for

Housing as Joint Decision», Journal of Public Economics, Vol. 14

Bibliographie 114

[42] Lazarsfeld, P. F. (1950) : «The Logical and Mathematical Foundation of Latent

Structure Analysis & The Interpretation and Mathematical Foundation of Latent

Structure Analysis», S. A. Stouffer et al. (eds.) Measurement and Prediction 362-

472. Princeton, NJ : Princeton University Press.

[43] Larsen, B., M. and Nesbakken, R.(2004) : «Household Electricity End-use

Consumption : Results from Econometrics and Engineering Models», Energy Eco-

nomics, Vol.26, p. 179-200

[44] Lee, L. F.(1978) : Unionism and Wage Rates : «A Simultaneous Equations Mo-

dels with Qualitative and Limited Dependent Variables», International Economic

Review, Vol. 19, p. 415-433.

[45] Liao Hue-Chu and Chang Tsai-Feng (2002) : « Space-heating and Water-heating


[46] Marshall, A. (1890) : Principles of Economics, London, Macmillan

[47] McFadden, D. (1989) : «A Method of Simulated Moments for Estimation of the

Multinomial Probit Models without Numerical Integration», Econometrica, Vol.

57, Issue 5.

[48] McFadden, D., Puig, C., and Kirshner, D. (1977) : «Determinants of the Long-

Run Demand for Electricity», In the Proceeding of the Business and Economic

Statistics Section, American Statistical Association, p. 109-119.

[49] McFadden, D. and Train, K. (2000) : «Mixed MNL Models for Discrete Response»,

Journal of Applied Econometrics 15(5) 447-470.

[50] Marshall, A. (1890) : Principles of Economics, London, MacMillan

[51] Nesbakken, R. (2001) : «Energy Consumption for Space Heating : a Discrete-

Continuous Aproach», Scandinavian Journal of Economics, Vol.103, No.1, p. 165-

184

[52] Olsen, R.J. (1978) : «Note on the Uniqueness of the Maximum Likelihood Estima-

tor for the Tobit Model», Econometrica, Vol. 46, No.5, p. 1211-1215

[53] Olsen, R.J. and Bailey, M. J (1981) : «Positive Time Preference», The Journal of

Political Economy, Vol. 89, No. 1, p.1-25

[54] Pakes, A. and D. Pollard (1989) : «Simulation and the Asymtotics of Optimization

Estimations», Econometrica, Vol. 57, Issue 5.

[55] Polzin, P. E. (1984) : «The Specification of Price in Studies of Consumer Demand

Under Block Price Scheduling», in the Proceedings of the Business and Economic

Statistics Section, American Statictical Association, p. 109-119.

[56] Reiss, P. and White M.W. (2005) : «Household Electricity Demand Revisited»,

Review of Economic Studies, Vol. 72, p. 853-883.

Bibliographie 115

[57] Sanga, D. M. (1999) : «Estimation des Modeles Econometriques de Choix Dis-

crets/Continus avec Choix Polytomiques Interdependants : une Approche par Si-

mulation», These Ph.D, Universite Laval

[58] Shen J., Sakata Y and Hashimoto Y. (2006) : « A Comparison between Latent

Class Model and Mixed Logit Model for Transport Model Choice : Evidences from

two Datasets of Japan», Discussion Paper 06-05, Osaka University, Japan

[59] Taylor, L., D., (1975) : «The Demand for Electricity : A Survey», The Bell Journal

of Economics, Vol. 6, No. 1, p. 74-110.

[60] Train, K. (1985) : «Discount Rates in Consumers’ Energy Related Decisions : A

Review of the Litterature», Energy, Vol. 10, No. 12, p. 1243-1253

[61] Train, K. (1993) : Continuous/Discrete Models. Qualitative Choice Analysis :

Theory, Econometrics, and an Aplication Aplication to Automobile Demand. Cam-

bridge : The MIT Press

[62] Train, K. (2002) : Discrete Choice Methods with Simulation, Cambridge University

Press.

[63] Vaage K. (2000) : «Heating Technology and Energy Use : a Discret/Continuous

Choice Approach to Norwegian Household Energy Demand», Energy Economics,

Vol.22, No.6, p. 649-666

[64] F. Vekeman, F., Bolduc D. and Bernard J-T (2004) : «Household Vehicles Choice

and Use : What a more Disaggregated Approach Reveals ?», Working Paper, De-

partment of Economics, Universite Laval.

[65] Vermunt J. K. and Magidson J. (2000) : «Latent Class Cluster Analysis», Statis-

tical Innovations Inc. Tiburg University

[66] Vermunt J. K. and Magidson J. (2005) : « Factor Analysis with categorical indica-

tors : A comparison between traditional and latent class approaches», In A. Van

der Ark, M.A. Croon and K. Sijtsma (eds), New Developments in Categorical Data

Analysis for the Social and Behavioral Sciences, 41-62. Mahwah : Erlbaum.

[67] Winter Russel, S. (1997) : «Discounting and its Impact on Durables Buying Deci-

sions», Marketing Letters, Vol. 8, No.1, p. 109-118

Chapitre 4

Estimation de la demande

d’electricite avec des pseudo-panels

de cohortes

4.1 Introduction

Nous cherchons a analyser la demande d’electricite des menages de la province de

Quebec a partir de bases de donnees d’enquetes (ou coupes transversales) independantes.

Pour cela, nous constituons des cohortes comme l’a suggere pour la premiere fois Dea-

ton (1985). Deux criteres seront utilises pour constituer les cohortes : la superficie de

l’habitation ainsi que la region ou est situe le menage. Apres avoir cree les cohortes,

nous exploiterons les methodes classiques pour analyser la demande d’electricite de

la province. Habituellement, avec un modele a effets fixes (pour des pseudo-panels),

les auteurs ne cherchent plus a verifier si les tests d’hypothese sont vraiment valides.

Nous savons en effet qu’en presence d’heteroscedasticite et/ou d’autocorrelation des

erreurs, les variances des estimateurs des moindres carres ordinaires sont biaisees, et

donc les tests d’hypothese et intervalles de confiance ne sont plus valides. En presence

d’heteroscedasticite et/ou d’autocorrelation des erreurs, la methode des moindres carres

quasi-generalises permet d’avoir des estimateurs convergents des variances des estima-

teurs. Nous proposons de verifier les caracteristiques des termes d’erreurs en presence

d’effets fixes et de faire les corrections necessaires s’il y a lieu afin d’avoir des tests

d’hypotheses valides. Nous estimons un modele de demande d’electricite statique et un

modele de demande dynamique avec erreurs heteroscedastiques et autoccorrelees. Les

elasticites prix et revenus sont egalement calculees et sont comparees aux valeurs qu’on

Chapitre 4. Estimation de la demande d’electricite avec des pseudo-panels de cohortes117

obtiendrait si aucune correction n’est faite.

Nous presentons a la section (4.2) la revue des ecrits anterieurs, la section (4.3) porte

sur le modele statique de demande d’electricite, a la section (4.4), nous analyserons

le modele dynamique de demande d’electricite, et enfin, la section (4.5) donne une

conclusion.

4.2 Revue des ecrits anterieurs

Pour analyser le comportement de consommation des menages, les donnees de panels

sont souvent appropriees. Avec les donnees de panel, il est possible de suivre les memes

individus au cours d’une periode donnee. Les donnees de panel sont constituees d’ob-

servations tirees de facon repetees a differentes periodes. Ainsi, pour un meme individu,

il y a plusieurs observations correspondantes. Les panels ont a la fois une dimension de

coupe transversale et une dimension de serie chronologique. Contrairement aux coupes

transversales, il est possible de suivre un individu donne dans le temps avec les donnees

de panel. Contrairement aux series chronologiques, on peut observer plusieurs series (ou

variables) avec les donnees panel. En observant plusieurs coupes transversales a travers

le temps, il est possible d’analyser les aspects dynamique et statique d’un probleme

donne.

Les donnees de panel ont un certain nombre d’avantages par rapport aux donnees

purement en coupes transversales ou de series chronologiques. Hsiao (2001) et Bal-

tagi (2005) donnent un survol des avantages et limites des donnees de panel. Un de

ces avantages est le nombre plus important d’observations ; cela permet d’ameliorer

la precision des estimateurs. Les donnees de panel ont aussi l’avantage de pouvoir

resoudre le probleme de multicolinearite. Lorsque les variables explicatives varient dans

les deux dimensions (temporelle et transversale), elles ont tendance a etre moins for-

tement correlees. Avec les donnees de panel, il est possible de reduire le probleme de

la multicolinearite en introduisant des differences entre les individus a travers les effets

individus. En outre, avec les panels, il est possible de mesurer des effets qui ne sont

pas facilement identifiables avec des coupes transversales ou des series chronologiques.

Les donnees de panel offrent la possibilite de reduire les biais d’omission de variables

pertinentes grace a une transformation du modele en difference ; cette transformation

a pour but d’eliminer les variables specifiques aux individus mais invariantes dans le

temps et qui sont correlees avec le terme d’erreur. Soulignons aussi que les panels sim-

plifient l’inference statistique. Avec les series chronologiques, il est important de savoir

si les series sont stables, integrees ou explosives. Mais avec les donnees de panel, tant

que la dimension transversale approche l’infinie, la distribution limite des coefficients


reste normale, que la dimension temporelle soit fixee ( Anderson et Hsiao 1982) ou tend

vers l’infini (Levin et Lin 1993, Phillips et Moon 1999).

Les panels souffrent cependant du probleme d’attrition. Puisque ce sont les memes

individus qui sont suivis sur plusieurs periodes, il peut arriver que certains ne soient plus

observables a partir d’une periode donnee. Les non-reponses augmentent habituellement

avec le temps. L’attrition peut devenir problematique parce qu’elle peut creer un biais

de selection. Le biais de selection se produit lorsque les individus de l’echantillon ne

sont plus tires de facon aleatoire mais sont selectionnes en suivant le critere selon lequel

l’individu est observable sur toute la periode consideree. Dans un tel contexte, il peut

arriver d’exclure un pourcentage non negligeable d’observations de l’echantillon. Ainsi,

une bonne partie de l’information ne sera pas utilisee dans l’analyse et l’echantillon

ne serait plus le resultat d’un tirage aleatoire. Une solution au probleme d’attrition

serait d’utiliser un panel rotatif ou un pseudo-panel. Un panel rotatif est un panel dans

lequel on decide de changer un pourcentage fixe des individus interroges. Biorn (1981) a

propose un panel rotatif ou le pourcentage d’individus manquants a la deuxieme periode

doit etre remplace par de nouveaux individus dans le but de garder la meme taille de

l’echantillon. Biorn et Jansen (1983) ont considere un panel rotatif sur les menages

Norvegiens dans lequel la moitie des menages est remplacee a la seconde periode par

de nouveaux menages. Les pseudo-panels sont un cas extreme de panel rotatif, car

a chaque periode, c’est tous les individus de l’echantillon qui sont remplaces par de

nouveaux individus.

Dans beaucoup de pays, et particulierement dans les pays en developpement, les

donnees de panel sont rares ou meme inexistantes ; cependant, il existe beaucoup de

series de coupes transversales independantes. En effet, les donnees de panel sont souvent

couteuses a collecter puisqu’il faut suivre les memes individus sur plusieurs periodes

(annees, mois, jours...). De plus, elles sont sujettes au probleme d’attrition. Avec les

donnees en coupes transversales, les individus qui font l’objet de l’enquete changent

d’une periode a l’autre de sorte que leur collecte est beaucoup moins contraignante.

Cependant, les coupes transversales ne permettent pas de suivre un individu donne

dans le temps pour pouvoir capter l’aspect dynamique de son comportement. Comment

donc se servir de ces coupes transversales pour pallier au manque de donnees de panel ?

Deaton (1985) fut le premier a proposer une solution a ce probleme. Il suggere

de remplacer les observations par des moyennes de cohortes ; ces moyennes de cohortes

constituent un panel synthetique ou un pseudo-panel. Une cohorte est definie comme un

ensemble d’individus ayant des caracteristiques communes. Les cohortes sont construites

a partir de criteres invariants dans le temps. Si l’individu ne peut pas etre suivi dans le

temps, la cohorte peut par contre etre suivie dans le temps. Etant donne qu’on dispose


d’echantillons de cohortes et non de la population entiere de cohortes, les moyennes

des cohortes sont une approximation des moyennes de la population et par consequent,

sont des variables avec des erreurs de mesure. Deaton propose alors d’estimer le modele

en tenant compte de ces erreurs de mesure. Lorsque le nombre d’individus par cohorte

est suffisamment grand, les erreurs de mesure peuvent alors etre ignorees (Browning,

Deaton et Irish (1985)). Rappelons que le probleme d’erreur de mesure existe aussi

avec les vrais panels. Suite a l’article de Deaton (1985), les modeles avec cohortes se

sont repandus dans la litterature a travers le temps dans le but de pallier au manque

de vrais panels. L’utilisation de pseudo-panels n’implique pas necessairement que les

resultats qui en decouleront seront inferieurs a ceux qu’on obtiendrait si on disposait de

vrais panels. On sait que les panels souffrent frequemment de probleme d’attrition. En

effet, il peut arriver que certains individus decident de quitter le groupe faisant l’objet

de l’enquete pour differentes raisons. Ces departs font qu’il est difficile d’observer tous

individus a chacune des periodes considerees. Avec les pseudo-panels, ce probleme est

ecarte puisque les individus ne sont plus les memes d’une periode a l’autre, eliminant

ainsi le probleme d’attrition. De plus, on peut etendre le nombre de periodes avec les

pseudo-panels si on dispose de coupes transversales sur ces periodes.

Comme avec les donnees de panels on est amene a introduire des effets individuels,

il en est de meme avec les pseudo-panels. Il faut choisir le type d’effet individuel : effets

fixes ou effets aleatoires. Rappelons que lorsque les regresseurs ne sont pas correles

avec les effets individuels, l’estimateur a effets fixes et l’estimateur a effet aleatoire

sont convergents, le dernier etant plus efficace que le premier. Cependant, si les effets

individuels sont correles avec un ou plusieurs regresseurs du modele, l’estimateur a effet

aleatoire n’est plus convergent mais l’estimateur a effets fixes est approprie. Apres avoir

choisi le type d’effets individuels de meme que le type de modele (modele statique ou

modele dynamique), il faut ensuite choisir la methode d’estimation.

Il existe dans la litterature plusieurs methodes d’estimation : estimation within, esti-

mation a variables instrumentales (VI) (comme les doubles moindres carres), estimation

par la methode des moments generalises,... Dans le contexte des pseudo-panels, l’esti-

mateur within ou a variables instrumentales sont les plus utilises. Deaton et al. (1985)

ont estime la consommation des menages des Royaumes-Unis en se servant de l’esti-

mateur within. Dargay et Vythoulkas (1998) et Dargay (2002) ont analyse un modele

de demande dynamique de voitures des menages des Royaumes-Unis en utilisant un

modele a effets fixes qu’ils estiment par la methode du maximum de vraisemblance.

Gardes et Loisy (1997) ont utilise des pseudo-panels pour estimer l’elasticite du re-

venu minimum par rapport au revenu declare. Ils ont cherche a verifier l’hypothese selon

laquelle la croissance economique cree de nouveaux besoins contribuant ainsi au main-


tien de l’insatisfaction des consommateurs. Ils ont utilise la transformation «within» et

la transformation «between» tout en corrigeant l’heteroscedasticite qui survient a cause

de l’aggregation des menages en cellules de cohortes.

Nous avons note cependant que lorsque les auteurs utilisent le modele a effets fixes,

la plupart ne cherchent pas a verifier s’il y a un probleme d’heteroscedasticite et/ou

d’autocorrelation des erreurs. On suppose implicitement l’homoscedasticite et l’absence

de correlation serielle. Hors, nous savons qu’en presence d’heteroscedasticite et ou d’au-

tocorrelation des erreurs, les tests d’hypotheses (tests de significativite individuelle des

parametres, tests de significativite globale,....) ne sont plus valides car les variances

des estimes sont biaisees. Dans un tel contexte, le test de Hausman (1978), pour sa-

voir s’il faut ou non inclure des effets fixes, ne serait plus valide. Il est donc important

de verifier au prealable si l’hypothese d’homoscedasticite (et l’absence de correlation

serielle) est valide et si elle est rejetee, il faut corriger le modele afin de pouvoir effec-

tuer de bons tests d’hypothese et de pouvoir ainsi faire de bonnes interpretations des

resultats. Dans le contexte de vrais panels, Garcia-Cerrutti (2000) ont utilise l’approche

des moindres carres generalises pour corriger a la fois un probleme d’heteroscedasticite

et de correlation serielle des erreurs dans un modele de demande dynamique d’electricite

avec des effets aleatoires. Dans ce travail, nous essayerons a partir de donnees de

pseudo-panels, d’estimer un modele statique et dynamique de demande d’electricite

des menages de la province de Quebec tout en pretant une attention particuliere au

probleme d’heteroscedasticite et de correlation serielle.

Le modele de demande d’electricite sera analyse avec des cohortes que nous avons

construites a partir d’une serie de coupes transversales independantes. Rappelons que

lorsqu’il s’agissait d’estimer la demande d’electricite des individus (menages), nous

etions obliges de corriger le biais de selection en introduisant des correcteurs obte-

nus dans une etape ulterieure. Nous avions egalement corrige le biais d’endogeneite du

au fait que le prix marginal de l’electricite est non lineaire, et pour cela, nous avions

utilise un modele a classes latentes. Lorsque nous passons de donnees individuelles a

des donnees groupees (macro) (en d’autres termes, nous passons aux cohortes), ces

deux problemes (biais de selection et biais d’endogeneite) ne se posent plus. En effet, le

choix du mode de chauffage n’est pas specifique a chaque cohorte ; dans chaque cohorte

construite, ils existe differents menages avec differentes modalites. De ce fait, nous n’es-

timons plus la demande conditionnelle avec les cohortes, mais nous estimons la demande

d’electricite ou encore la demande d’electricite d’un groupe donne de menages. Donc,

la question de biais de selection ne se pose plus a ce niveau.

Par ailleurs, pour ce qui concerne le probleme d’endogeneite du prix marginal de

l’electricite, nous avions utilise un modele a deux classes, les classes etant definies de


la facon suivante : si la variable consommation journaliere moyenne moins 30 kWh est

negative, alors le menage est dans la premiere classe avec un prix marginal d’electricite

(p1), et si cette variable est positive, le menage se retrouve dans la deuxieme classe

avec un prix marginal d’electricite (p2 > p1). Dans le contexte des cohortes, nous avons

constate que cette variable ne prenait qu’un seul signe (elle est toujours positive), ce qui

indique que toutes les cohortes se retrouvent dans la deuxieme classe. L’effet de groupe

l’emporte sur l’effet individuel. Il n’y a alors qu’une seule classe de consommateurs

(cohortes). Ceci est assez intuitif car la majorite des menages consomment en moyenne

plus de 30 kWh par jour, de sorte qu’au niveau macro (cohortes), toutes les cohortes

se retrouvent dans la deuxieme classe. Par consequent, nous nous retrouvons avec un

seul groupe de cohortes et donc avec une seule equation de demande, qui correspond a

l’equation de la deuxieme classe. En somme, en considerant les pseudo-panels au lieu

de vrais panels ou meme des coupes transversales ou les observations sont gardees au

niveau individuel, le modele de demande d’electricite se simplifie enormement.

4.3 Modeles statiques de demande d’electricite avec

des pseudo-panels

Lorsqu’on s’interesse a la demande d’electricite (ou l’energie en general), il est im-

portant de pouvoir suivre les menages sur une certaine periode. En effet, le menage

ne consomme pas l’electricite comme un bien final ; il l’utilise pour faire fonctionner

ses appareils de chauffage de l’eau ou de l’espace dans le but de maximiser son utilite.

Cela implique donc que le menage doit s’acheter des appareils pour le chauffage de

l’eau et celui de l’espace. Ces appareils sont des biens durables ou semi-durables dont

la duree de vie ne se limite pas a une annee. Dans un tel contexte, il est important

de suivre le menage sur une certaine periode pour mieux connaıtre son comportement

de consommation. Pour pouvoir suivre les memes individus sur plusieurs periodes, les

donnees de panels sont appropriees. Avec les donnees de panel, ce sont les memes in-

dividus qui sont enquetes a chaque periode. Or, pour le probleme qui nous concerne, il

n’existe pas de donnees de panel dans la province de Quebec qui nous permettrait de

suivre les memes menages sur plusieurs periodes. Les donnees disponibles sont plutot

constituees de plusieurs coupes transversales independantes. Comme dans d’autres pays,

les donnees de panel sont presqu’inexistantes, mais il existe plusieurs coupes transver-

sales independantes. Pour pallier au probleme de manque de panel, Deaton (1985)

suggere de creer des cohortes, composees de menages partageant un certain nombre

de caracteristiques communes. Les moyennes de cohortes representent les unites qui

composent les pseudo-panels. Selon Deaton (1985), comme les moyennes des cohortes


sont des variables avec erreurs de mesure des vraies moyennes de la population de co-

hortes, il faut utiliser les methodes d’estimation qui corrigent pour la presence d’erreur

de mesure. A partir d’un modele statique a effets fixes, il propose un estimateur wi-

thin qui corrige pour la presence d’erreurs de mesure ; son estimateur est convergent

lorsque le nombre d’individus par cohorte est fixe. Verbeek et Nijman (1993) modifie-

ront par la suite l’estimateur de Deaton dans le but d’atteindre la convergence lorsque

le nombre de periodes (T ) est fixe et lorsque le nombre d’individus par cohorte (C) est

fixe. Lorsque le nombre d’individus par cohorte est suffisamment grand, les erreurs de

mesure peuvent alors etre ignorees. Dans les applications empiriques en effet, la plupart

des auteurs ignorent les erreurs de mesure : Browning, Deaton et Irish (1985), Blundell

et al. (1985), Moffit (1993),... L’estimateur le plus souvent utilise est alors l’estimateur

within.

4.3.1 La construction des cohortes

Les cohortes doivent etre construites selon des regles bien etablies. Les variables

servant de criteres ne doivent pas changer d’une cohorte a l’autre et elles doivent etre

observables a chaque periode. Par exemple, Deaton (1985), Browning et al. (1985) ont

utilise l’annee de naissance comme critere pour construire les cohortes : les individus

nes par exemple en 1945 peuvent etre retrouves en 1990. Le probleme qui se pose

inevitablement est l’arbitrage entre le nombre de cohortes (C) et le nombre d’individus

par cohortes (nc). Si C est grand, alors nc sera petit, impliquant que les moyennes de co-

hortes contiendraient une certaine imprecision des vraies moyennes de la population de

cohortes. Mais si C est faible alors nc sera grand. Verbeek et Nijman (1992b) demontrent

que nc doit etre suffisamment grand pour que l’estimateur within soit convergent.

Avec les donnees d’Hydro-Quebec, nous disposons de quatre grosses bases de donnees

provenant d’enquetes independantes de 1989, 1994, 1999 et 2002. Ces enquetes ont porte

sur la consommation d’electricite des menages de la province de Quebec. Nous avons

extrait 2897 observations de l’enquete de 1989, 4850 de celle de 1994, 3129 de l’enquete

de 1999 et 2159 de l’enquete de 2002. La figure (4.1) ci-dessous presente les donnees et

decrit le probleme de manque de vrai panel. Un menage enquete en 1994 par exemple

ne peut pas etre retrouve dans l’enquete de 1989 ou celle de 1999. Il en est de meme

pour les autres menages des autres enquetes.

Comme criteres de construction des cohortes, nous avons choisi la region et la taille

de la maison. La province est en effet divisee en neuf (9) regions administratives et nous

estimons que les menages vivant dans la meme region partagent un certain nombre de

caracteristiques communes. Les comportements des menages concernant la consomma-


Fig. 4.1 – Manquante de vrai panel, enquetes independantes

tion d’energie devrait changer d’une region a l’autre. Comme l’objectif est d’analyser

la demande d’electricite, un element important dans la demande est la taille de la mai-

son : nous estimons que les maisons peuvent etre reparties en trois (3) groupes : les

petites (moins de 1000 pieds carres), les moyennes (entre 1000 et 2000 pieds carres) et

les grandes (plus de 2000 pieds carres) surface. Nous supposons que les menages gardent

les memes systemes de chauffage entre 1989 et 2002 ; par consequent, ils gardent la meme

maison. S’il y a des deplacements, nous supposons que les menages ne peuvent pas oc-

cuper plus d’une maison a la fois. Les menages qui quittent leur maison iront occuper

les maisons d’autres menages et laisseront leur maison a d’autres menages. Ces derniers

auraient des caracteristiques similaires aux premiers de sorte qu’on arrive finalement

a un continuum de menages. Nous supposons que les maisons ne restent pas vides et

que les deplacements se font dans la meme province. Dans le pire des cas, les menages

qui quittent completement la province sont remplaces par des menages immigrants qui

occuperont les maisons des premiers. Ces hypotheses sont assez realistes etant donne

que le but du travail est d’estimer la demande d’electricite des menages de la province.

Nous n’analysons pas de maniere specifique les caracteristiques socio-demographiques

des individus qui nous obligeraient a avoir les memes individus sur toute la periode

de l’etude. Nous avons juste besoin de certaines informations sur le menage pour ana-

lyser sa demande d’electricite. L’energie est indirectement consommee par le menage

a travers des appareils. Ces appareils ne sont pas a la limite intrinsequement lies aux

individus.


Avec ces deux variables (region et surface chauffee) nous avons une combinaison

de 9 × 3 = 27 cohortes possibles. Mais, nous avons regroupes certaines cohortes qui ne

comportaient pas suffisamment d’observations de sorte que nous avons finalement garde

25 cohortes. La taille moyenne des cohortes est de 131 observations, certaines cohortes

en contiennent plus, d’autres moins. Precisons que certaines cohortes ne contiennent pas

beaucoup d’observations parce que la population de ces cohortes n’est pas tres grande

au depart. En effet, dans la province de Quebec, il y a des regions de forte densite et

d’autres de faible densite. cela se reflete aussi dans la base de donnees de l’enquete de

sorte qu’on supposera que pour ces regions, on peut admettre qu’on a suffisamment

d’observations representatives de la population de depart. Les tableaux (5.7 a 5.10) a

l’annexe (5.8.1) presentent les differentes cohortes des quatre (4) periodes d’enquete 1.

4.3.2 Le modele a effets fixes

Supposons que le modele de demande d’electricite derivee d’apres l’identite de Roy

est defini comme suit :

ynt = Xntβ + θn + εnt n = 1, 2...Nt t = 1, ...T, (4.1)

l’indice n indique le menage et l’indice t la periode ; ynt est la demande d’electricite du

menage n a la periode t, Xnt est un vecteur de variables explicatives exogenes, θn est un

effet individuel inobservable, εnt est un terme d’erreur. Lorsqu’on dispose d’un ensemble

de coupes transversales independantes, les Nt individus presents a chaque enquete ne

sont pas necessairement les memes, un menage enquete a la periode t ne peut pas etre

retrouve a la periode precedente ou a la periode suivante. Donc, l’indice n change d’une

periode a l’autre. On peut donc ecrire n(t) pour etre beaucoup plus precis, mais pour

ne pas alourdir le texte, nous gardons l’indice n tout en ayant en tete qu’il s’agit bien

de n(t).

Etant donne que nous n’avons pas de vrais panels, nous construisons des cohortes

et utilisons les moyennes de cohortes comme unites constituant les pseudo-panels. Lors-

qu’on regroupe les individus en cohortes et qu’on calcule la moyenne dans chaque co-

horte, on aboutit au modele suivant :

yct = Xctβ + θc + εct c = 1, 2...C t = 1, ...T, (4.2)

avec : yct = 1nc

∑nc

n=1 ynt. Nous supposons que nous disposons de suffisamment d’ob-

servations par cohortes de sorte que les erreurs de mesure des moyennes de cohortes

1Comme le chapitre 5 et ce chapitre utilisent les memes cohortes, nous avons prefere presenter les

differents tableaux une seule fois pour economiser de l’espace. Donc, les tableaux dont il est question

ici sont dans le chapitre 5


peuvent etre ignorees. L’effet inobservable peut etre un effet aleatoire ou un effet fixe.

Rappelons que lorsqu’il s’agit d’effet fixe, l’estimateur le plus souvent utilise et le plus

approprie est l’estimateur within. Lorsqu’on estime que les effets inobservables sont des

effets aleatoires, la methode d’estimation appropriee est la methode des moindres carres

generalises (faisable). Beaucoup d’auteurs se limitent aux effets fixes lorsqu’ils ont des

pseudo-panels : Deaton (1985), Browning et al. (1985), Moffit (1993),... Cela se justifie

par le fait que les variables explicatives contiennent des erreurs de mesure qui cause-

raient une correlation entre regresseurs et terme d’erreur. Et lorsqu’on estime qu’il peut

y avoir une correlation entre les regresseurs et le terme d’erreur (qui comporte l’effet

inobservable), alors l’estimateur within est convergent tandis que l’estimateur a effet

aleatoire ne l’est pas. Mais si la correlation est nulle (cov(θc, Xct

)= 0), alors les deux

estimateurs (effet fixe et effet aleatoire) sont tous convergents mais l’estimateur a effet

aleatoire est asymptotiquement efficace.

Dans un tel contexte, l’estimateur le plus souvent utilise est l’estimateur within

defini de la facon suivante :

βW =

[1

CT

C∑

c=1

T∑

t=1

(Xct − Xc

)′ (Xct − Xc

)]−1 [

1

CT

C∑

c=1

T∑

t=1

(Xct − Xc

)′(yct − yc)

],

avec : Xct = 1nc

∑ncn=1 Xnt Xc = 1

T

∑Tt=1 Xct

Moffit (1991) propose une autre methode d’estimation lorsqu’il s’agit d’effets fixes.

Il propose d’utiliser la methode des variables instrumentales. L’estimateur a variables

instrumentales propose est identique a l’estimateur within lorsqu’on utilise les variables

binaires des cohortes comme instruments.

Pour s’assurer du bon choix du type d’effets inobservables, Hausman (1978) a pro-

pose un test dans le contexte des donnees de panel. Mais son test peut s’appliquer aux

pseudo-panels puisqu’il s’agit du meme probleme.

Hausman propose de comparer l’estimateur des MCG obtenu lorsque les effets sont

aleatoires (soit βMCG) a l’estimateur within (βW ). Les deux estimateurs sont convergents

sous l’hypothese nulle selon laquelle : cov(θc, Xct

)= 0. Sous l’hypothese alternative :

cov(θc, Xct

)6= 0, les deux estimateurs vont diverger de sorte que leur difference serait

importante. Hausman suggere d’utiliser la statistique de test suivante : q = βMCG− βW .

Sous H0, p lim q = 0. La variance de q est :

V (q) = V(βMCG − βW

)= V

(βMCG

)+ V

(βW

)− 2cov

(βMCG, βW

)

cov(βMCG − βW , βW

)= cov

(βMCG, βW

)− V

(βW

)= 0

=⇒ cov(βMCG, βW

)= V

(βW

).


Donc, on peut reecrire que :

V (q) = V(βMCG

)− V

(βW

)= Ψ.

Le test de Hausman est alors donne par :

m = q′ [V (q)]−1 q

=(βMCG − βW

)′ [V(βMCG

)− V

(βW

)]−1 (βMCG − βW

)∼ χ2

C−1,

ou C est le nombre d’effets fixes dans le modele. Notons que le test de Hausman est en

fait un test de Wald. Tres souvent, la variance Ψ n’est pas connue et doit donc etre rem-

placee par un estimateur convergent Ψ. On utilise alors la matrice de covariance estimee

des estimateurs de pente du modele avec variables binaires des cohortes (dummies) et

celle du modele a effets aleatoires.

4.3.3 Resultats de l’estimation du modele a effets fixes

Le tableau (4.1) presente les resultats du modele a effets fixes. Pour s’assurer que

le modele a effets fixes est approprie, nous avons effectue un test de Hausman comme

presente ci-dessus. La statistique de test de Hausman est de l’ordre de 123.24468, la

valeur critique du chi-deux a 5% et 24 degres de liberte est de 36.42. Donc, m =

123.24468 > 36.42. On rejette l’hypothese nulle d’absence de correlation entre le terme

d’erreur et les variables explicatives. Le modele a effets fixes est donc approprie puisqu’il

donne des estimateurs convergents. Le tableau (4.1) donne les resultats de l’estimation

du modele.

Seuls les effets marginaux du prix de l’electricite et de la variable hdd (degres jours

de chauffage) sont statistiquement significatifs a 5%.

Nous avons effectue un test de significativite globale sur les (C−1) effets specifiques

aux cohortes. Il s’agit d’un test de Fischer defini par :

F (C − 1, CT − C − K) =(R2

W − R2MCG) / (C − 1)

(1 − R2MCG) / (CT − C − K)

,

avec K le nombre de coefficients de pentes. La valeur de la statistique de test est

F (24, 69) = 3.36. La valeur critique a 5% est Fc ∈ [1.57; 1.62]. Comme la statistique

calculee est superieure a la valeur critique, on rejette l’hypothese nulle selon laquelle

tous les effets fixes sont egaux a zero. Les effets specifiques aux cohortes sont donc

globalement significatifs.


Tab. 4.1: Modele statique a effets fixes

Variables Estime Ecart-type t-Student

revenu net .6172 .3535392 1.75

prix elctricite -1.442158 .5200113 -2.77

prix gaz naturel .2178228 .194662 1.12

prix mazout -1.026381 .5786171 -1.77

hdd 1.958219 .9600648 2.04

cdd -8.482621 7.249241 -1.17

cohorte1 -2.417198 1.733671 -1.39

cohorte2 2.572027 1.679964 1.53

cohorte3 4.05885 1.679964 2.42

cohorte4 -2.035391 2.276674 -0.89

cohorte5 .9509011 1.997647 0.48

cohorte6 4.453147 1.895231 2.35

cohorte7 -.8243735 1.839923 -0.45

cohorte8 .388121 1.663072 0.23

cohorte9 3.66971 1.593354 2.30

cohorte10 -3.082057 1.69904 -1.81

cohorte11 -1.072986 1.53406 -0.70

cohorte12 .6223572 1.454324 0.43

cohorte13 -1.959902 1.693123 -1.16

cohorte14 .1139964 1.525058 0.07

cohorte15 2.280018 1.45824 1.56

cohorte16 -3.326363 1.886357 -1.76

cohorte17 -.6284879 1.646997 -0.38

cohorte18 -4.783232 1.423004 -3.36

cohorte19 -1.658285 1.342258 -1.24

cohorte20 -4.402492 2.069519 -2.13

cohorte21 -3.830722 1.938741 -1.98

cohorte22 -1.704322 1.772595 -0.96

cohorte23 -3.677466 1.365347 -2.69

cohorte24 -1.688461 1.328588 -1.27

constante 23.63549 7.44476 3.17

R-squared = 0.7888 Adj R-squared = 0.6969

Fin du tableau


4.3.4 Modele a effets fixes avec heteroscedasticite

Plusieurs raisons peuvent nous amener a penser que le terme d’erreur du modele

(4.2) est heteroscedastique. En effet, les cohortes sont des regroupements de plusieurs

menages partageant un certain nombre de caracteristiques. Il est donc raisonnable de

penser qu’il pourrait exister une certaine forme d’heteroscedasticite groupee entre les

cohortes. Si cette hypothese est verifiee, alors, les tests d’hypothese ne sont plus valides

memes si les estimateurs sont convergents. Supposons que la variance du terme d’erreur

est specifique a chaque cohorte :

yct = Xctβ + εct V (εct) = σ2c c = 1, 2...C.

L’indice c indique la cohorte et C = 25. Pour simplifier l’ecriture, nous incluons les

effets fixes dans le vecteur Xct. L’estimation de ce modele peut se faire par la methode

des moindres carres quasi-generalises (MCQG). Dans une premiere etape, on estime le

modele par les MCO et on recupere les residus notes ect. Ces residus sont ensuite utilises

pour estimer la variance specifique a chaque cohorte :

σ2c =

e′cec

T=

(yc − Xcβ

)′ (yc − Xcβ

)

T.

La derniere etape consiste a estimer le modele transforme par MCO qui corrige l’heroscedasticite :

yct

σc

=Xct

σc

β +εct

σc

.

L’estimateur des MCQG de β est alors donne par :

β =

[X

′Ω−1X

]−1 [X

′Ω−1y

]

=

[C∑

c=1

1

σ2c

X′cXc

]−1 [ C∑

c=1

1

σ2c

X′cyc

].

Etant donne σ2c , l’estimateur de β par les MCQG correspond a l’estimateur du maximum

de vraisemblance. Les resultats de l’estimation sont presentes dans le tableau (4.2).

Tab. 4.2: Modele avec Heteroscedasticite


revenu net .7385276 .2418165 3.05

pelec marg -1.751766 .2466844 -7.10

prixgn .185615 .0929948 2.00





prixm -1.238494 .2989311 -4.14

hdd 1.638906 .608246 2.69

cdd -8.225858 4.070753 -2.02

cohorte1 -2.489894 1.824612 -1.36

cohorte2 2.406516 1.956014 1.23

cohorte3 3.786586 1.735673 2.18

cohorte4 -2.602967 1.870596 -1.39

cohorte5 .2731698 1.549799 0.18

cohorte6 3.598371 1.493409 2.41

cohorte7 -1.155822 1.559821 -0.74

cohorte8 -.0787368 1.474065 -0.05

cohorte9 3.180688 1.485582 2.14

cohorte10 -3.241141 1.527891 -2.12

cohorte11 -1.324454 1.397899 -0.95

cohorte12 .2446808 1.408668 0.17

cohorte13 -2.238237 1.451103 -1.54

cohorte14 -.2821526 1.514672 -0.19

cohorte15 1.774275 1.779847 1.00

cohorte16 -3.507847 1.8153 -1.93

cohorte17 -1.020351 1.403998 -0.73

cohorte18 -4.530968 1.502309 -3.02

cohorte19 -1.541926 1.335396 -1.15

cohorte20 -4.625635 1.766542 -2.62

cohorte21 -4.17928 1.42428 -2.93

cohorte22 -2.156654 1.466682 -1.47

cohorte23 -3.499311 1.434226 -2.44

cohorte24 -1.553178 1.386549 -1.12

constante 28.03313 4.08412 6.86

σ21 5.5824

σ22 8.4061

σ23 3.5065

σ24 4.7037

σ25 1.3528

σ26 .9160

σ27 1.5197

σ28 .7815





σ29 1.0244

σ210 .4784

σ211 .3065

σ212 1.4995

σ213 .8193

σ214 2.9559

σ215 6.1830

σ216 5.0996

σ217 .4029

σ218 3.1199

σ219 .8286

σ220 2.6598

σ221 .2864

σ222 1.0682

σ223 3.5051

σ224 2.5861

σ225 7.6153


Fin du tableau

Pour tester l’hypothese nulle d’homoscedasticite du modele, nous utilisons le test du

ratio de vraisemblance (LR pour likelihood ratio). La fonction log-vraisemblance sous

l’hypothese d’homoscedasticite est :

ln L0 = −CT

2ln 2π − CT

2ln σ2 − 1

2

C∑

c=1

T∑

t=1

[yct − Xctβ

]′ [yct − Xctβ

]

σ2.

Sous l’hypothese alternative d’heteroscedasticite, la fonction log-vraisemblance est :

ln L1 = −CT

2ln 2π − 1

2

C∑

c=1

T ln σ2c −

1

2

C∑

c=1

T∑

t=1

[yct − Xctβ − θc

]′ [yct − Xctβ − θc

]

σ2c

.

La statistique de test est :

LR = −2 [ln L0 − ln L1] ∼ χ2C−1

.

La valeur du log-vraisemblance sous H0 est : L0 = −183.3154 et celle sous l’hypothese

d’heteroscedasticite est : L1 = −156.1297. La valeur de la statistique LR est : LR =


54.37. La valeur critique du chi-deux est : χ224,5% = 39.36 ; on rejette donc H0 au seuil de

5%. En conclusion, le terme d’erreur n’est pas homoscedastique. Apres la correction de

l’heteroscedasticite, nous constatons que les statistiques de Student sont plus grandes,

les estimes des coefficients de pente sont tous statistiquement significatifs au seuil de

5%. Il est donc important de corriger l’heteroscedasticite pour obtenir des tests valides.

4.3.5 Modele a effets fixes avec heteroscedasticite et correlation

serielle

Compte tenu des resultats du test LR, nous supposerons pour la suite que la variance

de l’erreur n’est pas homoscedastique. Supposons qu’il n’existe pas de correlation entre

les cohortes, plus precisement :

corr (εct, εks) = 0 si c 6= k.

Supposons cependant qu’il existe une correlation entre les termes d’erreurs de deux

periodes differentes :

εct = ρεct−1 + uct

V (εct) = σ2c =

σ2uc

1 − ρ2,

ou ρ est le coefficient d’autocorrelation et σ2c est la variance specifique a chaque co-

horte. Dans ce modele, nous supposons a la fois de l’heteroscedasticite et de l’auto-

correlation des erreurs. Le terme d’erreur suit en fait un processus autoregressif d’ordre

un (ou AR(1)). Pour estimer ce modele, nous devons d’abord corriger le probleme d’au-

tocorrelation en utilisant la transformation de Prais-Winsten (1954). Un estimateur

convergent de ρ note par ρ est :

ρ =

∑Cc=1

∑Tt=1 ectect−1∑C

c=1

∑Tt=2 e2

ct

ect = yct − Xctβ,

avec ect les residus de la regression des MCO. Le ρ est ensuite recupere pour effectuer

la transformation de Prais-Winsten de la facon suivante :

Y ∗c =

√1 − ρ2yc1

yc2 − ρyc1...

ycT − ρycT−1

X∗c =

√1 − ρ2Xc1

Xc2 − ρXc1

...

XcT − ρXcT−1.


Les donnees transformees sont utilisees dans une seconde regression par MCO pour

obtenir des estimateurs convergents des variances :

σ2uc =

e′∗ce∗cT

=

(Y ∗c − X∗cβ

)′ (Y ∗c − X∗cβ

)

T.

Apres avoir obtenu des estimateurs convergents des variances, ils sont utilises pour

transformer le modele de sorte a corriger l’heteroscedasticite :

β =

[X

′∗Ω

−1X∗

]−1 [X∗

′Ω−1y∗

]

=

[C∑

c=1

1

σ2uc

X′∗cX∗c

]−1 [ C∑

c=1

1

σ2uc

X′∗cy∗c

].

Conditionnellement a ρ, les estimateurs de β et σ2uc par les MCG correspondent a ceux

du maximum de vraisemblance (Greene, 2003). La fonction log-vraisemblance est :

ln L = −1

2ln 2π − 1

2

C∑

c=1

T ln

[σ2

uc

1 − ρ2

]− 1

2

C∑

c=1

T∑

t=1

[yct − Xctβ

]′ [yct − Xctβ

]

σ2c

.

Les resultats de l’estimation sont donnes dans le tableau (4.3). Les parametres du

modele peuvent aussi etre estimes de facon iterative comme dans les travaux de Obe-

rhofer et Kmenta (1974). Comme l’a note Greene (2003), cette procedure n’est pas

necessairement meilleure.

Tab. 4.3: Erreurs heteroscedastique et AR(1)


revenu net .6681975 .2340717 2.85

pelec marg -1.890073 .2274265 -8.31

prixgn .2186211 .0888686 2.46

prixm -1.291938 .2838837 -4.55

hdd 1.237069 .5848032 2.12

cdd -6.924017 3.870414 -1.79

cohorte1 -2.040675 1.466644 -1.39

cohorte2 3.10831 1.544003 2.01

cohorte3 4.540684 1.435885 3.16

cohorte4 -3.446144 1.605437 -2.15

cohorte5 -.3695903 1.32581 -0.28

cohorte6 3.098054 1.250655 2.48

cohorte7 -1.635418 1.328303 -1.23

cohorte8 -.421821 1.236856 -0.34





cohorte9 2.855164 1.192159 2.39

cohorte10 -3.375336 1.272062 -2.65

cohorte11 -1.45073 1.151959 -1.26

cohorte12 .0755473 1.155748 0.07

cohorte13 -2.537264 1.199643 -2.12

cohorte14 -.5510944 1.219404 -0.45

cohorte15 1.48284 1.423668 1.04

cohorte16 -3.748977 1.496833 -2.50

cohorte17 -1.216339 1.160432 -1.05

cohorte18 -4.170202 1.180676 -3.53

cohorte19 -1.196916 1.05465 -1.13

cohorte20 -4.356801 1.437122 -3.03

cohorte21 -3.996954 1.16711 -3.42

cohorte22 -1.87687 1.194698 -1.57

cohorte23 -3.373312 1.209076 -2.79

cohorte24 -1.463929 1.120043 -1.31

constante 31.25113 3.838271 8.14

σ21 5.1941835

σ22 6.5342976

σ23 4.292325

σ24 2.4605299

σ25 .17748612

σ26 .37009621

σ27 .61783052

σ28 .93305238

σ29 .78685749

σ210 1.04243

σ211 .507171

σ212 1.20919

σ213 .184374

σ214 1.66861

σ215 5.29729

σ216 3.63777

σ217 .323159

σ218 1.6752

σ219 .370896





σ220 3.59636

σ221 .157379

σ222 1.03062

σ223 2.09437

σ224 1.1418

σ225 6.01092

Log likelihood =-147.8451

ρ = -0.2925

Fin du tableau

Nous avons effectue un test LR pour savoir si les erreurs sont a la fois heteroscedastiques

et autocorrelees.

LR = −2 [ln L1 − ln L] ∼ χ2C

avec lnL1 le log-vraisemblance du modele heteroscedastique et lnL le log-vraisemblance

du modele avec heteroscedasticite et AR(1). La valeur du log-vraisemblance du modele

avec de l’heteroscedasticite est lnL1 = −156.1297 et celle du modele avec heteroscedasticite

et AR(1) est lnL = −147.8451. La statistique de test est alors egale a : LR = 16.5692 et

la valeur critique de la chi-deux a un degre de liberte est χ21 = 37.65. 2 Comme la valeur

du test est superieure a celle du point critique, nous avons une evidence empirique en

faveur du modele avec erreurs heteroscedastique et AR(1). La statistique de test nous

permet de confirmer que les erreurs sont heteroscedatiques et seriellement correlees.

Comme on peut le constater, tous les coefficients d’interet (coefficients de pente) sont

tres significatifs (au seuil de 5%), a l’exception du coefficient de la variable cdd (qui est

cependant significatif a 10%). De plus, ils ont les bons signes. Nous concluons que le

modele avec erreurs heteroscedastiques et AR(1) represente mieux les donnees. Ainsi,

comme ce modele est le meilleur, cela implique que les ecart-types des estimateurs du

modele sous l’hypothese d’heteroscedasticite sont biaises et ainsi, les tests d’hypothese

sur ces derniers sont invalides. De meme, les ecart-types du modele sous l’hypothese

d’effets fixes homoscedastiques ne sont pas valides.

2Sous l’hypothese de AR(1), nous avons suppose que le coefficient d’autocorrelation est commun

a toutes les cohortes et sous l’hypothese d’heteroscedasticite simple, nous n’avons aucun coefficient

d’autocorrelation.


4.3.6 Analyse de sensibilite : elasticites prix et revenu de la

demande

Le tableau (4.4) presente les differentes elasticites prix directe, prix croisees et revenu

de la demande d’electricite. L’elasticite prix directe de la demande est definie par :

η =∂Qe

∂Pe

× Pe

Qe

,

avec Qe la demande d’electricite et Pe le prix marginal de l’electricite. Elle donne la

variation directe de la demande d’electricite suite a une variation du prix de l’electricite.

η = −0.488 sous l’hypothese d’erreurs heteroscedastiques et AR(1). Cela signifie qu’une

augmentation de 1% du prix marginale de l’electricite entraınerait une baisse de 0.488%

de la demande globale de la province. On peut egalement noter qu’un test de Student

nous permet de dire que cette elasticite est tres significative (t = 8.295). On peut aussi

noter que l’elasticite du modele homoscedastique est inferieure a celle du modele avec

de l’heteroscedasticite uniquement, qui elle aussi est inferieure a celle du modele avec

heteroscedasticite et AR(1).

Nous avons egalement estime deux elasticites prix croisees. L’elasticite prix croisee d’un

bien est definie comme etant egale a la variation de la demande d’un bien suite a la

variation du prix d’un autre bien :

ηc =∂Qe

∂Pj

× Pj

Qe

,

avec Pj le prix d’un bien autre que l’electricite (mazout ou gaz naturel pour ce qui

nous concerne). Sous l’hypothese d’heteroscedasticite et AR(1), l’elasticite prix croisee

du gaz est de (0.042) et est tres significative : une hausse de 1% du prix du gaz naturel

entraıne une augmentation de 0.042% de la demande d’electricite. Le gaz naturel et

l’electricite sont alors deux biens substituables. Si le prix du gaz naturel augmente,

les menages qui utilisent le gaz vont diminuer leur consommation en gaz au profit de

l’electricite. Nous remarquons que l’elasticite du modele retenu est superieure a celles

des deux autres modeles.

L’elasticite prix croisee du mazout est de (-0.373) et est tres significative. Une aug-

mentation de 1% du prix du mazout entraınera une baisse de (-0.373%) de la demande

d’electricite. Le mazout et l’electricite sont donc deux biens complementaires. Cela a du

sens puisque beaucoup de menages utilisent le mazout en combinaison avec l’electricite

pour leur chauffage (le chauffage en bienergie ou en electricite/mazout). Remarquons

que cette valeur de l’elasticite est comprise entre celle du modele homoscedastique et

celle du modele avec heteroscedasticite seulement.

Nous avons enfin calcule l’elasticite revenu de la demande d’electricite :

ηr =∂Qe

∂R× R

Qe

.


L’elasticite revenu de la demande est de (0.153) et est tres significative. Elle est comprise

entre celle du modele homoscedastique et celle du modele avec heteroscedasticite seule-

ment. Une hausse de 1% du revenu entraınera une hausse de (0.153%) de la demande

d’electricite, donc une hausse moins de 1%. L’electricite est donc un bien ordinaire.

Tab. 4.4 – Elasticites du modele statique

effets fixes heterosc. heterosc. et AR(1)

elasticite-prix electricite (directe) -0.372 -0.452 -0.488

E-T (0.1342) (0.064) (0.059)

elasticite prix gaz naturel (croisee) 0.0423 0.0360 0.042

E-T (0.0378) (0.018) (0.0172)

elasticite prix mazout (croisee) -0.2964 -0.358 -0.373

E-T (0.1671) (0.086) (0.082)

elasticite revenu 0.1418 0.17 0.153

E-T (0.0812) (0.056) (0.054)

4.4 Modeles dynamiques de demande d’electricite

Un certain nombre d’auteurs se sont interesses a l’estimation de modeles dynamiques

avec des pseudo-panels : Moffit (1993), Collado (1997), Girma (2000), McKenzie (2001

et 2004), Verbeek et Vella (2004). On parle de modele dynamique lorsqu’on intro-

duit une variable endogene retardee dans le modele. Moffit (1993) etend l’approche

de Deaton (1985) a l’estimation de modeles dynamiques a partir de coupes transver-

sales independantes. Il interprete l’estimateur within comme un estimateur a variables

instrumentales base sur des pseudo-panels et qui utilise les variables binaires des co-

hortes. Les erreurs de mesure sont ignorees dans son modele etant donne que le nombre

d’observations par cohorte tend vers l’infini. Moffit suggere de remplacer la variable

dependante retardee ynt−1 par une valeur predite obtenue a partir de donnees dispo-

nibles a la periode t−1. Collado (1997) propose des estimateurs des moments generalises

(GMM) qui corrigent les erreurs de mesure des modeles dynamiques. Son estimateur est

convergent lorsque le nombre de cohortes tend vers l’infini, pour des valeurs fixes de T

et du nombre d’observations par cohorte. Elle propose egalement un estimateur within

qui corrige les erreurs de mesure, cet estimateur est convergent a mesure que T tend

vers l’infini. Une simulation Monte Carlo a ete effectuee pour etudier la performance

en echantillon fini de ses estimateurs. Il est ressorti que la correction des erreurs de

mesure est importante et que les estimateurs corriges reduiraient le biais. Par ailleurs,

si T est fixe, les estimateurs GMM sont meilleurs aux estimateurs within. Girma (2000)

propose une methode alternative a la methode des GMM pour l’estimation des modeles


dynamiques avec des coupes transversales independantes. Contrairement a l’approche

de Deaton (1985) qui consistait a prendre la moyenne des individus d’une meme cohorte,

son approche consiste a utiliser une transformation par quasi-differenciation entre deux

individus quelconque d’un meme groupe. Les proprietes asymptotiques des estimateurs

sont conditionnelles au fait qu’il faut avoir beaucoup d’observations dans chaque groupe.

L’avantage avec cette approche est qu’elle peut etre implementee avec seulement deux

coupes transversales. On n’a pas besoin d’avoir un grand nombre de coupes transver-

sales sur plusieurs periodes. McKenzie (2001) s’est interesse au probleme d’estimation de

modeles dynamiques a partir de pseudo-panels non balances. Precisons que les pseudo-

panels non balances sont des pseudo-panels ou T , la periode maximale d’etude, est

remplace par Tc ; cela signifie que la periode maximale de disponibilite de l’information

depend de chaque cohorte. Lorsqu’on a des pseudo-panels non balances, cela cree des

contraintes non lineaires sur les parametres. Plusieurs methodes d’estimation sont alors

suggerees comme les moindres carres non lineaires, l’estimation a distance minimale,...

Ces estimateurs sont convergents et asymptotiquement normaux pour T fixe et nc → ∞.

Dans un autre article, McKenzie ( 2004) introduit de l’heterogeneite deterministe entre

les cohortes. Il suppose precisement que les parametres sont specifiques a chaque co-

horte. Il developpe une theorie asymptotique pour les pseudo-panels en s’appuyant sur

les travaux de Phillips et Moon (1999).

Verbeek et Vella (2004) ont apporte des critiques aux estimateurs proposes par Moffit

(1993), Girma (2000) et McKenzie (2004). Ils montrent que l’estimateur de Moffit (1993)

n’est pas convergent a moins que les variables exogenes soient invariantes dans le temps

ou n’ont aucune autocorrelation. Ils proposent alors une approche alternative basee

sur les variables instrumentales et qui consiste a utiliser l’estimateur within avec les

moyennes des cohortes. L’estimateur «within» a variables instrumentales augmentees

qu’ils proposent est convergent ; cependant cette convergence exige un grand nombre

de cohortes pour pouvoir reduire le biais de l’estimateur. Ce biais existe aussi dans

l’estimateur «within» des modeles dynamiques utilisant de vrais panels, et il est meme

plus grand que le biais de l’estimateur «within» avec les pseudo-panels. Cet estimateur

converge sous les memes conditions que celles proposees par Collado (1997) mais ces

conditions ne sont pas facilement satisfaites dans les applications empiriques.

4.4.1 Le modele dynamique

Supposons que le modele de demande d’electricite est defini selon l’equation sui-

vante :

ynt = αynt−1 + Xntβ + θn + εnt n = 1, 2...Nt t = 1, ...T. (4.3)


Comme dans le modele statique ou l’information passee n’etait pas disponible, nous

utilisons l’approche de Deaton (1985) qui consiste a prendre la version moyennes des

cohortes :

yct = αyct−1 + Xctβ + θc + εct c = 1, 2...C t = 1, ...T.

Pour estimer ce modele, nous utilisons la methode des variables instrumentales qui

consiste a instrumenter la variable dependante retardee yct−1. L’approche utilisee est

assez proche de celle proposee par Moffit (1993) mais sous sa version moyennes de

cohortes comme l’ont suggere Verbeek et Vella (2004). Nous supposons que yct−1 depend

de variables variant dans le temps et de variables invariant dans le temps (comme les

variables binaires des cohortes) :

yct−1 = W ct−1a1 + Zca2 + εct−1,

avec W ct−1 un vecteur de variables qui varient dans le temps3 et Zc un vecteur de

variables invariant dans le temps incluant les effets fixes specifiques aux cohortes4. Apres

avoir instrumente yct−1, nous estimons le modele par la methode des moindres carres

ordinaires. Quant a la premiere observation, nous utilisons aussi une autre regression

auxiliaire pour la recuperer. Nous supposons que l’observation initiale est fonction d’un

certain nombre de variables invariant dans le temps et est definie comme suit :

yc0 = Zcb1 + vc0.

Les resultats de l’estimation sont presentes au tableau (4.5).

Tab. 4.5: Resultats du modele dynamique a ef-

fets fixes



cons anP .5170141 .3283345 1.57

revenu net .5528357 .3521903 1.57

pelec marg -1.755511 .5516658 -3.18

prixgn .5709668 .2956242 1.93

prixm -.8514604 .583189 -1.46

hdd 1.184587 1.069464 1.11

cdd -9.258611 7.189656 -1.29

cohorte1 1.100116 2.816372 0.39

cohorte2 3.180768 1.706599 1.86


3Les variables qui varient dans le temps et qui ont ete choisies pour constituer Wct−1 sont : les degres

jours de chauffage (hdd), les degres jours de climatisation (cdd) et le prix marginal de l’electricite.4Dans notre application empirique, nous avons choisi uniquement les effets specifiques aux cohortes


Tab. 4.5: Resultats du modele dynamique a ef-

fets fixes


cohorte3 3.743946 1.674224 2.24

cohorte4 -.0136661 2.59285 -0.01

cohorte5 1.34713 1.992521 0.68

cohorte6 2.853339 2.132768 1.34

cohorte7 .2112252 1.935659 0.11

cohorte8 .6303453 1.652698 0.38

cohorte9 2.0327 1.888451 1.08

cohorte10 -1.012113 2.134044 -0.47

cohorte11 -.2490677 1.605526 -0.16

cohorte12 .4483511 1.443215 0.31

cohorte13 .0981261 2.124772 0.05

cohorte14 .9696756 1.60383 0.60

cohorte15 1.795547 1.475291 1.22

cohorte16 -1.114574 2.335935 -0.48

cohorte17 -.0403331 1.671876 -0.02

cohorte18 -1.723582 2.399564 -0.72

cohorte19 -.4291699 1.54049 -0.28

cohorte20 .5350633 3.745028 0.14

cohorte21 .590691 3.400571 0.17

cohorte22 1.393288 2.635503 0.53

cohorte23 -1.58633 1.894362 -0.84

cohorte24 -.5960213 1.486405 -0.40

cons 14.8531 9.239461 1.61

R-squared = 0.7962 Adj R-squared = 0.7033 F( 31, 68)=8.57

Fin du tableau

Precisons que la variable cons anP est la consommation annuelle de la periode

precedente. Comme on peut le constater, un test de significativite individuelle indique

que la plupart des estimes ne sont pas significatifs (en particulier, seul l’estime de la

variable prix de l’electricite est significatif a 1%). Un test de Wald pour la significa-

tivite globale des effets fixes uniquement indique que ceux-ci ne sont pas globalement

significatifs (W= 0.61). On serait donc tente d’exclure les effets fixes du modele. La

statistique de test de Fischer( F (31, 68) = 8.57) (dont la p-value est egale a zero) in-

dique que tous les coefficients du modele sont globalement significatifs. Pourtant, les

signes des estimes sont conformes aux attentes. A la vue de tous ces resultats, on est


porte a croire qu’il pourrait exister soit un probleme d’heteroscedasticite ou soit un

probleme d’autocorrelation ou les deux, ceci entraınant des biais dans les variances des

estimateurs des MCO.

Comme dans le cas du modele statique presente precedemment, supposons que le

terme d’erreur du modele est seriellement correle et est heteroscedastique :

εct = ρεct−1 + uct

V (εct) = σ2c =

σ2uc

1 − ρ2.

Comme dans la section precedente, le modele peut etre estime par la methode des

moindres carres quasi-generalises : la premiere etape consistera a estimer le coeffi-

cient d’autocorrelation commun a toutes les cohortes pour corriger le probleme d’au-

tocorrelation. A la deuxieme etape, on corrige l’heteroscedasticite pour obtenir des

estimateurs dont les variances sont convergentes. La demarche est la meme que celle

effectuee avec le modele statique, et nous ne la repeterons pas a nouveau. Les resultats

de la regression par les MCQG sont presentes au tableau (4.6).

Tab. 4.6: Modele dynamique avec Heteroscedasticite et

AR(1)


cons anP .6164317 .1470966 4.19

revenu net .329807 .2362842 1.40

pelec marg -1.961809 .236709 -8.29

prixgn .6060003 .1277783 4.74

prixm -1.119214 .2924707 -3.83

hdd .2040774 .6102746 0.33

cdd -6.184466 3.854286 -1.60

cohorte1 1.866262 1.760028 1.06

cohorte2 3.846228 1.545563 2.49

cohorte3 4.307 1.395605 3.09

cohorte4 -1.744625 1.68578 -1.03

cohorte5 -.2562666 1.345449 -0.19

cohorte6 1.148856 1.383164 0.83

cohorte7 -.9429972 1.365099 -0.69

cohorte8 -.3662461 1.210054 -0.30

cohorte9 .8300997 1.304951 0.64

cohorte10 -1.450074 1.329133 -1.09

cohorte11 -.7575846 1.147127 -0.66




AR(1)


cohorte12 -.1817363 1.150077 -0.16

cohorte13 -.5609136 1.301616 -0.43

cohorte14 .2809824 1.223438 0.23

cohorte15 .9599508 1.383933 0.69

cohorte16 -1.794702 1.539853 -1.17

cohorte17 -.8161492 1.180051 -0.69

cohorte18 -.9224034 1.416723 -0.65

cohorte19 .1987281 1.108386 0.18

cohorte20 .7210995 1.848759 0.39

cohorte21 .6805055 1.650625 0.41

cohorte22 1.524573 1.429822 1.07

cohorte23 -1.231933 1.332008 -0.92

cohorte24 -.3925002 1.175754 -0.33

cons 21.33348 4.622642 4.61

σ21 5.2897031

σ22 6.5706749

σ23 3.7829192

σ24 2.894408

σ25 .23762125

σ26 .47230221

σ27 .97634242

σ28 .47618843

σ29 .9558614

σ210 .46551761

σ211 .20820747

σ212 1.0448476

σ213 .15323077

σ214 1.4526517

σ215 4.5521254

σ216 2.8969085

σ217 .40602174

σ218 1.4666186

σ219 .38202435

σ220 1.9795251

σ221 .22698583




AR(1)


σ222 .63675816

σ223 2.2665462

σ224 1.4666116

σ225 6.1677877


ρ = -0.3106

Wald chi2(31) = 1236.95

Fin du tableau

La plupart des estimes des parametres de pente sont statistiquement significatifs

aux seuil usuel a l’exemption du celui de la variable hdd, cdd et du revenu net.

Nous avons effectue un test du ratio de vraisemblance pour confirmer l’hypothese

d’erreurs heteroscedastiques. Plus precisement, la valeur du log-vraisemblance sous l’hy-

pothese d’homoscedasticite est lnL0 = −181.5247 et celle du modele avec unique-

ment de l’heteroscedasticite est lnL1 = −152.2155. La statistique de test LR est :

LR = −2(−181.5247 + 152.2155) = 58.62. La valeur critique du test est : χ224,5% =

36.42 < LR ; donc l’hypothese d’homoscedasticite est rejetee. Par ailleurs, nous avons

teste l’hypothese d’heteroscedasticite avec AR(1). La valeur du log-vraisemblance sous

cette derniere hypothese est lnL = −143.4006. La statistique de test est : LR =

−2(−152.2155 + 143.4006) = 17.63 > χ21,5% = 3.84. Donc, on a une evidence empi-

rique en faveur d’erreurs heteroscedastiques et AR(1) comme dans le modele statique.

Un test de Wald a aussi ete effectue sur les effets fixes. Apres avoir corrige le

modele, il est ressorti que les effets fixes sont globalement significatifs : la statistique

de test pour la significativite globale des coefficients specifiques aux cohortes est :

W = 47.43 > χ224,5%. Pourtant, avant la correction, les effets fixes n’etaient pas glo-

balement significatifs.

4.4.2 Analyse de sensibilite : elasticites prix et revenu

Nous avons calcule les elasticites prix directes, croisees et revenu de la demande

d’electricite. L’annexe (5.8.3) presente la demarche suivie pour calculer la variance de

l’elasticite de long terme. Mise a part l’elasticite revenu de court terme, les autres


elasticites de court terme (CT) et de long terme (LT) sont sous evaluees lorsqu’aucune

correction n’est faite sur le modele. Par ailleurs, comparativement aux elasticites obte-

nues dans le modele statique, les elasticites de long terme sont nettement superieures a

celles du modele statique.

En ce qui concerne les elasticites prix directes ou croisees de court terme, nous

remarquons qu’elles sont toutes inferieures en valeur absolue a celles de long terme.

Cela confirme la seconde loi de la demande. Cette loi postule en effet que l’elasticite

de LT doit etre plus grande que celle de CT. En d’autres mots, les consommateurs

peuvent trouver plus de substituts dans le long terme que dans le CT, etant donne

une certaine periode d’ajustement. A court terme, on s’attend a ce que la demande

soit inelastique et a LT on s’attend a ce qu’elle soit plus elastique. Lorsque le prix

d’une forme d’energie change, les changements a long terme dans la consommation des

cohortes devraient etre beaucoup plus importants que les changements a court terme.

Cela se justifie par le fait que les cohortes utilisent des biens durables dont elles ne

peuvent s’en departir sur le champ suite a une hausse du prix de l’energie utilisee. A

court terme, les cohortes changent leurs comportements (par exemple une baisse de

l’utilisation de l’energie suite a une hausse de son prix) et avec le temps, elles vont

investir dans de nouveaux equipements pour lesquels les depenses sont relativement

moins couteuses.

Ainsi, si le prix de l’electricite augmente de 1%, la demande d’electricite va baisser de

0.51% a court terme, mais a long terme, elle baissera de 1.32% (soit plus de trois fois la

baisse du court terme). Ainsi, si le prix de l’electricite augmente de 1%, on s’attend a

ce que les cohortes de menages baissent de plus de 1% leur consommation a long terme.

L’elasticite prix croisee de court terme du gaz naturel est de 0.118 et est significative a

1%, alors que celle de long terme est de 0.31 mais n’est pas significative. Si le prix du gaz

naturel augmente de 1%, les cohortes augmenteront leur demande en electricite de 0.12%

a court terme. L’electricite et le gaz naturel sont donc deux biens complementaires.

L’elasticite prix croisee de court terme du mazout est de -0.323 et significative a 1%,

tandis que celle de long terme est de -0.84, et egalement significative. Ainsi, si le prix

du mazout augmente de 1%, les cohortes baisseront leur consommation en electricite

d’environ 0.32% a court terme et a long terme, elles la baisseront d’environ 0.8%.

L’elasticite revenu de court terme est 0.076 et celle de long terme est de 0.198, toutes

les deux n’etant pas significatives.

Dans la litterature, il existe plusieurs valeurs estimees des elasticites de la demande

d’electricite. Dahl (1993) a fait une synthese des valeurs des elasticites obtenues dans

le passe ; elle est arrivee a la conclusion selon laquelle les valeurs obtenues sont tres

variables d’une etude a l’autre, d’une base de donnees a l’autre. D’autres auteurs plus

recents ont aussi abouti a la meme conclusion : Poyer et Williams (1993), Hsing (1994),

Maddala et al. (1997), Poyer et al. (1997), Silk et Joutz (1997),...


Par exemple, Hsing (1994) a utilise un modele qui corrige pour l’heteroscedasticite

et la correlation dans le but d’etudier la demande d’energie de cinq etats au sud des

Etats-Unis d’Ameriques sur la periode 1981-1990. Il aboutit a une valeur estimee du

parametre de la dependante retardee de 0.561, avec des elasticites revenu, prix directe

et prix croisee de 0.397, -0.239 et 0.143 respectivement. Garcia-Cerrutti (2000) a estime

la demande d’energie (electricite et gaz naturel) de 44 regions de la Californie pour la

periode 1983 a 1997. Il utilise la methode des moindres carres generalises qui corrige

l’heteroscedasticite et l’autocorrelation. Il compare ensuite ses resultats a ce qu’il ob-

tiendrait s’il utilisait l’approche iterative de Swamy. Pour ces deux modeles (le modele

de Swamy (1974) et son modele) il obtient respectivement 0.116 et 0.148 pour l’elasticite

revenu, -0.132 et -0.172 pour l’elasticite prix directe, -0.044 et -0.096 pour l’elasticite

prix croisee de la demande d’electricite de court terme. Pour le gaz naturel, il obtient

une elasticite revenu negative et non significative (-0.235). Comme on peut le constater,

il existe plusieurs valeurs estimees des differentes elasticites.

Tab. 4.7 – Elasticites des modeles dynamiques

dynamique simple heterosc. et AR(1)

elasticite prix electriciteCT -0.4530 -0.506

E-T (0.1423) (0.061)

elasticite prix electriciteLT -0.9380 -1.318

E-T (0.793) (0.529)

elasticite prix gaz naturelCT 0.1108 0.118

E-T (0.0574) (0.025)

elasticite prix gaz naturelLT 0.2294 0.306

E-T (0.2584) (0.507)

elasticite prix mazoutCT -0.2459 -0.323

E-T (0.1699) (0.084)

elasticite prix mazoutLT -0.5091 -0.842

E-T (1.088) (0.389)

elasticite revenuCT 0.1270 0.076

E-T (0.0809) (0.054)

elasticite revenuLT 0.2630 0.198

E-T (0.179) (0.158)

4.5 Conclusion

Comme les resultats des modeles statiques et dynamiques nous le demontrent, il

est important de verifier si les erreurs du modele sont homoscedastiques ou non, s’il y


a de l’autocorrelation ou non, lorsqu’on estime un modele avec des effets individuels.

Nous avons utilise le test de Hausman (1978) pour confirmer la presence d’effets fixes

et nous avons utilise des tests du ratio de vraisemblance pour tester l’hypothese d’ho-

moscedasticite et de correlation serielle. La plupart des elasticites prix et revenu de

la demande de court et de long termes sont significatives aux seuil usuel de signifi-

cativite. Ces elasticites sont souvent sous-estimes sous l’hypothese d’homoscedasticite

(hypothese la plus couramment utilisee). On peut egalement noter que les cohortes

s’ajustent de facon plus importante a long terme qu’a court terme lorsqu’il y a des

variations de prix et/ou de revenu. Cela s’explique aisement par le fait que les chan-

gements de court terme sont limites puisqu’il est question de biens durables souvent

acquis pour une longue periode.

Nous avons suppose tout au long de ce travail l’hypothese d’heterogeneite qui se ma-

nifeste uniquement a travers la constante du modele : nous avons suppose un modele

ou seules la constante change d’une cohorte a l’autre. Or, rien ne nous dit que cette

heterogeneite se limite a la constante. Puisqu’il s’agit de cohortes et non de menages

individuels, il est fort probable que les coefficients de pente (de meme que la constante)

changent d’une cohorte a l’autre. Supposer que les coefficients de pente sont identiques

pour toutes les cohortes serait une hypothese assez forte. Par exemple, supposer qu’un

menage (ou sa cohorte) qui est a Montreal a le meme comportement de consommation

qu’un menage (ou sa cohorte) qui reste dans une zone rurale serait une hypothese refu-

table. Dans le prochain chapitre, nous tenterons de prendre en compte l’heterogeneite

entre des groupes de cohortes.

Bibliographie

[1] Alessie R., Devereux M. P. et Weber G. (1997) : «Intertemporal Consumption, Du-

rables and Liquidity Constraints : a Cohort Analysis», European Economic Review,

Vol. 41, pp.27-59.



[3] Baltagi B. H. (1995) : Econometric Analysis of Panel Data, Wiley and Sons.


[5] Baltagi B. H. (2005) : Econometric Analysis of Panel Data, Third Ed., Wiley and

Sons.

[6] Beaudry P. and Green D. (2000) : «Cohort Patterns in Canadian Earnings : As-

sessing the Role of Skill Premia in Inequality Trends», Canadian Journal of Eco-

nomics, Vol.33, No.4

[7] Biron, E. (1981) : «Estimating Economic Relations from Incomplete Cross-

Section/Time-Series Data», Journal of Econometrics, Vol. 16, p.221-236.

[8] Biron, E. and Jansen, E. S. (1983) : «Individual Effects in a System of Demand

Functions», Scandinavian Journal of Economics, Vol. 85, p.461-483.

[9] Blundell R., Browing M et Meghir C. (1985) : «Consumer Demand and the Life-

Cycle Allocation of Household Expenditures», The Review of Economic Studies,

Vol. 61 No. 1, pp 57-80.

[10] Blundell R. et Meghir C. H. (1990) : «Panel Data and Life-Cycle Models», Contri-

butions to Econometrics, Vol. 192, pp. 231-252.



No.3 pp503-544

[12] Collado D. M. (1997) : «Estimating dynamic Models from Time Series of Inde-

pendent Cross-Sections», Journal of Econometrics, Vol,82, pp37-62

[13] Dahl, C. (1993) : «A Survey of Energy Demand Elasticities in Support of the

Development of the NEMS», Workin Paper prepared for United States Department

of Energy, Colorado School of Mines, Department of Mineral Economics.

Bibliographie 147

[14] Dargay, J. (2002) : «Determinants of Cars Ownership in Rural and Urban Areas :

a Pseudo-panel Analysis», Transportation Tresearch Part E, 38, pp. 351-366.

[15] Dargay, J. and Vythoulkas, C. (1998) : «Estimation of Dynamic Transport De-

mand Models Using Pseudo-panel Data», ESCR Transport Studies Unit Centre

for Transport Studies, University College London.

[16] Dargay J. M. et Vythoulkas P. C. (1999) : «Estimation of a dynamique car ow-

nership model : a pseudo panel approach», Journal of Transport Economics and

Policy, 33, pp. 283-302.

[17] Dargay J. M. (2002) : «Determinants of Car Ownership in Rural and Urban Areas :

a Pseudo-Panel Analysis», Tansportation Research E, 38(5), pp. 351-366.

[18] Dargay J. M. et Vythoulkas P. C. (1997) : «Estimation of a dynamique car owner-

ship model : a pseudo panel approach», ESCR Transport Studies Unit, Ref. 97/47,

University College London

[19] Deaton Angus (1985) : «Panel Data from Time Series of Cross-sections», Journal


[20] Garcia-Cerruti, Miguel L. (2000) : Estimating Elasticities of Residential Energy

Demand from Panel County Data using Dynamic Random Variables Models with

Heteroskedastic and Autocorrelated Error Terms, Resource and Energy Economics,

Vol. 22, pp. 355-366.

[21] Gardes F., Langlois S. et Richaudeau D. (1996) : «Cross-Section versus Times-

Series Income Elasticities of Canadian Consumption», Economics letters, Vol.51,

pp169-175.

[22] Gardes F. et Loisy C. (1997) : «La Pauvrete selon les Menages : une Evaluation

Subjective et Indexee sur leur Revenu», Economie et Statistique, No.308-309-310,

pp95-113.

[23] Garcia-Cerruti, M. L. (2000) : «Estimating Elasticities of Residential energy De-

mand from Panel County Data Using Random Variables Models with Heteros-

cedasticity and Correlation Error Term», Resource and Energy Economy, Vol.22,

pp.355-366

[24] Gassner K. (1998) : «An estimaion of UK Telephone Access Demand Using Pseudo-

Panel Data», Utilities Policy, Vol.7, pp 143-154.

[25] Girma S. (2000) : «A Quasi-Differencing Approach to dynamique Modeling from

a Time Series of Independent Cross-Sections», Journal of Econometrics, Vol.98,

pp365-383.

[26] Greene, W. (2003) : Econometrics Analysis, Fith Ed., Prince Hall, Upper Saddle

River, New Jersey.


Vol.46 No.6, p.1251-1271.

Bibliographie 148



365.

[29] Hsing, Y. (1994) : «Estimation of Residential Demand for Electricity with the

Cross-Sectionally Correlated and Timewise Autoregressive Model», Resource and

Energy Economics, Vol. 16, p.255-263

[30] Levin, A., C. F. Lin and C. Chu (2002) : «Unit Root Test in Panel Data : Asymp-

totic and Finite Sample Properties», Journal of Econometrics, Vol. 108, p.1-25.

[31] Maddala, G. S., Trost, R. P. Li, H., and Joutz, F. (1994) : «Estimation of Short-

Run and Long-Run Elasticities of Energy Demand from Panel using Shrinkage

Estimators», Journal of Business and Economic Statistics, Vol. 15, p.90-100.

[32] McKenzie D. J. (2001) : «Dynamic Pseudo-Panel Theory and Analysis of Consump-

tion in Taiwan and Mexico», Ph.D Disservation, Yale University

[33] McKenzie D. J. (2004) : «Asymptotic Theory for heterogeneous dynamique

Pseudo-Panels», Journal of Econometrics, Vol.120, pp.235-262.



[35] Nijman T. et Verbeek M. (1990) : «Estimation of Time-dependent Parameters in

Linear Models using Cross-Sections, Panels, or Both», Journal of Econometrics,

Vol.46, pp333-346.

[36] Oberhofer, W. and J. Kmenta (1974) : «A General Procedure for Obtaining

Maximum Likelihood Estimates in Generalized Regression Models», Econometrica,

Vol.42, p.579-590.

[37] Phillips, P. C. B. and Moon, H. (1999) : «Linear Regression Limit Theory for

Nonstationary Panel Data», Econometrica, Vol. 57, p. 1057-1111.

[38] Poyer, D. A. and Williams, M. (1993) : «Residential Energy Demand : Additional

Empirical Evidence by Minority Household type», Energy Economics, Vol. 15,

p.93-100.

[39] Silk, J. I. and Joutz, F. L. (1997) : «Short- and Long-Run Elasticities in US Resi-

dential Elestricity Demand : a Co-Integration Approach», Energy Economics, Vol.

19, p. 493-513.

[40] Skoufias, E. and A. Suryahadi (2002) : «A Cohort Cnalysis of Wages in Indonesia»,

Applied Economics, Vol. 34, No. 13, pp. 1703-1710.

[41] Swamy, P. A. V. B. (1974) : Linear Models with Random Coefficients, In Zarembka,

P. (ed), Frontiers in Econometrics. Academic Press, London, p. 143-168.

[42] Raj B. et Baltagi B. H. (1992) : «Can Cohort Data Be Treated as Genuine Panel

data ?», Studies in Empirical Economics, Vol. 17, No. 1, pp. 9-23

Bibliographie 149

[43] Verbeek M. et T. Nijman (1993) : «Minimum MSE Estimation of a Regression

Model with Fixed Effects frm a Series of Cross-Sections», Journal od Econometrics,

Vol.59, pp125-136.

[44] Verbeek M. et T. Nijman (1993) : «Can Cohort Data Be Treated As Genuine Panel

data ?», Empirical Economics, Vol. 17, pp. 9-23.

[45] Verbeek M. et Vella F. (2005) : Estimating dynamique Models from Repeated

Cross-Sections», Journal of Econometrics, Vol.127, pp.83-102

Chapitre 5

Estimation bayesienne de modeles a

parametres aleatoires

5.1 Introduction

L’objectif principal de ce travail est d’estimer des modeles de demande d’electricite

a parametres heterogenes a partir de donnees d’enquetes d’independantes. Nous ana-

lyserons plus precisement l’aspect dynamique dans la consommation d’electricite des

menages de la province de Quebec. Pour cette province il n’y a pas de panel permettant

de capter l’aspect dynamique dans le comportement des individus. L’alternative que

nous utilisons est de constituer un pseudo-panel compose de cohortes. Les individus

qui composent une cohorte sont supposes etre assez homogenes. Par ailleurs, dans la

definition des cohorte, on suppose une certaine heterogeneite entre des individus de

cohortes differentes. Il serait donc important que le modele tienne compte formellement

de l’heterogeneite qui existerait entre les cohortes.

Dans la litterature, les modeles qui sont habituellement utilises dans le context des

pseudo-panels sont des modeles a effets fixes. Dans ces modeles, l’heterogeneite est

uniquement prise en compte a travers la constante du modele. Hors, l’heterogeneite

peut aussi se manifester a travers les coefficients de pente, qui sont les coefficients

d’interet. McKenzie (2001 et 2004) a utilise l’hypothese d’heterogeneite deterministe

entre les cohortes et les parametres ont ete estimes selon les methodes classiques. Dans

ce papier, nous proposons plutot de l’heterogeneite aleatoire qui permet une certaine

flexibilite dans le modele. Notre approche est assez proche de celle de Maddala et al.

(1997) qui ont plutot utilise de vraies donnees de panel. Nous developpons a la fois des

Chapitre 5. Estimation bayesienne de modeles a parametres aleatoires 151

modeles statique et dynamique avec parametres heterogenes. Nous proposons d’utiliser

les techniques d’estimation bayesienne qui consistent a combiner l’echantillonnage de

Gibbs et l’augmentation des donnees. L’echantillonnage de Gibbs servira a estimer les

parametres tandis que l’algorithme de l’augmentation des donnees sera utilise dans

le modele dynamique pour completer les donnees manquantes qui sont : la variable

dependante retardee et la premiere observation. Ces deux variables sont habituellement

instrumentees dans le contexte de vrais panels pour avoir des estimateurs convergents.

Nous estimons aussi des modeles statique et dynamique avec parametres homogenes

pour fin de comparaison.

Il est ressorti de nos resultats que la prise en compte de l’heterogeneite entre les

cohortes donnent de meilleures estimations. Nous avons estime des elasticites prix et

revenu de la demande specifiques a chaque region de la province de Quebec. Lorsque

l’heterogeneite n’est pas consideree, cela conduit a une sous-estimation des valeurs des

elasticites. De plus, le modele dynamique avec parametres homogenes surevalue l’ajus-

tement de long terme des cohortes par rapport au modele avec heterogeneite. L’ap-

proche proposee est novatrice dans le domaine des pseudo-panels en ce sens qu’elle

est la premiere qui suggere d’utiliser les techniques de simulation pour resoudre des

problemes importants dans l’analyse de la demande d’energie ou d’electricite en parti-

culier. Cette demarche pourrait aussi s’appliquer a tout autre domaine ou des problemes

similaires se posent.

La section (5.2) presente un resume des ecrits anterieurs portant sur le sujet, la

section (5.3) elabore le modele de demande a parametres homogenes (modele habituel-

lement considere), la section (5.4) presente le modele de demande statique, la section

(5.5) presente le modele de demande dynamique d’electricite, la section (5.6) analyse

les elasticites prix et revenu de la demande et nous concluons a la section (5.7).

5.2 Revue des ecrits anterieurs

Dans l’analyse des donnees de panel ou de pseudo-panel, il est habituel d’estimer

les modeles en supposant que les coefficients sont les memes pour toutes les observa-

tions. On empile alors les donnees (peu importe s’il existe ou non des groupes dans

les donnees) pour estimer les parametres communs a tous. L’heterogeneite intervient

souvent a travers les effets fixes ou aleatoires (ou les erreurs composees). Avec les effets

fixes individuels, on permet a chaque observation ou cohorte d’avoir une constante qui

lui est specifique. Quant aux coefficients de pente, on suppose habituellement qu’ils sont

communs a tous. L’hypothese d’homogeneite des coefficients de pente est souvent une


hypothese trop forte. Pour le cas des pseudo-panels qui nous concerne, les unites qui

font l’objet d’etude sont les cohortes qui sont en fait des groupes d’individus supposes

assez homogenes entre eux et ayant un certain nombre de caracteristiques en commun.

De plus, on suppose implicitement que les menages de cohortes differentes sont suffi-

samment heterogenes. En regroupant les individus en differentes cohortes, l’hypothese

d’homogeneite entre cohortes devient alors une hypothese trop forte. Par exemple, il

semble logique de penser que les menages qui sont dans la meme region et qui ont

sensiblement la meme taille de maison (petite, moyenne ou grande superficie) ont des

comportements de consommation d’electricite assez proches (exemple, les menages qui

vivent a Montreal, ou ceux qui vivent dans la region de Quebec ont chacun des ca-

racteristiques specifiques).

Il est donc raisonnable de supposer qu’il existe une certaine forme d’heterogeneite

entre les cohortes. Dans le contexte des pseudo-panels, seul Mckenzie (2001, 2004)

a introduit l’hypothese d’heterogeneite entre les cohortes. Il a suppose en effet de

l’heterogeneite deterministe entre les cohortes : les parametres du modele sont specifiques

a chaque cohorte et ils sont estimes selon les methodes classiques habituelles : moindres

carres ordinaires (MCO), moindres carres quasi-generalises (MCQG), methode a va-

riables instrumentales,... Il propose d’utiliser le test de Wald pour tester l’hypothese

nulle d’homogeneite entre les cohortes. Dans son application empirique portant sur la

consommation en Taiwan et au Mexique, il est ressorti que les cohortes de jeunes avaient

une croissance de la consommation plus forte que les cohortes de vieux au cours de la

periode 1976-1996.

Il existe dans les ecrits anterieurs portant sur les vrais panels d’autres formes

d’heterogeneite : l’heterogeneite entre les individus (ou modele a parametres aleatoires)

et l’heterogeneite entre les periodes. Dans ce travail, nous nous limitons a l’heterogeneite

entre les observations (cohortes plus precisement). Cette forme d’heterogeneite a ete

particulierement utilisee dans le contexte de vrais panels (par exemple, Maddala et

al. 1997). Robertson et Symons (1992) et Pesaran et Smith (1995) ont discute des

biais potentiels qui pourraient exister dans l’estimation des elasticites de long terme

si l’heterogeneite est ignoree. Lorsqu’on suppose une forme d’heterogeneite aleatoire,

cela revient a supposer que les parametres proviennent d’une distribution commune.

Generalement, on s’interesse a l’estimation de la moyenne (commune) de cette distribu-

tion. En utilisant les modeles a parametres aleatoires, cela permet de reduire le nombre

de parametres a estimer en supposant que les coefficients sont tires d’une meme distri-

bution qui est fonction de ses premiers moments (moyenne et variance). Les modeles a

parametres aleatoires peuvent etre estimes soit par une approche classique (estimation

par le maximum de vraisemblance, les moindres carres generalises,...) ou soit selon une

approche bayesienne (approche iterative ou approche basee sur la simulation).


Maddala et al. (1997), dans le contexte de vrais panels, ont propose une approche

bayesienne permettant d’estimer les parametres aleatoires. Leur approche est inspiree

de celle de Smith (1973). Ils estiment les parametres conjointement et de facon iterative.

Ils utilisent cette approche pour estimer les elasticites de court et de long terme de la

demande d’electricite de 49 etats des Etats-Unis. Ils comparent leurs estimateurs a l’es-

timateur obtenu par la regle de Stein, a l’estimateur de l’approche empirique de Bayes et

a celui du maximum de vraisemblance. L’estimateur propose selon la methode iterative

serait superieur aux autres estimateurs surtout en presence de variables endogenes re-

tardees dans le modele.

Supposons que le modele a parametres aleatoires est defini comme suit :

yn = Xnβn + εn (5.1)

βn ∼ N (µ, Σ) (5.2)

=⇒ βn = µ + un

un ∼ N (0, Σ)

εn ∼ N(0, σ2

n

).

Le modele (5.1) peut encore s’ecrire :

yn = Xnµ + vn

vn ∼ N (0, Ψn)

Ψn = XnΣX ′n + σ2

nI.

En supposant que les εn sont independants, l’estimateur des MCG de µ est :

µ =

[N∑

n=1

X ′nΨ−1

n Xn

]−1( N∑

n=1

X ′nΨ−1

n yn

).

Comme les parametres Σ et σ2n sont souvent inconnus, Swamy (1970) a propose une

procedure en deux etapes qui utilise les estimateurs βnMCO ainsi que les εn, les residus

des MCO pour obtenir des estimateurs sans biais de Σ et σ2n. Les estimateurs proposes

par Swamy (1970) sont :

Σ =1

N − 1

N∑

n=1

(βnMCO − 1

N

N∑

n=1

βnMCO

)(βnMCO − 1

N

N∑

n=1

βnMCO

)′

− 1

N

∑

n

(X ′nXn)

−1σ2

n

σ2n =

ε′nεn

T − K.

Cette procedure donne des estimateurs asymptotiquement efficaces seulement si le vec-

teur Xn ne contient pas de variable endogene retardee. Lee et Griffiths (1978) ont derive


le meilleur estimateur lineaire (statique) sans biais de βn base sur l’approche de la vrai-

semblance a priori evoquee prealablement par Edwards (1969). Leurs estimateurs sont

tres proches de ceux de Maddala et al. (1997). Ces derniers auteurs ont en effet postule

une loi a posteriori normale pour βn. Si µ, Σ et σ2n sont connus, la loi a posteriori de βn

sera aussi une normale compte tenu de l’equation (5.2) :

βn =

[1

σ2n

X ′nXn + Σ−1

]−1(1

σ2n

X ′nXnβnMCO + Σ−1µ

)

V(βn

)=

[1

σ2n

X ′nXn + Σ−1

]−1

.

En presence de variables endogenes retardees, la normalite de la loi a posteriori tient

uniquement en asymptotique et sous les conditions de regularite imposees dans les

modeles de regression dynamiques. Ils supposent une loi a priori non informative pour

µ de sorte que la moyenne de sa loi a posteriori serait : µ = 1N

∑n βn. Comme les

parametres de nuisance Σ et σ2n sont souvent inconnus, Smith (1973) a suppose une loi

Wishart pour Σ−1 et des lois χ2 inverse independantes pour les σ2n. Les estimateurs des

parametres de nuisance sont finalement :

σ2n =

(yn − Xnβn

)′ (yn − Xnβn

)

T + 2

Σ =1

N − K − 1

[R +

∑

n

(βn − µ

)(βn − µ

)′]

,

ou R est une matrice diagonale de petites valeurs positives (exemple : 0.001).

Nous proposons dans ce chapitre une methode bayesienne d’estimation similaire a

celle de Maddala et al. (1997). A la difference de ces derniers, nous proposons d’utili-

ser l’algorithme de l’echantillonnage de Gibbs pour estimer les parametres aleatoires.

L’echantillonnage de Gibbs est une methode d’estimation bayesienne. La methodologie

bayesienne est essentiellement fondee sur le theoreme de Bayes qui relie l’information

a priori (information disponible avant que les donnees ne soient observees), la nouvelle

information et la distribution a posteriori. Supposons un modele lineaire :

Y = Xβ + ε

ε ∼ N (0, Σ) .

Posons θ = (β, Σ) le vecteur des parametres du modele. Si on veut estimer le vecteur

de parametres θ de facon conjointe, on peut se servir de la relation suivante :

f (θ,X, Y ) = f (θ |X,Y ) g (X,Y ) (5.3)

= g (X,Y |θ ) f (θ) . (5.4)


En divisant (5.3) et (5.4) par g (X,Y ), on obtient la distribution a posteriori qui est la

distribution d’interet :

f (θ |X,Y ) =g (X,Y |θ ) f (θ)

g (X,Y )

f (θ |X,Y ) : distribution a posteriori des parametres d’interet ;

g (X,Y |θ ) = L (θ |X,Y ) : fonction de vraisemblance des donnees

f (θ) : distribution a priori des parametres d’interet

g (X,Y ) : constante de proportionnalite.

On peut alors reecrire la derniere equation comme suit :

f (θ |X,Y ) ∝ L (θ |X,Y ) × f (θ)

L’echantillonnage de Gibbs utilise cette relation pour estimer les parametres d’interet.

C’est la technique MCMC (Markov Chain Monte Carlo) la plus simple. Sa popularite

date de l’application faite par German et German (1984) de la distribution de Gibbs

pour modeliser les images satellites. Gelfand (2000) definit l’echantillonnage de Gibbs

comme un outils pour obtenir des echantillons a partir de fonctions de densite jointes non

standard. Ces echantillons proviennent en fait de distributions conditionnelles associees

a la densite jointe. Rappelons que les MCMC sont un ensemble de techniques pour

faire des tirages pseudo aleatoires a partir de distributions de probabilite. L’objectif du

MCMC est de generer une ou plusieurs valeurs d’une variable aleatoire Z habituellement

multidimensionnelle. Il s’agit de faire de la simulation Monte Carlo sur une chaıne

markovienne ergodique. (Voir Gordon et Belanger, 2003 pour un survol sur ce sujet).

Nous utiliserons la technique d’echantillonnage de Gibbs pour estimer dans un pre-

mier temps un modele statique de demande d’electricite. Nous supposerons d’abord un

modele ou les parametres sont homogenes et ensuite nous supposerons de l’heterogeneite

entre les cohortes : les cohortes sont reparties en neuf (9) groupes heterogenes, mais

au sein de chaque groupe, nous supposons que les menages sont homogenes. Ces 9

groupes sont en fait les 9 regions administratives de la province de Quebec qui sont :

Manicouanga (1), Saint Laurent (2), Richelieu (3), Montmorency (4), Les Laurentides

(5), La Mauricie (6), La Grande (7), Matapedia (8) et enfin Saguenay (9). Dans un

second temps, nous etendrons la meme approche au modele dynamique de demande

d’electricite. Dans le modele dynamique, la variable dependante retardee de meme que

la premiere observation seront considerees comme des donnees manquantes que nous

simulerons en nous servant de l’algorithme de l’augmentation des donnees propose par

Tanner et Wong (1987). L’approche developpee ici est la premiere dans le contexte de

pseudo-panels, nous n’avons pas pu trouve dans les travaux anterieurs une demarche

semblable, qui pourtant pourrait etre d’une tres grande utilite dans un contexte de

coupes transversales independantes.


5.3 Modele statique a parametres aleatoires homogenes

Supposons que l’equation de demande au niveau du menage n a la periode t est

definie de la facon suivante :

ynt = Xntβ + θnt + εnt (5.5)

εnt ∼ N(0, σ2

ε

)

θnt ∼ N(0, σ2

θ

).

Notons l’inverse de la variance σ−2ε = h. Etant donne que nous ne disposons pas d’infor-

mation au niveau des menages pour chacune des periodes considerees, nous optons de

considerer des cohortes de menages definies au sens de Deaton (1985) dont nous pouvons

suivre l’evolution dans le temps. Pour construire les cohortes, nous devons regrouper les

menages suivant des criteres bien etablis. Nous avons choisi comme criteres la superficie

et la region d’habitation. La variable superficie de l’habitat est regroupee en 3 blocs : les

petites maisons (moins de 1000 pieds carres) les maisons moyennes (entre 1000 et 2000

pieds carres) et les grandes maisons (plus de 2000 pieds carres). En ce qui concerne la

variable region, nous avons garde le decoupage d’Hydro-Quebec qui consiste a diviser

toute la province de Quebec en 9 regions administratives. Nous supposons que durant

toute la periode consideree (1989 a 2002), les menages ont garde le meme systeme de

chauffage ; par consequent, nous supposons aussi que la superficie habitee et chauffee n’a

pas change, ou du moins si le menage a demenage, il choisira une maison qui a le meme

systeme de chauffage. Comme les enquetes sont menees dans la meme province d’une

periode a l’autre, nous estimons que meme si les individus demenagent, cela n’affecte

pas les maisons, les nouveaux occupants continueront d’utiliser les memes systemes de

chauffage. Nous considerons en quelque sorte un continuum de menages. Considerons

la version moyennes de cohortes du modele (5.5) :

yct = Xctβ + θct + εct, (5.6)

avec θct des effets individuels. La version population de cohortes est definie par :

y∗ct = X∗

ctβ + θ∗ct + εct. (5.7)

L’etoile indique que la variable n’est pas observable, puisqu’on ignore la moyenne de la

population entiere de cohortes. Les variables yct et Xct representent les moyennes de la

population (y∗ct et X∗

ct respectivement) mais avec erreurs de mesure. Nous supposons

que le nombre d’individus par cohorte est suffisamment grand de sorte que l’on peut

ignorer les erreurs de mesure.


Ecrivons le modele sous forme matricielle de maniere a le simplifier :

y =

y1

y2...

yC

X =

X1

X2

...

XC

ε =

ε1

ε2

...

εC

y = Xβ + θ + ε

ou chaque zc contient T observations et chaque z contient CT observations1. L’esti-

mation des parametres se fera avec l’algorithme de l’echantillonnage de Gibbs. Soit :

θ = (θ1, θ2, ........θJ) ou θj est un element ou un sous ensemble de θ. Si le modele est assez

complexe, la distribution marginale f (θ) = f (θ1, θ2, ........θJ) ne sera pas standard. Par

exemple, si on s’interesse a la densite marginale du premier element, on doit integrer

la densite conjointe par rapport aux autres elements de sorte a obtenir la fonction a

integrales multiples suivante :

f (θ1) =

∞∫

−∞

∞∫

−∞

.......

∞∫

−∞

f (θ1, θ2, θ3........θl) dθ2dθ3dθ4......dθl.

La presence d’integrales multiples posent de serieux problemes si on veut calculer cer-

tains moments (moyenne ou variance). Cependant, la densite conditionnelle f (θ1 |θ−1 )

est souvent facile a calculer (ou θ−1 = (θ2, ........θJ) represente les elements autres que

celui qui nous interesse, θ1). Dans le but d’eviter des calculer onereux en temps, Ger-

man et German (1984) ont propose la technique d’echantillonnage de Gibbs basee sur

la theorie des chaınes markoviennes.

Supposons une distribution conjointe P (θ) = P (θ1, θ2, ........θJ) et les distributions

conditionnelles suivantes :

θ1 ∼ P (θ1 |θ2, ........θJ )

θ2 ∼ P (θ2 |θ1, θ3........θJ )...

θJ ∼ P (θJ |θ1, θ2........θJ−1 ) .

Supposons que ces distributions conditionnelles sont plus simples et plus faciles a cal-

culer ; de plus supposons qu’il est possible de simuler des tirages artificiels de θj ∼P (θj |θ−j ) . Alors, l’algorithme de l’echantillonnage de Gibbs est defini selon les 3

etapes suivantes :

1y est de dimension (CT × 1), X est de dimension (CT × K), ε est de dimension (CT × 1), β est

de dimension (K × 1) et θ est de dimension (CT × 1).


– Etape 1 : Donner des valeurs de depart aux parametres : θ01, θ

02, ........θ

0J et poser

i = 1.

– Etape 2 : Effectuer les tirages conditionnels suivants :

θi1 ∼ P

(θ1

∣∣θi−12 , ........θi−1

J

)

θi2 ∼ P

(θ2

∣∣θi1, θ

i−13 ........θi−1

J

)(5.8)

...

θiJ ∼ P

(θJ

∣∣θi1, θ

i2........θ

iJ−1

).

– Etape 3 : Poser i = i + 1 et retourner a l’etape i.

L’ensemble constitue un tour et un element dans (5.8) constitue une iteration. No-

tons que cet algorithme decrit une chaıne markovienne du premier ordre parce que la

distribution conditionnelle d’un tirage depend de la realisation precedente. De plus,

si la densite P (θj |θ−j ) est positive pour toutes les valeurs possibles de θj, on dira

alors que la chaıne est ergodique. Dans ce cas, la sequence converge vers sa distri-

bution stable P (θ) pour toute valeur de depart θ0. De plus, comme nous l’avons

souligne anterieurement, si la sequence converge avant l’iteration n, alors la moyenne


i=n+1 g (θi) est un estimateur convergent simule de la moyenne a

posteriori de la population E [g (θ |.)].L’echantillonnage de Gibbs servira donc a simuler les parametres de nos modeles dans

un context de donnees manquantes.

5.3.1 Simulation de β

Si les croyances a priori sur β sont une normale P (β) = N (b0, B0), et si h = σ−2ε

est connu de meme que les donnees, alors sa distribution a posteriori sera aussi une

normale :

P(β∣∣y,X, h

)= N

(b, B

)

B = B0 + h × XX

b = B−1 [

b0B0 + h × Xy].


5.3.2 Simulation de h

Etant donne β, si la distribution a priori de h est une loi gamma : P (h) = G (a0, A0),

alors sa distribution a posteriori sera aussi une gamma :

P(h∣∣β, y,X

)= G (a1, A1)

a1 = a0 +CT

2A1 = A0 +

εε′

2avec : ε = y − Xβ.

5.3.3 Simulation de σ2θ

Etant donne les autres parametres du modele, si les croyances a priori sur σ−2θ sont

une gamma : P(σ−2

θ

)= G (c0, C0), alors sa distribution a posteriori serait aussi une

gamma :

P(σ−2

θ

∣∣y,X, h)

= G(c, C

)

C = C0 +

∑c θ2

c

2

c = c0 +CT

2.

5.3.4 Resultats et interpretation

Nous avons effectue 6000 tirages et nous avons enleve les 10% (soit les 600) premieres

valeurs simulees afin de permettre a l’algorithme de se defaire de l’influence des valeurs

de depart. Le tableau (5.1) presente la moyenne des 5400 tirages de chaque parametre et

son ecart-type. Dans ce modele, nous avons suppose que les parametres sont les memes

pour toutes les cohortes. Tous les estimes sont significatifs2 a 1%. L’effet individuel qui

traduit une heterogeneite non observable a une variance significative a 1%.

Nous avons aussi trace les graphiques (histogrammes et convergence) qui sont dans

l’annexe (5.8.2). Les graphiques qui presentent les valeurs estimees en fonction du

2Etant donne que les lois a posteriori des estimateurs des coefficients sont normales (les graphiques

de convergence indiquent que les estimes suivent une loi normale) et que les tirages sont faits de facon

independante les uns des autres, les conditions d’un test de Student (au sens classique) sont reunies.

Nous utilisons donc le test de Student pour juger de la significativite individuelle des estimes obtenus

selon l’approche par la simulation.


nombre de tirages indiquent que tous les estimateurs sont convergents. Nous nous ser-

virons de ces resultats pour effectuer une comparaison avec le modele a parametres

heterogenes de la section suivante.

Tous les coefficients estimes sont significatifs a 1% et ont le signe attendu. La variable

cdd (cooling degree days) pour la demande d’electricite n’a pas le meme signe que dans

les travaux de Maddala et al. (1997) de meme que ceux de Gracia-Cerrutti (2000). Ces

derniers avaient obtenu un signe positif signifiant que si cdd augmente, indiquant qu’il

fait plus chaud et donc les menages americains augmentent leur demande d’energie pour

fin de climatisation. Selon nos resultats, l’estime de la variable cdd est plutot de signe

negatif. Cela indique que si cdd augmente, donc il fait plus chaud, les menages quebecois

n’ont plus besoin de chauffer leur maison, et par consequent, la demande d’electricite

pour le chauffage va baisser. A Quebec, la penetration des systemes de climatisation est

un phenomene assez recent et de plus, tres peu de menages climatisent leur maison. On

s’attendait a ce que l’estime de la variable cdd ait un signe positif. Dans les resultats de

Maddala et al. (1997) et ceux de Gracia-Cerrutti (2000), la variable cdd avait cependant

un signe negatif pour la demande de gaz naturel. Une augmentation des degres jour

de climatisation entraınerait une baisse de la demande d’electricite. La variable hdd

(degres jours de chauffage) a le bon signe : plus il fait froid (hdd augmente), plus les

besoins de chauffage augmentent, plus la demande d’electricite augmente aussi.

Tab. 5.1 – Resultats du modele statique a parametres homogenes

Variables Moyenne ecart-type t-Student Min Max

pelec marg -3.165289 .1894613 16.703 -3.959758 -2.513447

revenu net 2.085332 .0974224 21.4096 1.747453 2.427006

hdd 1.346503 .26744 5.0348 .248548 2.234885

cdd -.7869049 .16167 4.8673 -1.339625 -.1509901

cst 22.81251 1.799671 12.6759 14.78075 28.42545

h 4.939011 .7124093 6.9328 2.68575 7.91684

sig2theta 1.871035 .5208126 3.5925 .7328739 5.674028

5.4 Modele statique a parametres heterogenes

Dans cette section, nous voulons estimer un modele a effets aleatoires en prenant en

compte l’heterogeneite entre les groupes de cohortes. Nous avons regroupe les cohortes

en 9 groupes distincts : puisque chaque cohorte se retrouve dans une des 9 regions

administratives du Quebec, nous les avons donc regroupees selon ces 9 regions. Nous

aurions voulu considerer plutot l’heterogeneite entre les unites de cohortes, mais la


dimension temporelle du pseudo-panel est tres petite (4 periodes), limitant davantage

le nombre de parametres a estimer par cohorte. En d’autres termes, puisqu’on a 25

cohortes sur 4 periodes, l’heterogeneite a travers les cohortes exigerait d’estimer 25

fois le nombre de parametres du modele, avec seulement 4 observations par cohorte

consideree. Cela poserait inevitablement un probleme de parametres d’incidence. Pour

cette raison, nous avons prefere estimer un modele a effets aleatoires avec heterogeneite

groupees selon les regions.

Le modele a effets aleatoires groupes selon les regions est defini comme suit :

ygt = Xgtβg + εgt (5.9)

g = 1, 2, ...G avec : G << C t = 1, 2, ...T εgt ∼ N(0, h−1g ).

Nous supposons que les coefficients sont specifiques a chaque region de la province.

5.4.1 Simulation de βg

Si la variance hg est connue, et si les croyances a priori sur βg sont une normale

P (βg) = N (b0g, B0g), alors la distribution a posteriori de βg sera aussi une normale :

P(βg

∣∣y,X, h)

= N(bg, Bg

)

Bg = B0g + hg × XgXg

bg = B−1

g

[b0gB0g + hg × Xgyg

].

Apres avoir estime βg le vecteur des coefficients specifiques au groupe g, nous calculons

la moyenne pour toute la province notee par : 1Gµ =

∑Gg=1 βg.

5.4.2 Simulation de hg

Etant donne les parametres βg et les donnees, si la distribution a priori de hg est une

inverse gamma : P (hg) = IG (a0g, A0g), alors la distribution a posteriori de hg serait

aussi une inverse gamma :

P(hg

∣∣y,X)

= IG (a1g, A1g)

a1g = a0g +CgT

2A1g = A0g +

εgε′g

2εgt = ygt − Xgtβg.


5.4.3 Resultats empiriques et interpretations

Le tableau (5.2) presente les resultats de l’estimation. Lorsqu’une variable se ter-

mine par un chiffre, cela signifie qu’il s’agit du coefficient specifique a une region donnee.

Les variables qui ne se terminent pas avec un chiffre representent les moyennes des va-

leurs estimees des parametres specifiques aux groupes de cohortes (ces valeurs estimees

sont dans le dernier bloc du tableau). Nous remarquons tout d’abord que la plupart

des coefficients de pente sont tres significatifs (au seuil de 1%) sauf ceux de la region6

(Mauricie). Les estimes du prix marginal et du revenu net ont le bon signe.

Une hausse du prix marginal de l’electricite entraıne une baisse de la demande d’electricite

des cohortes, l’amplitude de cette baisse varie cependant d’une region a l’autre. La

region6 a l’effet marginal (pelec marg) le plus bas en valeur absolue (-0.343) tandis que

la region2 a l’effet marginal le plus eleves en valeur absolue (-9.18). Mais en moyenne,

l’effet marginal du prix de l’electricite est de -3.56 pour toute la province. Cette valeur

est assez proche (neanmoins legerement superieure en valeur absolue) de celle du modele

empile ou a parametres homogenes (qui est -3.16).

Une hausse du revenu net des cohortes entraıne une augmentation de la demande

d’electricite. Cette augmentation est sensiblement la meme d’une region a l’autre (les

estimes du revenu net vont de 2.04 pour la region4 a 2.97 pour la region7). En moyenne,

l’effet marginal du revenu sur la demande d’electricite est de 2.47. Cette valeur est assez

proche (neanmoins legerement superieure) de celle du modele a parametres homogenes

(2.085).

Le signe de l’estime de la variable hdd est positif pour toutes les regions a l’exception

de celle de la region8 (Matapedia). L’effet marginal de hdd varie enormement d’une

region a l’autre : de 0.86 pour la region6 (Mauricie) a 66.82 pour la region2 (Saint

Laurent) et -0.45 pour la region8 (Matapedia). En moyenne, pour toute la province,

l’effet marginal de hdd est de 12.17. Cette valeur est nettement plus grande que celle

du modele a parametres homogenes qui est de 1.35.

Le signe de la variable cdd change d’une region a l’autre : de -13.98 pour la region8

(Matapedia) a 24.19 pour la region2 (St Laurent). En moyenne, pour la province, l’effet

marginal est de -2.16. Cette valeur est plus grande en valeur absolue que celle du modele

a parametres homogenes (-0.78).

En somme, le modele qui ne suppose pas l’heterogeneite entre les cohortes tend a sous-

estimer en general les valeurs estimees des coefficients.

Nous avons trace des graphiques pour connaıtre l’allure des valeurs estimees de meme

que leur convergence. Ces graphiques (de 5.7 a 5.15) sont presentes en annexe (5.8.2). Il

ressort que pour les 5400 tirages effectues et retenus, tous les parametres estimes sont

convergents. Toutes les valeurs tirees ont une distribution approximativement normale.


Tab. 5.2: Resultats du modele statique a parametres

aleatoires

Variables Moyenne Ecart-type t-Student Min Max

pelec marg1 -.8642672 .0214997 -40.1986 -.9482575 -.7826291

revenu net1 2.9627 .0089686 330.2898 2.925635 3.002838

hdd1 4.750125 .0260672 181.9971 4.650749 4.841973

cdd1 -22.65699 .1700166 -133.26 -23.3077 -22.04377

cst1 -9.167294 .2175722 -42.1291 -9.862601 -8.323303

pelec marg2 -9.185734 .0956011 -96.0847 -9.480932 -8.800672

revenu net2 2.510068 .0092572 269.8925 2.477339 2.541847

hdd2 66.81876 1.104012 148.9164 62.28748 70.44279

cdd2 24.19549 .4487 53.9238 22.38734 25.68117

cst2 -307.8905 5.67934 -54.2127 -326.6236 -284.4895

pelec marg3 -4.091616 .2723691 -15.0206 -5.02959 -3.114935

revenu net3 2.719563 .0700486 38.8514 2.481103 2.974701

hdd3 6.035679 .3691392 16.3507 4.459891 7.434901

cdd3 -1.669361 .4647404 -3.5924 -3.542754 -.1475001

cst3 6.176631 1.554138 3.9743 -.3545033 13.04043

pelec marg4 -2.23427 .0951919 -23.4695 -2.661975 -1.859941

revenu net4 2.042825 .0590032 34.6237 1.832794 2.251648

hdd4 5.738385 .343151 16.7227 4.554451 7.043915

cdd4 -4.693887 .3395806 -13.8218 -6.17069 -3.427003

cst4 2.782587 2.432901 1.1437 -6.640503 10.72125

pelec marg5 -5.974526 .1705893 -35.0205 -6.640073 -5.303625

revenu net5 2.053093 .0806284 25.4632 1.710571 2.37368

hdd5 7.609885 .3313862 22.9632 6.507118 8.8175

cdd5 1.993522 .2211105 9.0163 1.196688 2.723956

cst5 3.614408 1.527397 2.3664 -2.264388 8.997149

pelec marg6 -.3424912 .1779713 -1.9241 -.9422136 .3998406

revenu net6 2.08552 .1168845 17.8248 1.649317 2.501704

hdd6 7.809569 .457725 17.0515 6.110076 9.584657

cdd6 .6853828 .444335 1.5426 -.976067 2.531394

cst6 -27.09693 3.023183 -8.9630 -37.96975 -16.52878

pelec marg7 -1.971336 .1066243 -18.4233 -2.373545 -1.602479

revenu net7 2.974117 .0839918 35.4059 2.653901 3.281143

hdd7 5.877351 .3546131 16.5744 4.320054 7.128102

cdd7 -2.116276 .206181 -10.2633 -2.980656 -1.436925

cst7 -14.60774 2.242739 -6.5126 -22.65358 -6.134499



Tab. 5.2: Resultats du modele statique a parametres

aleatoires


pelec marg8 -2.600825 .0421039 -61.7577 -2.779636 -2.44366

revenu net8 2.130509 .0233122 91.4378 2.05178 2.205107

hdd8 -.452132 .1317455 -3.4328 -1.009248 .1087808

cdd8 -13.97846 .2367982 -59.0310 -14.93876 -13.15807

cst8 39.0665 1.038733 37.6143 34.61574 43.14957

pelec marg9 -4.759939 .1534593 -31.0230 -5.418258 -4.126169

revenu net9 2.797541 .1041405 26.8732 2.351736 3.144504

hdd9 5.322482 .6835877 7.7859 2.867464 7.829757

cdd9 -1.2126 .5466322 -2.2184 -3.418039 .5470991

cst9 5.764593 4.299163 1.3408 -9.558891 21.12454

Moyenne des moyennes

pelec marg -3.558335 .0482724 -73.6646 -3.73526 -3.356301

revenu net 2.475104 .0242518 102.2727 2.375677 2.550998

hdd 12.16779 .169713 71.7030 11.46009 12.81452

cdd -2.161464 .1220101 -17.7172 -2.699701 -1.731091

cst -33.48419 .9594234 -34.9157 -36.9938 -29.81465

Fin du tableau

5.5 Modele dynamique de demande d’electricite

Lorsqu’on analyse la demande d’energie des menages, il est important de prendre en

compte l’aspect dynamique puisque la demande d’energie necessite l’utilisation de biens

durables (systemes de chauffage de l’eau et de l’espace). Avec un modele dynamique,

nous pouvons mieux comprendre le comportement du menage sur une certaine periode.

L’estimation du modele dynamique se fera en deux etapes. Dans la premiere etape,

nous utilisons l’algorithme de l’augmentation des donnees pour simuler la dependante

retardee ainsi que la premiere observation manquante. Cette premiere etape est im-

portante car nous savons que meme dans le cas des modeles dynamiques avec de vrais

panels, la variable dependante retardee doit etre instrumentee pour que les estimateurs

soient convergents. A la deuxieme etape, nous estimons les parametres du modele en

suivant la meme approche que dans le modele statique. Le modele dynamique est defini

par :

ygt = αgygt−1 + Xgtβg + εgt. (5.10)


Comparativement au modele statique de la section precedente, dans ce modele, nous

avons inclus la variable dependante retardee. Pour estimer ce modele, nous devons

d’abord remplacer la dependante retardee par un bon instrument. Pour cela, nous utili-

serons l’algorithme de l’augmentation des donnees qui simulera les valeurs de la variable

ygt−1. Supposons que ygt−1 est fonction de variables qui varient dans le temps et de va-

riables invariantes dans le temps :

ygt−1 = agW gt−1 + Zgbg + εgt−1,

avec W gt−1 un vecteur de variables qui varient dans le temps et Zg un vecteur de

variables invariantes dans le temps incluant les effets specifiques aux cohortes. Si le

terme d’erreur suit une loi normale, alors ygt−1 suivra aussi une loi normale. Ainsi, il

est possible d’effectuer des tirages de ygt−1 a partir d’une loi normale :

si : εgt ∼ iidN(0, σ2

εg

)

=⇒ ygt−1 ∼ iidN[(

agW gt−1 + Zgbg

), σ2

εg

].

Quant a la premiere observation qui est une donnee manquante, nous la simulerons

egalement. Supposons que l’observation initiale depend d’un certain nombre de variables

invariantes dans le temps et est definie comme suit :

yg0 = Zgb∗g + εg0

=⇒ yg0 ∼ N[Zgb

∗g, σ

2εg

].

Apres avoir simule la variable dependante retardee ainsi que la premiere observation,

l’algorithme de l’echantillonnage de Gibbs est utilise pour estimer les parametres du

modele. L’estimation de βg se fera de la meme maniere que dans le modele statique

mais cette fois, nous ajouterons le parametre de la dependante retardee qui est αg.

L’estimation de hg se fera egalement comme dans le modele statique. La demarche

pour estimer les parametres etant la meme que celle du modele statique, nous ne la

repeterons plus a ce niveau. Signalons que nous n’avons pas inclus de constante pour

chaque groupe. Puisqu’il est question ici d’un modele dynamique, on peut ou non inclure

la constante si celle-ci s’avere pertinente. Nous avons estime le modele en incluant une

constante specifique a chaque groupe et il s’est avere que son inclusion deteriorait la

plupart des estimes du modele. Le modele sans constante s’averait meilleur que le

modele avec constante.

5.5.1 Resultats de l’estimation du modele dynamique

Comme dans le modele statique, nous avons estime le modele dynamique avec des

parametres homogenes dans le but de faire la comparaison avec le modele a parametres


heterogenes. Les resultats de l’estimation sont presentes dans le tableau (5.3). Tous les

coefficients sont significatifs aux seuils usuels. De plus, ils ont chacun le signe attendu.

Les resultats de l’estimation du modele avec heterogeneite sont presentes au tableau

(5.4). La plupart des coefficients ont le signe attendu. L’estime du parametre de la

consommation de la periode precedente devrait etre de signe positif. A l’exception de

ceux de la region6 et de la region7 (ils ne sont pas significatifs), les autres estimes sont

tous de signe positif. Les valeurs estimees varient d’une region a l’autre, allant de 0.15

(pour la region 9) a 0.68 (pour la region 5). Notons que pour les valeurs inferieures a

0.3 (en valeur absolue), les estimes ne sont pas significatifs (0.15 pour la region 9 et 0.22

pour la region 7, -0.19 pour la region 6 et -0.22 pour la region 7). En moyenne, l’effet

marginal de la consommation passee est de 0.32 et est significatif au seuil de 1%. Cette

valeur est a peu pres la moitie de celle du modele avec parametres homogenes (0.63).

Pour l’effet marginal du prix de l’electricite, on note que tous les estimes ont le bon

signe (negatif) et sont significatifs excepte celui de la region 6 (qui n’est pas significatif).

On note aussi que les valeurs estimees varient sensiblement d’une region a l’autre, allant

de -0.57 pour la region1 a -4.5 pour la region 9. En moyenne, l’effet marginal du prix

marginal de l’electricite est environ de -2.00 pour toute la province. Cette valeur est

plus grande en valeur absolue que celle du modele avec parametres homogenes (-1.36).

Les estimes de la variable revenu net ont le bon signe et sont significatifs aux usuels

sauf ceux de la region 4 , la region 5 et la region 6. Les valeurs qui sont statistiquement

significatives vont de 1.00 (region 2) a 3.5 (pour la region 7). En moyenne , dans la

province, l’effet marginal du revenu net est de 1.75 et est significatif a 1%. Cette valeur

est beaucoup plus grande que celle obtenu dans le modele a parametres homogenes.

Les estimes de la variable degres jour de chauffage (hdd) ont tous le signe positif, signe

attendu. Ils sont tous significatifs (a 5%) sauf celui de la region 6 qui l’est seulement

a 10%. Les valeurs estimees vont de 1.35 (pour la region 1) a 5.66 (pour la region 9).

Si les degres jours de chauffage augmentent, la demande d’electricite augmente aussi,

augmentation variant d’une region a l’autre. En moyenne, l’effet marginal de hdd est

de 3.75 pour toute la province. Cette valeur est beaucoup plus elevee que celle obtenue

dans le modele avec homogeneite (qui est de 1.12).

Les estimes de la variable degres jour de climatisation (cdd) varient enormement d’une

region a l’autre, soit de -26.05 pour la region 1 a 3.13 pour la region 5. En moyenne

dans la province, l’effet marginal de cdd est de -4.58. En moyenne, si les degres jours de

climatisation augmentent, la demande d’electricite baisse dans la plupart des regions.

Cette baisse vient du fait que les menages ont plus l’habitude de chauffer leur maison

que de les climatiser. Plus il fait chaud, moins on a besoin de chauffer la maison.

Comparativement aux resultats de Maddala et al. (1997), nous pouvons souligner que

la plupart des estimes ont les signes attendus (ce qui n’etait pas le cas pour les resultats

de Maddala et al.), de plus, la plupart sont significatifs aux seuils usuels. Nous pouvons


donc dire que le modele dynamique avec heterogeneite groupee represente assez bien les

donnees. De plus, nous pouvons noter que le modele a parametres homogenes (modele

empile) tend a sous-estimer les valeurs des estimees (en valeur absolue et a l’exemption

de l’estime de la consommation passee). Nous effectuons dans la section suivante une

analyse de sensibilite beaucoup plus precise.

Nous avons trace des graphiques pour verifier si les valeurs estimees sont conver-

gentes. Les graphiques (5.16 a 5.55) de l’annexe (5.8.2) montrent que tous les coefficients

estimes sont convergents et ont en general un histogramme en forme d’une loi normale.

Tab. 5.3 – Resultats du modele dynamique a parametres homogenes

Variables Moyenne ecart-type t-Student Min Max

cons anP .634935 .0745187 8.52044 .3887205 .9768851

pelec marg -1.363691 .3063907 -4.45082 -2.37125 -.0851546

revenu net .7311013 .1988775 3.6761 -.1890094 1.499027

hdd 1.1156 .3228509 3.4555 -.0152104 2.3408

cdd -.0386784 .2144884 -0.1802 -.71896 .7536452

cst 5.804642 2.910583 1.9943 -4.706696 15.68368

h 3.886542 .5855113 6.6379 2.241602 6.350213

sig2theta 4.563771 1.86918 2.4416 1.292306 31.01347

Tab. 5.4: Resultats du modele dynamique a parametres

aleatoires


cons anP1 .517814 .0773442 6.6951 .2431954 .8256719

pelec marg1 -.5698379 .269816 -2.1119 -1.364271 -.0047635

revenu net1 2.074719 .2157211 9.6184 1.193227 2.742003

hdd1 1.355358 .3769722 3.5968 -.168851 2.438571

cdd1 -26.05332 2.872829 -9.0675 -37.41143 -14.84921

cons anP2 .5504643 .1983863 2.7747 -.2235066 1.611054

pelec marg2 -2.443044 .722511 -3.3813 -4.606788 -.0005424

revenu net2 .9998094 .5592228 1.7879 -1.520581 2.997036

hdd2 3.590888 1.254639 2.8623 -2.405061 8.073588

cdd2 .4546423 .4976379 0.9136 -.9015738 3.112591

cons anP3 .4120871 .1360859 3.0279 -.2564157 .9446319

pelec marg3 -1.684074 .9560184 -1.7616 -6.379571 -.0054576

revenu net3 1.948476 .3227929 6.0325 .7230217 3.323908

hdd3 4.178384 1.017604 4.1045 .8933134 9.422189

cdd3 -3.555369 1.164877 -2.1561 -6.641167 1.312608




aleatoires


cons anP4 .5355461 .2236354 2.3949 -.3403449 1.429359

pelec marg4 -1.148883 .4891357 -2.3497 -3.110823 -.0074561

revenu net4 .8231053 .5390008 1.5271 -1.291398 2.847436

hdd4 3.348685 1.174226 2.8521 -1.139545 7.801832

cdd4 -2.806912 1.156823 -2.4291 -5.626341 2.511082

cons anP5 .6762941 .210533 3.2128 -.298628 1.660328

pelec marg5 -3.530369 .9321005 -3.7871 -7.108625 -.0485347

revenu net5 .447657 .5687525 0.7871 -2.169626 2.889652

hdd5 3.85586 1.456594 2.6474 -1.616587 10.0941

cdd5 3.129683 .7090963 4.4142 1.175993 6.419063

cons anP6 -.1901492 .6674757 -0.2848 -4.993971 3.045418

pelec marg6 -.9130979 .9984096 -0.9149 -12.62987 -.0002715

revenu net6 2.029616 1.630885 1.2444 -5.513525 13.06026

hdd6 4.747465 2.792149 1.7003 -7.275952 24.399

cdd6 -1.771557 1.634886 -1.0835 -13.54366 14.58572

cons anP7 -.2257151 .4275768 -0.5278 -3.0253 .8968959

pelec marg7 -2.412242 1.055874 -2.2843 -10.63322 -.0575934

revenu net7 3.59612 1.442717 2.4926 -.4390677 13.77392

hdd7 4.405299 1.489528 2.9586 .7892206 14.3657

cdd7 -3.362623 .8089361 -4.1565 -9.7223 .0164313

cons anP8 .4910895 .1954758 2.5120 -.7474549 1.257829

pelec marg8 -.7828563 .3227895 -2.4250 -2.29553 -.0006975

revenu net8 1.356919 .4348624 3.1195 -.2553755 4.071198

hdd8 2.599561 .719388 3.6141 -.0499376 6.956209

cdd8 -6.50051 1.246016 -5.267 -10.44973 -1.734685

cons anP9 .146972 .133826 1.0970 -.3264337 1.145255

pelec marg9 -4.499363 .3493064 -12.9840 -5.64748 -2.378198

revenu net9 2.514809 .2916827 8.6130 .5108625 3.679819

hdd9 5.660573 .53547 17.1027 1.459319 7.545402

cdd9 -.7820147 .3309281 -2.3625 -2.273902 .1642447

Moyenne des moyennes

cons anP .3238225 .1001232 3.240 -.2304264 .6235989

pelec marg -1.998196 .2401303 -8.2810 -3.089453 -1.191059

revenu net 1.754581 .2681055 6.5446 .9005185 2.938539

hdd 3.749119 .4454658 8.4247 2.345731 6.156491




aleatoires


cdd -4.583109 .4589998 -9.9847 -6.169567 -3.066297

Fin du tableau

5.6 Analyse de sensibilite : elasticites prix et revenu

de la demande

Dans cette section, nous analysons a la fois les elasticites prix et revenu du modele

statique et du modele dynamique. Le modele statique tend a representer l’etat station-

naire de l’economie de sorte que nous nous attendons a ce que les elasticites du modele

statique soient assez proches des elasticites de long terme du modele dynamique. Nous

avons aussi calcule les elasticites des modeles a parametres homogenes dans le but

de pouvoir effectuer des comparaisons. Ces comparaisons se justifient parce qu’on a

tendance souvent a ignorer l’hypothese d’heterogeneite dans beaucoup de travaux em-

piriques.

Pour le modele a parametres homogenes, les elasticites obtenues (voir tableau 5.5)

sont toutes statistiquement significatives aux seuils usuels et ont les signes attendus.

Les elasticites du modele statique sont assez proches des elasticites de long terme du

modele dynamique.

Interessons-nous maintenant aux elasticites du modele a parametres heterogenes. Le

tableau (5.6) presente les resultats. Les elasticites prix et revenu du modele statique

avec heterogeneite ont les bons signes et sont toutes statistiquement significatives au

seuil de 1%, a l’exception de l’elasticite revenu de la region 3 qui n’est pas significative.

(Les ecart-type sont presentes entre parentheses). L’elasticite prix de l’electricite du

modele statique est negative pour toutes les regions. Elle varie enormement d’une region

a l’autre. Elle va de -0.095 pour la region6 a -2.36 pour la region 2. Si le prix de

l’electricite augmente de 1%, la demande d’electricite va baisser, cette baisse sera plus

faible pour les cohortes qui habitent la region de la Mauricie (0.095%) alors qu’elle

sera plus importante dans la region du Saint Laurent (baisse de 2.36%). La demande

d’electricite est presque inelastique en Mauricie tandis qu’elle tres elastique dans le

Saint Laurent (depasse la hausse du prix qui est de 1%). En moyenne, la hausse de 1%

du prix de l’electricite entraınera une baisse de 0.92% (≈ 1%) dans toute la province.


Donc, la demande d’electricite a une elasticite presque unitaire dans toute la province.

L’elasticite revenu de la demande du modele statique est approximativement la

meme pour toutes les regions. L’elasticite revenu de la region 3 (Richelieu) est proche

de zero et non significative. Les autres sont par contre toutes significatives et varient

entre 0.45 et 0.69. Si le revenu net augmente de 1%, toutes les cohortes augmenteront

leur consommation d’electricite : les cohortes de la region8 (Matapedia) augmenteront

de 0.45% tandis que celles du Saint Laurent l’augmenteront de 0.69%. En moyenne, on

observera dans la province une hausse de 0.57%.

Pour ce qui est du modele dynamique, nous remarquons d’abord que toutes les

elasticites prix de court terme sont inferieures en valeur absolue a celles du long terme,

confirmant ainsi la seconde loi de la demande. Les cohortes reagissent beaucoup plus

fortement a long terme qu’a court terme suite a un changement de prix. Il existe une

periode d’ajustement durant laquelle les menages font un arbitrage entre garder leur

systeme ou le changer avec un autre qui couterait relativement moins cher.

Les elasticites prix de court terme sont toutes significatives a 1% a l’exception de celle

de la region6 (Mauricie). Elles varient enormement d’une region a l’autre et sont de signe

negatif. L’elasticite prix la plus petite est celle de la region1 (Manicouanga avec -0.13)

et la plus elevee est celle de la region9 (Saguenay avec -1.16). Si le prix de l’electricite

augmente de 1%, a court terme, les menages qui vivent dans la region du Manicouanga

sont ceux qui vont le moins baisser leur consommation (baisse de 0.13%), tandis que

ceux de la region du Saguenay seront ceux qui baisseront le plus leur consommation

(1.16%). La demande d’electricite est elastique dans la region de Saguenay tandis qu’elle

est inelastique dans le Manicouanga. En moyenne, dans la province, une baisse de 1%

du prix marginal de l’electricite entraınera une baisse de 0.52% de la demande de toute

la province dans le court terme. Cette valeur est beaucoup plus elevee en valeur absolue

que celle obtenue par Maddala et al. (1997) qui etait de -0.157.

Les elasticites prix de long terme ne sont pas toutes significatives. Elles varient de

-0.21 pour la region6 (Mauricie) a -2.77 pour la region5 (les Laurentides). A long terme,

la demande d’electricite des menages qui sont dans les Laurentides est tres elastique

tandis que celle des menages qui restent en Mauricie est inelastique. En moyenne, si le

prix de l’electricite augmente de 1%, la demande d’electricite baissera de 0.76% ; cette

valeur est assez proche de celle obtenue dans le modele statique. Elle est par contre

beaucoup plus elevee en valeur absolue que celle obtenue par Maddala et al. (1997) soit

-0.239. Cette difference viendrait du fait que dans leurs resultats, certains etats avaient

une elasticite prix directe positive (0.242), une valeur qui ne semble pas logique a priori.


L’elasticite revenu de la demande de court terme est inferieure a celle de long

terme pour toutes les regions (sauf pour la Mauricie, mais qui n’est pas significative).

L’elasticite revenu de court terme va de 0.11 (pour les Laurentides) a 0.77 (pour la

Grande). En moyenne, une hausse de 1% du revenu net des cohortes entraınera une

augmentation de 0.40% a court terme de la demande d’electricite et de 0.596% dans

le long terme, apres une certaine periode d’ajustement. Remarquons que l’elasticite de

long terme du revenu est tres proche de celle du modele statique (0.568). L’elasticite

revenu de court terme que nous avons obtenue est tres proche de celle obtenue par

Garcia-Cerrutti (2000), qui etait de 0.441, celle de Maddala et al. (1997) qui etait de

0.394 et de celle de Hsing (1994) qui etait de 0.397.

Tab. 5.5 – Elasticites des modeles a parametres homogenes

Modele statique

Elasticites valeur ecart-type

elasticite prix -0.8167 0.0489

elasticite revenu 0.4792 0.0224

Modele dynamique

elasticite prixCT -0.3519 0.0513

elasticite prixLT -0.9641 0.4863

elasticite revenuCT 0.1680 0.070

elasticite revenuLT 0.4603 0.1972

Chapitre

5.

Estim

atio

nbayesien

ne

de

modeles

apara

metres

alea

toires

172

Tab. 5.6: Elasticites des modeles a parametres aleatoires

region 1 2 3 4 5 6 7 8 9 Tous

Modele statique

elasticite prix -0.1968 -2.3598 -1.0120 -0.5983 -1.5065 -0.0952 -0.5324 -0.750 -1.2274 -0.9181

E-T (0.0055) (0.025) (0.0674) (0.0251) (0.0430) (0.0495) (0.0288) (0.0121) (0.0396) (0.0125)

elasticite revenu 0.6293 0.6880 0.0234 0.4750 0.4947 0.4502 0.6403 0.4493 0.6129 0.5680

E-T (0.0019) (0.0039) (0.0165) (0.0137) (0.0411) (0.0252) (0.0181) (0.1036) (0.0228) (0.0056)

Modele dynamique

elasticite prixCT -0.1297 -0.6276 -0.4166 -0.3030 -0.8902 -0.2540 -0.6515 -0.2257 -1.1602 -0.5156

E-T (0.0614) (0.1856) (0.2365) (0.1289) (0.2350) (0.2776) (0.2852) (0.0931) (0.0900) (0.0620)

elasticite prixLT -0.2691 -1.3960 -0.7090 -0.6516 -2.7675 -0.2134 -0.5340 -0.4435 -1.3601 -0.7627

E-T (0.1336) (0.7246) (0.4039) (0.4085) (1.8925) (0.2595) (0.2957) (0.2469) (0.2336) (0.1454)

Elasticite revenuCT 0.4402 0.2568 0.4820 0.1914 0.1129 0.4381 0.7743 0.2862 0.6692 0.4032

E-T (0.0458) (0.1533) (0.0763) (0.1253) (0.1370) (0.3521) (0.3106) (0.0917) (0.0639) (0.0616)

Elasticite revenuLT 0.9133 0.5712 0.820 0.4116 0.3484 0.3681 0.6347 0.5624 0.7845 0.5965

E-T (0.1743) (0.4103) (0.2125) (0.3287) (0.4703) (0.3502) (0.3343) (0.2782) (0.1414) (0.1268)


5.7 Conclusion

Nous avons pu estimer a partir de pseudo-panels de cohortes, des modeles de de-

mande d’electricite statiques et dynamiques. Nous avons pu egalement calculer les

differentes elasticites prix et revenus de la demande. Plusieurs conclusions peuvent etre

tirees. Il ressort des resultats que la non prise en compte de l’heterogeneite entre les

cohortes conduit a une sous-estimation des valeurs des elasticites. De plus, le modele dy-

namique avec parametres homogenes surevalue l’ajustement de long terme des cohortes

par rapport au modele qui prend en compte l’heterogeneite. Ce resultat confirme les

resultats obtenus au chapitre (4) portant sur l’approche classique avec des coefficients

de pente homogenes pour toutes les cohortes.

En comparant les elasticites de court terme et celles de long terme, nous constatons

que nos resultats confirment la seconde loi de la demande qui dit que les elasticites de

court terme doivent etre inferieures en valeur absolue a celle de long terme compte tenu

du temps d’ajustement dont les menages ont besoin pour choisir de bons substituts. Ce

resultat est aussi coherent avec le fait que dans le contexte de la demande d’energie, il

est beaucoup question de choix de systemes de chauffage qui sont des biens durables

dont l’achat est effectue dans le but de satisfaire des besoins sur plusieurs annees.

Par ailleurs, les resultats obtenus dans ce chapitre sont comparables avec ceux ob-

tenus dans certains travaux anterieurs (Maddala et al. (1997), Hsing (1994), Garcia-

Cerrutti (2000)). Nos resultats sont meilleurs dans le sens que les estimes ont les bons

signes et sont pour la plupart statistiquement significatifs aux seuils usuels. Maddala

et al. (1997) par exemple, dont l’approche est similaire a la notre, avaient abouti a

des estimes dont les signes etaient parfois aberrants (raison pour laquelle ils n’ont pas

presente certains resultats).

En conclusion, il est important de prendre en compte l’heterogeneite entre les co-

hortes. Les resultats confirment en effet que les comportements des cohortes, et im-

plicitement des menages, changent d’une region a l’autre de la province. L’approche

bayesienne semble bien representer les donnees. Cette facon de proceder serait une

premiere pour les etudes portant sur les pseudo-panels. Elle constitue une bonne alter-

native a l’approche classique surtout en ce qui concerne les modeles dynamiques (tel

que notes par Maddala et al. (1997)). Une des limites de cette approche serait principa-

lement la programmation sur ordinateur. Une fois ce probleme resolu, elle devient une

approche beaucoup plus attrayante que l’approche classique.

Bibliographie



No.3 pp503-544

[2] Deaton Angus (1985) : «Panel Data from Time Series of Cross-sections» Journal


[3] Gelfand A. E. (2000) : Gibbs Sampling, Journal of the American Statistical Assso-

ciation, Vol. 95, No. 452, p. 1300-1304.

[4] German, S. and German, D. (1984) : Stochastic Relaxation, Gibbs Distribution and

the Bayesian Restoration if Images, IEEE Transactions on Pattern Analysis and

Michine Intelligence, 6, pp. 721-741.

[5] Gordon S. et Belanger, G. (2003) : Echantillonnage de Gibbs et autres applica-

tions econometriques des chaınes markoviennes , Working Paper, Departement


[6] Hsing, Y. (1994) : Estimation of Residential Demand for Electricity with the Cross-

Sectionally Correlated and Timewise Autoregressive Model, Resource and Energy

Economics, Vol. 16, p.255-263

[7] Lee, L. F. and Griffiths, W. E. (1978) : The Prio Likelihood and Best Linear Unbia-

sed Prediction in Stochastic Parameter Models, Unpublished Manuscript, Unversity

of Minnesota, Dpt of Economics.

[8] Levin, A., C. F. Lin and C. Chu (2002) : Unit Root Test in Panel Data : Asymptotic

and Finite Sample Properties, Journal of Econometrics, Vol. 108, p.1-25.

[9] Maddala, G. S., Trost, R. P. Li, H., and Joutz, F. (1994) : Estimation of Short-

Run and Long-Run Elasticities of Energy Demand from Panel using Shrinkage

Estimators, Journal of Business and Economic Statistics, Vol. 15, p.90-100.

[10] Garcia-Cerruti, Miguel L. (2000) : Estimating Elasticities of Residential Energy

Demand from Panel County Data using Dynamic Random Variables Models with

Heteroskedastic and Autocorrelated Error Terms, Resource and Energy Economics,

Vol. 22, pp. 355-366.

Bibliographie 175

[11] McKenzie D. J. (2001) : Dynamic Pseudo-Panel Theory and Analysis of Consump-

tion in Taiwan and Mexico. Ph.D Disservation, Yale University

[12] McKenzie D. J. (2004) : Asymptotic Theory for heterogeneous dynamique Pseudo-

Panels, Journal of Econometrics, Vol.120, pp.235-262.

[13] Maddala, G., S., Trost, R., P., Li, H. and Joutz, F. (1997) : Estimation of Short-

Run and Long-Run Elasticities of Energy Demand from Panel Data Shrinkage

Estimators, Journal of Business and Economic Statistics, Vol. 15, No. 1, pp. 90-

100.

[14] McKenzie D. J. (2001) : Dynamic Pseudo-Panel Theory and Analysis of Consump-

tion in Taiwan and Mexico. Ph.D Disservation, Yale University

[15] McKenzie D. J. (2004) : Asymptotic Theory for heterogeneous dynamique Pseudo-

Panels, Journal of Econometrics, Vol.120, pp.235-262.

[16] Moffit R. (1993) : Identification and Estimation of dynamique Models with a Time

Series of Repeated Cross-Sections, Journal of Econometrics, Vol.59, pp99-123.

[17] Pesaran, M. K and Simths, R. (1995) : Estimating Long-Run Relationships from

Dynamic Heterogeneous Panels, Journal of Applied Econometrics, Vol.68, p.79-113.

[18] Robertson, D. and Symons, J. (1992) : Some Strange Properties of Panel Data

Estimators, Journal of Applied Econometrics, Vol.7, p.175-189.

[19] Smith, A. F. M. (1973) : A General Bayesian Linear Model, Journal of the Royal

Statistical Society, Vol. 75, Ser. B. 35, pp.67-75.

[20] Swamy, P. A. V. B. (1970) : Efficient Inference in a Random Coefficient Regression

Model, Econometrica, Vol. 38, pp. 311-323.

[21] Tanner M. A. and Wong Wing Hung (1987) : The Calculation of Posteriori Distri-

butions by Data Augmentation, Journal of the American Statistical Asssociation,

Vol. 82, No. 398, p. 528-540.

5.8 Les annexes

5.8.1 Annexe A : repartition des cohortes

Bibliographie 176

Tab. 5.7 – repartition des cohortes : base 1989

region petite surface moyenne surface grande surface total

MANICOUAGAN (1) 8 26 13 47

SAINT-LAURENT (2) 52 133 112 297

RICHELIEU (3) 97 433 243 773

MONTMORENCY (4) 102 286 119 507

LAURENTIDES (5) 114 412 194 720

MAURICIE (6) 32 74 44 150

LA GRANDE (7) 18 56 29 103

MATAPEDIA (8) 27 85 25 137

SAGUENAY (9) 36 82 45 163

Province 486 1587 824 2897



MANICOUAGAN (1) 11 34 23 68

SAINT-LAURENT (2) 37 139 86 262

RICHELIEU (3) 140 614 468 1222

MONTMORENCY (4) 120 558 320 998

LAURENTIDES (5) 148 598 470 1216

MAURICIE (6) 33 199 151 333

LA GRANDE (7) 14 73 46 133

MATAPEDIA (8) 50 181 96 327

SAGUENAY (9) 24 141 75 241

Province 577 2538 1735 4850



MANICOUAGAN (1) 103 23 9 135

SAINT-LAURENT (2) 194 67 33 294

RICHELIEU (3) 473 139 56 668

MONTMORENCY (4) 403 101 38 542

LAURENTIDES (5) 505 209 83 797

MAURICIE (6) 131 28 4 163

LA GRANDE (7) 100 25 5 130

MATAPEDIA (8) 196 36 22 254

SAGUENAY (9) 103 29 8 140

Province 2208 657 258 3129

Bibliographie 177



MANICOUAGAN (1) 12 53 39 104

SAINT-LAURENT (2) 14 45 51 110

RICHELIEU (3) 55 153 221 430

MONTMORENCY (4) 65 153 221 430

LAURENTIDES (5) 78 221 241 540

MAURICIE (6) 13 46 77 136

LA GRANDE (7) 16 37 40 93

MATAPEDIA (8) 28 78 90 198

SAGUENAY (9) 10 44 54 108

Province 291 829 1039 2159

5.8.2 Annexe B : Graphiques des simulations

Graphiques des modeles statiques a parametres homogenes

0.5

11.

52

2.5

Den

sité

−4 −3.8 −3.6 −3.4 −3.2 −3 −2.8 −2.6pelec_marg

(a) histogramme des valeurs moyennes si-

mulees

−4−3

.5−3

−2.5

pele

c_m

arg

0 2000 4000 6000obs

(b) convergence : valeur moyenne simulee

en fonction du nombre de boucles

Fig. 5.1 – estimation coefficient du prix de l’electricite du modele statique homogene

Bibliographie 178

01

23

4D

ensi

té

1.7 1.8 1.9 2 2.1 2.2 2.3 2.4revenu_net


mulees

1.8

22.

22.

4re

venu

_net

0 2000 4000 6000obs



Fig. 5.2 – estimation coefficient du revenu net du modele statique homogene

0.5

11.

5D

ensi

té

0 .5 1 1.5 2 2.5hdd


mulees

0.5

11.

52

2.5

hdd

0 2000 4000 6000obs



Fig. 5.3 – estimation coefficient de hdd du modele statique homogene

01

23

Den

sité

−1.4 −1.2 −1 −.8 −.6 −.4 −.2 0cdd


mulees

−1.5

−1−.

50

cdd

0 2000 4000 6000obs



Fig. 5.4 – estimation coefficient de cdd du modele statique homogene

Bibliographie 179

0.2

.4.6

Den

sité

2 3 4 5 6 7 8h


mulees

34

56

78

h

0 2000 4000 6000obs



Fig. 5.5 – simulation de la variance de l’erreur du modele statique homogene

0.2

.4.6

.81

Den

sité

0 1 2 3 4 5 6sig2theta


mulees

12

34

56

sig2

thet

a

0 2000 4000 6000obs



Fig. 5.6 – simulation effet inobservable du modele statique homogene

Bibliographie 180

Graphiques des modeles statiques a parametres heterogenes

02

46

810

Den

sité

−3.75 −3.7 −3.65 −3.6 −3.55 −3.5 −3.45 −3.4 −3.35pelec_margS


mulees

−3.7

−3.6

−3.5

−3.4

−3.3

pele

c_m

argS

0 2000 4000 6000obs



Fig. 5.7 – estimation coefficient prix electricite du modele statique a parametres

heterogenes

05

1015

20D

ensi

té

2.35 2.4 2.45 2.5 2.55revenu_netS


mulees

2.35

2.4

2.45

2.5

2.55

reve

nu_n

etS

0 2000 4000 6000obs



Fig. 5.8 – estimation coefficient du revenu du modele statique a parametres heterogenes

Bibliographie 181

0.5

11.

52

2.5

Den

sité

11.4 11.6 11.8 12 12.2 12.4 12.6 12.8hddS


mulees

11.5

1212

.513

hddS

0 2000 4000 6000obs



Fig. 5.9 – estimation coefficient de hdd du modele statique a parametres heterogenes

01

23

4D

ensi

té

−2.8 −2.6 −2.4 −2.2 −2 −1.8 −1.6cddS


mulees

−2.8

−2.6

−2.4

−2.2

−2−1

.8cd

dS

0 2000 4000 6000obs



Fig. 5.10 – estimation coefficient de cdd du modele statique a parametres heterogenes

05

1015

20D

ensi

té

−.94 −.92 −.9 −.88 −.86 −.84 −.82 −.8 −.78pelec_marg1


mulees

−.95

−.9

−.85

−.8

−.75

pele

c_m

arg1

0 2000 4000 6000obs



Fig. 5.11 – simulation prix region1 du modele statique a parametres heterogenes

Bibliographie 182

010

2030

4050

Den

sité

2.93 2.94 2.95 2.96 2.97 2.98 2.99 3revenu_net1


mulees

2.92

2.94

2.96

2.98

3re

venu

_net

1

0 2000 4000 6000obs



Fig. 5.12 – estimation coefficient revenu region1 du modele statique a parametres

heterogenes

0.5

11.

52

Den

sité

−5 −4.5 −4 −3.5 −3pelec_marg3


mulees3

−5−4

.5−4

−3.5

−3pe

lec_

mar

g3

0 2000 4000 6000obs



Fig. 5.13 – estimation coefficient du prix region3 du modele statique a parametres

heterogenes

Bibliographie 183

02

46

Den

sité

2.5 2.6 2.7 2.8 2.9 3revenu_net3


mulees3

2.5

2.6

2.7

2.8

2.9

3re

venu

_net

3

0 2000 4000 6000obs



Fig. 5.14 – estimation coefficient du revenu region3 du modele statique a parametres

heterogenes

0.5

11.

5D

ensi

té

4.5 5 5.5 6 6.5 7 7.5hdd3


mulees3

45

67

8hd

d3

0 2000 4000 6000obs



Fig. 5.15 – estimation coefficient de hdd region3 du modele statique a parametres

heterogenes

Bibliographie 184

Graphiques des modeles dynamiques a parametres heterogenes

0.5

11.

5D

ensi

té

−4 −3 −2 −1 0 1 2pelec_margDr


mulees

−4−2

02

pele

c_m

argD

r

0 2000 4000 6000obs



Fig. 5.16 – moyenne des coefficients simules du prix du modele dynamique a parametres

heterogenes

0.5

11.

5D

ensi

té

−2 −1 0 1 2 3revenu_netDr


mulees

−2−1

01

23

reve

nu_n

etD

r

0 2000 4000 6000obs

(b) convergence

Fig. 5.17 – moyenne des coefficients simules du revenu de l’electricite du modele dyna-

mique a parametres heterogenes

Bibliographie 185

01

23

4D

ensi

té

−.5 0 .5 1 1.5 2cons_anPDr


mulees

−.5

0.5

11.

52

cons

_anP

Dr

0 2000 4000 6000obs



Fig. 5.18 – moyenne des coefficients simules de la consommation passee du modele

dynamique a parametres heterogenes

0.2

.4.6

.8D

ensi

té

−4 −2 0 2 4 6 8hddDr


mulees

−4−2

02

46

hddD

r

0 2000 4000 6000obs



Fig. 5.19 – moyenne des coefficients simules de hdd du modele dynamique a parametres

heterogenes

0.2

.4.6

.8D

ensi

té

−7 −6 −5 −4 −3 −2cddDr


mulees

−7−6

−5−4

−3−2

cddD

r

0 2000 4000 6000obs



Fig. 5.20 – moyenne des coefficients simules de cdd du modele dynamique a parametres

heterogenes

Bibliographie 186

0.5

11.

5D

ensi

té

−2 −1.5 −1 −.5 0 .5 1pelec_margDr1


mulees

−1.5

−1−.

50

.51

pele

c_m

argD

r1

0 2000 4000 6000obs



Fig. 5.21 – estimation coefficient du prix region1 du modele dynamique a parametres

heterogenes

0.5

11.

52

Den

sité

1 1.5 2 2.5 3revenu_netDr1


mulees

11.

52

2.5

3re

venu

_net

Dr1

0 2000 4000 6000obs



Fig. 5.22 – estimation coefficient du revenu net region1 du modele dynamique a pa-

rametres heterogenes

01

23

45

Den

sité

.2 .3 .4 .5 .6 .7 .8 .9cons_anPDr1


mulees

.2.4

.6.8

1co

ns_a

nPD

r1

0 2000 4000 6000obs



Fig. 5.23 – estimation coefficient de la consommation passee region1 du modele dyna-


Bibliographie 187

0.2

.4.6

.81

Den

sité

−.5 0 .5 1 1.5 2 2.5hddDr1


mulees

−10

12

3hd

dDr1

0 2000 4000 6000obs



Fig. 5.24 – estimation coefficient de hdd region1 du modele dynamique a parametres

heterogenes

0.0

5.1

.15

Den

sité

−40 −35 −30 −25 −20 −15cddDr1


mulees

−40

−35

−30

−25

−20

−15

cddD

r1

0 2000 4000 6000obs



Fig. 5.25 – estimation coefficient de cdd region1 du modele dynamique a parametres

heterogenes

0.2

.4.6

Den

sité

−7 −6 −5 −4 −3 −2 −1 0 1pelec_margDr2


mulees

−6−4

−20

2pe

lec_

mar

gDr2

0 2000 4000 6000obs




heterogenes

Bibliographie 188

0.2

.4.6

.8D

ensi

té

−2 −1 0 1 2 3 4revenu_netDr2


mulees

−20

24

reve

nu_n

etD

r2

0 2000 4000 6000obs





0.5

11.

52

Den

sité

−.5 0 .5 1 1.5cons_anPDr2


mulees

−.5

0.5

11.

5co

ns_a

nPD

r2

0 2000 4000 6000obs





0.1

.2.3

.4D

ensi

té

−2 0 2 4 6 8 10 12hddDr2


mulees

−50

510

15hd

dDr2

0 2000 4000 6000obs




heterogenes

Bibliographie 189

0.2

.4.6

.8D

ensi

té

−2 −1 0 1 2 3 4cddDr2


mulees

−2−1

01

23

cddD

r2

0 2000 4000 6000obs




heterogenes

0.1

.2.3

Den

sité

−5 0 5 10 15pelec_margDr3


mulees

−50

510

15pe

lec_

mar

gDr3

0 2000 4000 6000obs




heterogenes

0.2

.4.6

.81

Den

sité

−2 −1 0 1 2 3 4revenu_netDr3


mulees

−10

12

3re

venu

_net

Dr3

0 2000 4000 6000obs





Bibliographie 190

0.5

11.

52

2.5

Den

sité

−.5 0 .5 1 1.5 2cons_anPDr3


mulees

−.5

0.5

11.

52

cons

_anP

Dr3

0 2000 4000 6000obs





0.1

.2.3

Den

sité

−10 −5 0 5 10hddDr3


mulees

−10

−50

510

hddD

r3

0 2000 4000 6000obs




heterogenes

Bibliographie 191

0.0

5.1

.15

.2.2

5D

ensi

té

−20 −15 −10 −5 0cddDr3


mulees

−20

−15

−10

−50

cddD

r3

0 2000 4000 6000obs




heterogenes

0.2

.4.6

.8D

ensi

té

−4 −3 −2 −1 0 1 2pelec_margDr4


mulees

−4−2

02

pele

c_m

argD

r4

0 2000 4000 6000obs




heterogenes

0.2

.4.6

.8D

ensi

té

−3 −2 −1 0 1 2 3 4revenu_netDr4


mulees

−4−2

02

4re

venu

_net

Dr4

0 2000 4000 6000obs





Bibliographie 192

0.5

11.

52

Den

sité

−1 −.5 0 .5 1 1.5 2cons_anPDr4


mulees

−10

12

cons

_anP

Dr4

0 2000 4000 6000obs





0.1

.2.3

.4D

ensi

té

−4 −2 0 2 4 6 8 10hddDr4


mulees

−50

510

hddD

r4

0 2000 4000 6000obs




heterogenes

0.1

.2.3

.4D

ensi

té

−8 −6 −4 −2 0 2 4cddDr4


mulees

−10

−50

5cd

dDr4

0 2000 4000 6000obs




heterogenes

Bibliographie 193

0.1

.2.3

.4.5

Den

sité

−8 −6 −4 −2 0 2 4pelec_margDr5


mulees

−10

−50

5pe

lec_

mar

gDr5

0 2000 4000 6000obs




heterogenes

0.2

.4.6

.8D

ensi

té

−3 −2 −1 0 1 2 3revenu_netDr5


mulees

−4−2

02

4re

venu

_net

Dr5

0 2000 4000 6000obs





0.5

11.

52

Den

sité

−.5 0 .5 1 1.5 2cons_anPDr5


mulees

−.5

0.5

11.

52

cons

_anP

Dr5

0 2000 4000 6000obs





Bibliographie 194

0.1

.2.3

Den

sité

−4 −2 0 2 4 6 8 10hddDr5


mulees

−50

510

hddD

r5

0 2000 4000 6000obs




heterogenes

0.2

.4.6

Den

sité

1 2 3 4 5 6 7 8cddDr5


mulees

02

46

8cd

dDr5

0 2000 4000 6000obs




heterogenes

0.5

11.

5D

ensi

té

−3 −2 −1 0 1 2pelec_margDr8


mulees

−2−1

01

2pe

lec_

mar

gDr8

0 2000 4000 6000obs




heterogenes

Bibliographie 195

0.2

.4.6

.81

Den

sité

−2 −1 0 1 2 3 4revenu_netDr8


mulees

−20

24

reve

nu_n

etD

r8

0 2000 4000 6000obs





0.5

11.

52

Den

sité

−1 −.5 0 .5 1 1.5 2cons_anPDr8


mulees

−10

12

cons

_anP

Dr8

0 2000 4000 6000obs





0.2

.4.6

Den

sité

−4 −2 0 2 4 6 8hddDr8


mulees

−50

510

hddD

r8

0 2000 4000 6000obs




heterogenes

Bibliographie 196

0.1

.2.3

.4D

ensi

té

−12 −10 −8 −6 −4 −2 0 2cddDr8


mulees

−15

−10

−50

cddD

r8

0 2000 4000 6000obs




heterogenes

0.5

11.

5D

ensi

té

−6 −5.5 −5 −4.5 −4 −3.5 −3 −2.5pelec_margDr9


mulees

−6−5

−4−3

−2pe

lec_

mar

gDr9

0 2000 4000 6000obs




heterogenes

Bibliographie 197

0.5

11.

5D

ensi

té

.5 1 1.5 2 2.5 3 3.5 4revenu_netDr9


mulees

01

23

4re

venu

_net

Dr9

0 2000 4000 6000obs





01

23

Den

sité

−.4 −.2 0 .2 .4 .6 .8 1 1.2cons_anPDr9


mulees

−.5

0.5

11.

5co

ns_a

nPD

r9

0 2000 4000 6000obs





0.2

.4.6

.8D

ensi

té

1 2 3 4 5 6 7 8hddDr9


mulees

02

46

8hd

dDr9

0 2000 4000 6000obs




heterogenes

Bibliographie 198

0.5

11.

5D

ensi

té

−3 −2.5 −2 −1.5 −1 −.5 0 .5cddDr9


mulees

−3−2

−10

1cd

dDr9

0 2000 4000 6000obs




heterogenes

5.8.3 Annexe C : Tests d’hypothese de restrictions non lineaires

Comme on peut le remarquer, le concept d’elasticite de court terme ou de long terme

a ete largement utilise. Il est important de savoir si ces elements sont statistiquement

significatifs ou non. Rappelons que le modele est defini en niveau, autrement dit, nous

n’avons pas utilise de transformation logarithmique. Une transformation logarithmique

de toutes les variables du modele permettrait d’obtenir directement les ecart-type des

elasticites, puisque les coefficients de pentes seraient aussi les elasticites. Cependant,

nous avons garde le modele en niveau pour deux principales raisons. La premiere vient

du fait que la demande d’electricite est derivee directement de la fonction d’utilite

indirecte du menage. Cette fonction d’utilite est definie en terme exponentiel comme

dans les travaux de Dubin et McFadden (1984). La forme de la fonction de demande

est obtenue directement en appliquant l’identite de Roy a la fonction d’utilite indirecte.

Cette fonction de demande n’est pas exprimee en terme logarithmique. Pour garder une

coherence dans tous nos travaux, nous gardons les variables qui entrent dans la fonction

de demande en niveau et non logarithme. La seconde raison vient du fait que nous avons

une tarification non lineaire. Hydro-Quebec a fixe un seuil de 30kWh en dessous duquel

elle fixe un prix marginal p1 et au dela duquel elle fixe un prix p2 > p1. Donc, le signe de

la variable (qui est egale a la difference entre la consommation journaliere non observable

et le seuil de 30 kWh) est tres important. Si le modele de demande est exprime des

le depart en log, il sera difficile de determiner correctement le signe de cette variable.

Car le log de la difference n’est pas egal a la difference des log. Pour ce qui concerne la

demande d’electricite des cohortes, elle est obtenue en prenant la moyenne de tous les

menages appartenant a la meme cohorte. Ainsi, nous gardons la demande des cohortes

en niveau dans le but de rester coherent avec l’ensemble des autres chapitres. Garder

les variables du modele en niveau ajoute une etape supplementaire pour obtenir les

Bibliographie 199

ecart-type des elasticites. Les elasticites n’etant pas directement donnees, pour savoir

si elles sont statistiquement significatives ou pas, il faut calculer leurs variances.

Pour tester la significativite des differentes elasticites, nous avons utilise le principe

des tests d’hypothese de restrictions non lineaires. En effet, l’elasticite est une fonction

non lineaire de parametres lorsque le modele est exprime en niveau (mais si le modele

est exprime en log-log, ces calculs ne sont plus necessaires puisque les tests peuvent se

faire directement, les ecart-types etant directement donnes). Par exemple, l’elasticite

de court terme du prix est :

η =∂Q

∂P

P

Q= β

P

Q= g (β)

avec Q la quantite et P le prix. Pour simplifier l’ecriture et aussi pour le generaliser (au

cas d’une elasticite revenu par exemple ou d’une elasticite prix-croisee), posons PQ

= X

L’elasticite de long terme est definie par :

θ =η

1 − α= g (η, α)

avec α le coefficient de la variable dependante retardee du modele dynamique.

Pour tester la significativite d’une elasticite, cela revient a effectuer un test de res-

triction non lineaire. Le principe general des tests de restrictions non lineaires (une seule

restriction en ce qui nous concerne) est donne par :

H0 : g (β) = r

H1 : g (β) 6= r

La statistique de test est :

z =g (β) − r

ecart − type estime [V (g (β) − r)]∼ t [N − K]

Le test de significativite de l’elasticite impose que r = 0 de sorte que la statistique de

test devient :

z =g (β)

ecart − type estime [V (g (β))]∼ t [N − K]

La variance peut etre approximee par :

V[g(β)]

≈

(∂g (β)

∂β

)′V(β)(∂g (β)

∂β

)

Pour le cas de l’elasticite de court terme, on a :

g (β) = η = βX

V[g(β)]

= X2V(β)

Bibliographie 200

La variance de l’elasticite de long terme est donnee par :

g (η, α) = θ =η

1 − α

V(θ)

=

(∂θ

∂η

)2

V (η) +

(∂θ

∂α

)2

V (α) + 2Cov [η, α]

=

(∂θ

∂η

)2

V (η) +

(∂θ

∂α

)2

V (α) + 2XCov[β, α

]

Chapitre 6

Analyse de la demande

conditionnelle : approche

bayesienne

6.1 Introduction

Dans ce travail, nous sommes interesses a l’analyse de la demande d’electricite a par-

tir d’une serie d’enquetes independantes. L’objectif poursuivi est d’utiliser une approche

permettant de simuler des panels ou l’information est gardee au niveau individuel. Nous

disposons en effet de plusieurs enquetes independantes qui ne nous permettent pas de

suivre les memes menages sur plusieurs periodes. Puisque chaque menage apparaıt seule-

ment dans une seule enquete, nous faisons face a un probleme de donnees manquantes.

Apres avoir completer les donnees, nous estimerons les parametres d’un modele de

demande statique et d’un modele dynamique ou nous corrigeons a la fois le biais de

selection provenant du choix du mode de chauffage et aussi le biais d’endogeneite du a la

structure tarifaire de l’electricite. Le probleme de biais de selection sera corrige a partir

d’un modele logit mixte avec erreurs autoregressives generalisees d’ordre un (Ben-Akiva

et Bolduc, 1991). Le probleme d’endogeneite du prix marginal de l’electricite sera cor-

rige a travers le modele a classes latentes que nous avons developpe. Nous utiliserons

une approche bayesienne, initialement proposee par Paquet (2002), Paquet et Bolduc

(2004) qui combine l’algorithme de l’augmentation des donnees pour obtenir des pa-

nels simules et l’echantillonnage de Gibbs pour estimer les parametres du modele. La

methodologie proposee pour analyser la demande d’electricite est une premiere car dans

les travaux anterieurs, les auteurs se contentent le plus souvent de corriger un des trois

Chapitre 6. Analyse de la demande conditionnelle : approche bayesienne 202

problemes poses. La section(6.2) presente la revue des ecrits anterieurs, la section (6.4)

decrit la methodologie bayesienne utilisee, la section(6.5) presente le modele statique

ainsi que les resultats de l’estimation, la section (6.6) etend l’approche proposee au

modele de demande dynamique et nous concluons a la section (6.7).

6.2 Revue de la litterature

Dans le chapitre (3), nous avons estime un modele de demande d’electricite en

tenant compte du choix du mode de chauffage et de la tranche de consommation ;

nous nous sommes interesses a un modele d’une seule periode, soit une seule coupe

transversale. L’aspect intertemporel ne pouvait pas etre pris en compte etant donne

qu’on n’avait qu’une seule periode d’etude qui etait celle de 1989. Pour consommer

l’energie, le menage doit choisir un systeme de chauffage (de l’eau et de l’espace) pour

plusieurs annees. Le systeme de chauffage est en fait un bien durable, par consequent, le

choix ne se fait pas a chaque periode. Pour analyser le comportement de consommation,

il serait interessant de suivre les memes menages sur plusieurs periodes. Les donnees de

panel sur ces menages peuvent nous permettre de les suivre durant differentes annees.

Les panels interrogent les memes individus a plusieurs reprises tandis que les donnees

de coupe transversale n’interrogent qu’une seule fois le meme individu.

Les donnees de panel ont en effet plusieurs avantages comparees aux donnees de

coupes transversales (ou donnees d’enquete) ou les series chronologiques. Hsiao (2001)

et Baltagi (2005) donnent les avantages et les limites des donnees de panel. Avec les

panels, il est possible de controler l’heterogeneite individuel. Les donnees de panel sont

des donnees qui comportent beaucoup plus d’information, plus de variabilite, moins de

colinearite entre les variables, plus de degres de liberte et plus d’efficacite.

Les panels ont cependant certaines limites. Il y a d’abord les problemes de collecte

des donnees. Cela inclut le probleme de disponibilite de la population d’interet, les non-

reponses (les individus peuvent ne pas vouloir cooperer ou il peut y avoir des erreurs

dans les questionnaires), la frequence des entrevues, l’espace entre les entrevues et la

periode de reference.

Comme d’autres types de donnees, les panels peuvent donner lieu a un probleme d’er-

reurs de mesure. Ces erreurs de mesure peuvent se produire soit parce que la personne

interrogee a donne une fausse reponse (volontairement ou non), ou soit parce que la

question posee n’est pas assez claire ou precise.

Les panels sont aussi sujets au probleme de selection. Par exemple, le questionnaire peut

etre adresse a un groupe d’individus tres specifique, et en n’interrogeant que ces indi-


vidus, on exclut automatiquement les autres. On se retrouve alors avec un echantillon

tronque qui causerait un biais de selection dans les estimations (Hausman et Wise,

1979). Il y a aussi le probleme d’attrition. Les non-reponses peuvent se produire dans les

donnees de coupes transversales comme dans les donnees de panel. Mais ce probleme est

beaucoup plus serieux avec les panels. Par exemple, les repondants peuvent disparaıtre

definitivement du panel (quitter, mourir ou ils ne trouvent plus d’interet a participer

aux entrevues). Une solution a ce probleme serait d’utiliser un panel rotatif, qui est en

fait un panel ou a chaque periode, on change un pourcentage fixe des repondants.

Les panels s’etalent souvent sur une tres courte periode. Cela n’est pas necessairement

negatif puisqu’en s’etalant sur plusieurs periodes, le probleme d’attrition pourrait s’ag-

graver et la base de donnees pourrait etre trop lourde a manipuler.

Dans la province de Quebec, il n’existe pas de donnees de panel portant sur la

consommation d’energie des menages. Les donnees dont nous disposons sont des coupes

transversales independantes. Il s’agit de donnees d’enquetes d’Hydro-Quebec de 1989,

1994, 1999 et 2002. Il sera alors difficile de faire une bonne analyse de la dynamique

d’ajustement des menages. Le probleme avec ce type de donnees est qu’il est impossible

de suivre le meme menage sur plusieurs annees : on ne peut pas retracer un menage

donne a chacune des quatre (4) enquetes. Les menages presents dans une enquete sont

absents dans les autres enquetes comme cela est decrit sur la figure 4.1. Les donnees

manquantes sont indiquees par les points d’interrogation.

Il s’agit donc d’un probleme de donnees manquantes. Ce manque de donnees est tres

prononce comparativement aux cas habituels ou on a que quelques observations man-

quantes. Lorsqu’il s’agit de quelques individus manquants, les observations manquantes

peuvent etre completees en utilisant soit l’algorithme EM (esperance maximisation) ou

l’imputation multiple qui sont parfois beaucoup plus appropries. Parfois aussi, s’il ne

s’agit qu’un faible pourcentage d’information manquante (5% ou moins), il suffit juste

d’eliminer ces observations de la base de donnees.

L’algorithme EM est une technique generale d’estimation par maximum de vraisem-

blance en presence de donnees manquantes. L’algorithme formalise une vieille idee ad

hoc qui consistait a : (1) remplacer les valeurs manquantes par les valeurs estimees etant

donnes les parametres, (2) estimer les parametres en supposant que les valeurs man-

quantes sont donnees par leurs valeurs estimees, (3) re-estimer les valeurs manquantes

en supposant que les nouveaux estimes des parametres sont corrects, (4) re-estimer

les parametres, et ainsi de suite jusqu’a la convergence (Little et Rubin 2002, Gelman

et al. (2000)). Bien que des cas particuliers de cet algorithme soient apparus avant

les annees 1970 dans la litterature statistique, c’est seulement en 1977 que Dempster,

Laird et Rubin ont introduit le terme esperance maximisation, formalise cet algorithme


et obtenu ses proprietes. L’algorithme se base sur l’interdependance qui existe entre

les observations manquantes et les parametres du modele. Schafer (2000) donne une

definition formelle de l’algorithme. L’algorithme EM pour une seule iteration comporte

deux grandes etapes :

1. L’etape E ou etape du calcul de l’esperance qui consiste a completer les donnees

manquantes.

2. l’etape M ou etape de la maximisation qui consiste a estimer les parametres par

maximum de vraisemblance etant donnee la base de donnees complete obtenue a

la premiere etape.

L’algorithme est approprie pour les situations ou il est facile d’effectuer les deux

etapes. Dans de telles situations, il permet d’atteindre le maximum global unique de la

fonction de vraisemblance. Cependant, il peut arriver que l’algorithme EM ne converge

pas vers le maximum global. D’apres Little et Rubin (2002) un inconvenient de l’algo-

rithme EM est que la convergence peut etre peniblement lente lorsqu’on a une fraction

importante de donnees manquantes. Comme d’autres algorithmes, l’algorithme EM a

certaines limites :

1. EM peut converger vers differents points suivant les valeurs initiales choisies,

2. la fonction log-vraisemblance peut comporter une region plate, ce qui signifie un

continuum de solutions,

3. la convergence peut etre trop lente si la quantite d’information manquante est

tres importante : plus la quantite d’information manquante est importante, plus

lente sera la convergence.

Il existe d’autres approches pour resoudre le probleme de donnees manquantes,

comme l’imputation simple et l’imputation multiple. L’imputation multiple a ete intro-

duite en premier par Rubin (1978) qui l’a ensuite decrite en detail en 1987. L’imputa-

tion multiple (IM) est une approche Monte Carlo pour l’analyse de bases de donnees

incompletes. Dans l’IM, les donnees manquantes sont remplacees par des valeurs si-

mulees. Cela revient a constituer m bases de donnees completes. Chacune des m bases

de donnees est analysee en se servant des methodes standard pour les bases de donnees

completes. L’analyse de l’IM peut se faire selon l’approche classique ou selon l’approche

bayesienne ( Rubin, 1978). L’imputation simple consiste a se limiter a creer une seule

base de donnees complete. L’IM est appropriee pour les cas ou le nombre d’observations

manquantes n’est pas tres grand. Par exemple, lors d’une enquete, certains individus

peuvent choisir de ne pas repondre a certaines questions soit parce qu’ils ne savent pas

quoi repondre ou soit parce qu’ils ne veulent pas divulger une information confidentielle.

Si le pourcentage de non-reponse est faible (5% ou moins), alors l’elimination de ces

observations peut etre une solution raisonnable au probleme de donnees manquantes.

Cependant, dans un ensemble multivarie ou plusieurs variables peuvent avoir des va-

leurs manquantes, les observations ayant au moins une donnee manquante representent


une proportion importante de la base de donnees. Dans ce cas, une elimination des

observations ayant des donnees manquantes conduirait a une perte d’efficacite car une

partie importante de l’information est ignoree. L’IM est bien appropriee pour resoudre

le probleme de non-reponse. Mais, lorsqu’on dispose d’un ensemble de coupes transver-

sales independantes, les individus observes une periode donnee ne sont plus presents

dans les autres periodes. L’information manquante va concerner toutes les variables du

modele pour tous les individus lorsqu’on passe d’une periode a l’autre. Le probleme

de donnees manquantes est alors plus serieux et l’IM risque fort de ne pas donner des

resultats satisfaisants. Gregoire (2003) et Vidal (2006) ont utilise cet algorithme, mais

les resultats n’etaient pas satisfaisants.

En somme, pour le probleme qui nous concerne, l’algorithme EM de meme que

l’imputation multiple ne sont pas appropries. D’autres solutions existent pour pal-

lier a ce probleme de donnees manquantes : constituer des cohortes d’individus qu’on

peut suivre a chaque periode (Deaton, 1985), ou utiliser une approche bayesienne telle

que l’algorithme de l’augmentation des donnees developpe par Tanner et Wong (1987)

pour completer les donnees manquantes. Cet algorithme peut etre combine avec l’algo-

rithme de l’echantillonnage de Gibbs pour estimer les parametres, une fois les donnees

completees. Cette approche a ete utilisee par Paquet (2002) et Paquet et Bolduc (2004).

La difference entre ces deux approches est importante. L’approche de Deaton (chapitres

4 et 5) regroupe les observations en cohortes, de sorte qu’au final, le nombre de cohortes

est tres faible par rapport au nombre d’individus des bases de depart. Cette approche

transforme les donnees microeconomiques en des donnees macroeconomiques : on passe

de 13035 menages distincts a 25 cohortes qu’on peut suivre sur quatre periodes avec

les pseudo-panels. L’approche bayesienne quant a elle garde l’information au niveau

individuel (on garde les 13035 menages qu’on essaie de suivre sur les quatre periodes),

permettant ainsi de garder les memes individus sur toutes les periodes. Son avantage est

qu’elle produit une certaine efficacite. Dans ce chapitre, nous utiliserons cette approche

pour completer d’abord les donnees manquantes et ensuite simuler les parametres de

notre modele de demande d’electricite. Nous procederons comme dans le chapitre (3)

en definissant d’abord un modele de choix du mode de chauffage, un modele de choix

de la tranche de consommation d’electricite et un modele de demande conditionnelle

d’electricite. Puisque nous supposons que le choix du mode de chauffage est effectue

une seule fois, pour la periode 1989-2002, le modele de choix du mode de chauffage

sera estime juste pour une seule periode. Ce choix est valable pour les autres periodes

considerees dans l’etude. Cela vient du fait que le choix de systemes de chauffage est

valable sur plusieurs periodes, puisque ce sont des biens durables. Mais, quant au choix

de la quantite a consommer ainsi que de la tranche (ou classe) de consommation, il

s’agit de choix qui se font chaque jour et donc a chacune des periodes considerees.

Cela simplifie largement la demarche puisque le probleme de donnees manquantes se


posera uniquement dans le modele de demande conditionnelle. L’approche bayesienne

sera donc utilisee uniquement pour le modele de demande conditionnelle. Cette facon

de proceder pour completer les donnees manquantes nous permet d’avoir des panels

synthetiques ou panels simules. Ces panels simules ont un certain nombre d’avantages

par rapport au vrais panels. D’abord, avec le panel simule, le probleme d’attrition (qui

est courant et important avec les vrais panels) est resolu. En effet, il ne s’agit pas des

vrais individus qui sont presents a chaque periode, mais plutot des individus fictifs, au

sens ou nous imaginons que si le meme individu etait present a toutes les enquetes,

il aurait alors telles autres caracteristiques. Par exemple, pour un menage enquete en

1989, il n’est pas present en 1994, ni en 1999, ni en 2002. Mais, avec les caracteristiques

qui lui sont propres, nous pouvons imaginer que s’il etait present dans les enquetes de

1994, 1999 et 2002, il aurait un certain nombre de caracteristiques (d’autres ne change-

ront pas, comme les systemes de chauffage, le sexe..., et d’autres changeront de facon

deterministe comme son age, ou de facon aleatoire comme son revenu, etc.). L’approche

par la simulation simulera alors l’individu fictif avec toutes ses caracteristiques pour les

annees durant lesquelles il est absent.

6.3 Modele de choix du mode de chauffage : le logit

mixte

La demande d’electricite n’est pas une demande de bien final, le menage utilise en

effet l’electricite ou d’autres formes d’energies pour satisfaire ses besoins de chauffage

(eau et espace) et ses besoins de base (comme l’eclairage, le fonctionnement des ap-

pareils electromenagers,...). La demande d’electricite est donc une demande derivee,

elle provient de l’utilite que procure les appareils et systemes de chauffage. Nous nous

limiterons essentiellement aux besoins de chauffage de l’eau et de l’espace. L’equation

de la demande d’electricite s’obtient a partir de l’identite de Roy. Estimer la demande

d’electricite sans tenir compte du modele de choix du mode de chauffage conduirait a

des estimateurs biaises et non convergents. Nous avons en fait un probleme de selection

qu’il faut corriger. Durbin et McFadden (1984) ont propose une methode pour corriger

le biais de selection. Nous avons, au chapitre (3) utilise une approche pour ce meme

probleme de selection dans le contexte d’une seule coupe transversale : nous avions uti-

lise un modele logit mixte pour le choix du mode de chauffage, et a partir de ce modele,

nous avions construit des correcteurs de biais de selection pour chaque modalite. Dans

ce chapitre, nous adopterons la meme demarche, mais pour toutes les bases de donnees

qui font l’objet de l’etude. Le modele de choix du mode est invariant dans le temps,

on l’estime pour chaque base et les correcteurs sont les memes pour toutes les periodes


pour chaque menage. Il n’y a pas a ce niveau un probleme de donnees manquantes.

Les parametres seront estimes par la methode du maximum de vraisemblance simulee

comme au chapitre (3).

Nous posons l’hypothese suivante : le menage fait le choix des systemes de chauffage

de l’eau et de l’espace une fois pour toute sur la periode 1989-2002. De ce fait, le choix

du mode de chauffage est invariant dans le temps (nous supposons que le choix est

effectue en 1989 ou avant pour simplifier le probleme et ce choix est valable au moins

jusqu’en 2002). Cette hypothese est justifiee parce que le menage fait un choix de biens

durables. Les systemes de chauffage de l’eau et de l’espace sont des biens durables.

Le modele de choix du mode de chauffage du menage est defini par la fonction

d’utilite suivante comme dans les travaux de Dubin et McFadden (1984) et Bernard,

Bolduc et Belanger (1996) :

U (j, rev − rj, X, Pe, Pm, Pg, Pbie, εj, η)

avec Pe est le prix de l’electricite, Pm le prix du mazout, Pg le prix du gaz naturel et

Pbie le prix de la bi-energie ; εj est l’ensemble des caracteristiques non observables du

mode de chauffage, η est l’ensemble des caracteristiques non observables du menage, rj

est le cout total du mode, rev est le revenu du menage et X est un vecteur de variables

exogenes.

Le menage choisit l’alternative j si et seulement si : Ujn > Uin ∀i 6= j. Definissons la

variable binaire djn comme suit :

djn =

1

0

si Ujn > Uin ∀ j ∈ Cn ∧ i 6= j

sinon.

La fonction d’utilite Ujn se decompose en deux elements : une partie deterministe (Vjn)

et une autre aleatoire (εjn) :

Ujn = Vjn + εjn

La partie deterministe est specifiee comme suit :

Vjn = Xjnβ,

ou Xjn est un vecteur de toutes les variables exogenes du modele de choix.

La probabilite que le menage n choisisse l’alternative j est :

Pn (j) = P (Ujn > Uin ∀ i 6= j)

= P (Vjn + εjn > Vin + εin ∀ i 6= j)

P (εin − εjn < Vin − Vjn ∀ i 6= j) .


Nous supposons comme dans le chapitre precedent un modele logit mixte avec erreurs

autoregressives generalisees d’ordre un (GAR(1)) (developpe par Ben-Akiva et Bolduc

1991) :

Ujn = Vjn + εjn

Ujn = Vjn + σjξjn + vjn

εjn = σjξjn + vjn

ξjn = ρ∑

i6=j

wijξin + ζjn.

Le modele peut s’ecrire sous forme vectorielle de facon compacte comme suit :

dn = [d1n, ..., djnn]′

Un = Xnβ + εn,

ou dn, Un et εn sont des vecteurs de dimension (Jn×1) et Xn est une matrice (Jn×Jn).

εn = Tnξn + vn

ou Tn est une matrice diagonale de dimension (Jn × Jn) qui contient les ecart-type σj

sur sa diagonale et

ξn = ρWnξn + ζn ζn ∼ N(0, IJn),

avec n = 1, ..., N , j ∈ Cn et vn un vecteur contenant les termes (vjn) qui suivent une

loi Gumbel iid.

Le modele de demande qui decoule de cette utilite indirecte est la meme a toutes

les periodes et prend la forme suivante :

yjnt = WjntB + ηjnt. (6.1)

Comme nous l’avons souligne auparavant, la demande d’electricite est une demande

derivee. Le menage exprime ses besoins en electricite conditionnellement aux systemes

de chauffage choisis. Il y a une simultaneite entre choix discret et choix continu. Toute

methode d’estimation qui ignore cette simultaneite produit des estimateurs biaises et

non convergents. Comme dans le chapitre (3) ou nous avons utilise les correcteurs

obtenus selon l’approche de Durbin et MacFadden (1984) et Vekeman et al. (2004),

dans ce chapitre egalement, nous adopterons la meme demarche. Nous savons, a partir

de l’equation (6.1), que : E (ηjn |εjn ) = E (ηjn |j ) 6= 0. Nous utiliserons directement les

resultats obtenus au chapitre (3) concernant la formulation des correcteurs de biais de

selection issus de ce modele.

yjnt = WjntB + ηjnt

= WjntB + E (ηjnt |j ) + ujnt, (6.2)


ou ujnt est un terme d’erreur que nous supposons de moyenne nulle. Nous omettons

l’indice t puisque le choix du mode de chauffage se fait une seule fois pour une longue

periode. Un simulateur lisse et convergent de E [ηjn |j ] propose par Vekeman et al.

(2004) serait :

E [ηjn |j ] =1

S

S∑

s=1

E [ηjn |j, ξsn ] , (6.3)

ou les ξsn sont des tirages dans la loi f (ξn) qui est ici une loi normale et S le nombre

total de tirages. En adoptant la specification de Dubin et McFadden (1984), l’esperance

conditionnelle de η est definie de la facon suivante :

E [ηjn |εjn, ξn ] =σ√

2

λ

∑

i∈Cn

ρiE [εin |j, ξn ] .

Cette esperance n’est pas specifique au mode choisi (j). Pour cette raison, l’indice j

sera mis en exposant et non en indice :

E[ηj

n |εjn, ξn

]=

σ√

2

λ

∑

i∈Cn

ρiE [εin |j, ξn ]

E[εj

n |j, ξn

]=

− ln Λ (j |ξn ) × λ

√3

π............si i = j

Λ(j|ξn )1−Λ(j|ξn )

ln Λ (j |ξn ) × λ√

3π

.........si i 6= j.

Donc, on deduit que :

E[ηj

n |j, ξn

]=

√6σ

π

[ ∑

i∈Cn,i6=j

(ρi

Λ (i |ξn )

1 − Λ (i |ξn )ln Λ (i |ξn )

)− ρj

ln Λ (j |ξn )

1 − Λ (j |ξn )

]

=

√6σ

π

[∑

i∈Cn

ρiΛ (i |ξn )

1 − Λ (i |ξn )(ln Λ (i |ξn ) − dij)

],

avec dij = 1 si i = j et dij = 0 sinon. De plus, nous avons la contrainte suivante :∑i∈Cn,j 6=i ρj + ρi = 0. Il s’ensuit que :

E[ηj

n |j, ξsn

]=

√6σ

π

[ ∑

i∈Cn,j 6=i

ρi

[Λ (i |ξs


1 − Λ (i |ξsn )

+ ln Λ (j |ξsn )

]].

Donc, (6.3) devient :

E[ηj

n |j]

=1

S

S∑

s=1

[ ∑

i∈Cn,i6=j

[Λ (i |ξs


1 − Λ (i |ξsn )

+ ln Λ (j |ξsn )

]] √6σ

πρi.

Pour simplifier l’ecriture du modele, definissons l’element ω tel que l’expression suivante

soit satisfaite : ∑

i∈Cn,i6=j

(.) ≡∑

i∈Cn

ωin

(.) ,


ou :

ωin

=

1

0

si i ∈ Cn ∧ i 6= j

sinon.

L’estimateur devient :

E[ηj

n |j]

=1

S

S∑

s=1

∑

i∈Cn

ωin

[Λ (i |ξs


1 − Λ (i |Asn )

+ ln Λ(j∣∣ξs

jn

)] √6σ

πρi

=∑

i∈Cn

ωin

[1

S

S∑

s=1

ωin

[Λ (i |ξs


1 − Λ (i |ξsn )

+ ln Λ (j |ξsn )

]] √6σ

πρi

=∑

i∈Cn

Fijn

√6σ

πρi

E[ηj

n |j]

= Fjnτi (6.4)

avec τi =√

6σπ

ρi un parametre a estimer.

L’estimateur de E [ηjn |j ] obtenu a partir du logit mixte est E [ηj

n |j ] = Fjnτi.

Ce correcteur entre dans l’equation de la demande conditionnelle (6.2). L’estimateur

de E [ηjn |j ] est obtenu apres la maximisation par simulation de la fonction de vraisem-

blance du logit mixte et a la forme E[ηj

n |j]

= Fnτ . Ces correcteurs de biais de selection

sont inclus par la suite dans le modele de demande comme des variables explicatives.

Les correcteurs de biais de selection ayant ete obtenus, nous les incluons dans le

modele de demande conditionnelle au choix du mode de chauffage comme nouvelles

variables explicatives. Le probleme de selection etant resolu, comme au chapitre (3),

il faut egalement corriger l’endogeneite du prix marginal de l’electricite. Rappelons

qu’Hydro-Quebec utilise une tarification par tranche (comme decrite au chapitre (3)).

Cette tarification non lineaire rend le prix marginal endogene. Toute estimation qui

ignore ce probleme donnerait des estimateurs biaises et non convergents. Au chapitre

(3), nous avons developpe un modele a classes latentes pour corriger ce probleme. Nous

etendrons ce nouveau modele au cas dynamique dans ce chapitre egalement.

Apres avoir defini le modele de demande conditionnelle (au choix du mode et au

choix de la classe), nous devons passer a son estimation. Or, comme cela a ete sou-

ligne auparavant, les bases de donnees disponibles sont des enquetes independantes que

nous considerons comme un «panel» avec donnees manquantes. Nous utilisons a cet

effet l’approche bayesienne qui combine l’algorithme de l’augmentation des donnees

(pour completer les donnees manquantes) et l’echantillonnage de Gibbs pour estimer

les parametres du modele.


6.4 Methodologie bayesienne

La methodologie bayesienne est essentiellement fondee sur le theoreme de Bayes qui

relie l’information a priori (information disponible avant l’usage des donnees), la nou-

velle information et la distribution a posteriori. L’echantillonnage de Gibbs utilise cette

relation pour estimer les parametres d’interet et l’algorithme de l’augmentation des

donnees l’utilise pour imputer les donnees manquantes dans des contextes multivaries.

Les deux techniques sont fondees essentiellement sur la methodologie MCMC (Markov

Chain Monte Carlo). Les MCMC sont un ensemble de techniques pour faire des tirages

pseudo aleatoires a partir de distributions de probabilite. L’objectif du MCMC est de

generer une ou plusieurs valeurs d’une variable aleatoire habituellement multidimen-

sionnelle. Il s’agit de faire de la simulation Monte Carlo sur une chaıne markovienne

ergodique. On peut consulter l’article de Gordon et Belanger (2003) pour un survol des

techniques d’echantillonnage de type MCMC.

6.4.1 Echantillonnage de Gibbs

L’echantillonnage de Gibbs est la technique MCMC la plus simple. Sa popularite

date de l’application faite par German et German (1984) de la distribution Gibbs pour

modeliser les images satellites. Son applicabilite s’etend cependant a une grande variete

de problemes. L’echantillonnage de Gibbs d’apres Casella et George (1992), est une tech-

nique pour generer des variables aleatoires d’une distribution (marginale) de facon indi-

recte sans toutefois avoir a calculer la densite. Gelfand (2000) definit l’echantillonnage

de Gibbs comme un outils pour obtenir des echantillons a partie de fonctions de densite

jointes non standard. Ces echantillons proviennent en fait de distributions condition-

nelles associees a la densite jointe. Soit : θ = (θ1, θ2, ........θJ) ou θj est un element

ou un sous-ensemble de θ. Si le modele est assez complexe, la distribution marginale

f (θ) = f (θ1, θ2, ........θJ) ne sera pas standard. Par exemple, si on s’interesse a la den-

site marginale du premier element, on doit integrer la densite conjointe par rapport aux

autres elements pour obtenir la fonction a integrales multiples suivante :

f (θ1) =

∞∫

−∞

∞∫

−∞

.......

∞∫

−∞

f (θ1, θ2, θ3........θJ) dθ2dθ3dθ4......dθJ .

La presence d’integrales multiples pose de serieux problemes si on veut calculer certains

moments (moyenne ou variance). Cependant, la densite conditionnelle f (θ1 |θ−1 ) est

souvent facile a calculer (ou θ−1 = (θ2, ........θJ) represente les elements autres que celui

qui nous interesse soit θ1). Dans le but d’eviter des calculs onereux, German et German


(1984) ont propose la technique d’echantillonnage de Gibbs basee sur la theorie des

chaınes markoviennes et donc qui exploite plus les densites conditionnelles au lieu des

densites conjointes souvent plus complexes.

6.4.2 L’algorithme de l’augmentation des donnees

La technique d’augmentation des donnees (AD) est souvent utilisee pour solutionner

les problemes avec donnees manquantes. On cherche a rendre ces problemes plus faciles a

analyser une fois que la base de donnees est completee. Supposons que la base de donnees

disponible comporte des donnees manquantes et notons : Y = (Yobs, Ymis). Le vecteur

Ymis = yimt, ximt contient a la fois des variables endogenes et exogenes manquantes.

Yobs = yint, xint contient a la fois des variables endogenes et exogenes observees.

Dans beaucoup de problemes avec donnees manquantes, la densite a posteriori des

donnees observees P (θ |Yobs ) n’est pas facile a manipuler ni facile a simuler ; il arrive

frequemment d’ailleurs qu’elle ne soit pas connue. En effet, cette densite est sous forme

d’integrale :

P (θ |Yobs ) =

∫

Ymis

P (θ |Yobs, Ymis ) dYmis.

On utilise la technique d’augmentation des donnees pour contourner ces difficultes. En

effet, si on augmente les donnees observees par des valeurs predites de Ymis, alors, la

densite a posteriori de la base complete P (θ |Yobs, Ymis ) devient plus facile a analy-

ser. L’algorithme AD utilise la dependance qui existe entre les densites P (θ |Yobs ) et

P (Ymis |Yobs ) de facon a calculer P (θ |Yobs ). En effet :

P (θ |Yobs, Ymis ) P (Ymis, Yobs) = P (Ymis |Yobs, θ ) P (θ, Yobs)

P (θ |Yobs, Ymis ) P (Ymis, Yobs) = P (Ymis |Yobs, θ ) P (θ |Yobs ) P (Yobs)

P (θ |Yobs ) =P (θ |Yobs, Ymis ) P (Ymis, Yobs)


=P (θ |Yobs, Ymis ) P (Ymis |Yobs ) P (Yobs)


=P (θ |Yobs, Ymis ) P (Ymis |Yobs )

P (Ymis |Yobs, θ )

∝ P (θ |Yobs, Ymis ) P (Ymis |Yobs )

P (θ |Yobs ) ∝ P (θ |Yobs, Ymis ) P (Ymis |Yobs ) .


De plus, nous avons :

P (Ymis |Yobs ) =

∫

θ

P (Ymis, θ |Yobs ) dθ

=

∫

θ

P (Ymis |Yobs, θ ) P (θ |Yobs ) dθ.

Il faut donc pouvoir faire des tirages dans les distributions conditionnelles suivantes :

P (θ |Yobs, Ymis ) et P (Ymis |Yobs, θ ). L’algorithme AD comporte en fait deux grandes

etapes :

– (etape-I ou etape de l’imputation) : conditionnellement aux parametres θt, faire

des tirages des valeurs manquantes de la densite predictive de Ymis :

Y t+1mis ∼ P

(Ymis

∣∣Yobs, θt). (6.5)

– (etape-P ou etape a posteriori) : conditionnellement aux valeurs predites obtenues

a l’etape I, faire des tirages de nouvelles valeurs des parametres a partir de la

densite a posteriori de la base complete :

θt+1 ∼ P(θ∣∣Yobs, Y

t+1mis

)(6.6)

Repeter a plusieurs reprises (6.5) et (6.6) en se donnant des valeurs de depart θ0.

On obtient alors une sequence de valeurs θt, Y tmis : t = 1, 2...... Cette sequence

converge vers sa densite stable qui est P (θ, Ymis |Yobs, ). Les sous-sequences :

θt, : t = 1, 2.....

et Y t

mis : t = 1, 2.....

ont leurs distributions conditionnelles stables qui sont respectivement P (θ |Yobs )

et P (Ymis |Yobs ).

Dans ce travail, nous disposons de plusieurs coupes transversales independantes.

L’ideal serait d’avoir des donnees de panel qui permettraient de tenir compte de l’as-

pect intertemporel de la demande d’electricite. La consommation d’energie necessite

le choix de systemes de chauffage ; ce choix est fait pour satisfaire des besoins pour

plusieurs annees. Donc, il est important de pouvoir suivre les memes menages sur une

certaine periode afin de mieux capter leur comportement de consommation. Les series

de coupes transversales independantes ne permettent pas de suivre les memes individus

sur plusieurs annees. Pour pallier a ce probleme, plusieurs approches peuvent etre uti-

lisees : constituer des cohortes (individus ayant un certain nombre de caracteristiques en

commun) qu’on peut suivre dans le temps (ceci a fait l’objet des chapitres 4 et 5 ), ou si-

muler les donnees manquantes. Puisqu’il ne s’agit pas des memes menages d’une enquete


a l’autre, les menages presents dans une enquete seront absents dans l’enquete suivante

(ou precedente). Nous nous servirons de l’algorithme d’augmentation des donnees pour

completer les donnees manquantes. Une fois les donnees manquantes completees, nous

utiliserons l’algorithme de l’echantillonnage de Gibbs pour estimer les parametres tout

en corrigeant le biais de selection du choix du mode et le biais d’endogeneite provenant

du choix de la classe. Pour corriger le choix de la classe, au chapitre (3), nous avons

developpe un modele a classes latentes et l’estimation du modele a ete faite selon la

methode du maximum de vraisemblance. Il existe aussi dans la litterature bayesienne

une methode d’estimation de ce type de modele. La section suivante presente la methode

d’estimation des modeles a classes latentes selon l’approche bayesienne.

6.4.3 Estimation bayesienne des modeles a classes latentes

Dans les ecrits anterieurs, un certain nombre de travaux ont porte sur l’estimation

bayesienne des modeles a classes latentes. L’estimation des modeles a classes latentes

selon l’approche bayesienne a ete largement utilisee dans les domaines tels que le mar-

keting, la psychiatrie, les statistiques,... On en denombre tres peu dans le domaine de

l’econometrie. La plupart des auteurs qui se sont interesses a l’estimation bayesienne

des modeles a classes latentes ont utilise une des methodes MCMC. On peut citer

entre autres : Diebolt et Robert (1994), Fruhwirth-Schnatter (1999a, 1999b, 2001),

Lenk et DeSarbo (1999), Allenby et al. (1998), Meng et Wong (1996), Richardson et

Green (1997), Roeder et Wasserman (1997), Stephens (1997) Fruhwirth-Schnatter et

al. (2002),...

Nous nous inspirons un peu de l’approche utilisee dans les travaux de Fruhwirth-

Schnatter et al. (2002). Leur modele a fait l’objet d’une application dans un contexte

de modele a choix discret portant sur le marche d’eau minerale en Australie . Ils n’ont

pas estime les parametres du modele de choix de la classe, il ont plutot suppose que la

probabilite de choisir une classe peut etre simulee a partir d’une loi de Dirichlet. Nous

pensons en effet que la probabilite de choix d’une classe depend d’un certain nombre

de variables explicatives (par exemple, le fait d’utiliser des appareils energivores comme

des climatiseurs,... pourrait augmenter la chance qu’un menage se retrouve dans la

deuxieme classe). Rappelons que dans notre modele, nous ne disposons que de deux

classes : la classe des menages qui consomment moins de (ou egale a) 30 kWh par jour

et celle des menages qui consomment au dela des 30 kWh. Nous proposons d’utiliser

l’approche par la simulation pour estimer les parametres du modele latent pour le choix

de la classe ; les differentes valeurs simulees correspondront a des probabilites simulees.

Cette approche est beaucoup plus concrete que celle utilisee par Fruhwirth-Schnatter et

al. (2002) dans laquelle la probabilite de choisir une classe ne depend d’aucune variable


explicative. De plus, ils ont suppose que le nombre de classes n’etait pas connu au

depart, ce qui n’est pas le cas dans notre modele.

6.5 Estimation d’un modele statique de demande

d’electricite

Dans cette etude, contrairement au cas habituel de modele a classes latentes, nous

supposons qu’il existe deux classes. Nous supposons que les probabilites dependent d’un

certain nombre de variables explicatives. Nous simulerons d’abord les donnees man-

quantes, ensuite, nous estimerons les parametres du modele. Definissons tout d’abord

les equations du modele.

6.5.1 Modele de demande conditionnelle a la classe et au mode

de chauffage

Hydro-Quebec utilise un tarif croissant par partie. En effet, la structure tarifaire a

deux parties : si la consommation journaliere du menage ne depasse pas les 30 kWh,

Hydro-Quebec fixe un prix par unite consommee de p1 et si sa consommation journaliere

est superieur aux 30 kWh, chaque kWh additionnel coutera au menage p2 avec p1 < p2.

Ces prix varient d’une annee a l’autre (mais durant la periode 1998 et 2004, Hydro-

Quebec a gele ses prix en les gardant a ceux de Mai 1998). Donc, le prix marginal depend

de la quantite consommee et cette quantite consommee depend aussi du prix marginal.

Il y a donc un probleme d’endogeneite. Un autre probleme qui se pose aussi est que

la consommation journaliere n’est pas directement observable par le chercheur comme

cela a ete decrit au chapitre (3). Hydro-Quebec se base sur la consommation totale d’un

cycle de mesurage d’environ deux mois pour approximer la consommation journaliere

moyenne. Mais le consommateur a la possibilite de suivre sa consommation au jour le

jour et peut donc controler le niveau de consommation. En optant pour un tarif en

deux parties, Hydro-Quebec cree deux classes de consommateurs : les consommateurs

de la premiere classe (consommation journaliere ne depassant pas les 30 kWh) et ceux

de la deuxieme classe (consommation journaliere depassant les 30 kWh). La prise en

compte de ces classes dans l’estimation de la demande d’electricite peut se faire grace

aux modeles a classes latentes que nous avons developpe. Pour le probleme qui nous

concerne, le nombre de classes est connu (deux classes). De plus, nous n’imposons pas de

restrictions sur les parametres des classes, en d’autres termes, nous n’imposons pas de


contraintes sur les parametres comme c’est le cas dans la plupart des travaux anterieurs.

L’estimation des modeles a classes latentes peut se faire soit par une approche

classique qui consiste a maximiser la vraisemblance de l’echantillon comme cela a ete fait

dans le chapitre (3), ou soit par une approche bayesienne. L’avantage avec l’approche

bayesienne est qu’il est possible d’estimer a la fois les parametres du modele et de

simuler les donnees manquantes.

Definissons la variable y∗jnt = consommation journalierent − 30kWh ; avec j la

modalite choisie par le menage n. Si y∗jnt ≤ 0, le menage n se situe dans la premiere

tranche a la periode t. Si y∗jnt > 0, le menage se situe dans la deuxieme tranche a

la periode t. Cependant, le chercheur ne sait pas exactement dans quelle tranche le

menage se situe car sa consommation journaliere n’est pas directement observable. Il

existe deux groupes de menages et chaque groupe devrait avoir des caracteristiques

qui lui sont specifiques. Le choix de la classe devrait dependre d’un certain nombre de

facteurs. Nous admettons que le choix de la tranche change d’une annee a l’autre, mais

il peut aussi arriver qu’un menage reste dans la meme classe durant les periodes de

l’etude.

Les modeles a classes latentes sont souvent utilises pour prendre en compte l’heterogeneite

qui existe entre differents groupes d’observations. Dans un modele a classes latentes, les

coefficients sont specifiques aux groupes ou classes. Supposons que le menage considere

appartient a une des deux classes notee par s, (s = 1, 2) avec une certaine probabi-

lite. Soit Q(y∗

jnt ≤ 0), la probabilite qu’un menage appartienne a la premiere classe

et soit Q(y∗

jnt > 0)

la probabilite qu’il appartienne a la deuxieme classe. Supposons

que la consommation journaliere (y∗jnt) est fonction d’un certain nombre de variables

explicatives regroupees dans le vecteur Mjnt :

y∗jnt = Mjntα + ujnt ujnt ∼ N

(0, σ2

u

)

Q(y∗

jnt ≤ 0)

= Q

(y∗

jnt − Mjntα

σu

≤ −Mjntα

σu

)(6.7)

= Φ

(−Mjntα

σu

)= π1jnt

Q(y∗

jnt > 0)

= 1 − Q(y∗

jnt ≤ 0)

= 1 − Φ

(−Mjntα

σu

)= π2jnt

.

Le vecteur Mjnt contient aussi les correcteurs de biais de selection obtenus dans une

etape anterieure, etant donne que le choix de la tranche de consommation est condi-

tionnelle au choix du mode de chauffage, justifiant ainsi l’ajout de l’indice j. En condi-

tionnant sur le choix de la tranche et celui du mode de chauffage, le modele de demande


d’electricite peut s’ecrire comme suit :

yjnt = xjntδs + xjnγs + ϑn + εjnt s = 1, 2

ϑn ∼ N(0, σ2

ϑ

)εjnt ∼ N

(0, σ2

ε

)

yjnt =

xjntδ1 + xjnγ1 + ϑn + εjnt si y∗

jnt ≤ 0

xjntδ2 + xjnγ2 + ϑn + εjnt si y∗jnt > 0

(6.8)

yjnt =

Xjntβ1 + ϑn + εjnt si y∗

jnt ≤ 0

Xjntβ2 + ϑn + εjnt si y∗jnt > 0

, (6.9)

avec : xjnt un vecteur de variables exogenes qui varient dans le temps, et xjn est un

vecteur de variables exogenes invariantes dans le temps (ce vecteur contient aussi les

correcteurs de biais de selection du choix du mode de chauffage). L’indice s = 1, 2

indique la classe du menage en question, le terme ϑn est un effet individuel aleatoire

que nous supposons normale comme dans les travaux de Collado (1997).

Nous ne disposons cependant pas d’information sur les periodes precedentes au sujet

du meme menage. De ce fait, on ne peut pas suivre un menage donne dans le temps.

Une facon de resoudre ce probleme est de constituer des cohortes a partir de la base

de donnees disponible comme l’avait propose Deaton (1985). Un des inconvenients avec

cette methode est que l’information est analysee a un niveau agrege (cohortes) et non a

un niveau desagrege (menage). On passe de NT observations a CT << NT observations

avec les pseudo-panels conventionnels. Il y a donc une perte d’efficacite dans l’utilisation

de l’information. Une solution a ce probleme de perte d’information consiste a utiliser

l’approche bayesienne qui combine l’echantillonnage de Gibbs et l’augmentation de

donnees. Cette approche a l’avantage de garder l’information au niveau desagrege et

donc elle n’entraıne pas de perte d’information. Nous definissons d’abord le modele a

classes latentes et ensuite nous presenterons les differentes etapes de l’estimation.

Pour simplifier la notation, nous omettons l’indice j. Le modele de demande condi-

tionnelle (6.9) peut s’ecrire de facon plus condensee pour le menage n de la facon

suivante :

yn = Xnβ + ϑn + εn (6.10)

ϑn ∼ N(0, σ2

ϑ

)εn ∼ N

(0, σ2

εIT

),

avec Xn =(XnD

(1)n XnD

(2)n

)le vecteur des variables exogenes et β = [β1 β2]

′ le vecteur

des parametres, D(s)n est un vecteur compose de (0, 1), le 1 indiquant que le menage n

a choisi la classe s. Nous pouvons aussi ecrire le modele sous forme matricielle :

Y = Xβ + w (6.11)

w = ϑ + ε,


avec

ϑ ∼ N (0, Σϑ) ε ∼ N (0, Σε) w ∼ N (0, Ω)

Σϑ = σ2ϑIN Σε = σ2

εINT .

Notons que : Y est de dimension (NT × 1), X est de dimension (NT × 2K), Ω est

de dimension (NT × NT ) , β est de dimension (2K × 1), etant donne que nous avons

suppose l’existence de deux classes latentes dans le modele. ϑ est de dimension (N × 1)

et ε est de dimension (NT × 1). La matrice de variance covariance du terme d’erreur

w est alors definie par :

Ω = E (ww′) = E (ϑϑ′) + E (εε′) (6.12)

= Σϑ ⊗ (IN ⊗ ιT ) + Σε ⊗ (IN ⊗ IT )

Nous supposons que les vecteurs ϑ et ε sont independants. Nous imposons l’hypothese

iid (independamment et identiquement distribue) pour les elements de w.

Pour simuler les donnees manquantes des variables exogenes, nous utilisons des

regressions auxiliaires. Ainsi, si on a L variables explicatives (avec L = 2K), les

equations auxiliaires sont :

x1n = z1nγ1 + ε1n

x2n = z2nγ2 + ε2n

...

xLn = zLnγL + εLn

εln ∼ N(0, τ 2).

Le modele sous la forme matricielle est :

X∗n = vec(Xn) =

z1n 0 . . . 0

0 z2n . . . 0...

. . . . . ....

0 0 0 zLn

γ1

γ2

...

γL

+

ε1n

ε2n

...

εLn

X∗n = Znγ + e e ∼ N(0, V ), (6.13)

avec V = τ 2INT , I est une matrice identite de dimension (NT ), Xn et vec(Xn) sont des

matrices de dimension (NT × L) et (NT × 1) respectivement.

6.5.2 Etape de la simulation des donnees manquantes

Cette etape se divise en trois parties. Nous indicons les variables par m pour indiquer

qu’il s’agit de donnees manquantes. Nous utilisons l’algorithme de l’augmentation des


donnees pour completer les donnees manquantes.

Etape 1 : Simulation de ynt(m)

Etant donnees Xnt(m) ou l’indice (m) indique qu’il s’agit d’une observation man-

quante, etant donne aussi les parametres du modele, il est possible de simuler yjnt(m) a

partir de :

ynt(m) = Xnt(m)β + ϑn(m) + εnt(m).

Et puisque nous avons suppose l’hypothese de normalite du terme d’erreur, nous simu-

lerons les valeurs de ynt(m) a partir d’une loi normale :

ynt(m) ∼ N(Xnt(m)β, σ2

ϑ + σ2ε

).

Etape 2 : Simulation de Xnt(m)

Pour simuler les valeurs manquantes de Xnt(m) nous devons utiliser la regression

auxiliaire (6.13). Pour obtenir la distribution conditionnelle, nous exploitons les hy-

potheses du modele. En effet, on a :

p[Y(m)

∣∣X(m), ϑn(m)

]∝ exp

(−1

2

(Y(m) − X(m)β

)′Ω−1

m

(Y(m) − X(m)β

))(6.14)

p[X(m)

∣∣Zm, ϑn(m)

]∝ exp

(−1

2

(X(m) − Z(m)γ

)′Ω−1

m

(X(m) − Z(m)γ

)), (6.15)

Ωm etant l’element m de la matrice de variance covariance definie en (6.12). En combi-

nant les equations (6.14) et (6.15), nous pouvons ecrire la densite conditionnelle d’interet

comme suit :

p[X(m)

∣∣Y(m), ϑ(m)

]=

p(X(m), Y(m)

∣∣Z(m)

)

p(Y(m)

) (6.16)

p[X(m)

∣∣Y(m), ϑ(m)

]∝ p

(X(m), Y(m)

∣∣Z(m)

)

p[X(m)

∣∣Y(m), ϑn(m)

]∝ p

(Y(m)

∣∣X(m)

)p(X(m)

∣∣Z(m)

).

Lorsqu’il s’agit du cas scalaire, la densite conditionnelle prend la forme :

P(xknt(m) |.

)∝ exp

−

(β2

k

φ+ 1

τ2

)

2

xknt(m) −

βk

φ

(yt(m) − β−kx−knt(m) − ϑn(m)

)− 1

τ2 γznt(m)(β2

k

φ+ 1

τ2

)

2 ,


avec P(xknt(m) |.

)= P

(xknt(m)

∣∣ynt(m), x−knt(m), znt(m), ϑn(m)

). L’annexe (6.8) donne les

differentes etapes du calcul. Cette expression est tout simplement le noyau d’une dis-

tribution normale :

P(xknt(m) |.

)∝ N

−

β2

kφ

+ 1τ2

2

xknt(m) −

θkφ (yt(m)−β−kx

−knt(m)−ϑn(m))− 1τ2 γznt(m)

β2k

φ+ 1

τ2 ,

(β2

k

φ+ 1

τ2

)−1

.

L’indice (−k) indique toutes les variables exogenes autres que celle qui nous interesse et

φ = σ2ϑ +σ2

ε . En supposant que les autres elements sont connus, nous pouvons proceder

ainsi pour simuler toutes les variables exogenes.

Etape 3 : Simulation de Mnt(m)

Rappelons que Mnt est la matrice de variables exogenes du modele latent. Nous

simulerons Mnt(m) de la meme maniere que nous avons simule les Xnt(m), c’est-a-dire

a partir d’une distribution normale. Cela est justifie par le fait que certaines variables

contenues dans Xnt pourraient se retrouver dans Mnt.

6.5.3 Etape de la simulation des parametres

Apres avoir simule les donnees manquantes, nous pouvons alors estimer les pa-

rametres en exploitant l’algorithme de l’echantillonnage de Gibbs.

Etape 4 : simulation de β = (δ1, δ2, γ1, γ2)

Nous estimons de facon conjointe les parametres des deux classes en utilisant l’echantillonnage

de Gibbs. Si les croyances a priori sur le vecteur des parametres β sont decrites par une

loi normale p (β) = N(b, B

−1), si les donnees sont completees et si les autres pa-

rametres du modele sont connus, alors, le modele est reduit a une simple regression

avec variance connue. La distribution a posteriori de β est alors egale a :

p (β |Y,X ) = N(b, B−1

),

avec

B = X ′X + B b = B−1(X ′Y − bB

).


Etape 5 : Simulation de ϑ

Reecrivons l’equation de demande de la facon suivante : Y = Y − Xβ = ϑ + ε

(Y

ϑ

)∼ NMV

[(ϑ

ϑ

),

(Ω Σϑ ⊗ INT

Σϑ ⊗ INT Σϑ

)]

avec : ϑ = 0 etant donne les hypothese faites sur les termes d’erreur.

Nous pouvons alors deduire que :

P (ϑ |β,X, Y, Σϑ, Σε ) = NMV(µϑ| Y , Σϑ| Y

)

avec :

µϑ| Y = (Σϑ ⊗ INT )′ Ω−1Y

Σϑ| Y = Σϑ − (Σϑ ⊗ INT )′ Ω−1 (Σϑ ⊗ INT ) .

Pour le cas d’un seul individu, la loi conditionnelle prend la forme suivante :

P(ϑn

∣∣β,X, Y, σ2ϑ, σ

2ε

)= N

[∑Tt=1 ynt

T + 1σ2

ϑ

,

(T +

1

σ2ϑ

)−1]

1

avec : ynt = ynt − Xntβ.

Nous fixons la variance σ2ϑ pour que le modele soit identifiable.

Etape 6 : Simulation de σ2ε

Etant donne β et les donnees completees, si la loi a priori sur σ2ε est une inverse

gamma : P (σ−2ε ) = IG

(c, C

), alors la loi a posteriori de σ2

ε sera aussi une inverse

gamma :

p(σ−2

ε |β,X, Y)

= IG(c, C

)

avec : c = c +N

2C = C +

∑Nn=1 εnε

′n

2.

Il s’agit d’une distribution inverse gamma de moyenne cC et de variance cC2 connues.

Dans la pratique, nous prenons en compte les estimations de chacune des deux classes en

passant par les esperances conditionnelles. En ecrivant le modele en terme d’esperance

conditionnelle, nous pouvons facilement recuperer les residus pour ensuite estimer la

matrice de variance-covariance du modele. Le modele de demande peut s’exprimer en


terme d’esperance conditionnelle comme suit :

ynt = Xntβ + ϑn + εjnt (6.17)

= E (ynt) + εjnt

= E (ynt |s = 1) × Q (s = 1) + E (ynt |s = 2, ) × Q (s = 2) + εjnt

= Xntβ1 × π1nt + Xntβ2 × π2nt + εjnt,

εjnt etant le terme d’erreur du modele de demande conditionnelle.

Etape 7 : Simulation de α

Etant donnees Y , X, M , σ2w et β, il est possible d’estimer les parametres qui inter-

viennent dans la probabilite d’etre dans une classe donnee. Si les croyances a priori sur

α sont une normale : p (α) = N (α, ∆−1), alors, la distribution a posteriori de laquelle

nous pouvons tirer α sera aussi une normale :

p (α |M,Y ∗, s1, s2 ) = N(α, ∆−1

)

avec : ∆ = M ′M + ∆ α = ∆−1 (M ′Y ∗ − α∆) π1nt + π2nt = 1,

avec πsnt la probabilite que le menage n soit dans la classe s comme definie a l’equation

(6.7) ; Y ∗ est le vecteur de la variable latente.

Etape 8 : Simulation de σ2u

Etant donne y∗jnt la dependante non observable, Mjnt les exogenes et α le vecteur des

parametres, nous pouvons recuperer les erreurs de la maniere suivante : ujnt = y∗jnt −

Mjntα. Si les croyances a priori sur σ2u sont une loi inverse gamma : p (σ−2

u ) = G (a,A),

alors on peut simuler σ2u a partir d’une distribution inverse gamma egalement :

p(σ−2

u |α,M, Y ∗ ) = G(a, A

)

avec : a = a +N

2A = A +

uu′

2

Il s’agit d’une inverse gamma de moyenne aA et de variance aA2, toutes deux connues.

Nous fixons cette variance a 1 pour que le modele soit identifiable.


Etape 9 : simulation de τ 2

Etant donne X, Z et γ, nous pouvons recuperer le vecteur des erreurs de la maniere

suivante : ε = X − Zγ. Si les croyances a priori sur τ 2 suivent une loi inverse gamma :

p (τ−2) = G (d,D), alors on peut simuler τ 2 a partir d’une distribution inverse gamma

egalement :

p(τ−2 |γ,W,Z

)= G

(d, D

)

avec : d = d +N

2D = D +

εε′

2.

Il s’agit d’une inverse gamma de moyenne dD et de variance dD2, toutes deux connues.

Etape 10 : simulation de γ

Etant donne Z et τ 2, la regression auxiliaire (6.13) est un modele de regression avec

variance connue. Si les croyances a priori sur γ sont une normale : p (γ) = N (γ, Υ−1),

alors, la distribution a posteriori de γ sera aussi une normale :

p (γ |τ, Z ) = N(γ, Υ−1

)

Υ =

(Z ′Z

τ 2

)+ Υ γ = Υ

[(Z ′Z

τ 2

)+ γΥ

].

6.5.4 Experience Monte Carlo sur le modele a classes latentes

Une experience Monte Carlo a ete effectuee afin d’evaluer la performance du modele

a classes latentes qui a ete developpe. Rappelons que le probleme consistait a esti-

mer une equation de demande conditionnelle au choix de deux classes non observables.

Nous avions alors defini un modele pour la demande et un autre modele pour le choix

de la classe. Dans cette experience, nous definissons une equation lineaire et une autre

equation pour le modele latent, c’est-a-dire pour le choix de la classe. Nous supposons

qu’il existe deux classes inobservables. Supposons un panel complet a deux periodes.

Nous evacuons le probleme de donnees manquantes, puisque le but est de verifier si

toutes choses egales par ailleurs, le modele a classes latentes donne des resultats sa-

tisfaisants. Pour le modele observe, supposons un modele lineaire avec deux variables


explicatives et une constante :

ynt = β0 + β1xnt1 + β2xnt2 + εnt

avec :

xn1 =

(xn11

xn21

)∼ N

[(0

0

),

(3 0

0 3.5

)]

xn2 =

(xn12

xn22

)∼ N

[(0

0

),

(1.3 0

0 2

)]

εn =

(εn1

εn2

)∼ N

[(0

0

),

(1 0

0 1

)].

Avec deux classes, fixons la valeurs des parametres comme suit :

β10 = 0.25 β2

0 = 3

β11 = −0.7 β2

1 = −7

β12 = 2 β2

2 = 3 σ2 = 0.25.

Supposons que le modele latent est defini comme suit :

y∗nt = α0 + α1mnt + unt

avec :

Mn =

(mn1

mn2

)∼ N

[(0

0

),

(1.2 0

0 2.5

)]

un =

(un1

un2

)∼ N

[(0

0

),

(1 0

0 1

)].

Les valeurs donnees aux parametres du modele latent sont :

α0 = 0.5 α1 = 3.7.

Le choix de la classe est fait de la facon suivante :

ynt = β10 + β1

1xnt + β12xnt + εnt si y∗

nt ≤ 0

ynt = β20 + β2

1xnt + β22xnt + εnt si y∗

nt > 0.

Nous avons simule 4000 observations au total. Nous avons utilise l’algorithme de

l’echantillonnage de Gibbs comme decrit ci-dessus pour estimer les parametres du

modele. Nous avons effectue d’abord 1000 tirages et ensuite 6000 tirages ; nous avons en-

leve les 10% premieres valeurs pour permettre a l’algorithme de se defaire de l’influence

des valeurs de depart. Les resultats sont presentes au tableau (6.1).


Tab. 6.1 – Resultats de l’experience Monte Carlo

Variables Moyenne Ecart-type Min Max Vraie valeur

1000 tirages

α0 .8393361 .1154664 .5771488 1.036828 0.5

α1 3.792657 .0683228 3.67698 3.925366 3.7

β10 .3996924 .0678183 .2103657 .6142751 0.25

β11 -1.060028 .0468272 -1.215307 -.946053 -0.7

β12 2.077945 .0379697 1.954906 2.20218 2

β20 2.751913 .0550171 2.560399 2.916448 3

β21 -6.518776 .0390225 -6.618841 -6.405156 -7

β22 2.913989 .0293284 2.819306 3.024495 3

6000 tirages

α0 1.04156 .2346462 .5809309 1.582095 0.5

α1 3.893778 .1251993 3.518268 4.219666 3.7

β10 .3683428 .0684028 .1458027 .6362044 0.25

β11 -1.001891 .0711623 -1.202843 -.8196668 -0.7

β12 2.067435 .0381105 1.940932 2.22667 2

β20 2.730945 .0618015 2.48367 2.922762 3

β21 -6.462256 .0905749 -6.642634 -6.185466 -7

β22 2.905234 .0329231 2.768908 3.024495 3


Comme on peut le constater, la plupart des valeurs obtenues sont proches des vraies

valeurs. Tout d’abord, tous les signes sont corrects et toutes les valeurs estimees sont

statistiquement significatives au seuil de 1%. La constante du modele latente a une

moyenne qui est presque le double de la vraie valeur. Mais pour ce qui est des coefficients

des deux classes, qui sont les coefficients d’interet, toutes les estimes sont assez proches

des vraies valeurs de depart.

6.5.5 Resultats empiriques et interpretations

Le tableau (6.2) presente les resultats de l’estimation bayesienne du modele de de-

mande statique avec un panel simule. A partir des quatre bases de donnees d’enquete

(1989, 1994, 1999 et 2002), nous avons construit un panel simule tout en gardant le

meme nombre d’observations. C’est comme si nous avons un panel de 130352 menages

que nous avons suivi en 1989, 1994, 1999 et 2002. Nous avons simule les donnees man-

quantes et estime les parametres du modele simultanement.

La premiere partie du tableau presente les coefficients estimes du modele latent, ou

modele de choix de la classe, et la derniere partie presente les estimes du modele de

demande de la classe1 (lorsque la consommation journaliere est inferieure ou egale a

30 kWh) et de la classe2 (si la consommation journaliere depasse les 30 kWh). Nous

interpretons dans un premier temps les estimes du modele de choix de la classe et

dans un second temps, nous nous interesserons aux resultats du modele de demande

conditionnelle.

2Les 13035 observations sont la somme des observations des quatre bases de donnees : 2897 obser-

vations pour l’enquete de 1989, 4850 observations pour celle 1994, 3129 pour l’enquete de 1999 et enfin

2159 observations pour celle de 2002.

Chapitre

6.

Analy

sede

ladem

ande

conditio

nnelle

:appro

che

bayesien

ne

227

Tab. 6.2: Resultats du modele statique de demande condi-

tionnelle

Variables Moyenne Ecart-type Min Max Moyenne Ecart-type Min Max

Modele latent

surf .9307073 .005774 .9119956 .9507542

systeme plinthes -.3155197 .0111963 -.3515644 -.278529

systeme-air-chaud .1497021 .0162897 .090245 .2022296

systeme-eau-chaude -.1609059 .0248379 -.2440916 -.0708636

systeme thermop -.6594631 .0181368 -.7302276 -.5982333

systeme convectair -1.096412 .0220973 -1.172506 -1.005492

nbre refrigerateurs .1759727 .0080955 .1439458 .2094434

maison detachee 4.320145 .0258599 4.222261 4.414021

maison jumelee 1.399692 .0303405 1.296213 1.524894

climatiseur central .4040354 .0217762 .3375888 .4860479

climatiseur fenetre .4775089 .0152718 .4201961 .5357873

correcteur1 .1119521 .0023776 .1039549 .1197522

correcteur2 .3970023 .0023244 .3892315 .4052929

correcteur3 -1.303473 .0079418 -1.329628 -1.274627

correcteur4 .4182431 .0055556 .3977959 .4362388

correcteur5 -2.229231 .0065911 -2.256227 -2.205665

correcteur6 -1.566491 .0055432 -1.587362 -1.544538

correcteur7 4.882422 .0051584 4.866739 4.902759

correcteur8 -.2166533 .0025109 -.2260688 -.206557

correcteur9 -.0818318 .0024643 -.0899981 -.0735316

montreal .5805794 .0211695 .4947817 .6649718

nbre Resid Aug 5.612193 .0043212 5.594985 5.627344

suite de a la page suivante

Chapitre

6.

Analy

sede

ladem

ande

conditio

nnelle

:appro

che

bayesien

ne

228


tionnelle


rev Aug 2.368532 .0024876 2.360426 2.376157

hdd -.0580651 .0117446 -.1028366 -.0177491

cdd -1.368219 .0104426 -1.406493 -1.333008

cst -3.232633 .0779258 -3.510565 -2.939584

Classe1 Classe2

prixelec -.2715623 .0854674 -.5903434 -.0130102 -1.897176 .0425372 -2.046313 -1.75258

prixbie -.1251919 .0625863 -.3680488 .1198795 -.7556955 .0410098 -.8910108 -.6019601

prixgn .0479374 .0252735 -.0491205 .1351161 .1838072 .0119721 .1354056 .2283756

prixm -.0203362 .053969 -.2147555 .1602362 -.2269305 .0308347 -.3318951 -.1041453

rev Aug .2555698 .0693037 .0193609 .5130699 1.7412 .0115035 1.70042 1.783675

cdd -.2351754 .0971299 -.5910597 .1001802 -1.46788 .0542479 -1.665287 -1.294884

hdd -.1987059 .1312201 -.6991754 .2446916 -1.126186 .0652407 -1.355069 -.8988301

mode occupation -.0723843 .0831676 -.3613322 .2626467 -.6030748 .055787 -.8308909 -.4157551

systeme plinthe .0027 .1388287 -.521081 .4814138 -.2851902 .0555841 -.5164998 -.0975061

syst airChaud -.0475588 .1419234 -.5803982 .4448071 -.0262968 .0999967 -.3977866 .3327716

systeme eau -.0247949 .2003977 -.7571678 .7675938 .5473069 .1666713 -.1590979 1.177681

systeme th .1212947 .217612 -.581003 .9762406 1.176695 .1418844 .6514208 1.716593

systeme co .1075157 .1949105 -.5534391 .7868503 .5092389 .111007 .0951405 .9205879

nbre refrigerateurs .0426555 .0674857 -.2207974 .3046449 .3445458 .0414961 .2066506 .4802429

maison detachee .4181527 .1938257 -.3123712 1.081235 3.342698 .1703991 2.732647 3.966824

maison jumelee .3187978 .2101844 -.428337 1.134953 1.666885 .1921929 .9313059 2.31641

piscine .139899 .097813 -.1882611 .4888396 1.156492 .0549364 .9445149 1.336969

dispoGaz -.2302352 .1106141 -.6818559 .1322343 -1.428966 .0612777 -1.657045 -1.233189

coutfix -.2062949 .2199587 -1.021684 .5147018 -2.486532 .1317468 -2.93668 -2.001063


Chapitre

6.

Analy

sede

ladem

ande

conditio

nnelle

:appro

che

bayesien

ne

229


tionnelle


coutm -1.124679 .2287656 -2.012711 -.2936653 -5.714736 .1114345 -6.140579 -5.238469

nbre Resid Aug .6835497 .1505822 .1140503 1.19972 3.929162 .0206121 3.861329 4.00886

age .1496158 .0331249 .0255302 .3102966 1.163346 .0186117 1.088789 1.232113

correcteur1 -.0026871 .014561 -.0623405 .0509988 -.0768471 .0172636 -.1419165 -.0185896

correcteur2 .0008973 .0146728 -.0525974 .0582592 .1700156 .0174634 .109775 .239759

correcteur3 -.1190988 .052989 -.2942762 .0630643 -.5947681 .0640375 -.7991508 -.346376

correcteur4 -.0797875 .0443514 -.2238057 .0923691 .1490336 .0367279 .0090355 .3007672

correcteur5 .0092462 .0458009 -.1708724 .1774694 -1.342013 .0552614 -1.560515 -1.138114

correcteur6 -.0263735 .0391128 -.1535638 .1216813 -.7545114 .0428243 -.9530813 -.5858495

correcteur7 .2429218 .1061439 -.1121451 .6052834 2.569295 .0308946 2.460853 2.684673

correcteur8 -.0264531 .0167171 -.0887928 .0352466 -.0399313 .0179092 -.1039357 .0182023

correcteur9 -.0144949 .015751 -.0650561 .0422789 .1594203 .0173819 .1034005 .2283756

cst 4.170694 1.255694 -.1191594 9.10605 25.44619 .5737589 22.99682 27.57408

h .0546871 .0003381 .0531751 .0558467

Fin du tableau


Sur la base des resultats du modele latent, nous pouvons directement deduire qu’il

s’agit precisement des parametres estimes de la probabilite que le menage se retrouve

dans la deuxieme classe. Nous remarquons aussi que tous les estimes sont statistique-

ment tres significatifs (au seuil de 1%).

L’estime du parametre de la variable surface (surf) est positif et significatif au seuil de

1%. Plus la surface habitee et chauffee est grande, plus la probabilite que le menage

soit dans la deuxieme classe est forte. Les grandes surfaces necessitent beaucoup plus

d’electricite que les petites.

Le fait d’avoir un systeme de climatisation augmente les chances d’etre dans la deuxieme

classe. Cela est logique puisque la climatisation necessite de l’electricite.

La variable revenu, qui a ete simulee par l’algorithme de l’augmentation des donnees,

a un estime de signe positif. Les menages qui ont un revenu eleve ont beaucoup plus

de chance de se retrouver dans la deuxieme classe. Un revenu relativement eleve donne

plus de latitude au menage dans ses choix de consommation comme l’achat d’appareils

de luxe (souvent energivores). Les menages qui sont le plus souvent dans la deuxieme

classe sont des menages relativement riches que les menages qui sont le plus souvent

dans la premiere classe.

La variable nombre de personnes a un estime de signe positif et statistiquement si-

gnificatif au seuil de 1%. Plus il y a de personnes dans le menage, plus la demande

d’electricite sera importante et plus il y aura de chance que le menage soit dans la

deuxieme classe.

Le fait que le menage soit dans la region de Montreal augmente ses chances d’etre dans

la deuxieme classe. Les menages qui vivent dans la region de Montreal ont peu acces au

bois et ils ont moins de systemes d’appoint que dans les autres regions. Par consequent,

la consommation d’electricite des menages de Montreal est relativement plus elevee que

celle des menages des autres regions.

Nous avons inclus dans le modele latent le type de systeme de chauffage utilise. Seule

la centrale a air chaud augmente les chances d’etre dans la deuxieme classe. Les autres

systemes ont des estimes de signe negatif indiquant qu’ils exigent relativement moins

d’electricite que les autres. Le systeme de convectair a une amplitude relativement plus

grande que les autres ; si le menage a un systeme de convectair, il a de tres fortes

chances d’etre dans la premiere classe. Le systeme de chauffage ne semble donc pas etre

un element determinant pour que le menage choisisse la deuxieme classe. Le chauffage de

l’espace ne peut donc pas a lui seul determiner si le menage est dans la deuxieme classe

ou non. Les systemes de chauffage residuels (n’ayant pas ete inclus dans le modele)

sont : le systemes de plinthes (electriques et non electriques), le systeme radiant a

rayonnement dans le plafond, la fournaise murale ou plancher et la fournaise a bois ou

a poele,... Precisons que nous avons garde les systemes de chauffages qui sont presents

dans toutes les enquetes, les enquetes les plus recentes ayant plus de systemes que les

autres.


Plus le nombre de refrigerateurs est important, plus cela augmente les chances d’etre

dans la deuxieme classe.

Le type d’habitation est egalement utilise pour determiner le choix de la classe : les mai-

sons detachees et les maisons jumelees3. Les maisons detachees affectent relativement

plus la probabilite d’etre dans la deuxieme classe. Les maisons detachees ne permettent

pas de faire des economies dans la consommation d’electricite. Cela s’explique par le

fait que les maisons detachees ont quatre murs tandis que les maisons jumelees n’ont

que trois murs. Les besoins en electricite seront donc plus importantes dans une maison

detachee que dans une maison jumelee.

La variable degres jours de climatisation (cdd) a un estime de signe negatif et significatif

au seuil de 1%. S’il y a une augmentation de cdd, cela indique qu’il fait plus chaud ; par

consequent, les menages n’ont plus besoin de l’electricite pour leurs besoins de chauf-

fage. La climatisation dans la province de Quebec est un phenomene assez recent et tres

peu de menages l’utilisent. Les menages sont habitues a chauffer leurs maisons plutot

qu’a les climatiser. Ainsi, une augmentation de cdd tend a amener le menage dans la

premiere classe.

La variable degres jours de chauffage (hdd) a un estime de signe negatif et signifi-

catif. Nous nous attendons plutot a un signe positif, car les degres jour de chauffage

necessitent de l’electricite.

Nous avons inclus les correcteurs de biais de selection dans le modele latent. Rap-

pelons que le choix de la classe est effectue en meme temps que le choix de la quantite

d’electricite a consommer (consommation journaliere). Par consequent, il faut considerer

la demande journaliere conditionnelle au choix du mode de chauffage. Tous les estimes

des correcteurs sont significatifs au seuil de 1%.

La constante est negative et significative au seuil de 1%. Cela signifie que si toutes les

variables sont fixees a zero, le menage aura moins de chance d’etre dans la deuxieme

classe. Ceci a du sens, en effet, un menage qui utilise juste l’electricite pour les besoins

de base sera dans la premiere classe et non la deuxieme, puisque sa consommation est

faible.

Interessons-nous a present aux estimes du modele de demande conditionnelle au

choix du mode et au choix de la classe. Remarquons tout d’abord que la plupart des

estimes sont statistiquement significatifs aux seuils usuels. Les estimes qui sont signifi-

catifs sont plus grands en valeur absolue dans la deuxieme classe que dans la premiere.

Cela signifie que les menages qui sont dans la deuxieme classe sont beaucoup plus sen-

sibles aux changements que ceux qui sont dans la premiere classe. Ainsi, les effets du

prix de l’electricite, du gaz naturel, du mazout et de la bi-energie sont plus importants

3La variable binaire exclue est celle des maisons individuelles en rangee attachees des deux cotes ;

ce type de maison a en fait moins de murs a chauffer que les deux autres.


dans la deuxieme classe que dans la premiere.

Si le prix marginal de l’electricite augmente, la demande d’electricite baissera da-

vantage dans la deuxieme classe que dans la premiere. Le tableau (6.4) presente les

elasticites prix et revenu de la demande. Si le prix marginal de l’electricite augmente de

1%, la demande d’electricite baissera de 0.1616% dans la premiere classe alors qu’elle

baissera de 0.4412% dans la deuxieme classe. Ainsi, si le prix augmente, les menages de

la deuxieme classe sont incites a economiser davantage l’electricite. Comme les menages

de la premiere classe economisaient deja, donc leur baisse sera moins importante. Souli-

gnons que les elasticites prix directes de l’electricite des deux classes sont significatives

au seuil de 1%. Le terme E-T dans le tableau (6.4) est utilise pour designer l’ecart-type

estime.

L’elasticite prix de la bi-energie est de -0.0443 pour la premiere classe et de -0.1875 pour

la deuxieme classe ; les deux etant statistiquement significatives au seuil de 1%. Comme

l’electricite, les menages de la deuxieme classe reagissent tres fortement a la hausse

du prix de la bi-energie 4 que les menages de la premiere classe. Pour les menages qui

sont au tarif DT, la bi-energie et l’electricite sont des complements. Dans la realite, le

menage peut utiliser une combinaison de ces deux formes d’energie ou l’une ou l’autre

dependamment du tarif choisi et de la temperature.

Si le prix du mazout augmente, tous les menages qui utilisent principalement le mazout

baisseront leur demande d’electricite, mais ceux de la deuxieme classe baisseront da-

vantage leur consommation. L’elasticite prix du mazout est de -0.0145 pour la premiere

classe (non significatif) et de -0.0975 pour la deuxieme classe (et statistiquement tres

significative au seuil de 1%). Il est probable que les menages qui sont souvent dans la

premiere classe n’utilisent pas le mazout comme source de chauffage. Il est aussi probable

que les menages qui sont dans la deuxieme classe et qui utilisent le mazout, l’utilisent

en combinaison avec l’electricite. Pour ces menages, le mazout est un complement pour

l’electricite.

Le gaz naturel a un effet positif sur la demande d’electricite. Si le prix du gaz naturel

augmente de 1%, la demande d’electricite des menages qui utilisent le gaz augmentera

de 0.032% dans la premiere classe et de 0.0732 dans la deuxieme classe. Le gaz naturel

est donc un substitut a l’electricite.

L’effet du revenu est beaucoup plus important dans la deuxieme classe que dans la

premiere. Une hausse du revenu de 1% entraıne une augmentation de la demande

d’electricite de 0.1384% dans la premiere classe et de 0.371% dans la deuxieme classe.

Les menages qui sont dans la deuxieme classe sont des menages riches ; une augmenta-

4Precisons que la tarification de la bi-energie n’est pas la meme pour tous les menages qui l’utilisent.

Il y a les menages qui sont au tarif D et ceux qui sont au tarif DT. Ces derniers ont un compteur

leur permettant de changer de l’electricite a une autre forme d’energie comme le gaz ou le mazout,

dependamment de la temperature. Le prix varie donc d’un tarif a l’autre.


tion du revenu leur permet de consommer plus.

Comme dans la partie latente, les variables cdd et hdd ont des estimes negatifs. On

pourrait penser que plus le nombre de degres jours de chauffage augmente (donc, plus

il fait tres froid durant l’hiver), plus les menages ont interet a utiliser une autre forme

d’energie que l’electricite pour leur besoins de chauffage. Plus le nombre de degres jours

de climatisation augmente (plus il fait tres chaud durant l’ete), moins les menages ont

besoin de chauffer leurs maisons, et donc leur demande d’electricite va baisser. Comme

nous l’avons souligne plus haut, la climatisation est un phenomene assez recent au

Quebec comparativement a d’autres regions du reste du monde ou les menages sont

plus habitues a climatiser leur maisons plutot qu’a les chauffer. Le signe de l’estime de

hdd n’est cependant pas le signe attendu.

La variable mode d’occupation affecte negativement la demande d’electricite, son effet

est significatif dans la deuxieme classe mais ne l’est pas dans la premiere. Ainsi, si le

menage est proprietaire, sa demande d’electricite sera importante et s’il est locataire,

sa demande sera relativement plus faible. Le menage proprietaire a beaucoup plus de

marge de manoeuvre que le menage locataire. Il est probable aussi que les menages

proprietaires soient le plus souvent dans la deuxieme classe.

La disponibilite du gaz naturel dans la zone affecte negativement et de facon significa-

tive la demande d’electricite ; cela a du sens car le gaz naturel est un bon substitut a

l’electricite.

La presence de piscine permanente affecte positivement la demande d’electricite a tra-

vers son moteur de chauffage. Durant les periodes froides, le menage chauffera sa piscine

et cela augmentera sa consommation d’electricite.

L’age affecte positivement et significativement la demande d’electricite. Plus l’age aug-

mente, plus la demande d’electricite augmente. Les personnes plus agees ont tendance

a etre le plus souvent a la maison, et en etant a la maison, ils doivent satisfaire a chaque

moment leurs besoins en energie tels que le chauffage ou la climatisation, l’eau chaude,...

Ce resultat concorde avec les resultats obtenus par Liao et Chang (2002) : selon eux,

aux Etats-Unis, la consommation d’energie augmente avec l’age et particuliere chez les

personnes agees. De plus, l’effet de l’age est dix fois plus grand dans la deuxieme classe

que dans la premiere. Les personnes agees qui sont dans la deuxieme classe consomment

dix fois plus d’electricite que les personnes agees qui sont dans la premiere classe. La

deuxieme classe tend a regrouper des menages relativement plus riches, de sorte que

les personnes agees de cette classe ont plus de marge de manoeuvre que les personnes

agees de l’autre classe.

L’effet du nombre de residents dans le menage est beaucoup plus important dans la

deuxieme classe que dans la premiere. Plus il y a de personnes dans le menage, plus la

demande d’electricite augmente et cette augmentation sera plus importante si le menage

est dans la deuxieme classe.

Les variables binaires relatives au type de systeme de chauffage utilise ont des coeffi-


cients qui sont significatifs dans la deuxieme classe mais ne le sont pas dans la premiere

classe. Les systemes de plinthes affectent negativement la demande d’electricite des

menages de la deuxieme classe. Les thermopompe et les centrales a eau chaude af-

fectent positivement la demande.

L’estime du nombre de refrigerateurs n’est pas significatif dans la premiere classe mais

l’est dans la deuxieme classe. Plus il y a de refrigerateurs dans la maison, plus la consom-

mation du menage de la deuxieme classe sera importante.

Nous avons inclus les variables cout moyen (ou cout d’operation) et cout fixe comme

cela a ete fait dans les travaux de Dubin et McFadden (1984). La demande d’electricite

est definie comme etant une fonction du revenu net qui se decompose en revenu, en

couts fixes et en couts d’operation. Nous nous attendons a ce que les coefficients des

deux couts soient negatifs. L’estime de la variable cout fixe (coutfix) n’est pas signifi-

cative dans la premiere classe mais l’est dans la deuxieme classe. Les estimes des deux

coefficients des deux classes sont tous de signe negatif, ce qui repond a nos attentes.

La variable cout moyen (coutm) est significative dans les deux classes et de signe negatif.

Cela repond aussi a nos attentes etant donne que ces couts interviennent de facon

negative dans la fonction de demande.

Les variables maison detachee et jumelee affectent positivement la demande d’electricite

et ceci est d’autant plus important si le menage est dans deuxieme classe. Dans les deux

classes, l’on note que l’effet de la variable maison detachee est plus important que celui

de la variable maison jumelee ; cela s’explique par le fait que les maisons detachees ont

quatre murs a chauffer tandis que les maisons jumelees n’ont que trois.

La constante est positive et significative au seuil de 1% dans les deux classes ; elle est

cinq fois plus grande dans la deuxieme classe que dans la premiere. Si toutes les autres

variables sont fixees a zero dans les deux classes, alors la consommation de base moyenne

serait approximativement de 4.170 (multiplie par 1000) dans la premiere classe et de

25.4462 (multiplie par 1000). Pour les besoins de base (eclairage, fonctionnement d’ap-

pareils electromenagers,...), un menage de la deuxieme classe consommerait plus de six

fois ce qu’un menage de la premiere classe consomme. En somme, la deuxieme classe est

composee de grands consommateurs et la premiere est composee de menages economes

en terme de consommation d’electricite.

Les estimes des variables binaires specifiques aux differents systemes de chauffage 5 sont

tous significatifs dans la deuxieme classe, mais ne le sont pas dans la premiere classe.

Tous les correcteurs de biais de selection sont significatifs au seuil de 1% dans la

deuxieme classe. Dans la premiere classe, seul les correcteur3 et correcteur7 sont signi-

ficatifs. Probablement les menages qui sont dans la premiere classe utilisent la modalite

5Nous les avons inclus pour remplacer les variables binaires specifiques aux differentes modalites.

Bernard, Bolduc et Belanger (1996) ont inclus 8 des 9 variables binaires dans leur modele. Dans notre

cas, leur inclusion n’a pas ameliore les resultats, certainement a cause de leur nombre plus eleve (soit

16 pour les deux classes).


3 (bi-energie/electricite) et 7 (electricite/electricite). Ces deux modalites sont parmi les

moins cheres aussi, confirmant que la premiere classe est principalement composee de

menages a faibles revenus. Il est donc important d’inclure dans l’equation de demande

les correcteurs de biais de selection du choix du mode de chauffage.

Les graphiques de convergence montrent la convergence des differents tirages des

estimes des parametres6. Nous avons exclus les 10% premieres valeurs simulees afin de

permettre a l’algorithme de ne pas dependre des valeurs de depart. L’allure de tous

les graphiques (moyenne en fonction du nombre de tirages) indiquent que les valeurs

simulees convergent vers la moyenne des tirages.

Nous avons aussi estime le modele de demande conditionnelle au choix du mode en

ne tenant pas compte des deux classes. Le tableau (6.3) presente le modele de demande

qui ne corrige pas pour l’endogeneite du prix marginal. Les signes des coefficients sont

pour la plupart les memes que dans le modele avec les deux classes. En general, le modele

sans classe tend a surestimer les valeurs des parametres du modele de la premiere classe

et a sous-estimer les valeurs de ceux de la deuxieme classe. De plus, nous remarquons

que tous les correcteurs sont statistiquement tres significatifs au seuil de 1%, indiquant

que la correction pour le biais de selection est importante.

Enfin, nous notons que la constante est negative et n’est pas significative. Cela

pose un probleme puisque la constante representerait la consommation de base. Nous

concluons donc que l’estime de la constante est biaise.

En somme, en ne prenant pas en compte l’endogeneite du prix marginal de l’electricite,

les estimateurs obtenus sont biaises et non convergents. Les elasticites prix du gaz na-

turel, du revenu, de hdd et de cdd du modele sans classe sont superieures a celles des

deux classes.

Tab. 6.3: Modele statique sans classes

Variables Moyenne Ecart-type Min Max

prixelec -1.858805 .0366465 -1.990745 -1.739214

prixbie -.6668927 .0341371 -.7943268 -.5428016

prixgn .1774433 .0106191 .1369859 .2123366

prixm -.1380657 .0264551 -.2467523 -.0467931

rev Aug 1.766807 .0111111 1.722506 1.811354

cdd -1.444081 .044749 -1.600038 -1.254171


6Par soucis d’economie d’espace, nous presentons uniquement les graphiques de convergence du

modele dynamique. Mais les graphiques non presentes pourront etre fournis sur demande.


Tab. 6.3: Modele statique sans classes


hdd -1.208912 .0563343 -1.402946 -.9914814

mode occupation -.5140094 .0458912 -.6746259 -.350204

syst plinthes -.4702281 .0501512 -.6378653 -.2728448

syst airChaud .002845 .0799517 -.3323804 .2728628

syst eauChaude .5864748 .123691 .1653239 1.035077

syst thermopompe .7109346 .1158087 .2957682 1.12017

syst convectair .4018328 .0958389 .0600707 .7360938


maison detachee 2.803689 .1178807 2.405132 3.203869

maison jumelee 1.264936 .1344148 .7950717 1.783507

piscine 1.015965 .0469672 .8548229 1.188509

dispoGaz -1.361034 .0517185 -1.528609 -1.1537

coutfix -1.867666 .1094554 -2.25613 -1.461878

coutm -5.420183 .0952334 -5.774654 -5.081071

nbre Resid Aug 3.75022 .0190652 3.670795 3.825747

annee construction .0134284 .0010198 .0098689 .0172582

conversion .0257835 .0592395 -.2066023 .232305

age 1.037727 .0156256 .9735566 1.096695

correcteur1 -.0363413 .0104148 -.073947 .0050332

correcteur2 .1075181 .0100499 .0654195 .140389

correcteur3 -.7338775 .0347861 -.8884758 -.5975106

correcteur4 -.1662372 .0256761 -.2544493 -.0675511

correcteur5 -.8776007 .0293778 -.9702761 -.7614997

correcteur6 -.5379632 .0236715 -.6269385 -.4509554

correcteur7 2.414071 .0262857 2.318467 2.501372

correcteur8 -.1048734 .0104196 -.1395488 -.0641181

correcteur9 .0309633 .0104774 -.0053672 .0699891

cst -1.114514 2.121796 -9.246691 6.616562

h .0545151 .0003345 .0533674 .0558131

Fin du tableau


Tab. 6.4 – Elasticites du modele statique

Elasticites Classe1 Classe2 Sans classe

prixelec -0.1616 -0.4412 -0.4283

E-T (0.0509) (0.0099) (0.0084)

prixbie -0.0443 -0.1875 -0.1736

E-T (0.0221) (0.0102) (0.0089)

prixgn 0.0320 0.0732 0.0973

E-T (0.0167) (0.0048) (0.0058)

prixm -0.0145 -0.0975 -0.0670

E-T (0.0385) (0.0132) (0.0134)

rev 0.1384 0.3710 0.4020

E-T (0.0375) (0.0024) (0.00025)

cdd -0.0541 -0.1069 -0.1151

E-T (0.0223) (0.0039) (0.0036)

hdd -0.1314 -0.2358 -0.2771

E-T (0.0868) (0.0137) (0.0129)

6.6 Estimation d’un modele de demande dynamique

Nous avons estime dans la section precedente un modele de demande statique.

Dans cette section, nous faisons une extension de l’approche utilisee au modele de

demande dynamique. Il est tout a fait raisonnable de penser que la consommation de

la periode courante est reliee a la consommation de la periode precedente, surtout que

les menages utilisent les memes systemes de chauffage pour plusieurs annees. Comme

dans le modele statique ou nous avons corrige le probleme de biais de selection et le

probleme d’endogeneite du prix, dans le modele dynamique, nous corrigerons aussi ces

memes problemes. Rappelons que Hydro-Quebec utilise la meme forme de tarification

(de 1989 a 2002, periode de notre etude). Une redevance quotidienne est egalement

fixee pour tous, peu importe la quantite consommee. Ces prix par tranche peuvent va-

rier d’une annee a l’autre , de meme que la redevance. Mais entre Mai 1998 et Avril

2004, Hydro-Quebec a gele ses tarifs en les gardant au niveau de Mai 1998. Comme

dans le cas du modele statique, nous utiliserons l’approche bayesienne pour augmenter

les donnees et simuler les parametres.

Le modele de demande d’electricite conditionnelle au choix du mode de chauffage


et au choix de la classe de consommateur peut s’ecrire comme suit :

yjnt = asy∗jnt−1 + xntδs + xjnλs + ϑn + εjnt s = 1, 2

ϑn ∼ N(0, σ2

ϑ

)εjnt ∼ N

(0, σ2

ε

)

yjnt =

a1y

∗jnt−1 + xntδ1 + xjnλ1 + ϑn + εjnt si y∗

jnt ≤ 0

a2y∗jnt−1 + xntδ2 + xjnλ2 + ϑn + εjnt si y∗

jnt > 0(6.18)

yjnt =

Xjntβ1 + ϑn + εjnt si y∗

jnt ≤ 0

Xjntβ2 + ϑn + εjnt si y∗jnt > 0

, (6.19)

avec : y∗jnt−1 la demande d’electricite du menage n a la periode precedente (information

non disponible), xjnt est un vecteur de variables exogenes qui varient dans le temps, et

xjn est un vecteur de variables exogenes invariantes dans le temps (ce vecteur contient

aussi les correcteurs de biais de selection du choix du mode de chauffage). L’indice s

indique la classe du menage, le terme ϑn est un effet individuel aleatoire que nous suppo-

sons normal. Nous avons ajoute l’indice j parce qu’il s’agit de la demande conditionnelle

au choix du mode. Cette demande conditionnelle se traduit par la presence des correc-

teurs de biais de selection, qui dependent de la modalite choisie par le menage. Nous

avons egalement regroupe toutes les variables explicatives (y compris la dependante

retardee) ensemble sous Xn =(XnD

(1)n XnD

(2)n

)et le vecteur de parametres corres-

pondant est β = [a1, a2, δ1, δ2, λ1, λ2]. Le modele de demande dynamique peut s’ecrire

en matriciel sous la forme de l’equation (6.11) comme dans le cas statique.

L’estimation des modeles de panels dynamiques (avec N −→ ∞ et T fixe) necessite

la prise en compte d’effets aleatoires ; les effets fixes ne sont pas appropries puisqu’ils

rendraient les estimateurs biaises ( Nickell (1981) et Lee (2000) pour une demonstration

detaillee). Avec l’approche bayesienne, ce choix ne se pose pas, puisqu’on suppose que

tous les parametres suivent une loi a priori donnee.

Par ailleurs, on sait que le traitement des premieres observations de la variable

dependante (yjn0, n = 1, ...N, j ∈ Cn) joue un role important dans la procedure d’esti-

mation ; dans les ecrits anterieurs, on parle souvent de conditions initiales. Les methodes

d’estimation (telle que le maximum de vraisemblance) qui supposent que y0 est exogene

donnent des estimateurs qui pourraient etre biaises. Bhargava et Sargan (1983) ont

suggere de prendre la premiere observation comme une variable endogene qui serait

reliee aux effets individuels. Ils estiment ensuite les parametres du modele par la

methode du maximum de vraisemblance en information limitee. D’autres auteurs ont

utilise leur approche, comme Chamberlain (1984), Blundell et Smith (1991). Il existe

d’autres methodes pour le traitement des conditions initiales (Lee (2000) donne une

synthese des differents travaux qui ont porte sur ce sujet et propose aussi une autre

approche basee sur celle de Wooldridge (2000) dans le cadre de vrais panels). L’ap-


proche de Bhargava et Sargan (1983) semble plus appropriee a notre probleme. Nous

supposons que la premiere observation est definie en fonction de variables exogenes de

la facon suivante :

yjn0 = a0 +T∑

t=0

K1∑

k=1

∑

j∈Cn

akxkjnt +

K2∑

k=1

bkxkjn + εjn0, (6.20)

avec K1 le nombre de variables exogenes qui varient avec le temps et K2 le nombre de

variables exogenes invariantes dans le temps, j etant toujours la modalite choisie par le

menage n, et Cn indique le nombre total de modalites disponibles pour le menage. Le

terme d’erreur est suppose suivre une loi normale.

Lorsqu’on traite de panels dynamiques, la question de savoir si les series sont sta-

tionnaires ou non est essentielle lorsqu’on utilise une approche classique. Si le processus

generateur d’une variable n’est pas stationnaire, il n’est pas possible de deriver la fonc-

tion de vraisemblance des observations. Cependant, avec l’approche bayesienne, le fait

qu’une serie ou variable soit ou non stationnaire n’a aucune importance. Les estimateurs

peuvent etre obtenus sans avoir a imposer de restrictions de stationnarite. Nandram et

Petrucelli (1997) ont montre qu’imposer faussement l’hypothese de stationnarite a une

serie qui ne l’est pas en realite causerait un biais dans l’estimation. L’echantillonnage

de Gibbs permet d’estimer les parametres, que les variables soient stationnaires ou non.

Selon les memes auteurs, on peut estimer les parametres par l’approche bayesienne

sans avoir a conditionner sur les variables dependantes passees (conditionner sur tous

les ynt−p, si on a un AR(p)). Il suffit de tenir compte de la condition d’initialisation

dans la procedure d’estimation ; l’initialisation porte en effet sur y0 defini a l’equation

(6.20).

6.6.1 Etapes additionnelles : simulation de yt−1 et de y0

L’estimation du modele de demande d’electricite conditionnelle au choix du mode

et au choix de la classe se fera suivant la meme demarche utilisee pour le modele

statique, avec quelques etapes additionnelles. En plus des etapes suivies dans le cadre

du modele statique, nous devons ajouter deux autres etapes supplementaires. Cette

section comporte plusieurs parties : l’initialisation qui permet de simuler les premieres

observations (yn0), ensuite la simulation des exogenes manquantes, puis la simulation de

la variable dependante et enfin la simulation de la dependante retardee. Nous indicons

les variables par m pour indiquer qu’il s’agit de donnee manquante. Nous utilisons

l’algorithme de l’augmentation des donnees pour completer les donnees manquantes.


Etape 0 : simulation de yj0(m)

L’equation (6.20) servira a simuler les conditions initiales, conditionnellement aux

variables exogenes et aux parametres du modele. En imposant l’hypothese de normalite

du terme d’erreur, cela permet de simuler les observations initiales de la facon suivante :

yj0(m) ∼ N(µy0, σ

2ε

)n = 1, ....N j ∈ Cn,

etant donne µy0 = E(y0(m)) et σ2ε de l’equation (6.20).

Etape 1bis : Simulation de yjt−1(m)

Nous savons que meme avec de vraies donnees de panel, il faut instrumenter la va-

riable dependante retardee pour avoir des estimateurs convergents (Anderson et Hsiao

(1981), Moffit (1993)). Pour cette raison, nous supposerons que la dependante retardee

est definie en fonction d’un certain nombre de variables explicatives variantes dans le

temps et invariantes dans le temps (approche utilisee par Moffit (1993) dans le cadre de

pseudo-panels de cohortes). Nous supposons que la variable dependante de la premiere

periode (soit yn0) est connue. Conditionnellement a yn0, on peut simuler yt−1(m). Sup-

posons que :

yjt−1(m) = Wjt−1(m)α1 + Wj(m)α2 + εjt−1(m)

Wjt−1(m) etant un vecteur de variables variantes dans le temps et Wj(m) est un vecteur

de variables invariantes dans le temps. En supposant que les W sont donnes, si les autres

parametres du modele sont connus, et si le terme d’erreur suit une normale, alors il est

possible de faire des tirages de yjt−1(m) a partir d’une normale :

yjt−1(m) ∼ N(Wjt−1(m)α1 + Wj(m)α2, σ

2ε

).

Les valeurs de la variable dependante retardee seront simulees en tenant compte des

deux classes. Les autres etapes qui restent sont les memes que dans le modele statique.

Nous simulerons les exogenes comme a l’etape (2) du modele statique. Dans la partie

estimation des parametres, les etapes (4 a 10) seront repetees ici egalement avec une

legere modification a l’etape (4) pour l’estimation du vecteur des parametres β. A cette

etape, nous inclurons les parametres a1 et a2 qui sont les coefficients de la dependante

retardee de la classe 1 et 2 respectivement. Il n’y a aucune autre modification a apporter

dans les autres etapes.


6.6.2 Resultats et interpretation

Les resultats de l’estimation du modele de demande dynamique sont presentes au

tableau (6.8). Precisons que le premier bloc represente les estimes des parametres de la

probabilite d’etre dans la deuxieme classe, il s’agit donc des estimes du modele latent.

Le deuxieme bloc (reparti entre les deux classes) represente les estimes du modele de

demande conditionnelle au choix de la classe et au choix du mode de chauffage.

Nous remarquons que tous les estimes du modele de choix de la classe sont tres si-

gnificatifs (au seuil de 1%). Plus la surface de l’habitation est grande, plus la probabilite

que le menage soit dans la deuxieme classe est forte. Les grandes maisons necessitent

beaucoup plus d’energie. Les maisons de type detachees et jumelees affectent positi-

vement la probabilite d’etre dans la deuxieme classe 7. Les menages qui utilisent un

systeme de chauffage thermopompe ou un systeme de chauffage convectaire ont moins

de chance d’etre dans la deuxieme classe. La climatisation de la maison affecte positive-

ment la probabilite d’etre dans la deuxieme classe. Le nombre de refrigerateurs affecte

positivement la probabilite d’etre dans la deuxieme classe.

La variable binaire specifique a la region de Montreal a un estime de signe positif et

significatif au seuil de 1%. La region de Montreal regroupe pas mal de consommateurs

de la deuxieme classe. Cela vient du fait que les menages habitant cette region ont tres

peu de flexibilite quand au choix des systemes de chauffage que les menages des autres

regions. Par exemple les systemes d’appoint ou le bois, qui permettent de reduire la

consommation d’electricite, leurs sont peu accessibles.

La variable revenu a un estime de signe positif. Plus le revenu du menage est eleve,

plus il aura de chance d’etre dans la deuxieme classe. Donc, les menages riches sont ceux

qui consomment le plus d’electricite. Un menage pauvre aura plus de chance d’etre dans

la premiere classe. La variable nombre de personnes dans le foyer affecte positivement

la probabilite d’etre dans la deuxieme classe. Plus il y a de personnes dans le menage,

plus les besoins en electricite augmentent et plus la probabilite que le menage soit dans

la deuxieme classe augmente.

L’estime de la variable degres-jours de chauffage (hdd) a le bon signe et est significatif

au seuil de 1%. Plus hdd augmente, indiquant qu’il fait plus froid, plus les besoins de

chauffage augmentent et plus la probabilite que le menage soit dans la deuxieme classe

augmente.

7La variable binaire que nous avons exclus du modele est celle des maisons individuelles en rangee,

attachees des deux cotes. Avec ce type de maison, le nombre de murs a chauffer est inferieurs (2) a ces

ces autres types d’habitation.


La variable degres jours de climatisation (cdd) a un estime de signe negatif et signi-

ficatif au seuil de 1%. Plus cdd augmente, indiquant qu’il fait chaud, moins les menages

de la province chauffent leurs maisons. Comme souligne precedemment, le phenomene

de climatisation est assez recent dans la province et le chauffage est une activite plus

courante, a cause des conditions climatiques de la province.

Nous remarquons, qu’a l’exception des correcteurs, les estimes les plus grands en

valeur absolue sont ceux du nombre de personnes dans le foyer, le revenu, le type d’ha-

bitation et les degres jours de chauffage. Plus les valeurs de ces variables augmentent,

plus la probabilite que le menage se retrouve dans la deuxieme classe est forte. En

d’autres mots, les familles riches, celles qui sont nombreuses, celles qui ont de grandes

maisons et celles qui ont des maisons detachees ou jumelees sont celles qui sont le

plus souvent dans la deuxieme classe et donc celles qui consomment le plus. Les hivers

rudes ou les regions les plus froides augmentent les chances des menages d’etre dans la

deuxieme classe.

La constante est negative, signifiant que si toutes les autres variables sont fixees a

zero, le menage aura moins de chance d’etre dans la deuxieme classe. Les correcteurs

de biais de selection sont aussi tous significatifs ; donc la correction pour le biais de

selection est tres importante dans le modele de choix de la classe.

En ce qui concerne les estimes du modele de demande conditionnelle aux deux choix

(mode de chauffage et classe), nous remarquons que les estimes des variables de la

deuxieme classe sont tous superieurs en valeurs absolues a ceux de la premiere classe,

indiquant que les menages de la deuxieme classe classe sont beaucoup plus sensibles

aux changements que ceux de la premiere classe.

L’effet marginal du prix marginal de l’electricite (prixelec) est negatif et significatif

au seuil de 1% dans les deux classes. Plus le prix marginal de l’electricite augmente,

plus la demande d’electricite baisse et cette baisse est plus importante dans la deuxieme

classe que dans la premiere. L’effet du prix de la bi-energie (prixbie) est negatif et

significatif seulement dans la deuxieme classe. La bi-energie n’explique pas la demande

d’electricite de la premiere classe. L’effet marginal du prix du gaz naturel (prixgn)

est positif et significatif dans les deux classes. Plus le prix du gaz naturel augmente,

plus la demande d’electricite augmente dans les deux classes, et cette augmentation

est d’autant plus forte que le menage est dans la deuxieme classe. Le gaz naturel et

l’electricite sont donc des biens substituts. Pour les deux classes, le prix du mazout

(prixm) n’explique pas significativement la demande d’electricite.

L’effet marginal du revenu (rev Aug) est positif et significatif seulement a 10% dans


la premiere classe, et tres significatif (1%) dans la deuxieme classe. Plus le revenu

augmente, plus la demande d’electricite augmente dans les deux classes, augmentation

plus forte dans la deuxieme classe que dans la premiere.

La variable degres jours de chauffage (hdd) a un estime positif significatif au seuil

de 1% dans les deux classes. Plus il fait froid (periodes hivernale, ou dans les regions

les plus froides), plus la demande d’electricite augmente, et cette hausse est beaucoup

plus importante dans la deuxieme classe que dans la premiere.

L’effet de la variable degres jours de climatisation (cdd) n’est pas significatif dans la

premiere classe, mais est significatif a 10% dans la deuxieme classe. Pour cette derniere

classe, plus cdd augmente, plus il fait chaud, moins les menages utilisent l’electricite

pour leurs besoins de chauffage.

L’effet marginal de la variable mode d’occupation est negatif et significatif seulement

dans la deuxieme classe. Rappelons que cette variable est codee de 1 a 3, le 1 pour

proprietaire, 2 pour coproprietaire et 3 pour locataire. Ainsi, les locataires consomment

moins d’electricite tandis que les proprietaires en consomment plus dans la deuxieme

classe. Cela s’explique par le fait que les proprietaires ont beaucoup plus d’appareils

que les locataires.

Le choix des systemes de chauffages n’explique pas significativement la demande

d’electricite des menages de la premiere classe, mais leurs effets sont significatifs dans

la deuxieme classe. Le type d’habitation affecte positivement la demande d’electricite :

la maison de type detachee a un effet plus important que la maison jumelee, pour toutes

les classes. Cela s’explique pour le fait que la maison detachee a quatre murs a chauffer

tandis que la maison jumelee n’en a que trois. L’effet marginal de la maison jumelee

n’est cependant pas significatif dans la premiere classe. Dans cette derniere classe, les

menages habitent certainement plus les maisons jumelees.

La piscine n’explique pas significativement la demande d’electricite de la premiere

classe, mais son effet est significatif au seuil de 1% et positif dans la deuxieme classe.

La presence de piscine, a travers la chauffe-piscine, necessite de l’electricite.

L’effet marginal des variables cout fixe (coutfix) et cout moyen (coutm) sont negatifs

dans les deux classes, celui du cout fixe n’etant pas significatif dans la premiere classe.

Les couts affectent negativement la demande d’electricite, cela resulte meme de la for-

mule de l’equation de demande. La disponibilite du gaz naturelle dans la zone d’habi-

tation affecte negativement et de facon significative la demande d’electricite.


Le nombre de residents (nbre residents) a un effet marginal positif et significatif

au seuil de 1% dans les deux classes. Plus il y a de personnes dans le menage, plus

la demande d’electricite augmente. L’age affecte positivement et de facon significative

la demande d’electricite. Plus l’age augmente, plus la demande d’electricite augmente,

augmentation plus forte dans la deuxieme classe que dans la premiere. Cela vient du fait

que les personnes agees restent le plus souvent a la maison, donc elles doivent chauffer

le plus souvent leurs maisons durant les periodes froides, ou les climatiser durant les

periodes chaudes de l’annee.

Pour la deuxieme classe, presque tous les estimes des variables sont statistiquement

significatives au seuil de 1%, a l’exception de celui de la variable prix du mazout. Tous

les estimes des correcteurs (sauf celui du correcteur8) sont statistiquement significatifs,

indiquant que la correction pour le biais de selection est necessaire pour cette classe.

La correction n’est cependant pas necessaire pour la premiere classe.

Dans le modele dynamique, la difference avec le modele statique est principalement

la presence de la variable endogene retardee notee Lcons anAug. La consommation de la

periode precedente etant une donnee non disponible, nous l’avons simulee en utilisant

l’algorithme de l’augmentation des donnees. L’estime de la dependante retardee est

positif (signe attendu) et significatif au seuil de 1% pour la deuxieme classe tandis

qu’il est negatif et non significatif dans la premiere classe. Selon la seconde loi de la

demande, l’estime de la consommation de la periode precedente devrait etre positif de

sorte a permettre que les elasticites de court terme soient plus faibles que celles de long

terme. Dans le contexte de la demande d’electricite residentielle, les changements de

prix entraınent des changements de la demande a court terme mais des changements

plus importants a long terme. Les menages peuvent a court terme reduire un peu leur

demande, mais a long terme, ils choisiront un systeme de chauffage qui est relativement

moins couteux. Pour la deuxieme classe, le signe de l’estime de la consommation retardee

permet de confirmer cette loi. De plus, nous remarquons que pour la premiere classe, son

estime est tres faible tout en etant non significatif. Pour cette classe, la consommation

retardee n’explique pas de facon significative la consommation courante. Si les menages

de la deuxieme classe, qui sont les plus sensibles aux variations, ont des changements

de long terme qui ne sont pas tres differents de ceux de court terme (l’effet marginal

de la consommation retardee etant tres faible : 0.033), il est tout a fait raisonnable que

les menages de la premiere classe ne reagissent pas plus a long terme qu’a court terme.

Pour la premiere classe, il se pourrait que les changements de long terme ne soient pas

statistiquement plus importants que les changements de court terme, et donc a la limite,

il n’y aurait pas plus de changements a long terme qu’a court terme. Cela a du sens

puisque si ces menages utilisent la quantite d’energie juste necessaire pour satisfaire

leur besoins, ils ne pourront pas baisser leur consommation plus qu’un seuil donne dans


le long terme, lorsque certains changements se produisent (comme la hausse du prix de

l’electricite).

Il est important de noter egalement que la consommation d’electricite au Quebec a

une certaine particularite. D’abord, La province de Quebec est une grande productrice

d’hydro-electricite. Sa production represente environ 50% de la puissance installee au

Canada en terme d’hydro-electricite. Le prix de l’electricite au Quebec est aussi parmi

les plus bas au monde. En 2002, le Quebec etait le deuxieme plus grand consomma-

teur d’electricite au monde derriere la Norvege avec une consommation moyenne de 27

207 kWh par habitant, et en 2003, Quebec etait premier au monde. La consommation

d’electricite par habitant au Quebec est restee relativement stable durant la majeure

partie des annees 1990. Apres une chute de 7% en 1998 (suite a une baisse du prix du

mazout), la consommation d’electricite a connu des hausses. Ces hausses s’expliquent

principalement par l’augmentation de la competitivite des prix de l’electricite compa-

rativement aux prix du mazout leger et du gaz naturel. Les prix de ces energies ont

beaucoup grimpe depuis 1998 avec comme consequence une hausse d’environ 20% de la

consommation d’electricite (entre 1998 et 2003). Entre Mai 1998 et Avril 2004, Hydro-

Quebec avait gele ses prix, les gardant au niveau de Mai 1998. Le tableau (6.5) presente

la tarification d’hydro-Quebec de quelques annees, nous ne presentons que le tarif D

qui est le tarif le plus utilise pour les menages. Le tableau 6.6 compare le prix moyen

de l’electricite par rapport au prix moyen des autres formes d’energies dans la province.

Enfin, le tableau 6.7 compare le prix de vente moyen de l’electricite au Quebec par

rapport a quelques pays industrialises. On constate que dans la province de Quebec,

l’electricite n’est pas vendue a son cout d’opportunite, elle est vendue a un prix beau-

coup plus bas. Cela pourrait expliquer pourquoi l’effet marginal la dependante retardee

est relativement faible, traduisant de faibles changements dans le long terme pour la

deuxieme classe. Les menages n’ont pas vraiment interet a changer leurs systemes de

chauffage au profit d’autres formes d’energies que l’electricite, puisque cette derniere

est vendue a un prix tres competitif.

Nous avons exclus la constante du modele de demande conditionnelle. Comme nous

avons un modele dynamique, il est possible de ne pas inclure la constante dans le modele

si elle n’est pas pertinente. Nous avions estime le meme modele avec une constante et

les estimes de la dependante retardee des deux classes etaient de signe negatif, ce qui

n’est pas theoriquement justifiable. Pour cette raison, nous avons estime le modele sans

constante et les resultats sont plus satisfaisants.

Les graphiques (6.1 et 6.14) montrent la convergence de tirages des differents es-

timateurs des parametres. Nous avons prefere ne presenter que quelques graphiques

pour economiser de l’espace. Les autres graphiques pourront etre fournis sur demande.


Tab. 6.5 – Tarif D de quelques anneesannee redevance p1 p2

1989 31.70 3.76 4.46

1993 37.60 4.51 5.46

1994 37.70 4.54 5.54

1996 37.90 4.59 5.79

1997 38.50 4.66 5.88

1998-2002 4.74 5.97

Tab. 6.6 – Prix moyens en dollars constant

annee Electricite Gaz naturel Mazout IPC

1989 5.22 13.20 32.46 89.02

1994 5.69 12.83 35.69 102.00

1999 5.75 12.57 33.45 110.32

2002 5.14 14.33 40.49 118.55

Tab. 6.7 – Comparaison prix de vente moyen avec pays industrialisesannee Qc USA France RU Norvege Allemagne Australie

2001 6.2 13.1 12.0 14.9 6.9 16.5 8.8

2002 6.1 13.3 12.9 15.7 3.8 18.3 9.7


Comme dans le modele statique, les autres tirages convergent toutes vers la moyenne

des tirages.

Nous avons aussi estime le modele de demande sans les deux classes, il s’agit de l’es-

timation faite habituellement si on ne corrige pas pour l’endogeneite du prix marginal.

Les resultats sont presentes au tableau (6.9). Nous remarquons que tous les estimes qui

sont statistiquement significatifs ont les memes signes que dans le modele avec classes.

L’effet marginal de la dependante retardee (qui est egal a 0.61 et significatif au seuil

de 1%) est beaucoup plus important que les effets obtenus pour les deux classes : il

vaut plus de 18 fois celui de la deuxieme classe. Le modele sans classe surestime donc

le coefficient d’ajustement de long terme des menages. Avec ce modele, les ajustements

des menages sont les memes peu importe la quantite qu’ils consomment. Ce modele

ne corrige pas pour l’endogeneite du prix marginal de l’electricite, par consequent les

estimateurs qui en decoulent sont biaises et non convergents.

Comme nous pouvons le remarquer, l’approche par la simulation donne des resultats

satisfaisants tant du cote du modele statique que du cote du modele dynamique, avec

et sans la correction de l’endogeneite. Tous les graphiques indiquent la convergence des

tirages. Cette approche a ete utilisee par Bernier-Martel (2003) et Vidal (2006) pour

l’estimation de modeles a variable dependante discrete (estimation du choix du mode

de transport), mais les resultats qu’ils ont obtenus n’etaient pas satisfaisants (probleme

de convergence).

Chapitre

6.

Analy

sede

ladem

ande

conditio

nnelle

:appro

che

bayesien

ne

248

Tab. 6.8: Resultats du modele dynamique de demande condi-

tionnelle


Modele latent

surf .8053653 .0057747 .7866445 .8254184

syst plintes .412864 .0111871 .3768592 .4498259

syst airChaud .8265344 .0162922 .767087 .8790817

syst eauChaude .4010582 .0248429 .3178867 .4911104

syst thermopompe -.1062571 .0181284 -.1770167 -.0450317

syst convectair -1.222884 .0220832 -1.298967 -1.132012


maison detachee 5.268571 .0258582 5.170697 5.362463

maison jumelee 2.319284 .0303369 2.215795 2.444474

climatiseur central .4902232 .0217813 .4237933 .5722097

climatiseur fenetre .3695003 .0152668 .312193 .4277806

correcteur1 .1016286 .0023776 .0936277 .1094283

correcteur2 .3928439 .0023229 .3850721 .4011269

correcteur3 -1.267888 .0079403 -1.294028 -1.23907

correcteur4 .3996153 .0055558 .3791714 .4176137

correcteur5 -2.251663 .0065907 -2.278672 -2.22806

correcteur6 -1.642364 .005544 -1.663225 -1.620412

correcteur7 4.908011 .0051466 4.892428 4.928285

correcteur8 -.178237 .00251 -.1876499 -.16814

correcteur9 -.0513887 .002464 -.0595561 -.0430866

montreal .4141185 .0211552 .3286342 .498473

nbre Resid Aug 5.655535 .004292 5.638442 5.670697


Chapitre

6.

Analy

sede

ladem

ande

conditio

nnelle

:appro

che

bayesien

ne

249


tionnelle


rev Aug 2.391379 .0024557 2.383291 2.398927

hdd 1.931895 .0117357 1.887139 1.972222

cdd -.2079282 .0104431 -.2461303 -.1726781

cst -16.61547 .0778904 -16.89345 -16.32256

Classe1 Classe2

Lcons anAug -.0137221 .0098202 -.0518959 .0209906 .0329621 .0119482 -.0097334 .0724392

prixelec -.1531998 .0636947 -.3982412 .0940642 -1.13323 .039647 -1.287637 -1.002575

prixbie -.0574677 .0629993 -.3026415 .1665241 -.4755445 .0416098 -.6138941 -.3102421

prixgn .0509807 .0238979 -.0410404 .1382281 .1083917 .0121017 .0663643 .1523161

prixm -.00554 .0540338 -.2418853 .201996 .0054699 .0315163 -.1114016 .1330733

rev Aug .1155362 .0596164 -.1049657 .3171176 1.714152 .0120906 1.671236 1.754156

hdd .2192763 .0698995 -.0188201 .4834838 1.139081 .0408709 .9699029 1.270505

cdd .0436296 .0716954 -.2155777 .3025586 -.0793391 .0437973 -.2665749 .0682747

mode occupation .004915 .0832216 -.2665778 .3223797 -.1238893 .0563731 -.3489133 .0914745

syst plinthes -.0216401 .138166 -.5996295 .44475 .1953706 .0556586 .0092419 .4164602

syst airChaud -.0420766 .1442657 -.4959154 .4820698 .5283572 .1035233 .1223169 .9269534

syst eauChaude -.048544 .2060396 -.749579 .646625 1.021774 .1702947 .4270283 1.642505

syst thermopompe .0964804 .2200163 -.6338891 .865214 1.767166 .1445891 1.226482 2.322727

syst convectair .0837167 .1918498 -.6700451 .8516477 .2400187 .1125461 -.1659149 .6407747

nbre refrigerateurs .0460817 .0709766 -.1865273 .3064386 .4075419 .0438214 .2597247 .5616124

maison detachee .5809519 .1938493 -.217577 1.290787 5.048513 .1734351 4.503286 5.633108

maison jumelee .5441456 .2086472 -.163063 1.296402 3.337558 .1957055 2.557172 4.015889

piscine .148988 .099633 -.2562871 .5021353 1.065607 .0562922 .8531217 1.271572

dispoGaz -.2744695 .1052755 -.6161385 .1154829 -1.578728 .0644807 -1.816617 -1.359471


Chapitre

6.

Analy

sede

ladem

ande

conditio

nnelle

:appro

che

bayesien

ne

250


tionnelle


coutfix -.1483239 .2193409 -1.040032 .6267778 -2.659707 .138828 -3.189317 -2.197259

coutm -.9158148 .2140408 -1.654402 -.2301752 -4.853326 .1184972 -5.248229 -4.44451

nbre Resid Aug .4401259 .1431503 -.0732975 .9600185 4.106384 .0209442 4.038107 4.188228

age .1199509 .0318886 .0045794 .2461233 1.217065 .0189962 1.147362 1.286651

correcteur1 -.003464 .0141092 -.0584347 .0466376 -.0850308 .0184047 -.1536204 -.0125786

correcteur2 -.0059773 .0142077 -.0592809 .0444861 .1692086 .0184939 .1041085 .2441264

correcteur3 -.0698597 .053762 -.2478641 .1130684 -.5194372 .0649511 -.7387234 -.2933008

correcteur4 -.0632029 .0448182 -.2281163 .0764429 .1971346 .0372527 .065143 .3277125

correcteur5 .0445795 .0471011 -.126213 .229913 -1.375666 .0570454 -1.586237 -1.168917

correcteur6 -.0004248 .0403252 -.1680608 .1302271 -.8402245 .0435324 -1.005605 -.6849921

correcteur7 .1142404 .1058214 -.2473042 .5179531 2.507538 .0333458 2.382941 2.647789

correcteur8 -.0214573 .0161434 -.0803732 .0381502 .0097903 .0185172 -.053492 .072148

correcteur9 -.0158292 .0154464 -.0648478 .0428233 .1906169 .0181048 .1309543 .2536349

h .0523885 .0003234 .0509425 .053531

Fin du tableau


6.6.3 Analyse de sensibilite : elasticite prix et revenu du modele

dynamique

Les elasticites de court terme (CT) et de long terme (LT) du modele de demande

conditionnelle sont presentees au tableau (6.10). Nous avons ajoute les elasticites du

modele dynamique qui ne prend pas en compte les deux classes pour fin de comparaison.

La premiere remarque qui peut etre faite est que les elasticites de la deuxieme classe

sont superieures (en valeur absolue) a celles de la premiere classe. Les menages de la

deuxieme classe sont beaucoup plus sensibles aux changements que ceux de la premiere

classe. Nous n’avons pas calcule les elasticites de long terme de la premiere classe

etant donne que l’estime de la variable dependante retardee n’est pas significative. Les

elasticites de long terme du modele sans classes sont superieures a celles de la deuxieme

classe, a cause de l’estime de la dependante retardee qui est de 0.61 dans le modele sans

classe alors qu’il n’est que de 0.033 dans la deuxieme classe. Le fait que cet estime soit

tres grand dans le modele sans classe implique que les changements a long terme sont

nettement plus importants que les changements a court terme des menages lorsqu’on

ne corrige pas l’endogeneite du prix de l’electricite, ce qui est en contradiction avec la

situation atypique de la province.

Les elasticites prix directes de l’electricite sont significatives aux seuils usuels pour

les deux classes. Une augmentation de 1% du prix de l’electricite entraınera une baisse

a court terme de la demande d’electricite de 0.03% dans la premiere classe et de 0.29%

dans la deuxieme classe. La baisse de la deuxieme classe represente approximativement

10 fois celle de la premiere classe. A long terme, la hausse du prix de l’electricite entraıne

une baisse d’environ 0.3% de la demande de la deuxieme classe, ce qui n’est pas vraiment

tres different de celle de court terme. Pour le modele sans classe, la meme hausse du

prix de l’electricite entraıne une baisse de 0.257% a court terme et de 0.659% a long

terme, soit plus du double de la baisse de court terme.

Comme nous l’avons dit a la section precedente, a cause de la forte competitivite

du prix de l’electricite, les autres formes d’energies coutent relativement plus cheres.

Les menages gagnent par exemple en gardant leurs systemes de chauffage a l’electricite,

tout en procedant a de petits ajustements suite aux variations de prix marginal de

l’electricite.

L’elasticite-prix croisee de la bi-energie de court terme est de -0.134 pour la deuxieme

classe et significative au seuil de 1%. L’elasticite de long terme (-0.1386) est legerement

superieure a celle de court terme. L’electricite et la bi-energie sont des complements

pour la deuxieme classe. Nous ne l’avons pas calculee pour la premiere classe puisque

l’effet marginal de la bi-energie n’y est pas significatif. Il faut noter egalement que les


Tab. 6.9 – Modele dynamique sans classes


Lcons anAug .6091785 .0140601 .558571 .6547343

prixelec -1.1117 .032389 -1.233221 -.9953239

prixbie -.2013451 .0335995 -.3252463 -.0746047

prixgn .1393822 .0104403 .0934721 .1771624

prixm -.1115086 .0259855 -.2051902 -.0247235

rev Aug 1.726394 .0109282 1.683321 1.768727

cdd -.4176887 .0367334 -.5551287 -.2587649

hdd 1.018956 .0333198 .8981479 1.149357

mode occupation .0134113 .045632 -.1787785 .167416

syst plinthes .0078086 .0498476 -.174138 .186967

syst airChaud .0206141 .0810743 -.3010442 .3617504

syst eauChaude .0748696 .1271383 -.3958437 .5065987

syst thermopompe .4019441 .1167069 -.0193215 .8698936

syst convectair .1898654 .0955916 -.172184 .627471


maison detachee 2.705835 .1209687 2.306439 3.139576

maison jumelee 1.745679 .1332034 1.24658 2.273157

piscine .5926193 .0476694 .4080888 .7678842

dispoGaz -1.111164 .0518061 -1.324946 -.9282253

coutfix -.7856949 .1146698 -1.17785 -.382114

coutm -5.370204 .0967492 -5.723956 -5.010257

nbre Resid Aug 3.820648 .0186505 3.752082 3.890048

age 1.069834 .0155386 1.010157 1.138757

correcteur1 -.0220614 .0104304 -.057626 .01818182

correcteur2 .095256 .0102112 .0585535 .129394

correcteur3 -.6045301 .0352017 -.7263629 -.4626905

correcteur4 -.2559823 .0263755 -.3570903 -.1585329

correcteur5 -.5409295 .0299161 -.6466652 -.4323207

correcteur6 -.2956058 .0251502 -.3930686 -.194282

correcteur7 1.734312 .0283539 1.629566 1.836736

correcteur8 -.0684855 .0106435 -.106994 -.0353066

correcteur9 .0107806 .0107719 -.0225216 .050201

h .0545433 .0003334 .0532867 .0557696


menages qui sont au tarif bi-energie ont en fait deux tarifs differents : il y a ceux qui

sont au tarif D (electricite) et ceux qui sont au tarif DT (tarif bi-energie). Cela pourrait

explique pourquoi l’effet dans la premiere classe n’est pas significatif. Dans le modele

sans classe, l’elasticite de court terme est de -0.056 et celle de long terme est de -0.144

soit plus du double de celle de court terme, toutes deux etant significatives au seuil de

1%.

L’elasticite-prix croisee de court terme du gaz naturel est 0.0125 (significative a 5%)

pour la premiere classe et de 0.0265 pour la deuxieme classe (ou elle est significa-

tive a 1%). Une hausse du prix du gaz naturel entraınera une hausse de la demande

d’electricite de 0.012% pour la deuxieme classe et de plus du double pour la deuxieme

classe. Le gaz naturel et l’electricite sont des substituts. Le modele sans classe surestime

les deux elasticites.

L’effet marginal du prix du mazout n’est pas significatif dans les deux classes mais l’est

dans le modele sans classes. Pour ce modele, l’elasticite-prix croisee de court terme du

mazout est de -0.032 et celle de long terme est de -0.082. Le mazout et l’electricite

sont des bien complementaires pour le modele sans classes tandis qu’ils sont des biens

independants pour le modele avec classes. L’independance semble assez intuitif puis-

qu’un menage qui chauffe au mazout utilise des systemes de chauffage specifiques a

cette forme d’energie et qui ne peuvent en principe etre utilises directement avec une

autre forme d’energie telle que l’electricite.

L’elasticite-revenu de court terme de la demande est positive et significative a 1% dans

la deuxieme classe et a 10% dans la premiere. Une hausse du revenu de 1% entraınera

une hausse a court terme de 0.026% la demande de la premiere classe et de 0.39% la

demande de la deuxieme classe. L’effet revenu est donc beaucoup plus important dans la

deuxieme classe, et tres faible dans la premiere. D’apres les resultats du modele latent,

les menages qui sont dans la deuxieme classe sont plus riches que ceux qui sont dans

la premiere, et une hausse du revenu les amene a consommer davantage d’electricite.

L’electricite a la limite serait un bien necessaire pour les menages de la premiere classe.

L’elasticite de long terme du modele sans classe est d’environ l’unite. Cette valeur serait

trop elevee puisqu’elle implique qu’une hausse du revenu de 1% entraınera une hausse

de la demande d’electricite de 1% a long terme. C’est comme si toute la hausse de

revenu est affectee uniquement a la consommation d’electricite, ce qui est enorme.

L’elasticite de la variable degres jours de chauffage est positive et significative au seuil

de 1% dans les deux classes ainsi que dans le modele sans classes. Si la temperature en

hiver baisse de 1%, la demande d’electricite a court terme augmente d’environ 0.05%

dans la premiere classe et de 0.264% dans la deuxieme. Une fois de plus, la deuxieme

classe reagit plus fortement aux changements que la premiere. L’elasticite de long terme

du modele sans classe est plus de deux fois celle de la deuxieme classe.

Les resultats du modele sans classe indiquent que tous les menages reagissent de la


meme facon peu importe la classe d’appartenance. Pourtant, les menages de la premiere

classe sont beaucoup plus pauvres et n’ont pas les memes caracteristiques que ceux de

la deuxieme classe. Par consequent, ils ne devraient pas avoir les memes reactions que

ceux de la deuxieme classe quant aux variations de prix, de revenu ou de temperature

par exemple.

Tab. 6.10 – Elasticites du modele dynamique

Elasticites Classe1 Classe2 Sans classe

prixelecCT -0.0315 -0.2881 -0.257

E-T (0.013) (0.01) (.008)

prixelecLT - -0.2979 -0.659

E-T - (0.011) (0.0314)

prixbieCT - -0.134 -0.056

E-T - (0.012) (0.0094)

prixbieLT - -0.1386 -0.144

E-T - (0.018) (0.0061)

prixgnCT 0.0125 0.0265 0.034

E-T (0.006) (0.0029) (0.0025)

prixgnLT - 0.0274 0.087

E-T - (0.003) (0.007)

prixmCT - - -0.032

E-T - - (0.0074)

prixmLT - - -0.082

E-T - - (0.019)

revCT 0.026 0.3895 0.392

E-T (0.0136) (0.0027) (0.0025)

revLT - 0.4028 1.005

E-T - (0.0057) (0.0037)

hddCT 0.051 0.2641 0.236

E-T (0.016) (0.0095) (0.0077)

hddLT - 0.2731 0.6064

E-T - (0.0104) (0.0295)

cddCT - -0.0066 -0.034

E-T - (0.0036) (0.003)

cddLT - -0.007 -0.087

E-T - (0.0037) (0.0083)


6.7 Conclusion et recommandations

L’objectif poursuivi dans ce travail etait d’estimer un modele de demande d’electricite

a partir de series de coupes transversales independantes, tout en corrigeant le biais de

selection du choix du mode de chauffage et le biais d’endogeneite du prix marginal de

l’electricite. Nous avons estime un modele statique et un modele dynamique en utili-

sant une approche bayesienne. Habituellement, les modeles qui analysent la demande

d’electricite ou d’energie en general utilisent de vraies donnees de panel et ne traitent

pas simultanement le probleme de selection du mode de chauffage et le probleme d’en-

dogeneite du prix marginal. Ils se limitent le plus souvent a un de ces trois problemes

(completer les donnees manquantes, ou corriger un des biais). Or, dans le cadre de

la demande d’electricite de la province de Quebec, la structure meme des donnees

fait de sorte que si ces problemes ne sont pas corriges simultanement, il en resulterait

des estimateurs biaises et non convergents. De plus, si l’on veut analyser la demande

d’electricite en profondeur, on ne peut pas se limiter a une seule coupe transversale qui

ne peut capter l’aspect dynamique ou inter-temporel dans les decisions des menages. Or,

l’aspect dynamique est assez important puisque le menage utilise les memes systemes

de chauffage sur plusieurs annees.

Puisque nous n’avons pas de vrais panels, mais des series d’enquetes independantes,

nous faisions donc face a un probleme de donnees manquantes ; les menages enquetes

durant une periode ne sont plus retracables au cours des autres periodes. Nous avons

donc utilise l’algorithme de l’augmentation des donnees pour simuler les donnees man-

quantes. Une fois les donnees completees, nous avons estimer le modele de demande

conditionnelle. Le probleme de biais de selection provenant de la simultaneite entre le

choix du mode de chauffage et le choix de la quantite est corrige a partir d’un modele

logit mixte avec erreurs autoregressives generalisees d’ordre un. Le probleme de l’en-

dogeneite du prix marginal de l’electricite est corrige en developpant un modele a classes

latentes. Il s’agit d’une approche non encore utilisee a notre connaissance dans le cadre

d’un modele a variable dependante continue. Les modeles a classes latentes sont le plus

souvent utilises dans le cadre de modele de choix discrets et les parametres du modele la-

tent ne font habituellement pas l’object d’estimation. Nous avons utilise l’algorithme de

l’echantillonnage de Gibbs pour estimer les parametres du modele apres avoir complete

les donnees manquantes avec l’algorithme de l’augmentation des donnees. L’approche

proposee dans ce travail est novatrice surtout dans le contexte de la situation atypique

de la demande d’electricite de la province de Quebec. Les resultats obtenus sont tres

satisfaisants et les modeles de demande proposes representent bien les donnees.


6.8 Annexe

6.8.1 Graphiques pour la convergence des tirages0

24

68

Den

sité

−.4 −.3 −.2 −.1 0 .1prixelec_F

(a) histogramme des valeurs moyennes

−.4

−.3

−.2

−.1

0.1

prix

elec

_F

0 2000 4000 6000obs



Fig. 6.1 – simulation du coefficient de prix electricite classe1

02

46

8D

ensi

té

−.3 −.2 −.1 0 .1 .2prixbie_F


−.3

−.2

−.1

0.1

.2pr

ixbi

e_F

0 2000 4000 6000obs



Fig. 6.2 – simulation du coefficient de prix bi-energie classe1


05

1015

20D

ensi

té

−.05 0 .05 .1 .15prixgn_F


−.05

0.0

5.1

.15

prix

gn_F

0 2000 4000 6000obs



Fig. 6.3 – simulation du coefficient de prix gaz naturel classe1

02

46

8D

ensi

té

−.2 −.15 −.1 −.05 0 .05 .1 .15prixm_F


−.2

−.1

0.1

.2pr

ixm

_F

0 2000 4000 6000obs



Fig. 6.4 – simulation du coefficient de prix mazout classe1

02

46

8D

ensi

té

−.1 −.05 0 .05 .1 .15 .2 .25 .3rev_Aug_F


−.1

0.1

.2.3

rev_

Aug

_F

0 2000 4000 6000obs



Fig. 6.5 – simulation du coefficient du revenu augmente classe1


02

46

Den

sité

−.2 −.1 0 .1 .2 .3cdd_F


−.2

−.1

0.1

.2.3

cdd_

F

0 2000 4000 6000obs



Fig. 6.6 – simulation du coefficient de cdd classe1

02

46

Den

sité

0 .1 .2 .3 .4 .5hdd_F


0.1

.2.3

.4.5

hdd_

F

0 2000 4000 6000obs



Fig. 6.7 – simulation du coefficient de hdd classe1

02

46

810

Den

sité

−1.3 −1.25 −1.2 −1.15 −1.1 −1.05 −1prixelec_Sd


−1.3

−1.2

−1.1

−1pr

ixel

ec_S

d

0 2000 4000 6000obs



Fig. 6.8 – simulation du coefficient de prix electricite classe2


05

1015

Den

sité

−.35 −.3 −.25 −.2 −.15 −.1prixm_Sd


−.35

−.3

−.25

−.2

−.15

−.1

prix

m_S

d

0 2000 4000 6000obs



Fig. 6.9 – simulation du coefficient de prix mazout classe2

010

2030

40D

ensi

té

1.67 1.68 1.69 1.7 1.71 1.72 1.73 1.74 1.75rev_Aug_Sd


1.66

1.68

1.7

1.72

1.74

1.76

rev_

Aug

_Sd

0 2000 4000 6000obs



Fig. 6.10 – simulation du coefficient du revenu augmente classe2

02

46

810

Den

sité

−.25 −.2 −.15 −.1 −.05 0 .05 .1cdd_Sd


−.3

−.2

−.1

0.1

cdd_

Sd

0 2000 4000 6000obs



Fig. 6.11 – simulation du coefficient de cdd classe2


02

46

810

Den

sité

.95 1 1.05 1.1 1.15 1.2 1.25 1.3hdd_Sd


.91

1.1

1.2

1.3

hdd_

Sd

0 2000 4000 6000obs



Fig. 6.12 – simulation du coefficient de hdd classe2

010

2030

40D

ensi

té

−.05 −.04 −.03 −.02 −.01 0 .01 .02Lcons_anAug_F


−.06

−.04

−.02

0.0

2Lc

ons_

anA

ug_F

0 2000 4000 6000obs



Fig. 6.13 – simulation coefficient de la dependante retardee classe1

010

2030

40D

ensi

té

−.01 0 .01 .02 .03 .04 .05 .06 .07Lcons_anAug_Sd


−.02

0.0

2.0

4.0

6.0

8Lc

ons_

anA

ug_S

d

0 2000 4000 6000obs



Fig. 6.14 – simulation coefficient de la dependante retardee classe2


6.8.2 Determination de la loi a posteriori des exogenes

Ecrivons le modele de facon compacte pour ne pas allourdir la demonstration :

ynt = aynt−1 + Xntθ + ϑn + εjnt

Le modele de regression auxilliaire s’ecrit :

xnt = γznt + εnt

Les densites conditionnelles pour le cas scalaire sont :

Chapitre

6.

Analy

sede

ladem

ande

conditio

nnelle

:appro

che

bayesien

ne

262P (ynt |ynt−1, xnt, znt, ϑ) ∝ exp

[− 1

2φ(ynt − ϑn − aynt−1 − xkntθk − xntθ−k)

2

]

P (xknt |znt, ϑ) ∝ exp

[− 1

2τ 2(xknt − γznt)

2

]

P (xknt |ynt, ynt−1,znt, ϑ) =P (xknt, ynt |znt, ynt−1 )

P (ynt |ynt−1 )

∝ P (xknt, ynt |znt, ynt−1 )

∝ P (ynt |ynt−1, xknt, x−knt, znt, ϑ) × P (xknt |znt, x−knt, ϑ)

∝ exp

[− 1

2φ(ynt − ϑn − aynt−1 − xkntθk − x−kntθ−k)

2

]× exp

[− 1

2τ 2(xknt − γznt)

2

]

∝ exp

− 1

2φ

y2nt − 2ϑnynt − 2aynt−1ynt − 2θkxkntynt + 2aϑnynt−1 + 2θ−kx−kntxknt

−2θ−kx−kntynt + 2θ−kx−kntynt−1 + 2θ−kx−kntϑn

+2aθkynt−1xknt + 2θkϑnxknt + ϑ2n + a2y2

nt−1 + x2kntθ

2k + x2

−kntθ2−k

× exp

[− 1

2τ 2

(x2

nt − 2γzntxnt + γ2z2nt

)]

∝ exp

[− 1

2φ

(−2θkxntynt + 2aθkynt−1xnt + 2θkϑnxnt + 2θ−kx−kntxknt + x2

ntθ2k

)− 1

2τ 2

(x2

nt − 2γzntxnt

)]

Ecrivons la densite conditionnelle de sorte a isoler x2nt et xnt de la facon suivante :

P (xknt |ynt, ynt−1,x−knt, znt, ϑ) ∝ exp

[−1

2

((1

2φx2

ntθ2k +

1

2τ 2x2

nt

)−(

2θkxntynt − 2aθkynt−1xnt − 2θkϑnxnt − 2θ−kx−kntxknt

φ

)+

2

τ 2γzntxnt

)]

∝ exp

[−1

2

((θ2

k

φ+

1

τ 2

)x2

nt − 2θk

(ynt − aynt−1 − θ−kx−knt − ϑn

φ

)xnt +

2

τ 2γzntxnt

)]

∝ exp

−

(θ2k

φ+ 1

τ2

)

2

x2

nt − 2θk

ynt − aynt−1 − θ−kx−knt − ϑn

φ(

θ2k

φ+ 1

τ2

)

xnt −

−2γznt

τ 2(

θ2k

φ+ 1

τ2

)xnt

∝ exp

−

(θ2k

φ+ 1

τ2

)

2

xnt −

θk

φ(ynt − aynt−1 − θ−kx−knt − ϑn) − 1

τ2 γznt(θ2k

φ+ 1

τ2

)

2

Ceci represente le noyau de la densite d’une normale, soit :

N

θk

φ(ynt − aynt−1 − θ−kx−knt − ϑn) − 1

τ2 γznt(θ2k

φ+ 1

τ2

)

,

(θ2

k

φ+

1

τ 2

)−1

Bibliographie

[1] Allenby, G. M., Arora, N. and Ginter, J. L. (1998) : «On Heterogeneity of Demand»,

Journal of Marketing research, Vol. 35, p.384-389.




[4] Bhargava, A. and Sargan, J. D. (1983) : «Estimting Dynamic Random Effects

Models From Panel Data Covering Short Time Periods», Econometrica, Vol. 51,

p.1635-1660.

[5] Bernard, J-T., D. Bolduc and D. Belanger (1996) : «Quebec Residential Electricity

Demand : a Microeconometric Approach», The Canadian Journal of Economics,

Vol. 24 (1), pp. 92-113.

[6] Ben-Akiva, M. and D. Bolduc (1991) : «Multinomial Probit with Autoregres-

sive Error Structure», Working Paper 91-22, Groupe de Recherche en Econo-

mie de l’Energie, de l’Environnement et des Ressources Naturelles, Departement


[7] Bernier-Martel, N. (2005) : «Echantillonnage de Gibbs et Augmentation de

Donnees : Une Alternative aux Pseudo-panels», These de Maıtrise, Universite La-

val.

[8] Blundell, R. and R. S. Smith (1991) : «Conditions Initiales et Estimation Efficace

dans les Modeles Dynamiques sur les Donnees de Panel», Annales d’Economie et

de Statistiques, Vol.20-21, p.109-123.

[9] Boucher, N. (2003) : «Predicting National Data on the Use of Private Vehicles in

Canada for the 1980-1996 Period : an Application of the Bayesian Approach of

Gibbs Sampling with Data Augmentation», PhD. Thesis, Queen University

[10] Carlin B. P. and Louis Thomas (2000) : Bayes and Empirical Bayes Methods for

Data Analysis, New York, Chapman and Hill/CRC

[11] Casella G. and George E. I. (1992) : « Explaining the Gibbs Sampler», The Ame-

rican Statitician, Vol. 46, No. 3, p. 167-174.

Bibliographie 264

[12] Chamberlain G. (1984) : Panel Data. Handbook of Econometrics. Vol.II, Griliches

and Introligator M. D.

[13] Chamberlain G. (1980) :« Analysis of Covariance with Qualitative Data», The

Review of Economic Studies, Vol. 47, No. 1

[14] Dempster A. P., Laird M. N. and Rubin B. D. (1977) : «Maximum Likelihood from

Incomplete Data via le EM Algorithm», Journal of the Royal Statistical Society,

Series B (Methodological), Vol. 39, No. 1, pp. 1-38.

[15] Diebolt, J. and Robert, C. P. (1994) : «Estimation of Finite Mixture Distributions

through Bayesian Sampling», Journal of the Royal Statistical Society, Ser. B, 56,

p.363-375.

[16] Dubin J. A and Mcfadden D. L. (1984) : «An Econometric Analysis of Residential

Electricity Appliance Holdings and Consumpton», Econometrica, 52(2), pp.345-

362.

[17] Dupuis, F., Durcoher, B., Montmarquette, C. and Robert, M. (2006) : «Le Defi

des Finances Publiques : Le Redressement de la Situation Fiscale du Quebec,

un Defi a la fois Prioritaire et Incontournable», CIRANO (Centre de Recherche

Interuniversitaire de Recherche en Analyse des Organisations).

[18] Fruhwirth-Shnatter, S. (1999) : «Model Likelihoods and Bayes Factors for Swit-

ching and Mixture Models», Preprint Vienna University of Economics and Business

Administration.

[19] Fruhwirth-Shnatter, S. (2001) : «MCMC of Estimation of Classical and Dyna-

mic Switching and Mixture Models», Journal of American Statistical Association,

Vol.96, p.194-209.

[20] Fruhwirth-Shnatter, S., Otter, T. and Tuchler, R. (2002) : «A Full Bayesian Ana-

lysis of Multivariate Latent Class Models with an Application to Metric Conjoint

Analysis», Adaptative Information and Modelling in Economics and Management

Science, Vienna University of Econimucs and Business Administration, Working

Paper No.89.

[21] Gelman A., Carlin J. B., Stern H. B. and Rubin D. B. (2000) : Bayesian Data

Analysis, New York, Chapman and Hill/CRC.

[22] Gelfand A. E. (2000) : «Gibbs Sampling», Journal of the American Statistical

Asssociation, Vol. 95, No. 452, p. 1300-1304.

[23] German, S. and German, D. (1984) : «Stochastic Relaxation, Gibbs Distribution

and the Bayesian Restoration if Images», IEEE Transactions on Pattern Analysis

and Michine Intelligence, 6, pp. 721-741.

[24] Gordon S. et Belanger, G. (2003) : «Echantillonnage de Gibbs et autres appli-

cations econometriques des chaınes markoviennes», Working Paper, Departement


Bibliographie 265

[25] Gourieroux C. and A. Monfort (1996) : Statistique et Modeles Econometriques, Vol.

1, Ed. Economica

[26] Gregoire, C. (2004) : L’imputation Multiple», These de Maıtrise, Uniervsite Laval.

[27] Hausman, J. A. and D. Wise (1979) : «Attrition Bias in Experimental and Panel

Data : the Gary Income Maintenance ExperimentZ, Econometrica, Vol.47, p.455-

473.

[28] Heckman, J. (1979) : «Sample Selection Bias as a Specification Error», Econome-

trica, 47 (1), pp. 153-161.



365.

[30] Hydro-Quebec (2005) : Comparaison des Prix de l’Electricite dans les Grandes

Villes Nord-Americaines

[31] Lee, C.-J. (2000) : «Dynamic Unobserved Effects for Continuous and Binary Pres-

ponse», Ph.D Thesis, Michigan State University.

[32] Lenk, P. J. and DeSarbo, W. S. (1999) : «Bayesian Inference for Finite Mixture of

Generalized Linear Models with Random Effects», Journal of Time Series Analy-

sis, Vol. 15, p.523-539.

[33] Liao Hue-Chu and Chang Tsai-Feng (2002) : «Space-heating and Water-heating


[34] Little R. J. A. and Rubin D. B. (2002) : Statistical Analaysis with Missing Data,

second ed.Wiley Series in Probability and statistics.

[35] McFadden, D. (1989) : «A Method of Simulated Moments for Estimation of Dis-

crete Response Models Without Numerical Integration», Econometrica, Vol. 57

(5), pp. 995-1026.

[36] Meng, X. L. and Wong, W. H. (1996) : «Simulating Ratios of Normalising

Constants via a Simple Identity», Statistica Sinica, Vol. 6, p.831-860.



[38] Pakes, A. and D. Pollard (1989) : «Simulation and the Aymptotics of Optimization

Estimators», Econometrica, vl. 57 (5), pp 1027-1057.

[39] Paquet M-F. (2002) : «Une Approche a Simulation pour le Traitement de Donnees

Longitudinales Incompletes», These de Doctorat, Universite Laval.

[40] Paquet M. F. and Bolduc D. (2004) : «Le Probleme des Donnees Longitudinales

Incompletes : une nouvelle Approche», L’Actualite Economique, Vol. 80, 2/3, p.

341

Bibliographie 266

[41] Richarson, S. and Green, P. (1997) : «On Bayesian Analysis of Mixtures with

and Unknown Number of Components» (with discussion), Journal of the Royal

Statistical Society, Ser. B, p.731-792.

[42] Roeder, K. and Wasserman, L. (1997) : «Pratical Bayesian Density Estimatin using

Mixtures of Normals», Journal of the American Association, Vol.92, p.894-902.

[43] Rubin D. B. (1976) : «Inference and Missing Data», Biometrika, 63, pp.581-592.

[44] Rubin D. B. (1978) : «Multiple Imputations in Sample Surveys- a Phenomenologi-

cal Bayesian Approach to Nonresponse», The Proceedings of the Survey Research

Methods Section of The American Statistical Assciation, p. 20-34.

[45] Rubin D. B. (1986) : «Statistical Matching Using File Concatenation with Adjusted

Weight and Multiple Imputations», Journal of Business and Economic Statistics,

4, pp. 87-94.

[46] Rubin D. B. (1987) : Multiple Imputation for Nonresponse in Surveys, New York,

J. Wiley and Sons.

[47] Rubin D. B. (1996) : «Multiple Imputation after 18+ Years», Journal of the Ame-

rican Statistical Association, 91, pp. 473-489.

[48] Rubin D. B. and Schenker N. (1986) : «Multiple Imputation for Interval Estima-

tion from Simple Random with Ignorable Nonresponse», Journal of the American

Statistical Association,81, pp. 366-374.

[49] Schafer J. L. (1997) : Analysis of Incomplete Multivariate Data, New Yrok, Chap-

man and Hill.

[50] Schafer J. L. (2000) : «Analysis of Incomplete Multivariate Data», Monographs on

Statistics and Applied Probabilities 72. Chapman and Hall/CRC.

[51] Stephens, M. (1997) : «Bayesian Methods for Mixtures of Normal Distributions»,

Ph.D Thesis, University of Oxford.

[52] Tanner M. A. and Wong Wing Hung (1987) : «The Calculation of Posteriori Distri-

butions by Data Augmentation», Journal of the American Statistical Asssociation,

Vol. 82, No. 398, p. 528-540.

[53] Vekeman, F., D. Bolduc and Bernard, J-T. (2004) : Households’, «Vehicles Choices

and Use : What a More Disaggregated Approach Reveals ?», Working Paper,

GREEN, Departement d’Economique, Universite Laval.

[54] Vidal, V. (2006) : «Echantillonnage de Gibbs avec Augmentation de Donnees et

Imputation Multiple», These de Maıtrise, Universite Laval.

[55] Wooldridge, J. M. (2000) : «The Initial Conditions problem in Dynamic, Nonlinear

Panel Data Models with Unobserved Heterogeneity», Working Paper, Department

of Economics, Michigan State University

Bibliographie 267

[56] Wu, C. F. J. (1983) : «Generalized Linear Models with Random Effects : a Gibbs

Sampling Approach», Journal of the American Statistical Association, Vol. 86, pp.

79-86.

Chapitre 7

Conclusion

L’objectif principal poursuit dans cette these est de faire une analyse de la de-

mande d’electricite en exploitant des bases de donnees d’enquetes independantes obte-

nues aupres d’Hydro-Quebec. L’analyse de la demande d’electricite devrait tenir compte

de l’interdependance qui existe entre le choix des systemes de chauffage de l’eau et de

l’espace et le choix de la quantite d’electricite a consommer par le menage. Une approche

en deux etapes a ete utilisee pour estimer les parametres du modele de demande. Dans

une premiere etape le choix du mode de chauffage a ete estime par un modele logit mixte

avec erreurs autoregressives generalisees d’ordre un ou GAR(1) ; ce modele a permis de

prendre en compte la correlation entre les modalites. Les resultats de cette premiere

etape ont permis de calculer les correcteurs de biais de selection qui sont ensuite intro-

duits dans le modele de demande. Les parametres du modele de demande conditionnelle

sont ensuite estimes a la seconde etape. Etant donne qu’Hydro-Quebec utilise une tarifi-

cation par tranche, le prix marginal de l’electricite est une variable endogene, qui cause

un biais d’endogeneite dans le modele de demande. Pour corriger ce biais d’endogeneite,

nous avons developpe un modele a classes latentes. La structure tarifaire de l’electricite

ainsi que l’information disponible sur les menages creent deux classes de menages qui

ne sont pas directement observables. Dans les travaux anterieurs ayant porte sur les

modeles a classes latentes, la variable dependante du modele est habituellement une

variable discrete. Nous avons pu etendre le principe d’estimation des modeles a classes

latentes aux modeles avec variables dependantes continues. Les parametres du modele

latent sont egalement estimes, contrairement aux methodes existantes qui n’estiment

pas ces parametres mais plutot la valeur de la probabilite de choisir une classe donnee.

Le chapitre (3) a utilise la base de donnees de l’enquete de 1989 pour estimer la

demande d’electricite conditionnelle aux choix du mode de chauffage et de la classe

de consommation. Il est ressorti que le modele avec classes latentes est meilleur au

Chapitre 7. Conclusion 269

modele qui ne tient pas compte des classes. La premiere classe, celle ou la consommation

journaliere du menage ne depasse pas les 30kWh, serait composee de menages a faibles

revenus, donc beaucoup plus vulnerables. De plus, nous avons estime, a partir du modele

logit mixte avec erreurs GAR(1), des taux d’escompte individuels. Ces taux d’escompte

sont specifiques a chaque modalite. Les valeurs obtenues, contrairement a celles des

etudes anterieures, sont tres satisfaisants et la moyenne des taux est tres proche du

taux d’escompte sur le marche financier. La non prise en compte de l’heterogeneite

entre les individus pourrait justifier les valeurs enormes des taux d’escompte souvent

obtenues.

Dans les autres chapitres, nous avons cherche a prendre en compte la dynamique

dans les ajustements des menages, meme si nous n’avions que des donnees d’enquetes

independantes. Deux approches, classique et bayesienne, ont ete exploitees afin de pou-

voir corriger le probleme de manque de panel.

Nous avons exploite l’approche de Deaton qui consiste a creer des cohortes de menages

que l’on peut suivre dans le temps. Avec cette approche, la demande d’electricite est

desormais une demande agregee au niveau des cohortes. Avec le modele de demande

agregee, il n’a plus ete necessaire de prendre en compte le probleme de la simultaneite

entre choix discret et choix continu, puisque les cohortes sont des groupes de menages

ayant differentes modalites. La demande d’electricite d’une cohorte n’est donc pas une

demande conditionnelle a une modalite donnee. Il n’a pas ete non plus necessaire d’utili-

ser un modele a classes latentes, car toutes les cohortes se retrouvaient dans la deuxieme

classe. Avec le pseudo-panel cree, deux methodes d’estimation ont ete proposees : l’une

classique et l’autre bayesienne.

Au chapitre (4), nous avons pu estimer un modele statique et un modele dynamique

avec des effets fixes en utilisant les methodes classiques d’estimation. Nous avons cor-

rige simultanement le probleme d’heteroscedasticite groupee et de correlation serielle

en utilisant la methode des moindres carres quasi-generalises.

Generalement, lorsqu’on a des donnees groupees, il est logique de penser qu’il existe de

l’heterogeneite entre les groupes. Dans la litterature sur les pseudo-panels, il n’existe pas

de travaux ayant pris en compte explicitement l’heterogeneite, mis a part les modeles

a effets fixes qui ne s’interessent cependant pas aux parametres d’interet. Nous avons

propose d’utiliser l’algorithme de l’echantillonnage de Gibbs pour estimer un modele

statique et un modele dynamique avec des parametres heterogenes. L’heterogeneite est

consideree entre les neuf (9) regions administratives de la province de Quebec et les

resultats obtenus sont tres satisfaisants. Le comportement des cohortes change d’une

region a l’autre ; la hausse du prix de l’electricite par exemple n’aura pas les memes

consequences chez les cohortes vivant dans une zone urbaine que chez celles qui sont

dans une zone rurale. Les elasticites de court terme sont plus faibles que celles de long

terme, confirmant la seconde loi de la demande. Cette facon d’exploiter les pseudo-


panels est novatrice et serait tres utile dans les prises de decisions, puisqu’elle a permis

d’avoir des elasticites specifiques a chacune des neuf (9) regions de la province.

Nous avons aussi propose d’utiliser la methode par simulation pour obtenir un panel

simule afin de garder l’information au niveau des menages. Le chapitre (6) a exploite

cette approche bayesienne qui combine l’algorithme de l’augmentation des donnees avec

celui de l’echantillonnage de Gibbs pour completer les donnees manquantes tout en es-

timant les parametres du modele. Nous avons corrige a la fois le probleme de la simul-

taneite entre choix discret et choix continu, le probleme de l’endogeneite du prix margi-

nal et enfin le probleme de donnees manquantes. Nous avons estime a la fois un modele

statique et un modele dynamique dans un contexte de classes latentes. Les resultats

obtenus sont tres satisfaisants. Les effets marginaux des variables explicatives de la

premiere classe sont inferieurs a ceux des menages de la deuxieme classe. La premiere

classe est composee de menages a faibles revenus et donc beaucoup plus vulnerables

que les menages de la deuxieme classe. De plus, les changements de long terme ne sont

pas tres differents des changements de court terme dans le modele dynamique. Cela

est du a la situation particuliere de l’electricite dans la province. Nous recommandons

a Hydro-Quebec de tenir compte de l’existence et des caracteristiques de chacune des

classes de consommateurs dans ses politiques de tarification de l’electricite.

Certaines extensions pourraient etre apportees a ce travail, tant du cote du modele

de choix discret (ou choix du mode de chauffage) comme du cote du modele continu

qui est le modele de demande d’electricite. Par exemple, il serait interessant d’utiliser

un modele logit mixte avec heterogeneite aleatoire des parametres, en ce qui concerne

le modele de choix du mode de chauffage. Nous pouvons aussi envisager un modele

dynamique pour le modele de choix du mode de chauffage, en supposant que le menage,

a certaines periodes, change son systeme de chauffage. Cela necessiterait des donnees

sur toute la duree de vie des differents systemes.

En ce qui concerne le modele de demande d’electricite avec le panel simule, il serait

interessant de considerer la situation ou les termes d’erreur sont seriellement correles,

afin de voir si cela ameliore les resultats. Nous pourrions aussi envisager d’etendre le

modele a classes latentes aux vraies donnees de panel si celles-ci existent. Le modele a

classes latentes developpe dans cette these peut s’appliquer a tout autre domaine ou des

problemes similaires aux notres peuvent se poser : le domaine de l’energie en general,

l’economie du travail, l’economie de la sante, le marketing,... Les approches proposees

peuvent s’appliquer a des situations ou il existe de vraies donnees de panel, a des situa-

tions ou il existe des panels non balancees et a des situations avec donnees manquantes

(quelques observations sont manquantes, ou le cas extreme de coupes transversales

independantes comme le notre)


Il serait aussi interessant d’utiliser un critere bayesien de selection de modeles afin

de savoir si le modele a classes latentes est statistiquement meilleure au modele sans

classes dans un contexte de donnees manquantes, comme dans un contexte de vrais

panels. Nous avons utilise au chapitre (3) un test du ratio de vraisemblance dans le cas

d’une seule base de donnees. Il s’agit d’un test emboıte a la limite.

Par exemple, on pourrait aussi chercher a savoir si la structure tarifaire de l’electricite

est la structure socialement optimale. En d’autres termes, on pourrait chercher a savoir

si le prix marginal de l’electricite est vraiment le prix de marche ? Est-ce que le seuil des

30 kWh est le seuil socialement optimal ? Est-ce que la hausse du prix de l’electricite

devrait-elle se faire de facon uniforme peu importe la tranche de consommation ?

Les politiques de tarification de l’electricite devraient tenir compte d’une certaine

forme d’equite inter-generationnelle, surtout en matiere de protection de l’environne-

ment. Il ne faudrait pas non plus que les hausses de prix de l’electricite se fassent au

detriment de l’environnement. Car, si les menages venaient a changer leurs choix au

profit d’energies moins propres que l’electricite, cela pourrait se faire au detriment de

l’environnement (et augmenter les gaz a effets de serre). Des debats de societes doivent

etre faits, comme c’est le cas avec le projet Rabaska qui consiste a construire un termi-

nal de gaz naturel liquefie. Des choix dechirants et necessaires doivent etre faits, avec

l’appui de la societe civile, en matiere de sauvegarde de l’environnement, de meilleure

utilisation de l’electricite a son prix de marche, tout en assurant un developpement

economique durable de la province toute entiere.

ANALYSE DE LA DEMANDE RÉSIDENTIELLE D'ÉLECTRICITÉ À …

Documents

Transcript of ANALYSE DE LA DEMANDE RÉSIDENTIELLE D'ÉLECTRICITÉ À …