La consolidation des bases de données : application aux enquêtes sur la mobilité

36
J-P Hubert, Séminaire GRT 19 / 12 /2005 1/ 36 DEST La consolidation des bases de données : application aux enquêtes sur la mobilité Séminaire du GRT, Namur, FUNDP, 19 décembre 2005

description

La consolidation des bases de données : application aux enquêtes sur la mobilité. Séminaire du GRT, Namur, FUNDP, 19 décembre 2005. Consolidation des bases de données. Objectif : avoir des éléments pour maîtriser les faiblesses de toute enquête : - PowerPoint PPT Presentation

Transcript of La consolidation des bases de données : application aux enquêtes sur la mobilité

Page 1: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 1/ 36DEST

La consolidation des bases de données : application aux

enquêtes sur la mobilité

Séminaire du GRT, Namur, FUNDP,

19 décembre 2005

Page 2: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 2/ 36DEST

Consolidation des bases de données

• Objectif : – avoir des éléments pour maîtriser les faiblesses

de toute enquête :• les biais (de l’enquête ou de certaines questions)• les non-réponses• le caractère incomplet

• Moyen :– comparer des informations d’une enquête :

• avec des données exhaustives• avec d’autres enquêtes…

– redresser ou imputer des champs grâce à des modèles

Page 3: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 3/ 36DEST

• 1) Enquête mobilité-transport et enquête emploi du temps : deux enquêtes cousines

• 2) L’enquête budget, complément des enquêtes transport

• 3) Passerelles entre enquêtes dans les procédures CAPI

Page 4: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 4/ 36DEST

1) Enquête mobilité-transport et enquête emploi du temps : deux

enquêtes cousines

- Un objectif différent mais une intersection non nulle avec l’enquête transport

- Deux façons d’observer la mobilité :- en demandant leur déplacements aux répondants qui

interprètent la définition qui leur est donnée,- en demandant leurs activités, le transport étant l’une

d’elles (les activités sont décrites par tronçons de 10 minutes).

Page 5: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 5/ 36DEST

1999 année faste en Belgique : deux sources statistiques très compatibles

Mobel :

• Agenda de déplacements

• Auto-administré

• 11/98 – 12/1999

• 3064 ménages

• 7037 individus

• Base d’échantillonnage: Registre National

• Pondération INS-NIS

Emploi du temps :

• Agenda d’activités

• Enquête face-à-face

• 12/1998 – 02/2000

• 4275 ménages

• 8382 individus

• Base d’échantillonnage: Registre National

• Pondération INS-NIS

Page 6: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 6/ 36DEST

Comparaison des temps de transport quotidiens: une différence systématique de presque 20 minutes

Comparaisons des budgets-temps en semaine

20

40

60

80

100

120

140

écoliers étudiants travail sans emploi pensionnés

activité

bu

dg

ets-

tem

ps

(min

ute

s)

semaine ET

semaine MOBEL'1

semaine MOBEL'2

intervalle de confiance

pour mobel'1

Page 7: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 7/ 36DEST

Comparaison des nombres de déplacements par type de jour :

compatibles mais problèmes de définitions

3

3,5

4

4,5

semaine samedi dimanche

nombre de déplacements

nbre ET int.confiance nbre ET

nbre Mobel' int.confiance nbre Mobel'

3

3,5

4

4,5

semaine samedi dimanche

nombre de déplacements

nbre BTUS nbre Mobel* int.confiance

nbre Mobel* int.confiance nbre BTUS

avec depl. < 5 min Mobel sans depl. < 5 min Mobel

Page 8: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 8/ 36DEST

Conséquences sur les durées des déplacements par type de jour

15

20

25

30

semaine samedi dimanche

duréee moyenne

d'un déplacement

(min)

durée ET int.confiance durée ET durée Mobel'1

durée Mobel'2 int.confiance durée Mobel'2

15

20

25

30

semaine samedi dimanche

duréee moyenne d'un déplacement

(min)

durée ET int.confiance durée ET durée Mobel1*

durée Mobel*2 int.confiance durée Mobel*2

avec depl. < 5 min Mobel sans depl. < 5 min Mobel

Page 9: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 9/ 36DEST

Quels enseignements?

• Effet de l’arrondi, à 10 minutes pour BTUS, à 5, 10 ou 15 minutes pour Mobel.

• Un peu moins de déplacements reportés par la méthode de l’agenda de déplacements

• Grosse zone d’ombre sur les déplacements très courts (moins de 5 minutes)

• Surtout : un gros problème avec les immobiles

Page 10: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 10/ 36DEST

La comparaison rend les indicateurs multiples

• Les définitions ne correspondent jamais parfaitement

• Des adaptations apparemment mineures des indicateurs peuvent avoir de grands effets

• Des choix peuvent être remis en cause

• Illustration sur les enquêtes emploi du temps (TUS)

Page 11: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 11/ 36DEST

Analyse de l’immobilité selon les sources françaises et belges

• France :– Deux enquêtes INSEE– Protocoles semblables mais années différentes

(1993-94 et 1998)– Échantillons de 14.100 à 15.400 individus

• Belgique– Même année (1999) et même base d’échantillonnage

(INS)– Protocoles différents (questionnaire auto-administré

et interview à domicile)– Échantillons de 7.000 à 8.400 individus

Page 12: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 12/ 36DEST

(extract from Time use at different stages of life, Eurostat 2003)

Page 13: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 13/ 36DEST

Deux indicateurs possibles fondés sur le temps ou l’espace (1)

• Taux d’immmobilité

– I0 : pas d’activité transport

Temps de transport quotidien = 0 min

ou

– I1 : lieu inchangé pendant 24 heures

(domicile dans 99% des cas)

Page 14: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 14/ 36DEST

Deux indicateurs possibles fondés sur le temps ou l’espace (2)

• Nombre de déplacements par jour- Compte seulement les déplacements faits

à partir des activités de transport d’au moins 10 minutes = D1

ou- Compter aussi :

- changements de lieux = D2

et- Les allers-retours collés = D3

Page 15: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 15/ 36DEST

Indicateurs alternatifs sur l’immobilité un jour de semaine

Les différences viennent des changements de lieu, i.e. probablement des très courts déplacements

Immobility rate by age, BTUS 1999, INS

0%

5%

10%

15%

20%

25%

30%

35%

40%

15-24years

25-34 35-44 45-54 55-64 65 and + all

stay home travel time = 0

Immobility rate by age, FTUS, INSEE 1998

0%

10%

20%

30%

40%

50%

60%

15-24years

25-34 35-44 45-54 55-64 65 and + all

stay home travel time = 0

Immobility rate by age, FTUS, INSEE 1998

BTUS, INS 1999

0%

10%

20%

30%

40%

50%

60%

15-24 years 25-34 35-44 45-54 55-64 65 and + all

stay home (F) travel time = 0 (F) stay home (B) travel time = 0 (B)

I0F=27%

I0B=14%

I0B=9%

I1F=8%

Page 16: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 16/ 36DEST

Indicateurs alternatifs sur le nombre de déplacements, un jour de semaine

Les différences sont surtout dues aux changements de lieux ET

au taux d’immobilité (les moyennes incluent les zéros)

Daily number of trips by age,(included zero trips)

BTUS 1999, INS0

1

2

3

4

5

6

15-24 years 25-34 35-44 45-54 55-64 65 and + all

trips >= 10 min + extra trips >= 10 min

Immobility rate by age, FTUS, INSEE 1998

0

1

2

3

4

5

15-24 years 25-34 35-44 45-54 55-64 65 and + all

trips >= 10 min + extra trips >= 10 min

Daily number of trips by age,(included zero trips) FTUS, INSEE 1998

BTUS, INS 19990

1

2

3

4

5

6

15-24 years 25-34 35-44 45-54 55-64 65 and + all

trips>=10min (F) >=10min + extra (F) trips>=10min (B) >=10min + extra (B)

F B

D1 2.2 3.4

D2 1.7 1.0

D3 0.1 0.2

∑ 4.0 4.6

Page 17: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 17/ 36DEST

Indicators based on place / based on time

-100%

-50%

0%

50%

100%

150%

200%

15-24 years 25-34 35-44 45-54 55-64 65 and + all

rela

tive

vari

atio

n

Trips+extra (incl. zeros) Trips+extra (mobiles only) immobiles

Souvent indicateur varie…

Indicators based on place / based on time

-100%

-50%

0%

50%

100%

15-24 years 25-34 35-44 45-54 55-64 65 and + all

rela

tive

vari

atio

n

Trips+extra (incl. zeros) Trips+extra (mobiles only) immobiles

FTUS, INSEE 1998,average weekday

BTUS, INS 1999,average weekday

Page 18: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 18/ 36DEST

Retour sur la comparaison avec MOBEL

• Quels écarts choisir ?

• Le critère du parallélisme (chercher le biais systématique)

• La « vraie » valeur n’est pas donnée, elle doit être (re)construite

Page 19: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 19/ 36DEST

Comparaison des taux de mobilité mesurés par le temps de transport

% mobiles (temps>0)

EdT(BTUS)

MOBEL EdT(BTUS)

MOBEL EdT(BTUS)

MOBEL

Tous Tous Hommes

Hommes Femmes Femmes

Semaine 86% 78% 90% 82% 83% 74%

Samedi 85% 78% 86% 80% 85% 76%

Dimanche 78% 61% 81% 66% 74% 58%

Page 20: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 20/ 36DEST

Ecart encore plus grand avec l’indicateur « spatial »

• « immobile » : personne qui n’a réalisé aucun déplacement (ET) ou qui a fait toutes ses activités dans un même lieu (EdT)

Taux d’immobilité selon le sexe, un jour ouvré

France ET F 93-94 EDT F 98 différence

sexe taux d’immobilité

valeur sup. à 95%

valeur inf. à 95%

taux d’immobilité

valeur sup. à 95%

valeur inf. à 95%

taux d’immobilité

masculin 13,9% 13,0% 14,8% 5,6% 5,0% 6,3% 8,3

féminin 20,3% 19,4% 21,3% 10,9% 10,1% 11,6% 9,4

ensemble 17,4% 16,8% 18,1% 8,3% 7,8% 8,9% 9,1

Belgique MOBEL 99 EDT B 99 différence

sexe taux d’immobilité

valeur sup. à 95%

valeur inf. à 95%

taux d’immobilité

valeur sup. à 95%

valeur inf. à 95%

taux d’immobilité

masculin 17,5% 16,0% 19,0% 5,7% 5,0% 6,5% 11,8

féminin 25,8% 24,1% 27,4% 11,7% 10,7% 12,7% 14,1

ensemble 21,8% 20,7% 23,0% 8,8% 8,2% 9,4% 13,0

Sources: ET F 93-94 INRETS-INSEE, EDT F 98 INSEE, MOBEL 99 GRT SPF-PS, EDT B 99 INS

Page 21: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 21/ 36DEST

Un écart différencié, selon l’âge…

Sources: ET F 93-94 INRETS-INSEE, EDT F 98 INSEE, MOBEL 99 GRT SPF-PS, EDT B 99 INS

Excédent d'immobiles dans l'enquête transport

0

5

10

15

20

25

< 19 20 – 29 30 – 39 40 – 49 50 – 59 60 – 69 70 et plus

Age Tous

po

ints

France

Belgique

Page 22: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 22/ 36DEST

… et le capital social

Excédent d'immobiles dans l'enquête transport

0

5

10

15

20

25

Cad

res

Tec

hnic

iens

Em

ploy

és

Ouv

riers

San

s ac

tivité

Art

isan

s,co

mm

erça

nts

Agr

icul

teur

s

activité tous

po

ints

France

Sources: ET F 93-94 INRETS-INSEE, EDT F 98 INSEE, MOBEL 99 GRT SPF-PS, EDT B 99 INS

Excédent d'immobiles dans l'enquête transport

0

5

10

15

20

25

Ecole

prim

aire

ou a

ucun d

ipl.

Dip

lôm

e

secondaire

Enseig

nem

ent

supérieur

ou

univ

ers

itaire

scolarisation tous

po

ints

Belgique

Page 23: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 23/ 36DEST

En ce qui concerne la mobilité

Des résultats divergents :

- En France : même durée quotidienne de transport mais moins de déplacements dans l’enquête emploi du temps

- En Belgique : nombre de déplacements par jour similaires mais une durée totale plus grande dans l’enquête emploi du temps

Page 24: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 24/ 36DEST

La durée moyenne d’un déplacement est supérieure dans l’enquête emploi du temps

Sources: ET F 93-94 INRETS-INSEE, EDT F 98 INSEE, MOBEL 99 GRT SPF-PS, EDT B 99 INS

Page 25: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 25/ 36DEST

Un problème de non-réponse dans les enquêtes transport

• La mobilité de certaines classes d’âge ou catégories sociales mal représentée dans les enquêtes transport ?

• Les enquêtes emploi du temps sont plus fiables sur l’immobilité, mais moins précises sur la mobilité

• Peut-on envisager des procédures de redressement ?

Page 26: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 26/ 36DEST

• Deux outils différents, des points forts et des points faibles pour l’observation de la mobilité

• Deux biais :– Surestimation certaine des immobiles dans

les enquêtes transport– Surestimation probable des durées de

transport dans les enquêtes emploi du temps

• Une synergie à développer entre les deux types d’enquêtes

Page 27: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 27/ 36DEST

2) L’enquête budget, complément des enquêtes transport

Quelques propositions

Page 28: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 28/ 36DEST

Problématiques « budget » intéressant la mobilité

• Budget transport des ménages

• Orienter les comportements par des aides ou des taxes ciblées

• Les achats (problématique du transport de marchandise par les ménages)

Page 29: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 29/ 36DEST

Chaque pays a ses particularités

• Cas particulier de la Belgique les enquêtes budget 1999 et 2005 sont associées aux enquêtes emploi du temps

• En France, l’enquête budget des ménages demande les lieux d’achat pour chaque et tous les achats son codés selon une nomenclature automatique immense

• Possibilités d’imputation de champs absents par différentes stratégies

Page 30: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 30/ 36DEST

Stratégie 1 :Imputer un champ à partir d’une autre enquête (« greffe »)

• Principe :– Si l’on dispose d’une ensemble de variables

communes entre deux enquêtes, et que parmi cet ensemble se trouvent les variables explicatives d’un champ X de l’enquête A, absent dans B, alors :

– l’imputation de X dans B est possible grâce au modèle développé sur A et aux variables explicatives de B

Page 31: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 31/ 36DEST

Stratégie 2 : Imputer à partir d’enquêtes complémentaire

• Faire une enquête complémentaire sur un sous-échantillon (intérêt, il y a plus de variables pour modéliser le champ manquant sur l’ensemble de l’échantillon)

• Ex. distribuer des GPS à un sous échantillon d’individus pour connaître une estimation des distances dans une enquête emploi du temps

Page 32: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 32/ 36DEST

Stratégie 2 : Imputer à partir d’enquêtes complémentaire

• Faire une enquête complémentaire sur des achats pour convertir le coût et la nature des achats en encombrement et en poids

Page 33: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 33/ 36DEST

3) Passerelles entre enquêtes dans les procédures CAPI

Computeur Assisted Personal InterviewCollecte Assistée Par Informatique

• Ce que change le CAPI• Systématiser la partie commune des

enquêtes • Constituer une base pour les

redressements

Page 34: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 34/ 36DEST

Ce que change le CAPI

• L’informatisation du questionnaire est une tâche lourde (plus documentation et traitement aval de la collecte). Economies possibles en reprenant, tels quels, les morceaux d’une autre enquête (ex. ENT 07 en France)– Questions « emploi », « budget », « santé »,

« histoires de vie »

Page 35: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 35/ 36DEST

Systématiser la partie commune des enquêtes

• Tronc commun ménage (INSEE)– Avantages (enquêteurs rodés, mêmes

questionnements…) et inconvénients (informations hors champ de l’enquête, style différent…)

– Tous troncs communs des enquêtes ménages peuvent constituer une base pour le redressement pour des variables dont on ne dispose pas de données exhaustives (ex.

« unités de vie » ou « budgets séparés »)

Page 36: La consolidation des bases de données : application aux enquêtes sur la mobilité

J-P Hubert, Séminaire GRT 19 / 12 /2005 36/ 36DEST

En guise de conclusion

• Une enquête ne circonscrit jamais complètement un champ et n’est pas isolée.

• Mais la « consolidation » passe par certaines démolitions.

• Trois besoins essentiels :– Communiquer avec les autres utilisateurs d’enquêtes

statistiques– Communiquer avec les producteurs de données– Avoir du temps pour comprendre les biais propres à

chaque enquête