Projet de recherche - marketingthema.files.wordpress.com · SERVQUAL est publié en 1990 dans la...

37
Responsable du cours : Pr. Eric Vernette Etudiants : Quynh NGUYEN NGOC Yassine EL BOUCHIKHI Laurent MAUBISSON Master II Parcours Recherche en marketing Projet de recherche Etudes quantitatives Vérification de la fiabilité et de la validité d’une mesure d’un concept Les transports en communs IAE de Toulouse Université de Sciences Sociales - Toulouse I 2005 – 2006

Transcript of Projet de recherche - marketingthema.files.wordpress.com · SERVQUAL est publié en 1990 dans la...

Responsable du cours :

Pr. Eric Vernette

Etudiants :

Quynh NGUYEN NGOC

Yassine EL BOUCHIKHI

Laurent MAUBISSON

Master II Parcours Recherche en marketing

PPrroojjeett ddee rreecchheerrcchhee EEttuuddeess qquuaannttiittaattiivveess

Vérification de la fiabilité et de la validité d’une mesure d’un concept

LLeess ttrraannssppoorrttss eenn ccoommmmuunnss

IAE de Toulouse Université de Sciences Sociales - Toulouse I

2005 – 2006

- 2 -

SSoommmmaaiirree Introduction 3

- Choix du concept étudié 3 - Nomination des échelles de mesure 3

- Méthodologie 4

Définition du concept 5

- Revue de la littérature 5 - Justification du choix des items de l’échelle 11

Phase terrain 13

- Collecte des données 13 - Etude de la fiabilité 13

- Stabilité de contenu 14 - Stabilité temporelle 24 - Stabilité d’application 25

- Etude de la validité 27

- Validité convergente 27

• Matrice MTMM

• Régression linéaire

- Validité discriminante 30

• Matrice MTMM

- Analyse factorielle confirmatoire 32 - Analyse factorielle confirmatoire comparative 34

Synthèse de l’étude et conclusions 35 Annexes

- Questionnaires d’étude - Annexe 1 : ACP SERVQUAL - Annexe 2 : ACP SERVPERF - Annexe 3 : ACP EPI - Annexe 4 : Régression SERVQUAL - Annexe 5 : Régression SERVPERF

- 3 -

IInnttrroodduuccttiioonn

Une des composantes essentielles du marketing mix est le produit.

Certains courant de pensées lui confèrent le titre de « composante clé »

puisque les autres sont fonctions de cette première : les caractéristiques

d’un produit sont déterminantes pour définir le mode distribution, le prix,

l’avantage concurrentiel sur lequel communiquer…

Les produits tangibles sont souvent aujourd’hui accompagnés de services

(vente, après-vente, garantie, …) et constituent de réels éléments de

différenciation.

D’autre part, certaines organisations proposent uniquement des services,

tels que les transports en commun. La différence entre un produit et un

service s’exprime essentiellement par le caractère tangible du produit

(intangibilité), son degré de standardisation (hétérogénéité) ainsi que de la

participation ou non de l’acheteur au processus d’achat (inséparabilité),

(Parasuraman, Zeithaml, Berry, 1985).

Il est donc difficile d’évaluer la qualité de service autrement que par

l’étude de l’importance et de l’appréciation des dimensions perçues par un

consommateur (pas de mesures objectives possibles).

Enfin, étant exposé chaque jour à une multitude de services, le choix du

terrain d’application n’en sera que plus dense et diversifié.

Deux écoles (parmi d’autres) se sont intéressées au concept de qualité de

service et ont proposé deux échelles ; à premier abord similaires :

SERVQUAL (Parasuraman, Zeithaml, Berry) et SERVPERF (Cronin &

Taylor).

L’objet de ce rapport est de présenter une comparaison des deux versions

adaptées de SERVQUAL et SERVPERF sur les critères de fiabilité et de

validité convergente, afin de s’assurer que les qualités psychométriques de

ces échelles sont satisfaisantes.

Dans un second temps, nous testerons la validité discriminante de

l’échelle SERVPERF avec l’étude d’un autre outil, l’Echelle de Profil

d’Implication - EPI - de Kapferer et Laurent.

- 4 -

Nous avons décidé d’utiliser le paradigme de Churchill pour structurer

notre recherche. Celui-ci propose en effet une démarche de recherche

portant sur le développement d’une échelle.

Voir - Figure 1 -

Bien entendu, nous n’avons pas retenu certaines étapes telles que la

génération des attributs (�) ou la première collecte de données (�).

Attardons nous un instant sur le traitement de la fiabilité (�) et de la

validité (�) d’une échelle de mesure.

Il consiste, de manière très générale, à expliquer la variance totale de la

mesure en la décomposant/distinguant par : « la variance vraie », « la

variance systématique » et « la variance d’erreur ».

- Etude de la variance systématique : Validité

- Etude de la variance d’erreur : Fiabilité

Nous consacrerons donc une première partie à la définition du concept

largement illustrée par la présentation des travaux réalisés par les deux

écoles de Parasuraman, Zeithaml, Berry et Cronin & Taylor. Puis nous

nous concentrerons sur la phase terrain en découvrant la méthode de

recueil d’information ainsi que les traitements de la fiabilité et de la

validité des échelles.

� Specify document

of construct

���� � Generate sample

of items

���� � Collect data

���� � Purify mesure

���� � Collect data

���� � Reliability

���� � Validity

���� � Develop norme

- Figure 1 - Paradigme de Churchill, 1979

(Illustré du plan de la présentation)

Définition du concept

Revue de littérature

Définition du concept

Justification du choix de items

Phase terrain

Collecte des données

Phase terrain

Etude de la fiabilité

Phase terrain

Etude de la validité

Résultats de la vérification

- 5 -

DDééffiinniittiioonn dduu concept

- Revue de la littérature - L’approche d’un article scientifique consiste pour grand nombre de chercheurs à commencer dans une première étape par une lecture attentive sur le résumé, puis sur les références et enfin sur la méthode et les résultats obtenus. Dés la sélection des articles de Parasuraman, Zeithaml, Berry et Cronin & Taylor, nous sommes frappés par l’importance du facteur chronologique à considérer dans cette comparaison. SERVQUAL est publié en 1990 dans la revue Recherche et Application Marketing, Vol. V, n°1 avec pour intitulé « SERVQUAL : une échelle multi-items de mesure des perceptions de la qualité de service par les consommateurs ». SERVPERF est publié en Juillet 1992 dans la revue Journal of Marketing, Vol. 56. L’article est nommé « Measuring Service Quality : a reexamination and extension ». Ce titre pour le moins explicite employé par Cronin & Taylor met l’accent sur la ré-examen de la mesure de la qualité de service. Au vue des exigences éditoriales des revues dans lesquelles paraissent ces articles, nous sommes à même de croire que cet examen et ces propositions d’extension ont une contribution supplémentaire à apporter à l’appréciation de ce concept. Afin de nous forger une certaine objectivité de ces travaux, nous avons tenu à les traiter et les présenter en respectant cette chronologie. Parasuraman, Zeithaml et Berry annoncent la problématique suivante : la qualité de service représente un construit abstrait et diffus. Ils proposent alors de décrire une échelle multi items de mesure de la qualité de service d’une part et de présenter ses propriétés et ses applications potentielles. Afin de délimiter le domaine de construit, Parasuraman, Zeithaml et Berry ont réalisé une revue de littérature. Le premier point qu’ils soulignent est la distinction entre « qualité mécaniste » et « qualité humaniste ». En effet, une poignée de chercheurs (Garvin, 1983 ; Dodds et Monroe, 1984 ; Hlbrook et Corfman, 1985 ; Jacoby et Olsen, 1985 ; Zeithaml, 1987) s’accorde à définir la qualité mécaniste comme étant l’aspect ou la caractéristique d’ordre objectif de l’objet ; et la qualité humaniste s’applique à la réaction subjective des individus face à des objets.

- 6 -

Le second point mis en avant a été développé par Olshavsky (1985) et explique que la qualité de service est étroitement liée à l’évaluation globale du service (concept similaire à l’attitude). Olivier (1981) compare la qualité de service et la satisfaction. Ses résultats confirment que la qualité perçue représente un jugement global, tandis que la satisfaction est associée à une transaction spécifique. Enfin, Sasser, Olsen et Wickoff (1978), Lehtinen et Lehtinen (1982) montrent clairement que la qualité de service perçue résulte de la comparaison entre les attentes ‘E’ du consommateur envers un service et les performances ‘P’ perçues du prestataire de service. Parasuraman, Zeithaml et Berry se sont appuyés sur une étude exploratoire de la qualité de service, réalisée en 1985, pour la génération des items. Cette précédente étude avait permis d’identifier 10 dimensions de la qualité de service qui ont conduit à la génération de 97 items. Chaque item est exposé à l’évaluation des attentes dans un premier temps puis des performances. Nous pouvons également souligner l’utilisation d’une échelle en 7 points et la présence de questions négativement formulées. Concernant la purification des échelles, l’instrument a été administré auprès de 200 adultes répartis dans différentes catégories de service : réparation et maintenance de petits appareils électriques, services bancaires, téléphone longue distance, courtage de titres et cartes de crédit. La sélection finale des items est réalisée selon les recommandations de Churchill (1979) et Cronbach (1951) et à partir des scores calculés ‘Q= P - E’. Cette première itération a conduit à la génération de 54 items. Un certain degrés de chevauchement entre les 10 dimensions a conduit les chercheurs à privilégier une rotation oblique afin d’autoriser des inter corrélations entre dimensions. Cette seconde manipulation a autorisé la suppression de 20 items. Ce nouveau construit de 34 items a été administré une nouvelle fois auprès d’échantillons indépendants de 200 personnes pour les 4 mêmes secteurs d’activité identifiés dans une zone commerciale de l’Est des Etats-Unis. Une nouvelle analyse des loadings factoriels a permis de retenir les 22 items de l’échelle SERVQUAL. Les 5 dimensions retenues sont donc :

- Eléments tangibles (installations physiques, équipement et apparence du personnel)

- Fiabilité (capacité à réaliser le service promis en toute confiance et de manière précise)

- Serviabilité (bonne volonté pour répondre aux consommateurs et offrir un service prompt)

- Assurance (compétence et courtoisie des employés ainsi que leur capacité à inspirer confiance)

- 7 -

- Empathie (prise en considération, attention individualisée que l’entreprise accorde à ses consommateurs.

Les 2 dernières dimensions contiennent des items représentants les 7 dimensions originelles. Concernant les tests de fiabilité et de validité, nous serons plus concis dans la présentation et nous nous en tiendrons aux résultats accompagnés de quelques commentaires. Voici les coefficients présentés dans l’article pour étudier la fiabilité de l’échelle :

Dimension Intitulé Nbre

d’items

Coef de fiabillité (Alpha)

Items Loading factoriels des items par dimension

Eléments tangibles

F1

4

0.72

Q1 Q2 Q3 Q4

0.69 0.68 0.64 0.51

Fiabilité

F2

5

0.83

Q5 Q6 Q7 Q8 Q9

0.75 0.63 0.71 0.75 0.50

Serviabilité

F3

4

0.82

Q10 Q11 Q12 Q13

0.51 0.77 0.66 0.86

Assurance

F4

4

0.81

Q14 Q15 Q16 Q17

0.38 0.72 0.80 0.45

Empathie

F5

5

0.86

Q18 Q19 Q20 Q21 Q22

0.78 0.81 0.59 0.71 0.68

Fiabilité de la combinaison linéaire

0.92

- Figure 2 - Analyse des données de la première collecte

(Article de Parasuraman, Zeithaml et Berry)

Le pourcentage de variance extrait par les 5 facteurs est de 63,2 %. Les Alpha de Cronbach sont satisfaisants ainsi que les loadings factoriels (seuls 2 sont en dessous de 0,5). L’évaluation de la validité est essentiellement fondée sur des régressions linéaires puisque, d’après les auteurs, « L’évaluation de la validité de

- 8 -

contenu d’une échelle est nécessairement qualitative plutôt que quantitative ». Une première régression est réalisée sur l’appréciation de la qualité globale de l’entreprise à partir d’une échelle de Lickert. Une seconde puis troisième sont réalisées à propos de la recommandation du prestataire et de la pré-signalisation d’un problème. Voici les résultats présentés concernant la validité de l’échelle :

Dimensions Coefficient de régression standardisé

Niveau de signification de la pente

R² ajusté

Banque E. tangibles Fiabilité Serviabilité Assurance Empathie

0.13 0.39 0.07 0.13 0.01

0.07 0.00 0.35 0.09 0.89

0.28

Cartes de crédit E. tangibles Fiabilité Serviabilité Assurance Empathie

0.07 0.33 0.12 0.17 0.04

0.26 0.00 0.11 0.02 0.58

0.27

Réparat°/Maintenance E. tangibles Fiabilité Serviabilité Assurance Empathie

0.04 0.54 0.11 0.16 0.01

0.48 0.00 0.09 0.02 0.81

0.52

Tél. longue distance E. tangibles Fiabilité Serviabilité Assurance Empathie

0.08 0.45 0.12 0.15 0.02

0.17 0.00 0.09 0.03 0.78

0.37

- Figure 3 - Résultats de la régression à partir de la prédiction de la

qualité globale

(Article de Parasuraman, Zeithaml et Berry)

Les valeurs de R² sont significatives pour chacun des cas. La fiabilité est la dimension la plus critique en terme de prédiction de la qualité globale. Parasuraman, Zeithaml et Berry recommandent de procéder à une adaptation appropriée de l’instrument au secteur d’activité étudié. Il est également possible, à moindre mesure, de reformuler les items des cinq dimensions.

- 9 -

Pour Cronin & Taylor, la problématique est toute autre. De manière générale, elle s’exprime en deux points. Il s’agit de tester une méthode alternative de la perception de la qualité de service (SERVQUAL est jugé inadéquat pour mesurer la qualité de service selon eux). Dans un second temps l’orientation centrale de cette recherche sera d’étudier la relation entre qualité de service, satisfaction clientèle et intention d’achat. Le premier angle d’approche utilisé par les chercheurs est la supériorité de la qualité des résultats obtenus lorsque l’on se focalise sur la perception de la performance, phénomène évoqué par grand nombre d’écoles (Bolton et Drew 1991 ; Churchill et Surprenant 1982 ; Mazis, Ahtola et Klippel 1975 ; Woodruff, Cadotte et Jenkins 1983). Cronin & Taylor indiquent que la qualité de service est le plus souvent apparentée au concept d’attitude. Une ambiguïté persiste entre la définition et la conceptualisation de la qualité de service. Ils évoquent donc les travaux précédemment réalisés par Parasuraman, Zeithaml et Berry dont la finalité permet de croire que la qualité de service et la satisfaction sont deux construits distincts (Bitner 1990, Bolton et Drew 1991). Comme pour l’attitude, la qualité de service est l’évaluation à long terme réalisée par le consommateur alors que la satisfaction est spécifique à une transaction. La relation entre qualité de service et satisfaction est controversée par deux courants de pensées : Parasuraman, Zeithaml et Berry (1985) suggèrent que la qualité de service est un antécédent de la satisfaction, alors que Bitner (1990), Bolton et Drew (1991), suggèrent l’inverse. Un troisième point évoqué par les auteurs est l’effet d’expérience (vs première expérience) dans la formation de la perception de la qualité de service, travaux d’Oliver (1980). Mazis, Ahtola et Klippel (1975) indiquent que les dimensions de la performance font essentiellement appel à l’aspect behavioriste expérientiel du consommateur. Cela suggère donc de ne retenir que l’évaluation de la performance. Cronin & Taylor relatent les travaux réalisés sur SERVQUAL et formulent leur hypothèse à partir de ce dernier et des conclusions de leur revue de littérature. Le périmètre de recherche étant maintenant défini, intéressons nous à la méthode. Les chercheurs ont d’abord réalisé une analyse confirmatoire du construit SERVQUAL afin de déterminer si les 22 items mesurent réellement la qualité de service. Ils ont ensuite comparé ces résultats aux hypothèses suivantes :

� Qualité de service = (Performances perçues – Attentes) � Qualité de service = Importance x (Performances perçues – Attentes) � Qualité de service = Performances perçues � Qualité de service = Importance x Performances perçues

- 10 -

Enfin, la troisième étape de leur travaux consiste à éclaircir les relations qui interviennent entre qualité de service, intention d’achat et satisfaction clientèle. Le recueil des données est constitué de 660 questionnaires. Les secteurs d’activité étudiés par les chercheurs sont : les opérations bancaires (188), la dératisation (175), le nettoyage à sec (178) et la restauration rapide (189). Le questionnaire est composé des 22 items de SERVQUAL et décliné pour chaque mesure : interrogation sur les attentes, la performance puis l’importance de chaque dimension de la qualité de service. Les résultats exposés dans l’article concernent principalement l’étude la validité des construits SERVQUAL et SERVPERF. Cronin et Taylor soulignent le caractère unidimensionnel de SERVQUAL (convergence des corrélations, rotation oblique…).

Analyse Factorielle Confirmatoire Cinq paramètres d’appréciation de la qualité de service

Paramètres Banques Dératisation Lavage de voiture

Restauration rapide

Chi square d.f. p GFI* AFI** RMSR***

308.60 204 .000 .863 .831 .309

486.16 204 .000 .790 .740 .466

402.60 204 .000 .819 .776 .381

364.16 204 .000 .849 .813 .515

Correlation Coefficients for Structure Models

SERVQUAL SERVPERF

SERVQUAL SERVPERF Overall service quality Satisfaction

1.00 0.810 0.543 0.561

-

1.000 0.6012 0.5978

A partir de la revue de littérature et des résultats obtenus, Cronin et Taylor préconisent l’utilisation de SERVQUAL pour mesurer la qualité globale d’un service. Tandis que SERVPERF explique plus clairement la perception de la qualité de service. D’un point de vue managérial, SERVPERF mesure davantage la performance de la qualité de service. SERVQUAL est une approche par l’évaluation des écarts ; SERVQUAL est une approche analytique des performances. L’item n° 19 à propos de l’attention personnalisée, a été supprimé de l’énoncé car il présentait des saturations négatives dans les analyses factorielles, avec rotation oblique, réalisées avec chacun des secteurs d’activité.

- 11 -

- Justification du choix des items de l’échelle -

Cette étape peut donc s’apparenter à celle de « purification de la mesure »

proposée par le paradigme de Churchill. L’objectif est d’approprier le

questionnaire au terrain d’étude choisi.

En effet, les catégories de services retenues par les auteurs ne nous ont pas

encouragé à sélectionner un domaine d’application communément cité par

les deux écoles.

L’instabilité sémantique des items entre les différentes catégories de services précédemment étudiés, Carman (1990) déconseille de généraliser les cinq dimensions de SERVQUAL. Afin de « forcer » la fiabilité et la validité des outils et par commodité d’administration, nous avons choisi de tester le concept de Qualité de service sur le terrain des Transports en communs.

De part cette différence, certains items nous paraissent difficiles à

comprendre et à interpréter.

Un personnalisation, ou éventuellement, une suppression, des énoncés

s’impose. L’objectif de nos travaux étant d’étudier la fiabilité et validité

d’un construit, nous avons jugé plus intéressant de conserver tous les

items et de simplement personnaliser l’énoncé lorsque cela est nécessaire.

Concernant le construit SERVQUAL (et donc SERVPERF), seule une

modification a été apportée : le remplacement à la question n°9 de

« archives » par « dossiers ».

Pour l’EPI de Kapferer et Laurent, plusieurs modifications ont été

apportées :

- Question 2 : …ce qui touche…

- Question 4 : …en utilisant…

- Question 5 : …on utilise un… …on se porte une petite attention.

- Question 6 : …me déplacer en bus, métro ou navette…

- Question 7 : …en dit un peu sur qui l’on est.

Comme dans les travaux précédemment présentés, nous avons utilisé une

échelle sémantique en 7 points exprimant le degré d’accord avec l’intitulé.

Certaines questions intègrent une négation dans leur formulation ; nous

avons simplement inversé les scores lors de la saisie comme préconisé

dans l’article présentant SERVQUAL.

Le concept d’implication dans l’article de kappferer et laurent, Revue de littérature,

- 12 -

L’article que nous avons sélectionné afin d’appréhender le concept d’implication est celui de LAURENT G. & KAPFERER J.-N., publié en (1986), sous le titre : Les profils d'implication, dans la revue Recherche et Applications en Marketing. Les auteurs commencent dans un premier temps par une revue de littérature taxinomique afin de dresser un bilan synthétisant les différents courants qui ont préalablement tenté de délimiter le concept d’implication. En effet, dans la littérature marketing citée par LAURENT G. & KAPFERER J.-N, on s’accorde à penser que l’implication pour un objet est la relation qui existe entre cet objet et le système central de valeurs de l’individu (Sherif et Cantril, 1947 ; Ostrom et Brock, 1968 ; Bloch et Richins, 1983 ; Zaïchkowsky, 1986). L’implication est un concept multi-dimensionnel. Certains auteurs distinguent les dimensions affective et cognitive (Park et Young, 1986). Néanmoins c’est la distinction entre les orientations durable et occasionnelle (Houston et Rothschild, 1978) qui est privilégiée. Si la plupart des chercheurs admettent la multidimensionnalité du concept, ils ne s’accordent pas sur les dimensions à prendre en compte. Park et Young (1986) distinguent les dimensions affective et cognitive. L’implication affective est un moyen d’expression des valeurs propres aux individus. L’implication cognitive fait référence, par exemple, à la connaissance ou à l’expérience antérieure du produit. Kapferer et Laurent (1986, p. 55) soulignent que « l’implication est une variable hypothétique. Elle ne peut donc être mesurée directement, mais il faut la saisir à travers ses causes ». L’implication doit être appréhendée comme une variable médiatrice (Mitchell, 1979) qui n’est pas un déterminant unique du comportement. Elle affecte aussi bien les éléments constitutifs du processus de décision d’achat que des orientations comportementales plus durables. Les auteurs présentent ensuite la problématique de leur recherche visant à développer un instrument de mesure de la direction et l’intensité de l’implication à travers différents profils. LAURENT G. & KAPFERER J.-N., exposent ensuite la démarche méthodologique suivie (Paradigme de CHURCHILL) qui leur a permis de développer leur échelle. Notre domaine de recherche se limite ainsi à l’Echelle des Profils d’Implication (E.P.I.) qui se compose de 16 items, au format de type Likert en cinq points (de « Tout à fait d’accord » à « Pas du tout d’accord »). C’est une échelle multidimensionnelle globale qui permet de déterminer des profils d’implication envers une catégorie de produit.Cinq facettes de l’implication sont explorées :

- L’intérêt personnel dans la catégorie de produit - La valeur hédonique du produit considéré - La valeur de signe du produit - L’importance perçue des conséquences négatives en cas d’un mauvais

choix (« Imporisk ») - La probabilité subjective de faire une telle erreur (« Proberr »).

- 13 -

PPhhaassee tteerrrraaiinn

- Collecte des données - Afin de ne pas introduire de biais inutiles sur la stabilité d’application des

construits (robustesse), nous avons respecté les recommandations

précisées dans les articles. Ces deux consignes concernant

l’administration des questionnaires sont :

- de faire remplir directement le questionnaire par l’individu

- de n’interroger que des personnes qui ont consommé le service

étudié il y a moins de un mois

Nous avons administré 43 questionnaires (plusieurs questionnaires n’ont

pas été retenu car ils étaient incomplets).

Bien que l’objectif était de 40 questionnaires administrés, le nombre

d’individus constituant la matrice des répondants est faible et les

résultats obtenus (en terme d’implication managériale et statistique) sont

donc à nuancer.

La collecte des données s’est déroulée du 15 au 25 novembre 2005.

- Etude de la fiabilité - La fiabilité d’une mesure consiste à s’assurer de sa stabilité. La littérature

des sciences sociales a identifiée trois types de stabilité :

- La stabilité temporelle : Nous ne nous sommes pas aventurés à

tester la stabilité temporelle, cela nécessitait de renouveler l’enquête

une seconde fois et nous n’avions pas suffisamment de marge de

manoeuvre (intervalle de temps et délai de traitement).

Cependant la comparaison de nos résultats et de ceux obtenus par

Parasuraman, Zeithaml et Berry peut aboutir à certaines

conclusions.

- La stabilité des contenus : C’est la partie que nous avons le plus

développé en réalisant une analyse exploratoire du construit et

calculant les alpha de chaque dimension (Churchill, 1979). Il s’agit

de vérifier que les items représentent bien le concept (les dimensions

puis le concept pour être plus précis)

- La stabilité d’application : la robustesse du construit n’a pas été

traitée dans ces travaux. En effet il s’agit d’analyser la qualité de

recueil d’information et la seule méthode dont nous disposons est de

scinder le questionnaire en fonction des administrateurs et d’étudier

indépendamment puis conjointement les résultats obtenus. La taille

- 14 -

de notre échantillon total étant déjà relativement faible, l’étude de

fragment de celui-ci serait stérile.

Encore une fois, la présentation des résultats de notre étude suit le

déroulement méthodologique que nous avons parcouru. Dans cette partie,

l’étude de la stabilité temporelle sera donc traitée après celle de la stabilité

des contenus.

Stabilité des contenus

Nous avons donc débuté par une analyse exploratoire de chaque construit

afin d’identifier les dimensions de chacun et d’observer leur qualité.

Concernant l’étude de l’échelle SERVQUAL, plusieurs itérations ont bien

évidement été nécessaires pour obtenir une analyse en composante

principale ‘optimale’ (satisfaisante).

En effet, c’est au bout de la sixième itération que nous avons obtenu ces

résultats (Figure 4).

Alpha de

Cronbach Items F1 F2 F3 F4 F5 F6

Q.8 Engagement sur les délais

Q 6 Attitude sympathique

Q 7 Confiance envers l’entreprise

Q 20 Connaissance des besoins

Q 5 Délais annoncés

Q 14 Confiance envers les employés

Q 16 Politesse des employés

Q 22 Horaires pratiqués

.837

.805

.757

.712

.693

.678

.650

.636

.882

Q 12 Assistance aux consommateurs

Q 13 Compréhension de la charge de travail

.873

.837

.825

Q 18 Attention individuelle accordée

Q 19 Attention personnelle accordée

.906

.888

.833

Q 11 Rendre des services prompts

Q 10 Annoncer le moment de réalisation

.872

.730

.640

Q1 Equipement récent

Q 17 Soutien de l’entreprise

.891

.510

.420

Q 4 Adéquation matériel/service

Q 3 Employés vêtus correctement

.785

.646

.354

- Figure 4 - Résultats de la matrice des composantes après rotation et des

Alpha de Cronbach

(Annexe 3 - SERVQUAL - ACP n° 6)

- 15 -

Présentation des données brutes :

- La qualité de factorisation est juste satisfaisante (KMO) : 0.600

- La signification du test de Bartlett est très satisfaisante

(dispersion) : 0.00

- Le pourcentage d’information restitué par le modèle est également

satisfaisant (principe de parcimonie) : 73.54 % de variance

expliquée.

- La matrice des composantes présente des loadings très satisfaisants

concernant la constitution des axes, satisfaisant quand à leur

caractère indépendant.

- Les Alpha de Cronbach sont satisfaisants pour les 3 premières

dimensions, justes insuffisants pour la quatrième dimension et très

insuffisants pour les deux dernières dimensions.

Présentation succincte des itérations :

- ACP 1 : Résultats bruts (Annexe 2 - SERVQUAL - ACP n° 1)

- ACP 2 : Rotation varimax

- ACP 3 : Rotation varimax et suppression de l’item « sécurité des

transactions (Q 15) »

- ACP 4 : Rotation varimax et suppression des items « sécurité des

transactions (Q 15) » et « Matériel attractif (Q 2) »

- ACP 5 : Rotation varimax et suppression des items « sécurité des

transactions (Q 15) », « Matériel attractif (Q 2) » et « Tenir à jour ses

documents (Q 9) »

- ACP 6 : Rotation varimax et suppression des items « sécurité des

transactions (Q 15) », « Matériel attractif (Q 2) », « Tenir à jour ses

documents (Q 9) » et « Agir dans les meilleurs intérêts (Q 21) »

L’analyse en composantes principales (ACP) retenue comporte donc 18

items.

Interprétation des résultats :

- A première vue la constitution des facteurs diffère de celle de l’étude

réalisée par Parasuraman, Zeithaml et Berry. La Figure 5 indique la

dimension initiale à laquelle appartenait l’item.

On s’aperçoit clairement que la distribution des dimensions initiales

n’est plus respectée.

- 16 -

Le premier axe constitue la perception de la fiabilité du service,

conjugué avec quatre items mesurant l’assurance et l’empathie.

L’assurance et la fiabilité sont effectivement des concepts qui

peuvent comporter quelques similitudes, surtout dans le domaine

des transports en commun. C’est pourquoi nous attribuerons cet

écart de résultat à la stabilité des contenus plutôt que

temporelle. Concernant l’empathie, les items présents dans cette

dimension peuvent également être assimilés à la fiabilité d’un

service puisqu’il s’agit de la connaissance du besoin et des

horaires d’ouverture.

Le deuxième axe intègre deux items préalablement regroupés sur

le thème de la serviabilité. Ce dernier se trouve partagé sur deux

dimensions : deuxième et quatrième axe. D’après notre

interprétation, cette distinction peut provenir soit de la stabilité

des contenus (spécifique au secteur d’activité) soit de la stabilité

temporelle (évolution de la perception d’un service : distinction

entre la volonté/l’intérêt des employés et celle de l’entreprise ;

simili de la théorie de l’agence). De manière critique encore une

fois, nous attribuerons cette défaillance du modèle à la stabilité

des contenus car seule une question a pour sujet grammatical

« ces entreprises » ; les autres concernent les employés.

Le troisième axe regroupe deux questions évoquant l’attention

portée au consommateur, personnalisée et individualisée. Ces

deux items, proches de signification et dans leur position dans le

questionnaire nous amènent une fois de plus à penser qu’il s’agit

d’une mauvaise stabilité des contenus. L’hypothèse d’associer

l’empathie uniquement à l’attention portée à l’individu peut

cependant être retenue ; une analyse de la stabilité temporelle

approfondie serait recommandée.

Les deux derniers axes, bien qu’indépendants l’un de l’autre,

relatent de la qualité des éléments tangibles perçue par le

public ; la récence des équipements est corrélée avec le soutien

que porte l’entreprise à ces employés (=les moyens déployés).

L’adéquation entre les installations matérielles par rapport au

type de service proposé et les vêtements portés par les employés

sont corrélés (= la correspondance au cœur de métier).

- La remarque de Cronin & Taylor concernant le caractère

unidimensionnel de l’échelle SERVQUAL semble justifiée.

En effet, la première dimension est constituée de 8 items sur les 18

qui composent le construit ; les autres dimensions étant toutes

constituées de deux items seulement. La dispersion de certains

items conforte le caractère plausible de cette hypothèse.

- 17 -

- Enfin les valeurs des Alpha de Cronbach ne sont pas homogènes.

Seules les trois premières dimensions ont un coefficient de fiabilité

acceptable. Nous avons renouvelé des itérations de purification de

l’échelle en supprimant de nouveaux items appartenant aux deux

dernières dimensions pour obtenir un Alpha satisfaisant.

Malheureusement ces dimensions sont constituées d’uniquement

deux items et la suppression de l’un conduit à la suppression de

l’autre (il se retrouve seul à constituer l’axe).

Facteur Items

Fiabilité

Fiabilité

Fiabilité

Empathie

Fiabilité

Assurance

Assurance

Empathie

Q.8 Engagement sur les délais

Q 6 Attitude sympathique

Q 7 Confiance envers l’entreprise

Q 20 Connaissance des besoins

Q 5 Délais annoncés

Q 14 Confiance envers les employés

Q 16 Politesse des employés

Q 22 Horaires pratiqués

Serviabilité

Serviabilité

Q 12 Assistance aux consommateurs

Q 13 Compréhension de la charge de

travail

Empathie

Empathie

Q 18 Attention individuelle accordée

Q 19 Attention personnelle accordée

Serviabilité

Serviabilité

Q 11 Rendre des services prompts

Q 10 Annoncer le moment de réalisation

Eléments tangibles

Assurance

Q1 Equipement récent

Q 17 Soutien de l’entreprise

Eléments tangibles

Eléments tangibles

Q 4 Adéquation matériel/service

Q 3 Employés vêtus correctement

- Figure 5 - Dimensions originales de chaque item

(SERVQUAL)

- 18 -

Nous avons renommé les six axes identifiés dans notre analyse. Figure 6.

Facteur Items

Fiabilité

Q.8 Engagement sur les délais

Q 6 Attitude sympathique

Q 7 Confiance envers l’entreprise

Q 20 Connaissance des besoins

Q 5 Délais annoncés

Q 14 Confiance envers les employés

Q 16 Politesse des employés

Q 22 Horaires pratiqués

Serviabilité

Servitude

Q 12 Assistance aux consommateurs

Q 13 Compréhension de la charge de

travail

Empathie

Q 18 Attention individuelle accordée

Q 19 Attention personnelle accordée

Serviabilité (2)

Q 11 Rendre des services prompts

Q 10 Annoncer le moment de réalisation

Assurance

Q1 Equipement récent

Q 17 Soutien de l’entreprise

Eléments tangibles

Q 4 Adéquation matériel/service

Q 3 Employés vêtus correctement

- Figure 6 - Nouvelle nomination des dimensions

(SERVQUAL)

- 19 -

Concernant la stabilité des contenus de l’échelle SERVPERF, nous avons

réalisé 9 itérations pour réaliser l’ACP.

Les résultats de cette neuvième ACP sont les suivants :

Alpha de

Cronbach Items F1 F2 F3 F4 F5 F6

Q 12 Assistance aux consommateurs

Q 13 Compréhension de la charge de travail

.923

.925

.989

Q 14 Confiance envers les employés

Q 15 Sécurité des transactions

Q 16 Politesse des employés

.800

.797

819

.817

Q 18 Attention individuelle accordée

Q 20 Connaissance des besoins

Q 21 Agir dans l’intérêt du consommateur

.742

.696

.851

.732

Q 5 Délais annoncés

Q 7 Confiance envers l’entreprise

Q.8 Engagement sur les délais

.895

.627

.774

.794

Q 1 Equipement récent

Q 2 Matériel visuellement attractif

Q 3 Employés vêtus correctement

.766

.649

.825

.729

Q 9 Tenue des dossiers

Q 10 Annoncer le moment de réalisation

Q 11 Rendre des services prompts

.617

.774

.771

.320

- Figure 7 - Résultats de la matrice des composantes après rotation et des

Alpha de Cronbach

(Annexe 5 - SERVPERF - ACP n° 10)

Présentation des données brutes :

- La qualité de factorisation est juste satisfaisante (KMO) : 0.546

- La signification du test de Bartlett est très satisfaisante : 0.00

- Le pourcentage d’information restitué par le modèle est largement

satisfaisant : 80.16 % de variance expliquée avec six axes à

nouveau.

- La matrice des composantes présente des loadings mieux partagés

sur les dimensions, davantage équilibré en terme de répartition. Les

Alpha de Cronbach sont très satisfaisants sauf pour la dernière

dimension.

- Rappel : la question n°19 mesurant l’attention personnelle accordée

a été supprimée

- 20 -

Présentation succincte des itérations :

- ACP 1 : Résultats bruts (Annexe 4 - SERVPERF - ACP n° 1)

- ACP 2 : Rotation varimax

- ACP 3 : Rotation varimax et suppression de l’item « Tenir à jour ses

documents (Q 9) »

- ACP 4 : Rotation varimax et suppression de l’items « Attitude

sympathique (Q 6) »

- ACP 5 : Rotation varimax et suppression de l’items « Soutien de

l’entreprise (Q 17) »

- ACP 6 : Rotation varimax et suppression des items « Soutien de

l’entreprise (Q 17) » et « Tenir à jour ses documents (Q 9) »

- ACP 7 : Rotation varimax et suppression des items « Soutien de

l’entreprise (Q 17) » et « Horaires d’ouverture (Q 22) »

- ACP 8 : Rotation varimax et suppression des items « Soutien de

l’entreprise (Q 17) », « Horaires d’ouverture (Q 22) », « Adéquation

matériel/service » (Q 4) et « Attitude sympathique (Q 6) »

- ACP 9 : Rotation oblimin et suppression des items « Soutien de

l’entreprise (Q 17) », « Horaires d’ouverture (Q 22) », « Adéquation

matériel/service » (Q 4) et « Attitude sympathique (Q 6) »

L’analyse en composantes principales (ACP) retenue est donc l’ACP 8

(appelée ACP 10 en annexe), la rotation oblique n’apportant aucun intérêt

particulier dans ce cas. Le construit que nous avons élaboré est donc

composé de 17 items.

Interprétation des résultats :

- La constitution des facteurs diffère légèrement par rapport au

modèle de Cronin et Taylor. La Figure 8 indique la dimension initiale

à laquelle appartenait l’item. Seul un changement notable est noté

pour la dernière dimension très bien identifiée par l’Alpha de

Cronbach. Celui-ci s’élève à 0.640 lorsque l’on supprime la question

n°9 qui n’appartenait pas à cette dimension initialement.

Le premier axe constitue une des deux dimensions consacrées à

la serviabilité. Le constat est le même que pour SERVQUAL

puisque la dimension initiale de la serviabilité se retrouve à

nouveau scindée en deux, chacune composée des même items

identifiés dans SERVQUAL. Il serait donc très intéressant de

- 21 -

comparer ces résultats avec l’étude d’un autre secteur d’activité

avec les deux mesures de SERVQUAL et SERVPERF.

Le deuxième axe (Assurance) conserve trois items de ceux

initiaux, seul l’item qui traite du soutien de l’entreprise envers

ses employés n’a pas été retenu.

Le troisième axe est très intéressant à analyser : dans notre

étude, il confirme la décision de Cronin et Taylor qui ont décidé

de supprimer l’item de l’ « attention individualisée » puisque

nous retrouvons la même dimension que les auteurs : l’empathie.

Ce phénomène et l’alpha de Cronbach confirment la fiabilité de

cette dimension dans l’échelle.

La quatrième dimension mesure la fiabilité du prestataire.

L’alpha de Cronbach est satisfaisant. Nous pouvons néanmoins

identifier une anomalie sur cette dimension : l’item « Tenue des

dossiers » contribue davantage à la formation de la dimension

serviabilité (2) que de la fiabilité. Encore une fois, c’est la stabilité

des contenus qui est à remettre en cause : non seulement cette

question nous a paru surprenante (‘La gestion des archives’ n’est

pas vraiment perceptible par un consommateur) mais aussi parce

que nous avons adapté (et peut être mal) la formulation de cette

question.

Le cinquième axe comprend les items relatifs aux éléments

tangibles. Trois items sont identifiés. L’item non-retenu ne

correspond pas à celui de SERVQUAL. Nous aurons tendance à

privilégier la mesure SERPERF étant donnée la supériorité de

l’Alpha de Cronbach, constaté sur cette dimension et pour le

construit SERVPERF (PERF : 0.729 > 0.354 : QUAL). Ce constat

impute directement la stabilité des contenus de SERVQUAL sur

cette dimension tout au moins (calcul des scores P-E plus

précisément).

La fiabilité de l’axe six, serviabilité (2), est évoqué dans

l’interprétation du premier axe.

- Cronin & Taylor obtiennent une meilleure distribution des items sur

les cinq dimensions initiales de SERVQUAL. Les deux modifications

réalisées sur le construit SERVQUAL semblent donc justifiées :

mesure de la performance uniquement et la suppression de l’item n°

19.

- Les Alpha de Cronbach sont très satisfaisants dans l’ensemble. Seul

la dimension (Serviabilité (2)) n’obtient pas un bon score.

- 22 -

Facteur Items

Serviabilité

Serviabilité

Q 12 Assistance aux consommateurs

Q 13 Compréhension de la charge de

travail

Assurance

Assurance

Assurance

Q 14 Confiance envers les employés

Q 15 Sécurité des transactions

Q 16 Politesse des employés

Empathie

Empathie

Empathie

Q 18 Attention individuelle accordée

Q 20 Connaissance des besoins

Q 21 Agir dans l’intérêt du

consommateur

Fiabilité

Fiabilité

Fiabilité

Q 5 Délais annoncés

Q 7 Confiance envers l’entreprise

Q.8 Engagement sur les délais

Eléments tangibles

Eléments tangibles

Eléments tangibles

Q 1 Equipement récent

Q 2 Matériel visuellement attractif

Q 3 Employés vêtus correctement

Fiabilité

Serviabilité

Serviabilité

Q 9 Tenue des dossiers

Q 10 Annoncer le moment de réalisation

Q 11 Rendre des services prompts

- Figure 8 - Dimensions originales de chaque item

(SERVPERF)

- 23 -

Nous avons renommé les six axes identifiés dans notre analyse. Figure 9.

Facteur Items

Serviabilité

Q 12 Assistance aux consommateurs

Q 13 Compréhension de la charge de

travail

Assurance

Q 14 Confiance envers les employés

Q 15 Sécurité des transactions

Q 16 Politesse des employés

Empathie

Q 18 Attention individuelle accordée

Q 20 Connaissance des besoins

Q 21 Agir dans l’intérêt du

consommateur

Fiabilité

Q 5 Délais annoncés

Q 7 Confiance envers l’entreprise

Q.8 Engagement sur les délais

Eléments tangibles

Q 1 Equipement récent

Q 2 Matériel visuellement attractif

Q 3 Employés vêtus correctement

Serviabilité (2)

Q 9 Tenue des dossiers

Q 10 Annoncer le moment de réalisation

Q 11 Rendre des services prompts

- Figure 9 – Nouvelle nomination des dimensions

(SERVPERF)

- 24 -

Concernant l’Echelle de Profil d’Implication - EPI - de Kapferer et Laurent,

voici brièvement les principaux résultats :

Alpha de

Cronbach Items F1 F2 F3 F4 Q15. Sensation orientation

Q14. Choix du transport compliqué

Q16. Impossibilité de connaître bon choix

Q8. Image de l’utilisateur des transports

Q13. Incertitude choix du transport

0.879

0.850

0.838

0.645

0.593

0.874

Q6. Plaisir de déplacement

Q2. Plaisir personnel lors du transport

Q9. Le mode de transport reflète qui je suis

0.824

0.797

0.704

0.744

Q11. Ennui en cas d’erreur

Q12. C’est ennuyeux de se tromper

Q10. Choix pas grave en cas d’erreur

0.744

0.704

-0.666

-0.98

Q1. Importance accordée aux transports

Q2. Intérêt pour Les transports en

commun

0.878

0.843

0.761

- Figure 10 - Résultats de la matrice des composantes après rotation et des

Alpha de Cronbach

(Annexe 7 - IMPLICATION - ACP n° 11)

Stabilité temporelle

La stabilité temporelle, sans reproduire l’enquête sur le même terrain

d’application, est difficile à réaliser. La comparaison entre les travaux

réalisés par les auteurs et les notre ne nous apporte pas d’information

pertinente et elle est difficilement réalisable étant donné les différences

constatées dans la conception des dimensions. Nous nous en tiendrons

donc à la formulation d’hypothèses.

Hypothèse 1 : Les items connaissances du besoin et horaires d’ouverture

peuvent aujourd’hui être associés à la fiabilité du service. En effet, dans le

monde concurrencé dans lequel nous vivons, ces deux variables sont des

impératifs qui dépassent le sentiment d’empathie. Par exemple : si une

boutique est fermée à 18 heures, le consommateur ‘moderne’ s’interrogera

davantage sur le sérieux de l’enseigne plutôt que sur l’empathie.

La réciproque de cette remarque est bien entendu que l’empathie est

aujourd’hui et selon le construit SERVPERF, fondée exclusivement sur

l’attention (individualisée et personnalisée) portée au consommateur.

Hypothèse 2 : Concernant la serviabilité, les mœurs ont peu être évolué. Il

n’y pas si longtemps régnait une certaine culture d’entreprise. Les

employés s’associaient et étaient perçus par la profession qu’ils

exerçaient, l’enseigne pour laquelle ils travaillaient. Les solutions plus

flexibles de contrats de travail, les besoins des entrepreneurs ainsi que

- 25 -

l’évolution des mentalités (Caméléon, zapping…) nous laisse croire qu’il

existe une distinction plus forte entre l’homme et l’entreprise. En

particulier sur l’expression des items 12 et 13 qui relatent de la charge de

travail dont le salarié est tributaire.

Hypothèse 3 : En plus du facteur temporel, nous souhaitions préciser le

caractère anglo-saxon de ces construits (critique souvent généraliste dans

la littérature scientifique).

Stabilité d’application

La stabilité d’application peut être traitée globalement : le questionnaire

regroupe les trois construits, (pas de consignes spécifiques selon les

échelles).

Cependant un paramètre nous échappe : la redondance des questions

concernant l’évaluation des attentes et des performances. Etant donné

que SERVPERF est fondée sur l’étude des performances (deuxième partie

du questionnaire) les deux construits SERVPERF et SERVQUAL sont

victime de ce constat.

Nous avons comme il était préconisé dans l’article sélectionné les

interviewés à partir d’une question filtre : « Avez-vous utilisé un moyen de

transport en commun ces quatre dernières semaines ? »

Notre étude est réalisée sur un échantillon de convenance.

Les individus interrogés ont rempli eux même le questionnaire.

Nous n’avons constaté aucun dysfonctionnement, ni grève des services

publics durant notre étude.

- 26 -

Conclusion partielle

SERVQUAL, dans le cadre de notre recherche, ne peut pas prétendre à

une fiabilité satisfaisante selon nous.

Bien que les dimensions identifiées soient semblables à celles définies par

Parasuraman, Zeithaml et Berry, la structure du construit est beaucoup

trop modifiée (ordonnance des items, dédoublement des dimensions…) et

les coefficients de fiabilité trop hétérogènes entre dimension.

Afin de confirmer cette conclusion, nous avons calculé l’Alpha de

Cronbach sur nos résultats et sur la dimension Serviabilité originale. La

valeur de l’Alpha est de 0.557 avec quatre items (l’Alpha augmente en

fonction du nombre d’items). Pour chacun des axes 2 et 4 qui constituent

la dimension de serviabilité dans notre étude, nous avons obtenu des

coefficients plus élevés (avec seulement deux questions).

Les résultats constatés sur la dimension de l’empathie (résultats fiables pour SERVPERF / peu fiables pour SERVQUAL) nous amènent à croire que c’est effectivement un problème de stabilité des contenus qui a affecté SERVQUAL. S’il avait été temporel (hypothèse que l’empathie est fondée uniquement sur l’attention aujourd’hui), ce phénomène se serait reproduit sur l’échelle SERVPERF. De manière générale, nous ne sommes pas vraiment surpris des difficultés rencontrées concernant la formation des axes ni du nombre de questions que nous avons dû supprimer. Nous avions décidé de conserver toutes les variables lors de la phase de purification de la mesure ce qui sous-tend que l’adaptation du modèle se ferait lors du traitement des données (suppression à posteriori et non à priori).

- 27 -

- Etude de la validité - ���� Validité convergente : SERVQUAL et SERVPERF

A partir de la matrice MTMM La validité convergente va être jugée à partir des diagonales de fiabilité et validité. On observe ainsi que les scores de fiabilité sur la diagonale monotrait-monométhode (Alphas de Cronbach) sont élevés (>0.7) sauf pour les dimensions Assurance et Eléments tangibles et Serviabilité 2 pour SERVQUAL, et Serviabilité 2 pour SERPERF. On peut ainsi affirmer que les items qui constituent ces dimensions ne sont pas efficients à la construction de la dimension, ceci confirme l’hétérogénéité des items constitutifs du trait mesuré. On remarque aussi un alpha de Cronbach négatif (-0.980) pour la dimension importance de l’implication, ceci est inhérent à l’item N° 10 sur le questionnaire (Importance risque si l’on se trompe dans le choix du transport) qui une fois supprimé fait passer la fiabilité à 0.606 mais avec une forte perte d’informations et une modification de la structure factorielle, ce qui nous a amené à conserver cet item. On observe sur la diagonale monotrait-multiméthodes qu’il existe une bonne validité convergente entre SERVQUAL et SERVPERF sur les dimensions suivantes : Fiabilité (0.706), Serviabilité (0.587), Serviabilité 2 (0.450), et Assurance (0.513). Néanmoins, on constate une très faible convergence entre les dimensions empathie (0.287) et éléments tangibles (0.273). Ainsi, pour l’empathie les deux méthodes ne mesurent pas vraiment le même construit en dépit de la bonne fiabilité pour SERVQUAL (0.833) et SERVPERF (0.732). De même pour les éléments tangibles qui ont une faible fiabilité pour SERVQUAL (0.354) et une bonne fiabilité pour SERVPERF (0.729), mais une faible validité convergente. SERVQUAL et SERVPERF convergent ainsi sur 4 dimensions sur les 6 existantes. On peut ainsi émettre l’hypothèse que la fiabilité est une condition nécessaire à la validité. Nous pouvons aussi formuler une hypothèse supplémentaire vu le score de convergence entre éléments tangibles et assurance (.370 > 0.273) que pour le secteur des transports la perception des éléments tangibles est liée à la dimension assurance.

- 28 -

A partir des régressions linéaires SERVQUAL Récapitulatif du modèle SERVQUAL

R R-deux R-deux ajusté

Erreur standard de l'estimation

Changement dans les statistiques Durbin-Watson

Variation

de R-deux

Variation de F

ddl 1 ddl 2 Modification

de F signification

,601(a) ,361 ,255 ,780 ,361 3,393 6 36 ,009 1,492

a Valeurs prédites : (constantes), Q_axe6_Etangibles, Q_axe5_assurance, Q_axe4_servitude, Q_axe3_empathie, Q_axe2_serviabilite, Q_axe1_fiabilite b Variable dépendante : P_GLOBAL

ANOVA SERVQUAL

Somme des carrés ddl Carré moyen F Signification

Régression 12,382 6 2,064 3,393 ,009(a)

Résidu 21,897 36 ,608

Total 34,279 42

a Valeurs prédites : (constantes), Q_axe6_Etangibles, Q_axe5_assurance, Q_axe4_servitude, Q_axe3_empathie, Q_axe2_serviabilite, Q_axe1_fiabilite b Variable dépendante : P_GLOBAL

- 36,1 % de la dispersion est expliquée par le modèle (6 dimensions) - Test de Fisher : Tabulé : P 0,05 : 2.42 et P 0,01 : 3.47 Calculé : F = 3,393 Le test de Fisher est bon : Calculé > Tabulé ; la distribution suit la loi

de Fisher pour une probabilité d’erreur de 5 %. - La signification étant inférieure à 5 %, on peut supposer que le modèle

est valide. - Seules les variables « axe 1 » (fiabilité), « axe 5 » (assurance) et « axe 6 »

(éléments. Tangibles) sont significatives.

- 29 -

SERVPERF

Récapitulatif du modèle SERVPERF

R R-deux R-deux ajusté

Erreur standard de l'estimation

Changement dans les statistiques Durbin-Watson

Variation

de R-deux

Variation de F

ddl 1 ddl 2 Modification

de F signification

,543(a) ,295 ,177 ,820 ,295 2,506 6 36 ,040 1,598

a Valeurs prédites : (constantes), P_axe6_servitude, P_axe5_Etangibles, P_axe4_fiabilite, P_axe3_empathie, P_axe2_assurance, P_axe1_serviabilite b Variable dépendante : P_GLOBAL

ANOVA SERVPERF

Somme des

carrés ddl Carré moyen F Signification

Régression 10,099 6 1,683 2,506 ,040(a)

Résidu 24,180 36 ,672

Total 34,279 42

a Valeurs prédites : (constantes), P_axe6_servitude, P_axe5_Etangibles, P_axe4_fiabilite, P_axe3_empathie, P_axe2_assurance, P_axe1_serviabilite b Variable dépendante : P_GLOBAL

- 29.5 % de la dispersion est expliquée par le modèle (6 dimensions) - Test de Fisher : Tabulé : P 0,05 : 2.42 et P 0,01 : 3.47 Calculé : F = 3,393 Le test de Fisher est bon : Calculé > Tabulé ; la distribution suit la loi

de Fisher pour une probabilité d’erreur de 5 %. - La signification étant inférieure à 5 %, on peut supposer que le modèle

est valide.

Les résultats du test de Fisher et de la dispersion expliquée sont meilleurs

pour l’échelle SERVQUAL. On peut donc conclure que SERVQUAL est a

des qualités prédictives plus forte que SERVPERF pour exprimer la qualité

globale perçue.

- 30 -

���� Validité discriminante : SERVQUAL et IMPLICATION

A partir la matrice MTMM

Il ne suffit pas qu’un trait converge avec lui-même ; il faut aussi qu’il se distingue des autres. On remarque dans le bloc hétérotraits-hétérométhodes entre SERVQUAL et l’implication une absence de corrélation entre les différentes dimensions, sauf pour le cas des dimensions Plaisir et intérêt qui restent légèrement corrélées avec la dimension fiabilité sur SERVQUAL et SERVPERF, ceci peut éventuellement signifier une certaine relation latente entre ces dimensions. Nous remarquons aussi, que les patterns de corrélation respectent la même structure pour les croisements (SERVQUAL/EPI) et (SERVPERF / EPI), ce qui confirme la validité discriminante entre l’EPI et SERVQUAL et SERVPERF. Cf. Matrice MTMM Ci-dessous

- 31 -

QUAL_dim1

Fiabilité

QUAL_dim2

Serviabilité

QUAL_dim3

Empathie

QUAL_dim4

Serviabilité (2)

QUAL_dim5

Assurance

QUAL_dim6

E. tangibles

PERF_dim1

Fiabilité

PERF_dim2

Serviabilité

PERF_dim3

Empathie

PERF_dim4

Serviabilité (2)

PERF_dim5

Assurance

PERF_dim6

E. tangibles

IMP_dim1

Proba

d'erreur

IMP_dim2

Plaisir

IMP_dim3

Importance

IMP_dim4

Intérêt

QUAL_dim1

Fiabilité0,882

QUAL_dim2

Serviabilité0,237 0,825

QUAL_dim3

Empathie0,252 0,056 0,833

QUAL_dim4

Serviabilité (2)-0,187 0,063 -0,156 0,640

QUAL_dim5

Assurance0,422 0,265 0,211 -0,128 0,420

QUAL_dim6

E. tangibles0,175 -0,187 0,104 -0,265 0,129 0,354

PERF_dim1

Fiabilité0,706 0,257 0,085 -0,124 0,408 0,027 0,794

PERF_dim2

Serviabilité0,111 0,587 0,145 0,070 0,292 0,008 0,099 0,989

PERF_dim3

Empathie0,182 0,316 0,284 -0,054 0,175 -0,022 0,126 0,245 0,732

PERF_dim4

Serviabilité (2)-0,228 -0,038 -0,044 0,450 0,025 -0,046 -0,173 0,196 -0,094 0,320

PERF_dim5

Assurance0,504 -0,216 0,298 -0,347 0,513 0,370 0,470 -0,067 0,276 -0,020 0,817

PERF_dim6

E. tangibles0,183 -0,204 0,094 -0,096 0,286 0,273 0,195 -0,084 0,251 0,055 0,393 0,729

IMP_dim1

Proba d'erreur0,163 0,224 0,017 0,270 -0,172 -0,203 0,265 -0,108 0,089 -0,216 -0,125 -0,321 0,874

IMP_dim2

Plaisir0,386 0,342 -0,073 0,124 0,004 -0,054 0,428 0,000 0,088 -0,314 -0,016 -0,156 0,619 0,744

IMP_dim3

Importance0,185 0,239 0,200 -0,060 0,336 -0,025 0,184 0,077 0,101 -0,283 0,105 0,095 0,311 0,363 -0,980

IMP_dim4

Intérêt0,369 0,215 -0,138 -0,042 0,267 -0,091 0,646 0,127 0,283 -0,096 0,230 0,155 0,225 0,316 0,171 0,761

** Corrélation significative au niveau 0,01 (bilatéral)

* Corrélation significative au niveau 0,05 (bilatéral)

Corrélations de Pearson

- Figure 11 - Matrice MTMM

- 32 -

L’analyse factorielle confirmatoire

L’estimation de la validité du construit par une méthode d’équations

structurelles

Après avoir testé la validité du construit par la méthode classique à partir d’une analyse en composantes principales ACP, et identification de la structure factorielle, nous avons comparé la structure identifiée à une estimation fondée sur les hypothèses de liaison obtenues lors de notre ACP exploratoire. SERVQUAL : Les résultats obtenus sous EQS sont les suivants : CHI-SQUARE = 203.678 BASED ON 113 DEGREES OF FREEDOM

FIT INDICES (INDICES D’AJUSTEMENT)

-----------

BENTLER-BONETT NORMED FIT INDEX = .557

BENTLER-BONETT NON-NORMED FIT INDEX = .600

COMPARATIVE FIT INDEX (CFI) = .705

BOLLEN (IFI) FIT INDEX = .739

MCDONALD (MFI) FIT INDEX = .348

LISREL GFI FIT INDEX = .703

LISREL AGFI FIT INDEX = .551

ROOT MEAN-SQUARE RESIDUAL (RMR) = .428

STANDARDIZED RMR = .103

RELIABILITY COEFFICIENTS (COEFFICIENTS DE FIABILITE)

------------------------

CRONBACH'S ALPHA = .791

RELIABILITY COEFFICIENT RHO = .903

On observe dans un premier temps que le Chi-Deux est de 1,80 pour SERVQUAL, ce qui

signifie qu’il y’a pas rejet de l’hypothèse nulle H0 qui stipule qu’il existe un bon ajustement

entre les éléments observés et estimés de la matrice de corrélation. Néanmoins cet indicateur

ne peut être complètement significatif étant donnée qu’il reste tributaire de la variation de la

taille de l’échantillon.

Nous remarquons dans un second temps que le NFI obtenu est de 0,557, cette valeur est

inférieure à la norme empirique seuil exigée qui est de 0,90.

En ce qui concerne les indices AGFI et GFI, on trouve que le modèle ne reproduit pas un

montant de variance et de covariance suffisant selon les normes empiriques d’acceptation du

modèle proposés par Pedhazur et Pedhazur Schmelkin (1991), c'est-à-dire un GFI ≥ 0,90 et un

AGFI ≥ 0,80. Mais ces indicateurs nous permettent seulement d’évaluer la qualité du modèle

dans l’absolu et ne stipulent en aucun cas le rejet du modèle.

Enfin on trouve que le RMR obtenu 0,428 est supérieur à la norme fixée empiriquement par

Pedhazur et Pedhazur Schmelkin (1991) qui est de 0,05, ce qui signifie qu’il existe un écart

important entre les corrélations estimées et observées à partir des données empiriques.

- 33 -

SERVPERF :

CHI-SQUARE = 208.904 BASED ON 97 DEGREES OF FREEDOM

PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS .00000

THE NORMAL THEORY RLS CHI-SQUARE FOR THIS ML SOLUTION IS 172.277.

FIT INDICES (INDICES D’AJUSTEMENT)

-----------

BENTLER-BONETT NORMED FIT INDEX = .631

BENTLER-BONETT NON-NORMED FIT INDEX = .635

COMPARATIVE FIT INDEX (CFI) = .740

BOLLEN (IFI) FIT INDEX = .761

MCDONALD (MFI) FIT INDEX = .272

LISREL GFI FIT INDEX = .675

LISREL AGFI FIT INDEX = .487

ROOT MEAN-SQUARE RESIDUAL (RMR) = .283

STANDARDIZED RMR = .122

ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) = .166

90% CONFIDENCE INTERVAL OF RMSEA ( .133, .194)

RELIABILITY COEFFICIENTS (COEFFICIENTS DE FIABILITE)

------------------------

CRONBACH'S ALPHA = .724

RELIABILITY COEFFICIENT RHO = .880

On observe pour SERVPERF que le test du Chi Deux est de 2,15 < 3 ce qui nous permet de

confirmer l’hypothèse H0 qui indique qu’il n’existe pas une différence significative entre les

résultats observés et estimés.

Les Indicateurs GFI et AGFI sont inférieurs à la valeur normative seuil admise

empiriquement, et le RMR est faible 0,283 ce qui permet de confirmer que l’ajustement est

meilleur, et qu’il y’a une proximité entre les valeurs estimés et celles observées

empiriquement.

- 34 -

L’analyse factorielle confirmatoire comparative

Nous avons utilisé une autre méthode de test de validité, précisée dans le support de cours P. ROUSSEL. Nous avons comparé la structure factorielle de la mesure du même concept sur un autre terrain d’application : la restauration universitaire (réalisée par Georgio et Roland).

Voici les résultats que nous avons obtenus : CHI-SQUARE = 163.372 BASED ON 97 DEGREES OF FREEDOM FIT INDICES (INDICES D’AJUSTEMENT) ----------- FIT INDICES ----------- BENTLER-BONETT NORMED FIT INDEX = .594 BENTLER-BONETT NON-NORMED FIT INDEX = .650 COMPARATIVE FIT INDEX (CFI) = .750 BOLLEN'S (IFI) FIT INDEX = .782 MCDONALD'S (MFI) FIT INDEX = .462 JORESKOG-SORBOM'S GFI FIT INDEX = .749 JORESKOG-SORBOM'S AGFI FIT INDEX = .604 ROOT MEAN-SQUARE RESIDUAL (RMR) = .425 STANDARDIZED RMR = .107 ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) = .128 90% CONFIDENCE INTERVAL OF RMSEA ( .092, .159) RELIABILITY COEFFICIENTS ------------------------ CRONBACH'S ALPHA = .772 RELIABILITY COEFFICIENT RHO = .876

Tableau comparatif des deux modèles :

CHI-SQUARE

/dl NFI GFI AGFI RMR

Transport en commun

1.80 0.557 0.703 0.551 0.428

Restauration universitaire

1.68 0.594 0.749 0.604 0.425

L’application de nos résultats sur la structure retenue par ‘Georgio et Roland’ obtient de meilleurs scores que ceux de notre propre modèle. Ce phénomène peut être interprété par une mauvaise validité de notre construit. Ces scores sont une fois de plus à nuancer avec la taille de l’échantillon.

- 35 -

SSyynntthhèèssee ddee ll’’ééttuuddee eett ccoonncclluussiioonn

ous avons pu utiliser au cours de la réalisation de ces travaux

différents outils statistiques. Un premier constat notable est

qu’il est nécessaire de diversifier les indices pour s’assurer de la qualité

d’une mesure et que cette richesse d’information est d’autant plus délicate

à interpréter.

La matrice MTMM nous a permis, par exemple, de conclure que la fiabilité

est un facteur important et antérieur à la validité d’un construit.

Le nombre de dimensions peut etre déterminer à partir de deux outils

distincts et complémentaires : l’analyse en composante principale et les

Alpha de Cronbach qui nous permettent de s’assurer de la fiabilité des

dimensions identifiées. Cependant cette complémentarité trouve ses

^propres limites lors d’itérations successive de ces deux outils.

En effet, le but de cette série de démarches est de pouvoir trouver la

solution la plus stable possible en conservant un maximum d’information.

Ceci s’illustre dans notre étude par certains Alpha de Cronbach faibles

néanmoins nous permettant de conserver un maximum d’items pour la

richesse d’information et ne pas obtenir ainsi un outil de mesure avec des

valeurs élevées des Alpha de Cronbach mais dont les dimensions seraient

redondantes.

A l’issue d’un certain nombre d’achats, le consommateur a tendance à

ajuster ses aspirations aux services obtenus (Koelemeijer, 1991). Par

conséquent l’écart entre P-E tend à devenir nul. Ainsi les critères

d’évaluation de SERVQUAL évoluent en fonction de la familiarité avec le

produit. Les personnes que nous avons interrogées sont pour la plupart

des étudiants utilisateurs réguliers des transports en commun. Cela peut

expliquer pour une partie les résultats parfois insatisfaisants de

SERVQUAL, notamment en terme de validité.

D’après la revue de littérature et des résultats obtenus à propos des cinq

dimensions : Eléments tangibles, Assurance, Empathie, Serviabilité et

Fiabilité, ne sont pas exactement généralisables à tous secteurs

d’activités.

SERVQUAL est issu du modèle à point idéal (fortement contesté dans la

littérature). Les nouveaux éléments apportés par la réexamination de la

N

- 36 -

mesure de ce concept réalisée par Cronin et Taylor, ainsi que les résultats

de l’étude que nous avons menée, permettent de confirmer que l’outil

SERVPERF est mieux adapté à la mesure du concept de la qualité de

service.

- 37 -

RRééfféérreenncceess

Les articles étudiés

� “ SERVQUAL : une échelle multi-items de mesure des perceptions

de la qualité de service par les consommateurs”

A. PARASURAMAN, Valarie A. ZEITHAML, Leonard L. BERRY

1990, Recherche et Application Marketing, Vol. V, n°1

� “Measuring Service Quality : A Reexamination and Extension”

J. Joseph Cronin et Steven A. Taylor

1992 dans la revue Journal of Marketing, Vol. 56

� “ L’implication du consommateur et ses perspectives stratégiques”

KAPFERER et LAURENT

Les articles de support

� “A paradigme for Developing Better Measures of Marketing

Constructs”

Gilbert A. CHURCHILL, JR

1979, Journal of Marketing Research, Vol. 16

� “Conceptualisation et mesure de la qualité perçue d’un service

public”

William SABADIE

2003, Recherche et Applications en Marketing

� “L’implication du consommateur et ses perspectives stratégiques”

Héla Ben Miled-Chérif

2001, Recherche et Applications en Marketing, Vol. 16

Les ouvrages

� “Méthodes d’Equations Structurelles : Recherche et Applications en

Gestion”

Patrice ROUSSEL, François DURRIEU, Eric CAMPOY, Assaâd EL

AKREMI, Economica

� “Statistique – 4ième édition”

Thomas H. WONNACOTT, Ronald J. WONNACOTT, Economica

� “Market”

Yves EVRARD, Bernard PRAS, Elyette ROUX, Dunod