Classer et catégoriser pour mieux appréhender les données en éducation

Post on 24-Jan-2017

410 views 1 download

Transcript of Classer et catégoriser pour mieux appréhender les données en éducation

Classer et catégoriser pour mieux appréhender les données en éducation :

Initiation à la démarche statistique de « Clustering » et applications dans le logiciel SPSS

Gaëtan Temperman - Bruno De Lièvre

Exercice 1 : Vos représentations initiales En quelques mots,

pouvez-vous définir la démarche par cluster ?

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Objectifs de la formation

- Définir et caractériser la démarche de clustering

- Présenter des exemples mobilisant le clustering

- D é c r i r e t ro i s d é m a rc h e s d e c l u s t e r i n g complémentaires

- S’initier aux fonctions de base de SPSS

- Mettre en oeuvre les démarches de Clustering dans SPSS, dans Excel et dans Voyant-tools

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Objectifs d’une démarche par clusters

Cette procédure statistique vise à trouver une structure intrinsèque aux données en les organisant en groupes homogènes et distincts, appelés « clusters ». Pour former un « cluster », les éléments doivent être à la fois similaires entre eux et différents des objets regroupés dans d’autres « clusters » (Quintin, 2008)

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Caractéristiques d’une démarche par clusters

- Pas de distinction entre variables dépendantes et indépendantes

- Démarche statistique qui fait partie de la famille des ana lyses mult i -d imensionnel les (ana lyse en composantes principales, analyse factorielle de correspondances, analyse discriminante, …)

- Elle peut s'appuyer sur différents types de mesures (binaire, nominal, ordinal, métrique).

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Usages dans différentes disciplines

En médecine : identifier des patients qui ont des symptômes similaires à partir d’observations et de caractéristiques individuelles

En biologie : Elaborer des taxonomies avec des groupes et sous-groupes dans la faune et dans la flore à partir d’observations

En éducation : créer des profils d’apprenants (d’enseignants) homogènes à partir de ce qu’ils font ou de ce qu’ils disent

En marketing : Dresser des profils de consommateurs qui ont les mêmes besoins et les mêmes comportements

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Usages avec différents outils de prises d’informations

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Quelleestlaqualitédesproduitsdel'appren-ssage?

Commentlesacteursperçoivent-ilslesproduitsd’appren-ssage?Avecquellecohérence?

Caractéris-quesini-alesdesacteurs

Interac-onsTemps

Quelsprocessusd'appren-ssageinduitledisposi9f?

Contexte

Quelsliensentrelesvariablesduprocessus

etlaqualitédesproduitsde

l'appren9ssage?

Progression Niveaudemaîtrise

Transfert

Produc-ons Temps

Usages Interac-ons

Commentlesacteursperçoivent-ilsleur

processusdansledisposi9f?Avecquellecohérence?

Percep-ons

Produits

Processus

U-lisabilité

U-lité Sa-sfac-on

Mo-va-on

EquitéDisposi-fdeforma-onQuelle

percep9onontles

acteursdudisposi9fdeforma9on?

Usages avec différents outils de prises d’informations

Classer et catégoriser pour mieux appréhender les données en éducationUMonsTemperman & De Lièvre (à paraître)

Boelaert & Khaneboubi (2015)

Exemple 1 : méthode de visualisation de traces d’activités sur la plateforme open edX : le cas du Mooc « Enseigner et former avec le numérique »

Indicateurs Description

absent l’utilisateur ne s’est jamais connecté aux ressources correspondant à cette semaine

présent l’utilisateur s’est connecté aux pages de la semaine, mais n’a pas regardé de vidéos, ni répondu aux quiz

video l’utilisateur a regardé au moins une vidéo de la semaine, mais n’a pas répondu au quiz

view quiz l’utilisateur a consulté le quiz de la semaine, mais n’y a pas répondu

quiz l’utilisateur a répondu à au moins une question du quiz de la semaine.

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Boelaert & Khaneboubi (2015)Classer et catégoriser pour mieux appréhender les données en éducationUMons

Boelaert & Khaneboubi (2015)Classer et catégoriser pour mieux appréhender les données en éducationUMons

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Trois types de classification automatique

Procédures Caractéristiques

Nuées dynamiques(K-Means)

La procédure d'analyse de cluster de nuées dynamiques est limitée aux données continues et exige que vous indiquiez au préalable le

nombre de clusters

Classification hiérarchique

La procédure d'analyse de cluster hiérarchique est limitée à des fichiers de données plus réduits (centaines d’éléments à classer)

Possibilité de classer des observations ou des variables

Classification Two-Step

Sélection automatique du meilleur nombre de clusters, en plus des mesures de sélection parmi des modèles de cluster.

Possibilité de créer simultanément des modèles de cluster sur la base de variables catégorielles et continues.

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSSVariables

Individus

données

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSS

Nom de la

variable

Type de mesures

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSS

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSS

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSS

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSS

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSS

Classer et catégoriser pour mieux appréhender les données en éducationUMons

A la découverte de SPSS

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Nuées dynamiques

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Z-Scores

Si les variables ont différentes échelles, il est important de les

standardiser en utilisant la note Z.

Nuées dynamiques

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Note au cours de pédagogie

Note au cours de sciencesQuestionnaire de Desjardins

Stavaux, De Lièvre & Temperman (à paraître)

Nuées dynamiquesExemple 2 : Formation au tbi

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Nuées dynamiquesExemple 2 : Formation au tbi

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Stavaux, De Lièvre & Temperman (à paraître)

1.Ouvrir le fichier badges.sav dans spss

2.Calculer le nombre total de badges par individus

4.Identifier une structure à ces données à l’aide de la classification en tués dynamiques en intégrant les variables transformées en note Z

3.Transformer les 4 variables en note Z

Exercice 2 : Expérience badges

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Palm, De Lièvre & Temperman (à paraître)

Classer et catégoriser pour mieux appréhender les données en éducation

Exercice 2 : Expérience badges

5. Créer le radar suivant dans Excel en copiant les centres de classe finaux depuis SPSS

UMons

6. Catégoriser et interpréter les trois profils (1, 2 et 3) mis en évidence par le graphique

Exercice 2 : Expérience badges

6. Se connecter sur voyant-tools.org

7. Charger les 3 fichiers dans le dossier texte

8. Créer le graphique ci-dessous avec la commande « Scatterplot »

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Dendrogramme représentant le regroupement des tuteurs selon leur expérience pédagogique (Quintin, 2008)

Classification hiérarchiqueExemple 3 : Profils des tuteurs

Classer et catégoriser pour mieux appréhender les données en éducationUMons

2. Fusion et réduction de classes par itérations successives3. Fusion des classes dont la dissimilarité (= indice d’agrégation) est faible4. L’indice d’agrégation augmente au fur et à mesure des différentes itérations

indice d’agrégation

1. Au départ, chaque individu = une classe

Exemple 3 : Profils des tuteurs

Classer et catégoriser pour mieux appréhender les données en éducationUMons

(Quintin, 2008)

Nouvelle variable indépendante

Exercice 3 : « Réalité augmentée »

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Prompts

Montagne, De Lièvre & Temperman (à paraître)

Exercice 3 : « Réalité augmentée »

1.Ouvrir le fichier realite.sav dans spss

2. Sélectionner les individus dans la condition 2

4.Créer un dendrogramme identique à celui-ci

3. Générer un classement hiérarchique à l’aide de trois variables : prétest/posttest/prompts

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Novices IsolésSocio-nautes

- Usages timides- Moodle +- Médias sociaux avec prudence- Progrès outils bureautiques

- Usage chevronné

- Collaboration- Progrès en

ligne

- Usages variés- Moodle -- Progrès en

communication

1

2

3 Entretiens

Clusters

Questionnaires en ligne

N=1176

3 profils caractéristiques

N=12

Exemple 4 : le WEB 2.0 et les EPA Two step clusters

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Van Herp, De Lièvre & Temperman (à paraître)

Exercice 4 : Etude MTVL

1.Ouvrir le fichier mtvl.sav dans spss

2. Sélectionner les individus d o n t l e s r é p o n s e s s o n t c o m p l è t e s ( v a r i a b l e « complet »)

4.Intégrer l’ensemble des items du quest ionnaire dans le c h a m p «  v a r i a b l e s continues »

3. Lancer une procédure « Two step clusters »

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Witthier (2015)

Ce que nous pouvons retenir…

… complémentaire … … pertinente … … utilisable … … utile …

Exercice 5 : La démarche par clusters est …

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Ce que nous pouvons retenir…

… complémentaire à d’autres analyses quantitatives et/ou qualitatives … pertinente pour identifier de nouvelles variables indépendantes a posteriori … utilisable avec différentes sources d’informations (produits, processus, perceptions, caractéristiques individuelles) … utile pour synthétiser et pour visualiser des quantités importantes de données

Classer et catégoriser pour mieux appréhender les données en éducationUMons

Exercice 5 : La démarche par clusters est …

Pour aller plus loin …

www.statisticssolutions.com/cluster-analysis-2/

spss.espaceweb.usherbrooke.ca/

Classer et catégoriser pour mieux appréhender les données en éducationUMons

https://www.researchgate.net/publication/260574030

Une typologie des professeurs entrantsDe Stercke, Temperman & De Lièvre (2014)

UMons

Vos questions ?

Classer et catégoriser pour mieux appréhender les données en éducation