Post on 16-Oct-2021
Multivariate Curve Resolution (MCR)
Chimiométrie [LCHM1320]
Introduction▶ Défini&on : ▷ Résolu'on Mul'variée de Courbes pour résoudre le « mixture analysis problem » ▷ via un modèle addi3f bilinéaire de contribu3ons pures
▶ But principal exploratoire : visualiser et interpréter les données
▶ Ini&alement développé pour des données analy&ques évolu&ves▷ Dont les deux direc'ons ont une interpréta'on claire▷ Modèle analy'que sous-jacent en spectroscopie : loi de Beer-Lambert = modèle bilinéaire
de concentra'ons de signaux purs
▶ Applica&ons principales en chimie :▷ Profils de concentra.on de composés purs dans un mélange ▷ Suivi temporel de réac.ons chimiques (eg. plusieurs batchs d’une réac.on)▷ Données d’imagerie hyperspectrales, …
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 2
Exemple d’application sur des données chimiques▶ Jeu de données “2-voies” avec résolu&on temporelle
Matrice X
2020-2021 © M. Martin UCLouvain - LCHM1320 – Chimiométrie - MCR 3
Exemple d’application sur des données chimiques
MCR
Spectres de mélange
Spectres des espèces pures
Profil de concentra8on des espèces pures
Données “naturellement” bilinéaires
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 4
Modèle additif bilinéaire▶ Un exemple bien connu : la Loi de Lambert-Beer
▶ Dans l’exemple, 2 espèces pures (A et B)
• Composé par composé
C matrice des concentra.ons puresS matrice des spectres purs
Modèle bilinéaire
X = CS! + E
• Sous forme matricielle
X XBXA XBXA
X
X
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 5
Multivariate Curve Resolution – Alternating Least Squares
▶ Es&ma&on itéra&ve▷ Op'misa'on de C et S en alternance à par'r d’es'mateurs ini'aux
▶ Permet d’inclure de l’informa&on extérieure a priori▷ Connaissances chimiques/mathéma'ques peuvent être introduites dans le modèle
▶ Différentes étapes :1) Choix du nombre de composantes extraites
2) Es'ma'ons ini'ales de C ou S
3) Choix des contraintes
4) Algorithme ALS
5) Vérifica'on de la qualité du modèle
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 6
MCR-ALS (1)1) Choix du nombre de composantes extraites▷ = nombre d’espèces pures du système▷ Généralement, sur base d’un scree plot d’une PCA▷ Le nombre d’espèces pures, si connu d’avance▷ !Important de bien le choisir
2) Es&ma&ons ini&ales de C ou S▷ Evolving Factor Analysis (EFA)
§ Si direc.on structurée des données avec évolu.on con.nue et séquen.elle
§ e.g. évolu.on temporelle
▷ Méthodes de sélec'on de variables les plus pures§ SIMPLISMA, OPA, …§ But : trouver des lignes/colonnes de X les plus pures (i.e. dissimilaires) comme es.mateurs ini.aux§ Ils doivent idéalement être les plus proches des profils finaux
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 7
MCR-ALS (2)3) Contraintes▷ Permet d’introduire de l’information chimique/mathématique dans le modèle▷ Dépendent du jeu de données▷ Exemple :
§ Non-négativité: force les profils à être positifs (eg: concentrations)§ Unimodalité: un seul maximum par profil autorisé (eg: profils d’élution)§ …
4) Algorithme ALS▷ Régressions alternées sous contraintes jusqu’à atteindre le critère de convergence
5) Vérification de la qualité du modèle▷ Lack of Fit, R2, …
𝐶 = 𝑋𝑆 𝑆!𝑆 "# 𝑆′ = 𝐶!𝐶 "#𝐶!𝑋 Critère: min 𝑋 − 𝐶𝑆!
𝑅$ = 100 ∗ 1 −𝐸
$
𝑋$ avec 𝐸 = 𝑋 − 𝐶𝑆!
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 8
MCR-ALS (3)Incer&tudes dans la solu&on
▶ Différents types :▷ Les composantes extraites ne sont pas ordonnées (>< PCA)▷ Ambiguité des intensités: unités arbitraires pour C et S▷ Ambiguité rota'onnelle: différentes combinaisons de profils de C et S s’ajustent de façon
équivalente aux données
▶ Les contraintes permeUent de réduire ces ambiguités
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 9
Analyse de plusieurs tableaux de données▶ Structure bilinéaire conservée
▶ Matrices “augmentées” ou mul3sets: ▷ Par ligne : eg: monitoring mul.technique d’un processus
▷ Par colonne: eg: monitoring de plusieurs runs
▷ Par ligne et par colonne
▶ Les matrices doivent :▷ avoir de l’informa.on en commun▷ avoir un mode commun (C ou S) (eg: profils spectraux)
Exemple d’un jeu de données “3-way”: Plusieurs runs HPLC-DAD
𝑋! 𝑋" 𝑋# …𝑋$ = 𝐶 𝑆!% 𝑆"% 𝑆#% … 𝑆$% + 𝐸! 𝐸" 𝐸# …𝐸$ = 𝐶𝑆&'(% +𝐸&'(
𝑋#𝑋$𝑋%…𝑋&
=
𝑋#𝑋$𝑋%…𝑋&
S! +
𝑋#𝑋$𝑋%…𝑋&
= 𝐶'()𝑆! + 𝐸'()
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 10
Comparaison avec la PCA▶ Comme la PCA, méthode non supervisée
▶MCR : développé pour données analy&ques évolu&ves
▶ Construc&on des composantes :PCA: imbriquées vs MCR: non imbriquées
▶ Par construc+on, la PCA a des composantes orthogonales 2 à 2Mais les spectres de composés purs ne sont jamais totalement orthogonaux
=> plus difficile d’interpréter ces CPs en lien avec les spectres purs
▶ D’autres contraintes peuvent être appliquées directement en MCR
▶ En MCR, les profils (spectraux et de concentra+on) extraits par MCR-ALS ont un sens chimique direct
X = CS2 + E
X = TP2 + EPCA :
MCR :
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 11
PCA vs MCR▶ PCA
1
23
4
Condi&ons
1
23
4
Condi&ons
▶MCR
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 12
Non-negative Matrix Factorization (NMF)▶ Objec+f▷ Décomposer une matrice non-néga've X en une matrice S contenant r vecteurs de base
non-néga'fs et une matrice C contenant des coefficients non-néga'fs.
▶Modèle et critère d’op+misa+on (iden+ques à la MCR)
▶ Contraintes▷ Non-néga'vité de tous les éléments de C et S ▷ Des contraintes supplémentaires peuvent également être incluses dans des modèles plus
avancés
▶ Algorithme d’op+misa+on▷ Descente de gradient
Modèle ∶ X = CS! + E Critère : min 𝑋 − 𝐶𝑆! "
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 13
Résumé avantages / inconvénients de la MCR▶ Avantages principaux :▷ On ne doit pas connaitre a priori le système physico-chimique étudié▷ Si de l’informa'on a priori est disponible, elle peut être intégrée à la MCR▷ Flexibilité d’applica'on
▷ Interpréta'on directe des profils extraits
▶ Limita+ons principales : ▷ la dyade des profils Concentra'ons-Spectres doit être différente pour chaque composé
§ problème si deux composés ont :• des concentra+ons directement propor+onnelles entre eux• des spectres purs iden+ques
▷ Ambiguité possible des solu'ons
▷ Les résultats sont influencés par les paramètres et les choix de valeurs ini'ales
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 14
Références utiles▶ De Juan, A., Jaumot, J., & Tauler, R. (2014). Mul.variate Curve Resolu.on (MCR). Solving the mixture
analysis problem. Analy&cal Methods, 6(14), 4964-4976.
▶ CheMoocs 2020 (Agreenium): Chimiometrie chapitre 1/2 : les méthodes non supervisées (hfps://www.fun-mooc.fr/courses/course-v1:Agreenium+66002+session05/info)
2020-2021 © M. Mar+n UCLouvain - LCHM1320 – Chimiométrie - MCR 15