Normalisation des données et planification expérimentale

73
Préambule Technologie mono-couleur Technologie bi-couleur Perspectives Normalisation des données et planification expérimentale David Causeur Laboratoire de Mathématiques Appliquées Agrocampus Ouest IRMAR CNRS UMR 6625 http://www.agrocampus-ouest.fr/math/causeur/

description

la planification expérimentale

Transcript of Normalisation des données et planification expérimentale

Page 1: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Normalisation des données et planificationexpérimentale

David CauseurLaboratoire de Mathématiques Appliquées

Agrocampus OuestIRMAR CNRS UMR 6625

http://www.agrocampus-ouest.fr/math/causeur/

Page 2: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan du cours

1 Préambule

2 Technologie mono-couleurAnalyse différentielleBiais techniquesPlanification expérimentale

3 Technologie bi-couleurEffet fluorochromeInteraction gène × fluorochromePlans classiques

4 Perspectives

Page 3: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Données de biopuceUne structuration naturelle en sous-tableaux

Puces Expressions géniques123

4 Y56...

• Expressions géniques : quantitatives (nombreuses)

• Facteurs de variations : contrôlés (régime, génotype,temps, ...) ou nuisances (fluorochromes, marquage, ...)

• Informations externes : issues d’analyses parallèles

Page 4: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Données de biopuceUne structuration naturelle en sous-tableaux

Puces Expressions géniques Facteurs de variations123

4 Y X56...

• Expressions géniques : quantitatives (nombreuses)• Facteurs de variations : contrôlés (régime, génotype,

temps, ...) ou nuisances (fluorochromes, marquage, ...)

• Informations externes : issues d’analyses parallèles

Page 5: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Données de biopuceUne structuration naturelle en sous-tableaux

Puces Expressions géniques Facteurs de variations Informations externes123

4 Y X Z56...

• Expressions géniques : quantitatives (nombreuses)• Facteurs de variations : contrôlés (régime, génotype,

temps, ...) ou nuisances (fluorochromes, marquage, ...)• Informations externes : issues d’analyses parallèles

Page 6: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Planification expérimentaleOrganiser les données de telle sorte que :• l’interprétation ne soit pas entachée de confusion

• les résultats soient aussi précis que possible

• Contraintes expérimentales (coût, technologie, ...)• But de l’étude ?

• Comparer des traitements, des génotypes, ...• Mesurer l’évolution des niveaux d’expression dans le temps

Page 7: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Planification expérimentaleOrganiser les données de telle sorte que :• l’interprétation ne soit pas entachée de confusion• les résultats soient aussi précis que possible

• Contraintes expérimentales (coût, technologie, ...)• But de l’étude ?

• Comparer des traitements, des génotypes, ...• Mesurer l’évolution des niveaux d’expression dans le temps

Page 8: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Planification expérimentaleOrganiser les données de telle sorte que :• l’interprétation ne soit pas entachée de confusion• les résultats soient aussi précis que possible

Expertise préalable :• Contraintes expérimentales (coût, technologie, ...)

• But de l’étude ?• Comparer des traitements, des génotypes, ...• Mesurer l’évolution des niveaux d’expression dans le temps

Page 9: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Planification expérimentaleOrganiser les données de telle sorte que :• l’interprétation ne soit pas entachée de confusion• les résultats soient aussi précis que possible

Expertise préalable :• Contraintes expérimentales (coût, technologie, ...)• But de l’étude ?

• Comparer des traitements, des génotypes, ...• Mesurer l’évolution des niveaux d’expression dans le temps

Page 10: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan du cours

1 Préambule

2 Technologie mono-couleurAnalyse différentielleBiais techniquesPlanification expérimentale

3 Technologie bi-couleurEffet fluorochromeInteraction gène × fluorochromePlans classiques

4 Perspectives

Page 11: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Analyse différentielle• Technologie mono-couleur

Sur chaque spot, l’expression d’un gène dans unecondition.

• Un seul facteur contrôlé, à 2 modalités (génotypegras/maigre)

Page 12: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Analyse différentielle• Technologie mono-couleur

Sur chaque spot, l’expression d’un gène dans unecondition.

• Un seul facteur contrôlé, à 2 modalités (génotypegras/maigre)

Page 13: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Analyse différentielle• Technologie mono-couleur

Sur chaque spot, l’expression d’un gène dans unecondition.

• Un seul facteur contrôlé, à 2 modalités (génotypegras/maigre)

Page 14: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Comparaison de moyennesStatistique de Student

T =Y1 − Y2

S√

1n1

+ 1n2

, S : Écart-type intra-groupe

Variabilité intra-groupe• Si une puce = un patient (ou un animal) alors

S = variabilité biologique• Si une puce = un échantillon sur un patient donné, ... alors

S = variabilité techniqueIdéalement . . .σ = E(S) petit

Page 15: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Homogénéité des variancesExemple : données «poulets»

• Technologie : dépôt (mono-couleur)• Nombre de gènes : 314• Nombres de puces : 27

• 13 gras• 14 maigres

Page 16: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Homogénéité des variancesExemple : données «poulets»

• Technologie : dépôt (mono-couleur)

• Nombre de gènes : 314• Nombres de puces : 27

• 13 gras• 14 maigres

Page 17: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Homogénéité des variancesExemple : données «poulets»

• Technologie : dépôt (mono-couleur)

• Nombre de gènes : 314• Nombres de puces : 27

• 13 gras• 14 maigres

Page 18: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Homogénéité des variancesExemple : données «poulets»

• Technologie : dépôt (mono-couleur)• Nombre de gènes : 314

• Nombres de puces : 27

• 13 gras• 14 maigres

Page 19: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Homogénéité des variancesExemple : données «poulets»

• Technologie : dépôt (mono-couleur)• Nombre de gènes : 314• Nombres de puces : 27

• 13 gras• 14 maigres

Page 20: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Homogénéité des variancesExemple : données «poulets»

• Technologie : dépôt (mono-couleur)• Nombre de gènes : 314• Nombres de puces : 27

• 13 gras• 14 maigres

0 1000 2000 3000 4000 5000 6000

010

000

2000

030

000

4000

0

Différence d’expressions moyennes

Eca

rt−

type

intr

a−gr

oupe

Page 21: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Homogénéité des variancesExemple : données «poulets»

• Technologie : dépôt (mono-couleur)• Nombre de gènes : 314• Nombres de puces : 27

• 13 gras• 14 maigres

Stabilisation de la variancepar passage au log2

0.0 0.5 1.0 1.5

0.0

0.5

1.0

1.5

2.0

2.5

Différence d’expressions moyennes

Eca

rt−

type

intr

a−gr

oupe

Après transformation logarithmique

Page 22: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre pucesY (k)

ir : expression du gène k sur la rème puce du groupe i :

Y (k)ir = µ(k) + α

(k)i + ε

(k)ir , Var(ε(k)

ir ) = σ2k

σk = Variabilité intra-groupe

Page 23: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre pucesY (k)

ir : expression du gène k sur la rème puce du groupe i :

Y (k)ir = µ(k) + α

(k)i + ε

(k)ir , Var(ε(k)

ir ) = σ2k

σk = Variabilité intra-groupeGénotype gras

Ecarts à la moyenne

Fré

quen

ce

−10 −5 0 5 10

0.00

0.05

0.10

0.15

0.20

Page 24: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre pucesY (k)

ir : expression du gène k sur la rème puce du groupe i :

Y (k)ir = µ(k) + α

(k)i + ε

(k)ir , Var(ε(k)

ir ) = σ2k

σk = Variabilité intra-groupeGénotype gras

Ecarts à la moyenne

Fré

quen

ce

−10 −5 0 5 10

0.00

0.05

0.10

0.15

0.20

AG10 AG13 AG15 AG9 NG26 NG30 NG32

−10

−5

05

10Puces

Eca

rts

à la

moy

enne

Génotype gras

Page 25: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre pucesY (k)

ir : expression du gène k sur la rème puce du groupe i :

Y (k)ir = µ(k) + α

(k)i + ε

(k)ir , Var(ε(k)

ir ) = σ2k

σk = Variabilité intra-groupe

1

DES DONNEES BIAISEES

YORF 24 25 26YAL001C 675 150 567YAL002W 758 245 768YAL003W 874 208 986YAL005C 968 265 675YAL010C 506 157 856

,,,Marquage moins élevé

Un exemple de BIAIS très fréquent :⇒ le marquage variable d’un échantillon à l’autre et donc d’une puce à l’autre⇒ les conditions d’hybridation/lavage variables d’un échantillon à l’autre et donc d’une puce à l’autre

avec Kj = KRT j x Kmarquage j x K hybrid+lavage j

Puce 24(ech. 24)

Puce 25(ech. 25)

Puce 26(éch. 26)

Puce 24(ech. 24)

Puce 25(ech. 25)

Puce 26(éch. 26)

Hypothèse faite couramment :Si des milliers de gènes sont analysésseulment qq % de ces gènes varient entre conditions=> Moyennes entre puces doivent être proches

Dû à un effet éch. ou à un biais experimental ?

Var.systématique au sein d’une puce: BIAIS qu’il faudra corriger

=> étape de normalisation

AG10 AG13 AG15 AG9 NG26 NG30 NG32

−10

−5

05

10Puces

Eca

rts

à la

moy

enne

Génotype gras

Page 26: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre pucesY (k)

ir : expression du gène k sur la rème puce du groupe i :

Y (k)ir = µ(k) + α

(k)i + β

(k)ir + ε

(k)ir , Var(ε(k)

ir ) = σ2k

σk = Variabilité intra-groupe

1

DES DONNEES BIAISEES

YORF 24 25 26YAL001C 675 150 567YAL002W 758 245 768YAL003W 874 208 986YAL005C 968 265 675YAL010C 506 157 856

,,,Marquage moins élevé

Un exemple de BIAIS très fréquent :⇒ le marquage variable d’un échantillon à l’autre et donc d’une puce à l’autre⇒ les conditions d’hybridation/lavage variables d’un échantillon à l’autre et donc d’une puce à l’autre

avec Kj = KRT j x Kmarquage j x K hybrid+lavage j

Puce 24(ech. 24)

Puce 25(ech. 25)

Puce 26(éch. 26)

Puce 24(ech. 24)

Puce 25(ech. 25)

Puce 26(éch. 26)

Hypothèse faite couramment :Si des milliers de gènes sont analysésseulment qq % de ces gènes varient entre conditions=> Moyennes entre puces doivent être proches

Dû à un effet éch. ou à un biais experimental ?

Var.systématique au sein d’une puce: BIAIS qu’il faudra corriger

=> étape de normalisation

AG10 AG13 AG15 AG9 NG26 NG30 NG32−

10−

50

510

Puces

Eca

rts

à la

moy

enne

Génotype gras

Page 27: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre pucesY (k)

ir : expression du gène k sur la rème puce du groupe i :

Y (k)ir = µ(k) + α

(k)i + βr + ε

(k)ir , Var(ε(k)

ir ) = σ2k

σk = Variabilité intra-groupeAjustement de l’effet puce (tous groupes confondus) :

• Invariance de gènes de contrôle• Principe d’invariance moyenne entre puces

Page 28: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre puces

AG10 AG14 AG9 AM4 AM7 NG26 NG31 NM18 NM21

68

1012

1416

Puces

Exp

ress

ions

aju

stée

s de

l’ef

fet p

uce

AG10 AG14 AG9 AM4 AM7 NG26 NG31 NM18 NM21

Page 29: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable entre puces

AG10 AG14 AG9 AM4 AM7 NG26 NG31 NM18 NM21

68

1012

1416

Puces

Exp

ress

ions

aju

stée

s de

l’ef

fet p

uce

AG10 AG14 AG9 AM4 AM7 NG26 NG31 NM18 NM21 0.0 0.5 1.0 1.5 2.0

0.0

0.5

1.0

1.5

2.0

Ecart−types intra−groupes avant normalisation

Eca

rt−

type

s in

tra−

grou

pes

aprè

s no

rmal

isat

ion

Effet de la normalisation sur la variabilité résiduelle

Page 30: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable non-homogèneNormalisation

Mêmes corrections pour tous les gènes

Page 31: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable non-homogèneNormalisation

Mêmes corrections pour tous les gènes

Contrôle de la qualité des données

• Flags : spots retirés des données• Recalcul ponctuel des valeurs d’expression

Page 32: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable non-homogène

Génotype

A

B

B

A

Page 33: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable non-homogène

Génotype

A

B

B

A

Régime

α

β

α

β

Page 34: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable non-homogène

Génotype

A

B

B

A

Régime

α

β

α

β

Opérateur

Page 35: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable non-homogène

Génotype

A

B

B

A

Régime

α

β

α

β

Opérateur

♣+1

-1

+1

-1

+1

-1

-1

+1

Page 36: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Variabilité indésirable non-homogène

Génotype

A

B

B

A

Régime

α

β

α

β

Opérateur

♣+1

-1

+1

-1

+1

-1

-1

+1

+1

-1

-1

+1

Page 37: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan du cours

1 Préambule

2 Technologie mono-couleurAnalyse différentielleBiais techniquesPlanification expérimentale

3 Technologie bi-couleurEffet fluorochromeInteraction gène × fluorochromePlans classiques

4 Perspectives

Page 38: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

PrincipeTechnologie bi-couleur : une puce = un couple de mesuresd’expression par gène

Couple = 1 couleur (vert ou rouge) par condition

Page 39: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

PrincipeDonnées « zebrafish » : 8448 gènes

z−range 161.7 to 55699 (saturation 161.7, 55699) z−range 164.9 to 60030.6 (saturation 164.9, 60030.6)

Page 40: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

PrincipeTechnologie bi-couleur : une puce = un couple de mesuresd’expression par gène

Couple = 1 couleur (vert ou rouge) par condition

Si conditions i et j sur la rème puce

Y (k)i r = µ(k) + α

(k)i + β

(k)r + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + ε

(k)j r ,

Page 41: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

PrincipeTechnologie bi-couleur : une puce = un couple de mesuresd’expression par gène

Couple = 1 couleur (vert ou rouge) par condition

Si conditions i et j sur la rème puce

Y (k)i r = µ(k) + α

(k)i + β

(k)r + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + ε

(k)j r ,

Pas d’effet puce sur le log-ratio des expressions

M(k)i j r = Y (k)

i r − Y (k)j r .

Page 42: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Effet fluorochromeExpressions sur la rème puce (conditions i et j)

M(k)i j r = α

(k)i − α(k)

j + Bruit

Page 43: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Effet fluorochromeExpressions sur la rème puce (conditions i et j)

M(k)i j r = α

(k)i − α(k)

j + Bruit

Hypothèse d’invariance moyenne : pour presque tous les k ,α

(k)i − α(k)

j = 0

Page 44: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Effet fluorochromeHistogramme des valeurs M

Puce 1

Log−ratios

Effe

ctifs

−3 −2 −1 0 1 2 3

010

0020

0030

0040

0050

00

Moyenne= −0.48 Ecart−type= 0.55

Page 45: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Effet fluorochromeExpressions sur la rème puce (conditions i et j)

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

Page 46: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Effet fluorochromeExpressions sur la rème puce (conditions i et j)

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

Exemple : 2 puces, 2 génotypes

Puce Génotype Couleur1 G Rouge1 M Vert2 G Vert2 M Rouge

Page 47: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Effet fluorochromeExpressions sur la rème puce (conditions i et j)

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

Exemple : 2 puces, 2 génotypes

Puce Génotype Couleur1 G Rouge1 M Vert Plan « dye swap »2 G Vert2 M Rouge

Page 48: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Effet fluorochromeExpressions sur la rème puce (conditions i et j)

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

Exemple : 2 puces, 2 génotypes

Puce Génotype Couleur1 G Rouge Mi j1 = Condition + Fluorochrome1 M Vert Mi j2 = Condition− Fluorochrome2 G Vert Mi j1 + Mi j2 = Effet condition2 M Rouge

Page 49: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Interaction gène × fluorochromeExpressions d’un gène sur une puce

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

Page 50: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Interaction gène × fluorochromeExpressions d’un gène sur une puce

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

M(k)i j r = Y (k)

i r − Y (k)j r =

(k)i − α(k)

j

]+[γ

(k)rouge − γ

(k)vert

]+ Bruit

A(k)i j r = Y (k)

i r + Y (k)j r = 2µ(k) + 2β(k)

r + Bruit

Page 51: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Interaction gène × fluorochromeExpressions d’un gène sur une puce

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

M(k)i j r = Y (k)

i r − Y (k)j r =

(k)i − α(k)

j

]+[γ

(k)rouge − γ

(k)vert

]+ Bruit

A(k)i j r = Y (k)

i r + Y (k)j r = 2µ(k) + 2β(k)

r + Bruit

Hypothèse : pour la plupart des gènes, effet condition = 0

Page 52: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Interaction gène × fluorochrome

6 8 10 12 14

−2

02

46

8

Graphe MA − Données zebrafish − Puce 1

A

M

Page 53: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Interaction gène × fluorochrome

6 8 10 12 14

−2

02

46

8

Graphe MA − Données zebrafish − Puce 1

A

M

12345678910111213141516

Page 54: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Interaction gène × fluorochromeExpressions d’un gène sur une puce

Y (k)i r = µ(k) + α

(k)i + β

(k)r + γ

(k)rouge + ε

(k)i r ,

Y (k)j r = µ(k) + α

(k)j + β

(k)r + γ

(k)vert + ε

(k)j r ,

Effet fluorochrome = f (potentiel gène)

Page 55: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochrome

6 8 10 12 14

−2

−1

01

23

A

M

Graphe MA − Bloc d’aiguilles 1

Taille de la fenêtre : 5 % (environ 25 points)

Page 56: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochrome

6 8 10 12 14

−2

−1

01

23

A

M

Graphe MA − Bloc d’aiguilles 1

Attention: Gène x Couleur x Puce = Gène x Condition

Page 57: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochrome

6 8 10 12 14

−2

−1

01

23

A

M

Graphe MA − Bloc d’aiguilles 1

Taille de la fenêtre : 90 % (environ 475 points)

Page 58: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochrome

6 8 10 12 14

−2

−1

01

23

A

M

Graphe MA − Bloc d’aiguilles 1

Taille de la fenêtre : 60 % (environ 300 points)

Page 59: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochrome

−3

−1

01

23

4

6 8 10 12 14 6 8 10 12 14

−3

−1

01

23

4

−3

−1

01

23

4

6 8 10 12 14 6 8 10 12 14

−3

−1

01

23

4

A

M

Tip Column

Tip

Row

Page 60: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochromeNormalisation des données:

Y (k)i r ⇐ Y (k)

i r − γ(k)rouge,r

Modèle:

Y (k)ir = µ(k) + α

(k)i + β

(k)r + ε

(k)ir

Données:Gènes

1 2 3 . . . m Puce Facteur� � � . . . � 1 A� � � . . . � 1 B � = Y� � � . . . � 2 A� � � . . . � 2 C

......

...� � � . . . � R C� � � . . . � R B

Page 61: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochrome

−2

02

4

6 8 10 12 14 6 8 10 12 14

−2

02

4

−2

02

4

6 8 10 12 14 6 8 10 12 14

−2

02

4

A

M

Tip Column

Tip

Row

Page 62: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Correction de l’interaction gène × fluorochromeHistogramme des valeurs M

Puce 1

Log−ratios

Effe

ctifs

−3 −2 −1 0 1 2 3

010

0020

0030

0040

0050

00

Moyenne= 0.05 Ecart−type= 0.47

Histogramme des valeurs M Puce 2

Log−ratios

Effe

ctifs

−3 −2 −1 0 1 2 3

010

0020

0030

0040

0050

00

Moyenne= 0 Ecart−type= 0.28

Histogramme des valeurs M Puce 3

Log−ratios

Effe

ctifs

−3 −2 −1 0 1 2 3

010

0020

0030

0040

0050

00

Moyenne= 0.04 Ecart−type= 0.43

Histogramme des valeurs M Puce 4

Log−ratios

Effe

ctifs

−3 −2 −1 0 1 2 3

010

0020

0030

0040

0050

00

Moyenne= −0.01 Ecart−type= 0.35

Page 63: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en étoile »Lorsqu’une condition de référence s’impose . . .

Puce 1 Puce 4Puce 3Puce 2

C0 C0C0C0C1 C4C3C2

Page 64: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en étoile »Lorsqu’une condition de référence s’impose . . .

Puce 1 Puce 4Puce 3Puce 2

C0 C0C0C0C1 C4C3C2

Données:Gènes

1 2 3 . . . m Puce Facteur� � � . . . � 1 C1� � � . . . � 1 C0 � = Y� � � . . . � 2 C0� � � . . . � 2 C2

......

...� � � . . . � 4 C0� � � . . . � 4 C4

Page 65: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en étoile »Lorsqu’une condition de référence s’impose . . .

Puce 1 Puce 4Puce 3Puce 2

C0 C0C0C0C1 C4C3C2

Données:Gènes

1 2 3 . . . m Puce Facteur� � � . . . � 1 C1� � � . . . � 2 C2 � = M = Y − Y0� � � . . . � 3 C3� � � . . . � 4 C4

Page 66: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en étoile »Lorsqu’une condition de référence s’impose . . .

Puce 1 Puce 4Puce 3Puce 2

C0 C0C0C0C1 C4C3C2

Données:Gènes

1 2 3 . . . m Puce Facteur� � � . . . � 1 C1� � � . . . � 2 C2 � = M = Y − Y0� � � . . . � 3 C3� � � . . . � 4 C4

Estimateur VarianceMi0 2σ

2

RMi0 + M0j 4σ

2

R

Page 67: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en boucle »Lorsqu’une notion d’ordre existe entre les conditions . . .

Page 68: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en boucle »Lorsqu’une notion d’ordre existe entre les conditions . . .

Données:Gènes

1 2 3 . . . m Puce Facteur� � � . . . � 1 C1� � � . . . � 1 C2 � = Y� � � . . . � 2 C2� � � . . . � 2 C3

......

...� � � . . . � 4 C4� � � . . . � 4 C1

Page 69: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en boucle »Lorsqu’une notion d’ordre existe entre les conditions . . .

Estimateur VarianceM1,2 2σ

2

RM2,3 + M1,2 4σ

2

R

Page 70: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan « en boucle »Lorsqu’une notion d’ordre existe entre les conditions . . .

Estimateur VarianceM1,2 2σ

2

RM2,3 + M1,2 4σ

2

R

Estimateur Variance34M1,2 + 1

4

[M1,4 + M4,3 + M3,2

] 342σ

2

R12

[M1,2 + M2,3

]+ 1

2

[M1,4 + M4,3

] 124σ

2

R

Page 71: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

Plan du cours

1 Préambule

2 Technologie mono-couleurAnalyse différentielleBiais techniquesPlanification expérimentale

3 Technologie bi-couleurEffet fluorochromeInteraction gène × fluorochromePlans classiques

4 Perspectives

Page 72: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

PerspectivesUne première réflexion a permis• la réduction de σ par l’identification d’une variabilité «

technologique »• l’organisation optimale des données

Page 73: Normalisation des données et planification  expérimentale

Préambule Technologie mono-couleur Technologie bi-couleur Perspectives

PerspectivesUne première réflexion a permis• la réduction de σ par l’identification d’une variabilité «

technologique »• l’organisation optimale des données

Tout est en place pour• l’analyse des effets• l’identification des gènes s’exprimant différemment d’une

condition à une autre