Post on 06-Jan-2016
description
Departament d’EstadísticaDivisió de Ciències Experimentals i
Matemàtiques
Visió general del disseny d’experiments
Llicenciatura de Biologia
Disseny d’Experiments i Anàlisi de Dades
Jordi Ocaña Rebull
Visió general del disseny d’experiments
Departament
d’Estadística
Contingut
Estudis de camp i estudis experimentals Planificació d’estudis en Biologia Principis de disseny estadístic Dissenys més habituals en l’experimentació
biològica Determinació de la grandària mostral
Visió general del disseny d’experiments
Departament
d’Estadística
Estudis de camp i estudis experimentals
Proveu de comparar aquests dos estudis:– Agafem sengles mostres aleatòries, la primera de fumadors
passius habituals i la segona de persones que normalment estan lliures de fum de tabac. Posteriorment, mesurem el nivell de CO2 en sang de cada un d’aquests individus.
– Dividim a l’atzar una mostra uniforme de voluntaris no fumadors passius (ni actius) en dos grups. Seguidament el primer grup passa una temporada en un ambient ric en fum de tabac i l’altre no. Posteriorment, mesurem el nivell de CO2 en sang de cada un d’aquests individus.
Visió general del disseny d’experiments
Departament
d’Estadística
Estudis de camp i estudis experimentals
1er cas: estudi de camp, 2on cas estudi exp. Des del punt de vista del disseny
d’experiments i l’anàlisi estadística: major control al segon cas, al qual:Podem assignar veritables “tractaments”
d’acord a determinat criteri (aleatòriament) Diferències d’interpretació: més fàcil parlar
de causalitat, anàlisi estadística la mateixa
Visió general del disseny d’experiments
Departament
d’Estadística
Planificació d’estudis en BiologiaFases principals
Definició dels objectius Consideració de dissenys experimentals
alternatius i tria del més adequat Determinació de les mides mostrals
Recordeu la taula d’errors tipus I i II Generació d’un pla d’aleatorització Redacció del protocol experimental
… experimentació i anàlisi de resultats
Visió general del disseny d’experiments
Departament
d’Estadística
Planificació d’estudis en Biologia Caràcter iteratiu d’un estudi experimental
C on c lu s ion srecom an ac ion s
A n à lis i d e ls resu lta ts
E xp erim en tac ióam b reco llid a d e resu lta ts
D issen y exp erim en ta l
A n à lis is p rè viesd ec is ió d e rea litza r l'es tu d i
Visió general del disseny d’experiments
Departament
d’Estadística
Principis de disseny estadísticLes “peces” que formen un disseny
“Grups experimentals”:– Població de destí– Població experimental– Mostra
El pas de cada un d’aquests nivells al seu superior implica un problema d’inferència diferent
Visió general del disseny d’experiments
Departament
d’Estadística
Principis de disseny estadísticLes “peces” que formen un disseny
M os tra
P ob lac ió exp erim en ta l
P ob lac ió d e d es tí
Inferència no estadística
Inferència estadísticaRepresentativitat:mostra aleatòria
Validesa del disseny:assignació aleatòria
de tractaments
Visió general del disseny d’experiments
Departament
d’Estadística
Principis de disseny estadísticLes “peces” que formen un disseny
Unitat experimental: més petita unitat a la qual podem aplicar els diversos tractaments
Variable de resposta: variable aleatòria a mesurar a partir dels experiments
Factor: variable qualitativa que representa un dels tractaments o condicions experimentals que volem estudiar (o que poden influir en la resposta)– Nivells: els possibles valors d’un factor
Variable covariant o concomitant: variable quantitativa de la qual pot dependre la resposta
Visió general del disseny d’experiments
Departament
d’Estadística
Principis de disseny estadísticConcepte de biaix i de variabilitat
biaix: desviació sistemàtica de les mesures respecte del veritable valor ( mesures acurades: no tenen biaix -o en tenen poc)
variabilitat: fluctuació aleatòria al voltant d’un valor central ( mesures precises: baixa variabilitat)
… és “pitjor” el biaix que la variabilitat
Visió general del disseny d’experiments
Departament
d’Estadística
Principis de disseny estadísticFonts de biaix i de variabilitat
Identificació i quantificació– Revisió acurada del procés de mostratge:
població de destí i població experimental, representativitat de la mostra, …
– Revisió del procés experimental i dels criteris de mesura. El problema dels avaluadorsconveniència de dissenys “cecs”
– Proves d’uniformitat: estudis sense tractaments però tot reproduint les altres condicions
Visió general del disseny d’experiments
Departament
d’Estadística
Principis de disseny estadísticMètodes de control del biaix i la variabilitat
Un factor del qual “sospitem”:– Pot no ser controlable ni mesurable
Aleatorització: assignació aleatòria d’unitats experimentals a condicions experimentals (tractaments)
– Pot ser controlable, es pot fer participar del disseny experimental Blocs: comparació entre tractaments solament dins grups homogenis respecte de condicions que es sospita que poden influir
– Pot ser mesurable, juntament amb la variable de resposta Fer-lo intervenir a l’anàlisi estadística
Visió general del disseny d’experiments
Departament
d’Estadística
Principis de disseny estadísticMètodes de control del biaix i la variabilitat
“Encegament”: els “agents” (pacient, metge, estadístic, ...) que intervenen a l’experiment desconeixen el tractament aplicat a cada unitat experimental– Simple cec: p.e. pacient desconeix tractament rebut
– Doble cec: ni metge, ni pacient coneixen tractament
– Triple cec: ni metge, ni pacient, ni estadístic
Necessitat d’un “controlador”: dipositari d’informació “encegada” (també per raons de seguretat)
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habituals en l’experimentació biològica
Principals dissenys:– Dissenys totalment aleatoritzats– Dissenys estratificats/blocs aleatoritzats
• Dissenys creuats (crossover)
– Dissenys jeràrquics (mal anomenats “niats”)• Dissenys split plot • Dissenys de mesures repetides
Altres qüestions: grups control, selecció dels nivells d’un factor, estudis multicentre, ...
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys totalment aleatoritzats
Cada unitat experimental s’assigna, a l’atzar, a exactament una condició experimental o tractament– Com a conseqüència, el “factor” individu està
niat dins cada grup de tractament– Diversos noms segons el nombre de factors:
• disseny d’un sol factor: “una via” (one-way layout)
• disseny factorial (dos o més factors) (two-way, …)– moltes condicions experimentals– replicació oculta (hidden replication)
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys totalment aleatoritzats
Avantatges Simplicitat Optimització del
temps de durada de l’experiment
Mínim perill de pèrdua de casos
Inconvenients Creixement multiplicatiu
del nombre de condicions Comparació entre
subjectes, no dins dels subjectes
Mobilització de molts recursos en poc temps
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys estratificats/blocs aleatoritzats
Primer definim blocs o estrats (col·leccions d’unitats experimentals similars)– Els “factors de bloc” sovint no interessen per
ells mateixos
Els diversos tractaments s’apliquen dins cada bloc
El procediment d’aleatorització s’aplica per separat dins cada bloc
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys estratificats/blocs aleatoritzats
Avantatges Més control
experimental Si bloc = individu, les
comparacions són dins dels individus
Com a conseqüència, menors mides mostrals
Inconvenients Més condicions
experimentals Dependència de les
respostes dins cada bloc
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys creuats (crossover)
Cas especial de blocs aleatoritzats: – els propis individus són blocs– tots els tractaments s’apliquen a cada individu,
de forma seqüencial en el temps– totes les possibles seqüències de tractaments
balancejades (totes amb el mateix nombre de casos) i individus assignats a l’atzar a cada seqüència
– període de “neteja” entre tractaments
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys creuats (crossover)
SeqüènciaPeríode 1 2 3 4 5 61 A B C A C B2 B C A C B A3 C A B B A C
Exemple: suposem que tenim tres tractaments A, B i C.Ens caldran 3 períodes de temps i tindrem 3!=6 seqüènciesde possibles tractaments. Si tenim 30 individus assignarema l’atzar 5 individus a cada seqüència.
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys creuats (crossover)
Avantatges Comparacions dins els
individus Menors grandàries
mostrals necessàries Menys recursos
utilitzats simultàniament
Inconvenients Poden resultar de més
llarga durada Major perill de dades
faltants (abandons) Perill de biaix a causa
d’efectes acumulats o interaccions entre tractaments
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys niats o jeràrquics
Reflecteixen la natura jeràrquica de molts sistemes biològics (i no biològics), formats per subsistemes a diversos nivells
Mostratge a diversos nivells, com ara:– Individus
• Lòbuls del fetge (dret i esquerre)– Petits lòbuls
» Cèl·lules (hepatòcits)
Cal distingir factors fixos i aleatoris
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys split plot
S’assignen camps, finques, ... (“plots”) a l’atzar als nivells d’un factor “primari”
S’assignen a l’atzar àrees menors (“subplots”) dins de cada camp als nivells d’un factor “secundari”
Possibles nivells inferiors de divisió (“sub-subplots”) si són àrees molt grans
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys split plot
bloc 1 bloc 2“Plot” (p.e.localitat)
“Subplot” 1 2 3 4 5 61 G A A A G A2 A G G G A G
Factor primari: “adob” amb tres nivells (sac groc, sac verd-oliva, sac fúcsia).Factor secundari: “tipus de rec: G=gota a gota, A=aspersió.
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys en mesures repetides
A partir d’un cert nivell (“individu”, “plot”) el factor niat és el temps, tenim observacions per aquell “individu” en diversos instants consecutius (això no és aleatoritzable!)
En lloc d’instants de temps podríem tenir, per exemple, diverses concentracions, dosis, etc. (no aleatoritzades)
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys en mesures repetides
individuinstant 1 2 3 4 5 6
12345
Dos tractaments (groc, verd oliva) assignats a l’atzar
Visió general del disseny d’experiments
Departament
d’Estadística
Dissenys més habitualsDissenys niats
Avantatges Permeten estudiar la
variabilitat associada a cada nivell jeràrquic
Factor secundari estudiat amb més precisió que el primari (en disseny split plot)
Inconvenients Anàlisi més complexa
que, per exemple, en un disseny totalment aleatoritzat
Factor primari estudiat amb menys precisió que el secundari (en split plot)
Visió general del disseny d’experiments
Departament
d’Estadística
Altres qüestionsGrups o tractaments control
Condició de referència (en algun sentit) Històric: dades prèvies Concurrent: obtingut al mateix estudi
– Control negatiu: manca de tractament real• Propi subjecte abans del tractament
• No tractat
• Placebo: substància inòqua que sembla tractament
– Control actiu: autèntic tractament • habitual –vs. nous tractaments estudiats
• habitual –vs. habitual + nous tractaments estudiats (càncer)
Visió general del disseny d’experiments
Departament
d’Estadística
Altres qüestions
Selecció dels nivells d’un factor, depèn de:• objectius de l’estudi
– determinar existència d’un efecte: sovint millor 2 i prou– determinar la dinàmica d’efecte
• dinàmica subjacent (lineal, quadràtica, sigmoidea...)
Estudis multicentre– Menys durada– Dificultats de coordinació: cal protocol clar– Sovint cal fer correspondre blocs a centres, ...
Visió general del disseny d’experiments
Departament
d’Estadística
Determinació de la grandària mostral
Sovint prevalen criteris econòmics Enfoc estadístic, dues famílies de mètodes:
– Grandària fixa, determinada abans d’iniciar l’estudi, a partir de cert criteri d’optimalitat
– Seqüencial: repetidament, una nova dada (o un grup de dades) seguida d’una anàlisi que:
• és concloent i condueix a una decisió estadística final (i parem el mostratge)
• o bé a la necessitat d’obtenir una nova dada.
Visió general del disseny d’experiments
Departament
d’Estadística
Determinació de la g. mostralDisseny al qual aplicaríem la t de Student
Situació: disseny totalment aleatoritzat, estudi d’un factor amb solament dos nivells.– (p.e. Volem comparar dos tractaments respecte
de certa variable fisiològica, assignem a l’atzar individus a cada tractament, posteriorment farem una prova t de comparació de mitjanes.)
Quants individus hem d’assignar a cada grup?
Visió general del disseny d’experiments
Departament
d’Estadística
Determinació de la g. mostralDisseny al qual aplicaríem la t de Student
Suposem per un moment que és veritat que les mitjanes són diferents (H1 és certa).
En aquest cas la decisió correcta és rebutjar H0. Si no ho fem s’ha produït un error de tipus II.
La probabilitat que es produeixi aquest error depèn de les grandàries mostrals, de la veritable diferència de mitjanes, de ,...
Visió general del disseny d’experiments
Departament
d’Estadística
Determinació de la g. mostralCorba característica d’operació del test t
Una corba per cada n*=2n-1 (suposem n1=n2=n)
Ordenades: probabilitat d’error de tipus II
Abscisses: valor d amb:
2221
d
Visió general del disseny d’experiments
Departament
d’Estadística
Determinació de la g. mostralUtilització de la corba característica d’op.
Decidim el valor a partir del qual “val la pena” detectar diferències amb “seguretat”– p.e. suposem que és =0.5 a l’exemple
Decidim què vol dir “seguretat”– p.e. suposem que és 5% de prob. d’error II
Com que és desconegut, procurem proposar-ne un valor (p.e. estimació)– p.e. de prova pilot prèvia 25.0ˆ
Visió general del disseny d’experiments
Departament
d’Estadística
Determinació de la g. mostralUtilització de la corba característica d’op.
Tot això ens porta a
Si observem les corbes c.o., n*=16 permet un 5% de prob. d’error de tipus II,
Per tant 16=2n-1 n=9: caldria assignar 9 individus a cada grup experimental (tractament).
125.02
5.0
d