Visió general del disseny d’experiments

Departament d’EstadísticaDivisió de Ciències Experimentals i

Matemàtiques

Llicenciatura de Biologia

Disseny d’Experiments i Anàlisi de Dades

Jordi Ocaña Rebull

Departament

d’Estadística

Contingut

Estudis de camp i estudis experimentals Planificació d’estudis en Biologia Principis de disseny estadístic Dissenys més habituals en l’experimentació

biològica Determinació de la grandària mostral

Departament

d’Estadística

Estudis de camp i estudis experimentals

Proveu de comparar aquests dos estudis:– Agafem sengles mostres aleatòries, la primera de fumadors

passius habituals i la segona de persones que normalment estan lliures de fum de tabac. Posteriorment, mesurem el nivell de CO2 en sang de cada un d’aquests individus.

– Dividim a l’atzar una mostra uniforme de voluntaris no fumadors passius (ni actius) en dos grups. Seguidament el primer grup passa una temporada en un ambient ric en fum de tabac i l’altre no. Posteriorment, mesurem el nivell de CO2 en sang de cada un d’aquests individus.

Departament

d’Estadística

Estudis de camp i estudis experimentals

1er cas: estudi de camp, 2on cas estudi exp. Des del punt de vista del disseny

d’experiments i l’anàlisi estadística: major control al segon cas, al qual:Podem assignar veritables “tractaments”

d’acord a determinat criteri (aleatòriament) Diferències d’interpretació: més fàcil parlar

de causalitat, anàlisi estadística la mateixa

Departament

d’Estadística

Planificació d’estudis en BiologiaFases principals

Definició dels objectius Consideració de dissenys experimentals

alternatius i tria del més adequat Determinació de les mides mostrals

Recordeu la taula d’errors tipus I i II Generació d’un pla d’aleatorització Redacció del protocol experimental

… experimentació i anàlisi de resultats

Departament

d’Estadística

Planificació d’estudis en Biologia Caràcter iteratiu d’un estudi experimental

C on c lu s ion srecom an ac ion s

A n à lis i d e ls resu lta ts

E xp erim en tac ióam b reco llid a d e resu lta ts

D issen y exp erim en ta l

A n à lis is p rè viesd ec is ió d e rea litza r l'es tu d i

Departament

d’Estadística

Principis de disseny estadísticLes “peces” que formen un disseny

“Grups experimentals”:– Població de destí– Població experimental– Mostra

El pas de cada un d’aquests nivells al seu superior implica un problema d’inferència diferent

Departament

d’Estadística

M os tra

P ob lac ió exp erim en ta l

P ob lac ió d e d es tí

Inferència no estadística

Inferència estadísticaRepresentativitat:mostra aleatòria

Validesa del disseny:assignació aleatòria

de tractaments

Departament

d’Estadística

Unitat experimental: més petita unitat a la qual podem aplicar els diversos tractaments

Variable de resposta: variable aleatòria a mesurar a partir dels experiments

Factor: variable qualitativa que representa un dels tractaments o condicions experimentals que volem estudiar (o que poden influir en la resposta)– Nivells: els possibles valors d’un factor

Variable covariant o concomitant: variable quantitativa de la qual pot dependre la resposta

Departament

d’Estadística

Principis de disseny estadísticConcepte de biaix i de variabilitat

biaix: desviació sistemàtica de les mesures respecte del veritable valor ( mesures acurades: no tenen biaix -o en tenen poc)

variabilitat: fluctuació aleatòria al voltant d’un valor central ( mesures precises: baixa variabilitat)

… és “pitjor” el biaix que la variabilitat

Departament

d’Estadística

Principis de disseny estadísticFonts de biaix i de variabilitat

Identificació i quantificació– Revisió acurada del procés de mostratge:

població de destí i població experimental, representativitat de la mostra, …

– Revisió del procés experimental i dels criteris de mesura. El problema dels avaluadorsconveniència de dissenys “cecs”

– Proves d’uniformitat: estudis sense tractaments però tot reproduint les altres condicions

Departament

d’Estadística

Principis de disseny estadísticMètodes de control del biaix i la variabilitat

Un factor del qual “sospitem”:– Pot no ser controlable ni mesurable

Aleatorització: assignació aleatòria d’unitats experimentals a condicions experimentals (tractaments)

– Pot ser controlable, es pot fer participar del disseny experimental Blocs: comparació entre tractaments solament dins grups homogenis respecte de condicions que es sospita que poden influir

– Pot ser mesurable, juntament amb la variable de resposta Fer-lo intervenir a l’anàlisi estadística

Departament

d’Estadística

Principis de disseny estadísticMètodes de control del biaix i la variabilitat

“Encegament”: els “agents” (pacient, metge, estadístic, ...) que intervenen a l’experiment desconeixen el tractament aplicat a cada unitat experimental– Simple cec: p.e. pacient desconeix tractament rebut

– Doble cec: ni metge, ni pacient coneixen tractament

– Triple cec: ni metge, ni pacient, ni estadístic

Necessitat d’un “controlador”: dipositari d’informació “encegada” (també per raons de seguretat)

Departament

d’Estadística

Dissenys més habituals en l’experimentació biològica

Principals dissenys:– Dissenys totalment aleatoritzats– Dissenys estratificats/blocs aleatoritzats

• Dissenys creuats (crossover)

– Dissenys jeràrquics (mal anomenats “niats”)• Dissenys split plot • Dissenys de mesures repetides

Altres qüestions: grups control, selecció dels nivells d’un factor, estudis multicentre, ...

Departament

d’Estadística

Dissenys més habitualsDissenys totalment aleatoritzats

Cada unitat experimental s’assigna, a l’atzar, a exactament una condició experimental o tractament– Com a conseqüència, el “factor” individu està

niat dins cada grup de tractament– Diversos noms segons el nombre de factors:

• disseny d’un sol factor: “una via” (one-way layout)

• disseny factorial (dos o més factors) (two-way, …)– moltes condicions experimentals– replicació oculta (hidden replication)

Departament

d’Estadística

Dissenys més habitualsDissenys totalment aleatoritzats

Avantatges Simplicitat Optimització del

temps de durada de l’experiment

Mínim perill de pèrdua de casos

Inconvenients Creixement multiplicatiu

del nombre de condicions Comparació entre

subjectes, no dins dels subjectes

Mobilització de molts recursos en poc temps

Departament

d’Estadística

Dissenys més habitualsDissenys estratificats/blocs aleatoritzats

Primer definim blocs o estrats (col·leccions d’unitats experimentals similars)– Els “factors de bloc” sovint no interessen per

ells mateixos

Els diversos tractaments s’apliquen dins cada bloc

El procediment d’aleatorització s’aplica per separat dins cada bloc

Departament

d’Estadística

Dissenys més habitualsDissenys estratificats/blocs aleatoritzats

Avantatges Més control

experimental Si bloc = individu, les

comparacions són dins dels individus

Com a conseqüència, menors mides mostrals

Inconvenients Més condicions

experimentals Dependència de les

respostes dins cada bloc

Departament

d’Estadística

Dissenys més habitualsDissenys creuats (crossover)

Cas especial de blocs aleatoritzats: – els propis individus són blocs– tots els tractaments s’apliquen a cada individu,

de forma seqüencial en el temps– totes les possibles seqüències de tractaments

balancejades (totes amb el mateix nombre de casos) i individus assignats a l’atzar a cada seqüència

– període de “neteja” entre tractaments

Departament

d’Estadística

SeqüènciaPeríode 1 2 3 4 5 61 A B C A C B2 B C A C B A3 C A B B A C

Exemple: suposem que tenim tres tractaments A, B i C.Ens caldran 3 períodes de temps i tindrem 3!=6 seqüènciesde possibles tractaments. Si tenim 30 individus assignarema l’atzar 5 individus a cada seqüència.

Departament

d’Estadística

Avantatges Comparacions dins els

individus Menors grandàries

mostrals necessàries Menys recursos

utilitzats simultàniament

Inconvenients Poden resultar de més

llarga durada Major perill de dades

faltants (abandons) Perill de biaix a causa

d’efectes acumulats o interaccions entre tractaments

Departament

d’Estadística

Dissenys més habitualsDissenys niats o jeràrquics

Reflecteixen la natura jeràrquica de molts sistemes biològics (i no biològics), formats per subsistemes a diversos nivells

Mostratge a diversos nivells, com ara:– Individus

• Lòbuls del fetge (dret i esquerre)– Petits lòbuls

» Cèl·lules (hepatòcits)

Cal distingir factors fixos i aleatoris

Departament

d’Estadística

Dissenys més habitualsDissenys split plot

S’assignen camps, finques, ... (“plots”) a l’atzar als nivells d’un factor “primari”

S’assignen a l’atzar àrees menors (“subplots”) dins de cada camp als nivells d’un factor “secundari”

Possibles nivells inferiors de divisió (“sub-subplots”) si són àrees molt grans

Departament

d’Estadística

Dissenys més habitualsDissenys split plot

bloc 1 bloc 2“Plot” (p.e.localitat)

“Subplot” 1 2 3 4 5 61 G A A A G A2 A G G G A G

Factor primari: “adob” amb tres nivells (sac groc, sac verd-oliva, sac fúcsia).Factor secundari: “tipus de rec: G=gota a gota, A=aspersió.

Departament

d’Estadística

Dissenys més habitualsDissenys en mesures repetides

A partir d’un cert nivell (“individu”, “plot”) el factor niat és el temps, tenim observacions per aquell “individu” en diversos instants consecutius (això no és aleatoritzable!)

En lloc d’instants de temps podríem tenir, per exemple, diverses concentracions, dosis, etc. (no aleatoritzades)

Departament

d’Estadística

Dissenys més habitualsDissenys en mesures repetides

individuinstant 1 2 3 4 5 6

Dos tractaments (groc, verd oliva) assignats a l’atzar

Departament

d’Estadística

Dissenys més habitualsDissenys niats

Avantatges Permeten estudiar la

variabilitat associada a cada nivell jeràrquic

Factor secundari estudiat amb més precisió que el primari (en disseny split plot)

Inconvenients Anàlisi més complexa

que, per exemple, en un disseny totalment aleatoritzat

Factor primari estudiat amb menys precisió que el secundari (en split plot)

Departament

d’Estadística

Altres qüestionsGrups o tractaments control

Condició de referència (en algun sentit) Històric: dades prèvies Concurrent: obtingut al mateix estudi

– Control negatiu: manca de tractament real• Propi subjecte abans del tractament

• No tractat

• Placebo: substància inòqua que sembla tractament

– Control actiu: autèntic tractament • habitual –vs. nous tractaments estudiats

• habitual –vs. habitual + nous tractaments estudiats (càncer)

Departament

d’Estadística

Altres qüestions

Selecció dels nivells d’un factor, depèn de:• objectius de l’estudi

– determinar existència d’un efecte: sovint millor 2 i prou– determinar la dinàmica d’efecte

• dinàmica subjacent (lineal, quadràtica, sigmoidea...)

Estudis multicentre– Menys durada– Dificultats de coordinació: cal protocol clar– Sovint cal fer correspondre blocs a centres, ...

Departament

d’Estadística

Determinació de la grandària mostral

Sovint prevalen criteris econòmics Enfoc estadístic, dues famílies de mètodes:

– Grandària fixa, determinada abans d’iniciar l’estudi, a partir de cert criteri d’optimalitat

– Seqüencial: repetidament, una nova dada (o un grup de dades) seguida d’una anàlisi que:

• és concloent i condueix a una decisió estadística final (i parem el mostratge)

• o bé a la necessitat d’obtenir una nova dada.

Departament

d’Estadística

Determinació de la g. mostralDisseny al qual aplicaríem la t de Student

Situació: disseny totalment aleatoritzat, estudi d’un factor amb solament dos nivells.– (p.e. Volem comparar dos tractaments respecte

de certa variable fisiològica, assignem a l’atzar individus a cada tractament, posteriorment farem una prova t de comparació de mitjanes.)

Quants individus hem d’assignar a cada grup?

Departament

d’Estadística

Determinació de la g. mostralDisseny al qual aplicaríem la t de Student

Suposem per un moment que és veritat que les mitjanes són diferents (H1 és certa).

En aquest cas la decisió correcta és rebutjar H0. Si no ho fem s’ha produït un error de tipus II.

La probabilitat que es produeixi aquest error depèn de les grandàries mostrals, de la veritable diferència de mitjanes, de ,...

Departament

d’Estadística

Determinació de la g. mostralCorba característica d’operació del test t

Una corba per cada n*=2n-1 (suposem n1=n2=n)

Ordenades: probabilitat d’error de tipus II

Abscisses: valor d amb:

Departament

d’Estadística

Determinació de la g. mostralUtilització de la corba característica d’op.

Decidim el valor a partir del qual “val la pena” detectar diferències amb “seguretat”– p.e. suposem que és =0.5 a l’exemple

Decidim què vol dir “seguretat”– p.e. suposem que és 5% de prob. d’error II

Com que és desconegut, procurem proposar-ne un valor (p.e. estimació)– p.e. de prova pilot prèvia 25.0ˆ

Departament

d’Estadística

Determinació de la g. mostralUtilització de la corba característica d’op.

Tot això ens porta a

Si observem les corbes c.o., n*=16 permet un 5% de prob. d’error de tipus II,

Per tant 16=2n-1 n=9: caldria assignar 9 individus a cada grup experimental (tractament).

125.02

Visió general del disseny d’experiments

Documents

Transcript of Visió general del disseny d’experiments

Debats Catalunya Social - Taula Tercer Sector · disseny per a tothom (o disseny inclusiu) des de diferents perspectives. ... important al disseny industrial, disseny d’indumentària,

Racó d’experiments. llum i color

Classe 11 Visió

DISLÈXIA: UNA VISIÓ INCLUSIVA...DISLÈXIA: UNA VISIÓ INCLUSIVA L’Equip ICE – Dislèxia organitza la primera Trobada Pedagògica DISLEXIA:UNS VISIÓ INCLUSIVA amb l’objectiu

Racó d’experiments II

PBL a l'ESO. Una Visió

Disseny i maquetació Empresa d’inserció laboralgracia.escolateresiana.com/images/noticias_primaria/PEIr.pdf1. VISIÓ, MISSIÓ I VALORS ... Escola dissenyadora del canvi MISSIÓ

Empowerment:Una nova visió dels RRHH

Classe 10 Visió

CMOS: conceptes bàsics - docencia.ac.upc.edudocencia.ac.upc.edu/FIB/grau/VLSI/Intro_cmos.pdf · DM, Tardor 2004 15 Visió ideal vs visió realVisió ideal vs. visió real • Exemple:

VISIÓ GLOBAL 2014

Visió Localret Nº7

Visió d’andorra

La visió empresarial.

Cultures del disseny, la visió d'un antropoleg a la Catalunya del segle XXI

Una visió de l'Edat Mitjana

Visió per Computador - cvc.uab.es · Visió per Computador Deep learning Felipe Lumbreras Dept. Ciències de la Computació / Centre de Visió per Computador Universitat Autònoma

Classe 6 Visió

Regne vegetal - visió de conjunt

Visió Localret Nº9