¡Ya sé como es!
Transcript of ¡Ya sé como es!
Estadística Aplicada: “Didáctica de la
Estadística y Métodos Estadísticos en
Problemas Socioeconómicos.
Universidad Nacional de Colombia.
Sede Medellín
Enseñanza de la Estadística como parte de la
Metodología de Investigación
Dr. Ignacio Méndez Ramírez.
IIMAS-UNAM y IASI
Medellín Colombia 20 de julio de 2010
1
Panorama de la Plática
Universidad Nacional de
Colombia . sede Medellín
2
1. Tres Preguntas Básicas:
2. Filosofía de la ciencia. Método científico. Objetividad
3. Modelos estadísticos.
4. Papel de la estadística y el diseño en el Apoyo a
relaciones causales
1. Contrastación de hipótesis.
2. Explicaciones Alternativas.
3. Factores de Confusión.
4. Significancia Estadística.
5. Estrategia de modelado.
5. Consideraciones Didácticas
2.- Las estaturas de los seres humanos tienen distribución
normal
5Universidad Nacional de
Colombia . sede Medellín
3.- En una investigación se tienen dos grupos de
personas, uno realizó ejercicio físico vigoroso EFV,
durante un año y el otro (testigo o control) no lo
hizo. Al término del año se midieron los ácidos
grasos en suero.
Los resultados son:
Se efectúa una prueba de “t” y se tiene P <0.001.
Se concluye “el EFV disminuye los valores de
ácidos grasos”.
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1
6
Universidad Nacional de Colombia . sede Medellín
La respuesta en las tres
preguntas es .
NO
• Es necesario evaluarlas a la luz de
consideraciones filosóficas,
metodológicas y estadísticas.
7Universidad Nacional de
Colombia . sede Medellín
En todo trabajo de Investigación, setiene un marco epistémico.
En muchas áreas de investigación“tradicionales” como la Biología,Medicina, Agronomía, etc., este marcoes tácito, es decir, se asumeinconscientemente.
8Universidad Nacional de
Colombia . sede Medellín
1.- No se puede ser totalmente objetivo.
Además es muy común que sea un marcototalmente erróneo,a partir de la filosofía delPositivismo o Empirísmo Lógico.
El uso de este marco hace que lainvestigación sea muy rígida, pretendiendoser totalmente objetiva y racional.
Los filósofos modernos han rechazadounánimemente este marco epistémico, y hanpostulado entre otras cosas, que la cienciano es totalmente objetiva, que hay actos enel proceso de investigación científica, que nopueden ser justificados totalmente de formaracional. 9Universidad Nacional de
Colombia . sede Medellín
<Positivismo>
*Objetivo
*Empírico
*Racionalidad en el método
*Reduccionista
*Certeza.
*La Matemática es la realidad
*Causalidad Determinística
<Nueva Filosofía>
*Objetividad intersubjetiva
*Constructivismo
*Racionalidad en el científico
*Sistémico
*Minimizar errores
*La matemática aproxima la realidad
*Causalidad Probabilística
¡Ya sé
como
es!
¡Así se
debe
hacer!
Tengo una
teoría que
funciona
bien.
Este
método
funciona
10
La estadística cuando se aplica a otra disciplina, lo
que pretende es contribuir a que el conocimiento
que se adquiere sobre un aspecto de la realidad, esté
en la medida de lo posible libre de errores, o que
éstos sean pequeños.
Representación
11Universidad Nacional de
Colombia . sede Medellín
Epistemología, Metodología
Estadística y las Ciencias Fácticas
Para contribuir al objetivo de tener conocimiento
válido (libre de errores y sancionado por la
comunidad de científicos), es necesario contemplar
los aspectos epistemológicos de las disciplinas
involucradas, diseñar la forma de captar la
información más económica, factible y además que
sea “científica” en el sentido de minimizar errores.
12Universidad Nacional de
Colombia . sede Medellín
Cita
"Modern statistics--concerned with discovering
patterns and structures in nature, with unearthing
relationships which defy unaided perception and
with providing powerful tools for us to improve our
understanding of the world around us-- ought to
be regarded by the general public as one of the
most exciting of disciplines."
David J. Hand. ”Breaking misconceptions--
statistics and its relationship to mathematics”
The Statistician, 1998: 47, pert2, pp. 245-25013Universidad Nacional de
Colombia . sede Medellín
“La estadística moderna encargada de descubrir
patrones y estructuras en la naturaleza, de
desenterrar relaciones que desafían la percepción
normal y de proveernos con herramientas
poderosas para que mejorar el entendimiento del
mundo que nos rodea debería ser considerada
por el público en general como la más excitante
de las disciplinas”
14Universidad Nacional de
Colombia . sede Medellín
Los razonamientos con consideraciones
estadísticas intervienen en todas las
etapas del proceso.
El estadístico debe entender y colaborar
en todos los aspectos de la investigación.
Es un científico más de un grupo de
trabajo 15Universidad Nacional de Colombia . sede Medellín
ASPECTOS EPISTEMOLÓGICOS
.- Interesa principalmente cómo es el mundo y no
tanto por qué es así.
.- El encontrar, cómo es el mundo, tiene relación
con la explicación de por qué es así.
.- En la medida de tener mejores explicaciones, se
pueden encontrar nuevas regularidades, esto
constituye el complejo teórico metodológico con el
que construimos el conocimiento.
.- No hay objetividad Absoluta. Hay Objetividad
intersubjetiva.
.- La matemática está en la mente, no en la
realidad. Ningún modelo es “verdadero”, pero hay
algunos muy útiles. 16Universidad Nacional de
Colombia . sede Medellín
.- No existe un método científico infalibley obligado. El “enfoque científico”consiste en una búsqueda comprometida,exhaustiva e integral de metodologíasque minimicen o eviten los errores en laadquisición del conocimiento
.- No se puede ser totalmente racional,en el sentido de que todo los que se haceesta basado en premisas lógicas
.- No hay hechos puros. Hayinterpretaciones de hechos a la luz deteorías y subjetividad, considerandosiempre el diseño de investigación.
17Universidad Nacional de
Colombia . sede Medellín
Elaboración de proyectos
.- Se pueden considerar dos ciclos ligados en el
proceso de elaboración de un proyecto (protocolo).
C1.- Problema – Marco Teórico – Hipótesis –
Variables.
C2.- Hipótesis – Diseño-
Diseño: Poblaciones, métodos de muestreo,
mediciones, intervenciones, seguimiento.
Antes de realizar una investigación, se debe efectuar
una critica fuerte a todo el proyecto. Se busca
coherencia entre las partes y la minimización de
errores.18
Universidad Nacional de Colombia . sede Medellín
Tipos de diseños, mediciones,
modelos, supuestos, análisis,
etc..
Problema, marco teórico,
hipótesis. Conceptos, objetivos,
poblaciones, elementos, etc.Encuestas, cohortes,
experimentos, etapas,
estratos, bloques,
apareamiento, modelos de
regresión logísticos,
generalizados, discriminante,
factores, ecuaciones
estructurales, etc
Instrumentos, limitaciones
prácticas, trabajo de campo,
tiempo, dinero, etc.
19Universidad Nacional de
Colombia . sede Medellín
Realización de la investigación
Conducción – Obtención de Información- Análisis
Exploratorio – Construcción, verificación y selección
de modelos – Interpretación – Discusión –
Conclusiones y recomendaciones – Reporte.
Hay indivisibilidad del método de estudio con las
explicaciones (teoría) que se tienen sobre el propio
objeto estudiado.Método Teoría
Objeto Teoría
Interpretación 20Universidad Nacional de
Colombia . sede Medellín
La visón rígida de la ciencia positiva y su
adhesión en forma acrítica produce:
.- Poca creatividad en la metodología.
.- Se copian diseños y procedimientos.
.- Búsqueda de objetividad, que puede paralizar.
.- Fe ciega en la matemática.
logP/(1-P) = XB21
Universidad Nacional de Colombia . sede Medellín
Enfoque dogmático en Agronomía:
n=4 es parte del método científico.
Un experimento busca minimizar el error experimental
Uso de bloques frecuentemente inadecuado
Para cualquier experimento un coeficiente de
variación mayor a 20% indica que está mal el estudio.
Un tamaño óptimo de parcela experimental para un
cultivo, válido para todo tipo de tratamientos y
condiciones de experimentación. Pseudorepetición
Uso dogmático (mágico) del 5% de significación
No hay crítica para los diseños y los análisis
La distribución normal existe en la naturaleza
¡Buen
Experimento!
22
Universidad Nacional de Colombia . sede Medellín
2. Las estaturas de los seres humanos tienen distribución
normal
Con elevada frecuencia biólogos, matemáticos,
agrónomos, etc. ; con menor frecuencia sicólogos,
sociólogos, etc., contestan Verdadero
0)0( YP
Niños
HombresMujeres
La Normal es una propiedad
objetiva de la naturaleza,
existe por si sola. Sólo hay
que descubrirla.¡Existe una estatura negativa! Se ignora el diseño, ¿a qué
población de humanos se
refiere? ¿todos los que
existen? ¿a mujeres de 30 a
50 años , clase media, que
viven en México, D.F.?Basquetbolistas
23
H ~ Hipótesis
D ~ Diseño
E ~ Esperado ( condicionado a H , D y SA)
SA ~ Supuestos Adicionales para el funcionamiento de H
con diseño D. 25
Universidad Nacional de Colombia . sede Medellín
Práctica: D: ocurre O (Resultado Observado)
¿Concordancia (contrastación) E con O?
*
a).- Concuerdan E con O : se apoya H
b).- No concuerdan E con O : No se apoya H
¿Cómo se define
la concordancia?
Teoría: H, D, SA E*
26Universidad Nacional de
Colombia . sede Medellín
3. En una investigación se tienen dos grupos de
personas, uno realizó ejercicio físico vigoroso EFV,
durante un año y el otro (testigo o control) no lo
hizo. Al término del año se midieron los ácidos
grasos en suero.
Los resultados son:
Se efectúa una prueba de “t” y se tiene P <0.001.
Se concluye “el EFV disminuye los valores de
ácidos grasos
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1
27
Universidad Nacional de Colombia . sede Medellín
Con elevada frecuencia biólogos, matemáticos,
agrónomos, etc. ; con menor frecuencia sicólogos,
sociólogos, etc., contestan en pregunta 3:
Verdadero
28Universidad Nacional de
Colombia . sede Medellín
3. En una investigación se tienen dos grupos de personas, uno
realizó ejercicio físico vigoroso EFV, durante un año y el otro
(testigo o control) no lo hizo. Al término del año se midieron
los ácidos grasos en suero. Preguntas Básicas
¿ Cómo eran las personas en características
inherentes a ellas, tales como sexo, edad, tipo de
alimentación, raza, estado de salud, etc.?
¿Cómo se asignó el EFV? ¿Lo eligieron las
personas, fue con incentivos, fue al azar, etc.?
¿Cómo se define EFV y NoEFV?
¿En qué condiciones se realizó el EFV y el noEFV,
cambios climáticos, de salud, de organización,
sociales, alimenticios, etc.?
¿Cómo se midieron los ácidos grasos, fue igual
para ambos grupos?29
Universidad Nacional de Colombia . sede Medellín
Explicaciones alternativas A, B,...Q. Niegan
H, y explican la cercanía de E con O de otro
modo. Son “de Nulidad”
Teoría:
H, D, SAH E
Q, D, SAQ E
B, D, SAB E
A, D, SAA E
.................
Práctica: D ocurre O
a) Concuerdan O con E. Se apoyan por igual H, A, B, ... Q
b) No concuerdan O con E. No se apoyan H, A, B, ... Q. 31
Universidad Nacional de Colombia . sede Medellín
Explicaciones alternativas A, B,...Q. Niegan H, y explican
la cercanía de E con O de otro modo. Son “de Nulidad”
Grupo Edad Media
EFV 20-25 años 12.3
Control 47-62 años 18.6
Ac.
grasos
edad
EFV
o no
SA: Supuestos adicionales:
La edad y el EFV están
asociados. La edad produce
cambios en ác. Grasos.
La edad es un Factor de
Confusión en la relación
EFV Ac grasos 32
Universidad Nacional de Colombia . sede Medellín
Explicación
alternativa: Las
diferencias en ac.
grasos de deben
a la edad y no al
EFV
Etapa de planeación: Cambiar el diseño D o
cambiar la hipótesis empírica H, de manera
que los SA de las explicaciones alternativas,
no operen, o sean improbables.
Etapa de análisis y discusión: Mostrar
debilidad teórica, poca plausibilidad o
imposibilidad de los SA de las explicaciones
alternativas.
34Universidad Nacional de
Colombia . sede Medellín
“Control” de factores de confusión
1. Homogeneización.- Que los factores de confusión
no varíen en todos los elementos del estudio.
2. Formación de bloques o estratos homogéneos.-
Comparaciones dentro de los bloques y sus
promedios. No interacción.
3. Aleatorización.- Se asignan al azar a los
elementos de estudio las variantes del posible factor
causal o tratamientos. Tiende a homogenizar la
distribución de todas las variables presentes en los
elementos de estudio.
4. Análisis estadístico:- Se modela la influencia
conjunta de tratamientos y factores de confusión. Se
obtienen los “Efectos ajustados”35
Universidad Nacional de Colombia . sede Medellín
3.En una investigación se tienen 200 hombres de 25-
50 años, se asignan al azar 100 de ellos para que
se sometan a ejercicio físico vigoroso (EFV),
durante un año y el resto (testigo o control) no lo
haga (noEFV).
Se vigila que las condiciones de vida sean
semejantes en ambos grupos durante el año.
Al término del año, de cada individuo se toma una
muestra de sangre y se congela de inmediato, para
que en todas después del mismo tiempo de frío y
con los mismos instrumentos se miden los ácidos
grasos en suero.
36
Universidad Nacional de Colombia . sede Medellín
3. En una investigación se tienen dos grupos de
personas, uno realizó ejercicio físico vigoroso EFV,
durante un año y el otro (testigo o control) no lo
hizo. Al término del año se midieron los ácidos
grasos en suero.
Los resultados son:
Se efectúa una prueba de “t” y se tiene P <0.001.
Se concluye “el EFV disminuye los valores de
ácidos grasos
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1
37
Universidad Nacional de Colombia . sede Medellín
Con elevada frecuencia biólogos, matemáticos,
agrónomos, etc. ; con menor frecuencia sicólogos,
sociólogos, etc., contestan en 3 : Verdadero
38Universidad Nacional de
Colombia . sede Medellín
Explicación alternativa A.-
Hipótesis de Nulidad Estadística
No es cierta H y ocurre O “cercano” a E por azar.
SAA: Hay variación natural en ác. grasos en los
humanos, aunque sean semejantes (la misma
población), pueden darse por azar promedios bajos en
los de EFV y altos en los de noEFV. Bajo A, ambos
grupos son muestras de la misma población de sujetos.39
.....
EFVμ
Explicación alternativa A: noEFVEFV μμ
Se espera que los promedios muestrales sean iguales, EA
noEFVEFV YY Se efectúa el diseño, D y se obtiene O (observado):
)()( EODifEODifYY AnoEFVEFV
.....
noEFVμ
40
Universidad Nacional de Colombia . sede Medellín
Se mide
Yi
Ac graso
Se mide
Yi
Ac graso(Riqueza conceptual: poblaciones,
medias poblacionales, etc.)
¿La discrepancia entre O y EA, Dif, es compatible
con la hipótesis alternativa del Azar , A?
¿La discrepancia entre YEFV y YnoEFV es factible o
probable por azar o es improbable.?
Fisher: 0.05 o 0,01
41Universidad Nacional de
Colombia . sede Medellín
De las posibles Explicaciones alternativas A,
B,...Q. Niegan H, y esperan E de otro modo.
Son “de Nulidad”, si hay significancia estadística,
se considera que A: “El azar produce E” esta
eliminada, pero subsisten B,...Q
42Universidad Nacional de
Colombia . sede Medellín
Teoría:
H, D, SAH E
Q, D, SAQ E
B, D, SAB E
A, D, SAA E Improbable
..........
La significancia estadística sólo eliminó una
explicación alternativa, el azar. ¡Sólo esto!
Se puede decir que , pero no a que se
debe la diferencia , ya que subsisten explicaciones
alternativas (B, …, Q) 43
noEFVEFV
En la búsqueda de apoyo a hipótesis de causalidad
probabilística, se buscan diseños y modelos que
representen bien la realidad, y que permitan valorar si
hay cambios en la distribución de la variable de
respuesta o efecto Y, al cambiar los valores de la
variable causal, condicionado a valores fijos de
variables que representan explicaciones alternativas.
)....,,/()....,,/( * QBAXYfQBAXYf
Donde X y X* son diferentes valores de la variable
“causal” y A,B,...Q son situaciones fijas de las
explicaciones alternativas. Son los “efectos corregidos” o
“efectos de X sobre Y ajustados por A, B, ...Q 44
Universidad Nacional de Colombia . sede Medellín
En estadística es común que se plantee un modelo para
explicar las características de generación de los datos.
El modelo puede representar la situación esperada de
una hipótesis de causalidad, o puede ser el modelo de
negación de una hipótesis.
Se evalúa la concordancia entre los datos observados, O
y los esperados E, si el modelo es cierto.
Usualmente esta discordancia se valora de acuerdo a la
probabilidad de una discordancia como la obtenida o
aún mayor suponiendo cierto el modelo.
Es el ”Valor de P”. 45Universidad Nacional de
Colombia . sede Medellín
M1. Modelo mayor, con más parámetros
M2.- Modelo menor, o modelo reducido, con menos
parámetros.
Se obtiene a partir de M1, al especificar el valor de
uno o más parámetros, o establecer relaciones entre
ellos.
Se obtiene una medida de la discrepancia entre E1 y
O, Disc (M1); también la discrepancia entre E2 y O,
Disc (M2).46Universidad Nacional de
Colombia . sede Medellín
Disc (M2) es mayor que Disc (M1), pero ¿es mucho
mayor o no?
La diferencia entre el “ajuste” de ambos modelos, se
valora en términos de la probabilidad (P) de una
diferencia como esa o mayor si M2 es cierto.
Si P< 0.05 se adopta M1, si P>0.05 se considera M2
como bueno. (Principio de Parsimonia o “Navaja de
Ockam”)47Universidad Nacional de
Colombia . sede Medellín
48
La gran dificultad en la enseñanza es que se dan los
conceptos de probabilidad y de estadística desligados entre
si. Vg. después de 3 o 4 clases sobre probabilidades de
ciertos resultados en juegos de azar, o urnas, (espacios
equiprobables), se pasa a la prueba de hipótesis sobre una
media, a comparar dos medias, donde ahora se usa otro
concepto de probabilidad. !Con razón los alumnos sufren y
no entienden¡. Otro gravísimo problema es que no se toca
el hecho de que la estadística se usa como parte del
proceso de adquisición de conocimientos en muchas
disciplinas y como tal, deben contemplarse los diseños de
investigación de donde surgen los datos. Los datos nunca
son “datos puros”, están ligados a un propósito y a un
diseño. Debe contemplarse la estadística como parte de la
metodología de investigación
Universidad Nacional de Colombia . sede Medellín
49
1. Enfatizar que la estadística aplicada se convierte en
parte de la metodología de investigación.
2. Minimizar temas de Estadística descriptiva. Si es
importante, pero se debe ligar a la caracterización
de una población. El concepto de población(es) en
estudio es fundamental .
3. Presentar los conceptos de probabilidad clásica y
subjetiva, pero con mas énfasis el de probabilidad
frecuentista. Regularidad Estadística como
estabilización de frecuencias relativas al incrementar
el tamaño de la muestra. Limite de frecuencias
relativas. Ley de los grandes números. Modelos de
distribución de eventos en las poblaciones.
Universidad Nacional de
Colombia . sede Medellín
50
4.-“Distribuciones derivadas del muestreo” .
Distribuciones para “estadísticos”, estimadores y
estadísticas de prueba. Teorema Central del
Limite. Regularidad Estadística de segundo nivel.
Error estándar
5.- Intervalos de confianza y pruebas de hipótesis.
6.-Liga de los conceptos con investigaciones reales.
7.-Debe quedar muy claro que la inferencia es para
conocer algo de la regularidad estadística de una
medición en una o más poblaciones. Esto se
inserta en las hipótesis de la investigación