Prueba de Hipotesis

13
Pruebas de Hipótesis Pedro J. Rodríguez Esquerdo [email protected] Departamento de Matemáticas Universidad de Puerto Rico Recinto de Río Piedras mayo de 2009 Contenido I. Pruebas de hipótesis ....................................................................................... 2 A. Premisas e hipótesis............................................................................................................ 2 B. Incertidumbre en las decisiones ......................................................................................... 2 C. Hipótesis nula y alternativa ................................................................................................ 3 D. Ejemplos .............................................................................................................................. 5 E. Tipos de error ...................................................................................................................... 6 1. Error tipo I.................................................................................................................................... 6 2. Error tipo II................................................................................................................................... 8 II. Pruebas de hipótesis para la media poblacional .............................................. 8 F. Valor p ............................................................................................................................... 13 G. Poder de la prueba............................................................................................................ 13

Transcript of Prueba de Hipotesis

Page 1: Prueba de Hipotesis

Pruebas de Hipótesis Pedro J. Rodríguez Esquerdo [email protected] Departamento de Matemáticas Universidad de Puerto Rico Recinto de Río Piedras mayo de 2009

Contenido

I. Pruebas de hipótesis ....................................................................................... 2

A. Premisas e hipótesis............................................................................................................ 2

B. Incertidumbre en las decisiones ......................................................................................... 2

C. Hipótesis nula y alternativa ................................................................................................ 3

D. Ejemplos .............................................................................................................................. 5

E. Tipos de error ...................................................................................................................... 6 1. Error tipo I .................................................................................................................................... 6 2. Error tipo II ................................................................................................................................... 8

II. Pruebas de hipótesis para la media poblacional .............................................. 8

F. Valor p ............................................................................................................................... 13

G. Poder de la prueba ............................................................................................................ 13

Page 2: Prueba de Hipotesis

I. Pruebas de hipótesis

A. Premisas e hipótesis Con el fin de tomar alguna acción o decisión, en muchas ocasiones se parte de algunas

premisas que son tomadas por ciertas mientras no se obtenga alguna evidencia o información que las contradiga. Por ejemplo, una persona arrestada y acusada de cometer algún delito es legalmente considerada inocente. Esto es así hasta el momento en que la evidencia presentada por la fiscalía es considerada suficientemente fuerte para concluir, sin duda razonable, que la persona es en efecto culpable de cometer dicho crimen.

Las premisas o hipótesis proveen una guía sobre qué tipo de comportamiento generalmente esperar. Se plantean las hipótesis sobre el comportamiento general del todo, de la población, y mientras lo que se observa sea consistente con la premisa, no surge razón para cuestionarla. En estadísticas es de interés establecer y comprobar hipótesis sobre aquellos parámetros poblacionales que determinan o influyen en el comportamiento de lo que observamos. Las hipótesis estadísticas se establecen entonces para tomar decisiones sobre el valor de algún parámetro poblacional que denotaremos en general por la letra griega theta, .

En la ciencia se parte de la premisa de que el experimento no resultará en lo que desea demostrar. Partirá de premisas tal como: el tratamiento no es efectivo, no hay diferencia entre dos o más tratamientos. Según los datos observados en un experimento, que necesariamente contienen variabilidad, se toma la decisión de rechazar o no la premisa de la cual se partió. Si los datos observados llevan a la persona que investiga a rechazar la premisa de que, por ejemplo, el tratamiento no es efectivo, entonces ha demostrado que en efecto, el tratamiento es efectivo.

En la ciencia social o natural las premisas o hipótesis planteadas forman parte de la metodología de estudio de algún problema. Algunos ejemplos de premisas son:

un maestro parte de la premisa de que el estudiante asiste al curso con el deseo de aprender;

un electricista debe partir de la premisa de que la conexión eléctrica que va a revisar está viva con corriente eléctrica;

la sociedad parte de la premisa de que una persona es inocente hasta tanto se pruebe lo contrario;

dependiendo del lugar donde vivamos, podemos partir de la premisa de que la persona que maneja el otro vehículo en la intersección respetará la señal de Pare o Alto;

una investigadora parte de la premisa de que el nuevo medicamento no surtirá efecto alguno;

un sicólogo parte de la premisa de que dos grupos de individuos sometidos a tratamientos distintos no mostrarán diferencias en su comportamiento.

una persona que hace un experimento parte de la premisa de que no encontrará el resultado que desea.

B. Incertidumbre en las decisiones Al partir de la premisa de que la conexión eléctrica está viva, el electricista tomará las

debidas precauciones para preservar su vida. Este usará una prueba sencilla para determinar de forma inequívoca si en efecto la conexión está viva. Luego de hacer esta determinación podrá trabajar con seguridad en la conexión.

Page 3: Prueba de Hipotesis

Pruebas de Hipótesis página 3

© 2005-2009 PJ Rodríguez Esquerdo

Sin embargo, el tomar una decisión sobre por ejemplo, la efectividad de un medicamento o sobre las diferencias de comportamiento de dos grupos, es una tarea un tanto más compleja. Es poco común obtener evidencia inequívoca de la efectividad del medicamento o diferencias entre los grupos, puesto que la reacción o efecto no es idéntico en todos los sujetos. Esta variabilidad implica que cualquier decisión que se tome sobre la efectividad del medicamento, sobre las diferencias, o sobre la premisa, necesariamente tendrá elementos de incertidumbre.

Medidas de peso, volumen, área, concentración, tiempo y otras mostrarán variabilidad cuando el mismo objeto se somete a medidas repetidas con el mismo instrumento. Esto se debe a que las respuestas de los individuos a los tratamientos y las medidas con instrumentos contienen elementos de variación.

Primero, un individuo puede reaccionar de forma distinta en distintas ocasiones, aún ante el mismo estímulo. Segundo, aunque las reacciones pueden ser similares, los individuos no reaccionamos de forma idéntica ante un estímulo particular. Tercero, los instrumentos tienen una precisión limitada. Finalmente, los individuos u objetos que participan del estudio son sólo una muestra de la población de todos los posibles individuos que podrían potencialmente participar, lo cual añade variación debido al muestreo.

En esas ocasiones no observaremos evidencia inequívoca sobre el problema que intentamos resolver. Debemos entonces quedar satisfechos con decisiones que necesariamente contendrán una probabilidad pequeña o controlada de ser erróneas, pero que tienen una probabilidad grande de ser correctas.

C. Hipótesis nula y alternativa Las hipótesis estadísticas son premisas sobre el parámetro de una población tal como la

media ( = ), mediana, proporción ( = p) o varianza ( = 2) poblacionales. La premisa de la cual se parte sobre el valor del parámetro o parámetros de la población se conoce como la hipótesis nula. Se le llama nula pues la misma generalmente indica, por ejemplo, que la media poblacional es cero, que no hay diferencia entre grupos en la población, o que el tratamiento no es efectivo. La hipótesis nula se denota usualmente en símbolos por H0. El cero es un recordatorio que se parte de la premisa de que el efecto es nulo o que las diferencias entre los grupos es cero.

Al hacer investigaciones es usual pensar en una hipótesis de investigación, tal como: demostrar que el medicamento es efectivo; demostrar que hay una diferencia promedio significativa en la ejecución en una prueba entre individuos que durmieron toda la noche e individuos que no durmieron, o que unas plantas tratadas con hormonas crecen en promedio más que las plantas en el grupo control. Esta hipótesis, lo que el investigador desea demostrar sobre la población, se conoce como la hipótesis alternativa y se denota por Ha.

H0: premisa de la cual se parte sobre los parámetros poblacionales. La hipótesis nula generalmente tiene la forma H0: = 0, donde 0 es un número que denota un valor particular del parámetro . Ejemplos de hipótesis nulas son: H0: p = 0.75, H0: µ = 3.50, H0: σ2 = 4.6, H0: px = py.

Ha: aseveración que se desea demostrar sobre los parámetros de la población.

La hipótesis alternativa generalmente tiene una de las formas Ha: > 0, Ha: < 0 o Ha: ≠ 0, dependiendo de lo que el investigador desea demostrar. Ejemplos de hipótesis alternativas son: Ha: p > 0.5, Ha: σ2 < 6 o Ha: µ ≠ µ0.

Page 4: Prueba de Hipotesis

Pruebas de Hipótesis página 4

© 2005-2009 PJ Rodríguez Esquerdo

Lo que el investigador desea demostrar es parte de la hipótesis alternativa y no de la nula por varias razones. Una razón es que partir de una premisa contraria a lo que deseamos demostrar, y luego encontrar evidencia concreta que nos lleve a rechazarla es un argumento más contundente que presumir que lo queremos demostrar es cierto, para luego encontrar evidencia que apoya nuestro reclamo. En este último caso puede reclamarse que observamos esos resultados sencillamente porque de acuerdo con nuestra premisa, esperábamos que así fuera. Otra razón es que es podemos controlar matemáticamente la probabilidad de cometer algunos tipos de error.

Lógicamente hablando, el observar un resultado cónsono con la hipótesis nula no demuestra que es cierta, solo es evidencia a favor de que es cierta. Una persona comentó que cierto tipo de fósil no existe, puesto que si existiera, ya alguien lo hubiera encontrado. Es muy difícil demostrar que algo no existe. Los múltiples intentos fallidos de encontrarlo son cónsonos con la hipótesis nula de que el fósil no existe, pues no se ha encontrado. Pero para demostrar que no existe sería necesario hacer una búsqueda exhaustiva de todo el planeta; lo que es esencialmente imposible. Por otro lado, el que una especie no haya dejado su huella fosilizada, no quiere decir que no haya existido. Seguramente hay una gran cantidad de especies de plantas y animales que existe o existió, que no dejó huella en el record histórico. Si se encontrara un solo fósil del que se busca, es suficiente para demostrar la hipótesis alternativa, que el fósil existe.

De la misma manera, es muy difícil demostrar la hipótesis nula de que una persona es inocente de algún cargo. Puede hacerse demostrando que no estaba presente durante ese periodo en la escena del crimen o demostrando que otra persona es verdaderamente culpable. Sin embargo, en la mayoría de los casos eso es imposible de hacer. En estos, la evidencia que se presente a favor de la inocencia, tal como que la persona nunca había cometido un crimen, que es pacífica, que va a la iglesia y muchas otras no demuestran la hipótesis nula de que la persona es inocente de lo que se le acusa. Esta es una de las razones por las cuales a las personas no se les requiere demostrar su inocencia, y se parte de la premisa de que lo es. Es el fiscal quien tiene la obligación de demostrar la hipótesis alternativa de que la persona es culpable mas allá de duda razonable.

En la lógica matemática, si una proposición denotada por p se toma como la hipótesis nula H0 y la suponemos cierta, esperamos ver resultados experimentales denotados por q, también ciertos, que apoyen esa hipótesis nula. Esto es equivalente a la aseveración p implica a q, la que se escribe p q. Si p es cierta, la implicación p q es cierta solo cuando la proposición q también es cierta. En resumen, si la hipótesis nula es cierta, entonces esperamos resultados experimentales q ciertos, dentro de lo que se esperaría obtener. Esto se ve en la siguiente tabla, que define la relación p q:

Tabla I-1 Tabla de veracidad para la implicación p q

Tabla de verdad para p q

p Cierto Cierto Falso Falso q Cierto Falso Cierto Falso

p q Cierto Falso Cierto Cierto

Si p es cierta, para que la implicación p q sea también cierta, la proposición q

necesariamente tiene que ser cierta. Algo distinto ocurre cuando se observa resultados experimentales q’ que contradicen la hipótesis nula. Suponga que la hipótesis nula H0 es cierta (la proposición p se supone cierta), y que además la implicación p q también se supone cierta. Esto querría decir que se debe observar q, que la proposición q debe ser cierta.

Page 5: Prueba de Hipotesis

Pruebas de Hipótesis página 5

© 2005-2009 PJ Rodríguez Esquerdo

Pero si se parte de esas premisas y se hace un estudio donde se observe q’; es decir, se observa que q es falso, se observa resultados contrarios a la predicción de lo que se debiera observar, o que sería poco probable observar cuando la hipótesis nula (p) y la implicación p q son ciertas. ¿qué decisión se debe tomar entonces sobre p y sobre p q ? Ese resultado observado q´ es evidencia en contra de la hipótesis nula. En este caso se ha demostrado que la implicación p q es probablemente falsa, que en este caso, la proposición p cierta probablemente no implica que la proposición q tiene que ser también cierta. A diferencia de la matemática, la estadística necesariamente incluye elementos de incertidumbre. Por esta razón, observar q´ no es muestra inequívoca de que la implicación es falsa, sino que puede haberse obtenido ese resultado por operación del azar, cometiéndose entonces un error tipo I.

D. Ejemplos 1. Un grupo de consumidores desea verificar el reclamo en la etiqueta de una marca de refrescos

en botella. La etiqueta indica que la botella contiene 1 litro del refresco. Los consumidores creen que en promedio, las botellas contienen menos de 1 litro.

H0: = 1 litro Ha: < 1 litro

La hipótesis nula es que la cantidad media de refresco en las botellas es (mayor o) o igual a un litro, pues es el reclamo en la etiqueta y los consumidores aún no tienen evidencia para descartarla. La alternativa es que en promedio, las botellas contienen menos de 1 litro, pues el consumidor quiere proteger su dinero y no ser engañado. Ciertamente no protestará si el contenido promedio es mayor de un litro.

2. Por años, un agricultor de Lares ha estado usando abono orgánico para cultivar el café en su finca de 200 cuerdas. Su finca produce un promedio de 620 libras de café por cuerda. Un comerciante le ofrece un abono químico con la promesa de que producirá más de 650 libras de café por cuerda. Si es cierto lo que dice el comerciante, el agricultor usará el nuevo abono. Por esto decide probarlo y selecciona 30 lotes de una cuerda cada uno. Las hipótesis de interés son:

H0: = 650 libras por cuerda Ha: > 650 libras por cuerda

La hipótesis nula es que la cantidad media de libras de café por cuerda producido por el nuevo abono es menor o igual a 650 libras. El agricultor parte de la premisa de que no dejará de usar el abono que ha usado por años, a menos que demuestre que el nuevo producirá un promedio de más de 650 libras, lo que debe dejarle más ganancia.

3. Se desea conocer si la proporción de empleados de gobierno que son hombre ph, es distinta a la

proporción de empleados de gobierno que son mujer pm. Se selecciona una muestra aleatoria de 1,000 empleados del gobierno y se determina el sexo de cada sujeto. Las hipótesis de interés son:

H0: ph = pm Ha: ph ≠ pm

La hipótesis nula es que la proporción de hombres es igual a la proporción de mujeres empleados en el gobierno. Como no hay evidencia en dirección alguna sobre las proporciones, se parte de la premisa de que son iguales, que no hay diferencia. Lo que desea conocer es si estas proporciones son distintas, no si una proporción particular es mayor que la otra.

Page 6: Prueba de Hipotesis

Pruebas de Hipótesis página 6

© 2005-2009 PJ Rodríguez Esquerdo

En el caso de una población, es común hacer pruebas de hipótesis para parámetros tal como la media poblacional , la correlación poblacional ρ, o la varianza poblacional 2. Por ejemplo, si se quiere demostrar que la media es mayor que un número fijo 0, es decir, la hipótesis alternativa es Ha: > 0, se parte de la hipótesis nula de que la media poblacional es menor o igual a

0. Esta hipótesis nula, por razones matemáticas1 se escribe H0: = 0. La siguiente tabla muestra algunos ejemplos de hipótesis nula y alternativa para algunos parámetros.

Tabla I-2 Ejemplos de hipótesis nula y alternativa

Ejemplos de hipótesis nula y alternativa

Media : Una población

0 es un número fijo conocido. H0: = 0

Ha: > 0 Ha: < 0 Ha: ≠ 0

Media : Dos poblaciones

H0: x = y Ha: x > y Ha: x < y Ha: x ≠ y

Varianza 2: Una población 20 es un número fijo conocido.

H0: 2 = 20 Ha: 2 > 20 Ha: 2 < 20 Ha: 2 ≠ 20

Varianza 2: Dos poblaciones

H0: 2x = 2Y Ha: 2x > 2Y Ha: 2x < 2Y Ha: 2x ≠ 2Y

Correlación ρ: Una población ρ 0 es un número conocido

H0: ρ = ρ 0 Ha: ρ > ρ0 Ha: ρ < ρ0 Ha: ρ ≠ ρ0

E. Tipos de error Luego de diseñar el experimento, obtener datos y analizarlos, el investigador debe usar los

resultados observados para tomar una decisión sobre sus hipótesis. Si se observa datos contrarios a la hipótesis nula, la decisión debe ser la de rechazarla a favor de la hipótesis alternativa. En el caso en que no se haya observado evidencia suficientemente fuerte en contra de la hipótesis nula, la decisión será la de no rechazarla. La decisión tomada debe ser fiel expresión de los datos observados.

Idealmente los datos y por lo tanto, la decisión tomada, deben reflejar y ser cónsonas con la realidad poblacional desconocida. Sin embargo esto no siempre ocurre, aún en el experimento, encuesta o estudio mejor diseñado y realizado. Las medidas que se tomen siempre muestran variabilidad, pues los instrumentos tienen precisión finita. Además se introduce variabilidad al tomar una muestral. Por lo tanto, es posible que por mero accidente aleatorio, la muestra no refleje fielmente la población. Por estas razones, al tomar cualquier decisión, siempre existe siempre la posibilidad de cometer algún tipo de error estadístico.

1. Error tipo I

La realidad poblacional tiene sólo uno de dos posibles estados: la hipótesis nula es cierta; o la hipótesis nula es falsa. Si la hipótesis nula es cierta no debe ser rechazada a favor de la hipótesis alternativa. En el caso en que sea falsa debe ser rechazada a favor de la alternativa.

1 Las pruebas que usualmente se usan son óptimas cuando se presume que el parámetro es igual a un número. Véase Teorema de Neyman Pearson, DeGroot, estadísticas

Page 7: Prueba de Hipotesis

Pruebas de Hipótesis página 7

© 2005-2009 PJ Rodríguez Esquerdo

Sin embargo, los datos contienen necesariamente elementos de variación pues generalmente provienen de una muestra que puede ser o no representativa, los instrumentos de medición tienen una precisión limitada y los materiales usados pueden cambiar por distintos factores tal como la humedad del aire, temperatura, manejo o reacción con otros materiales. Una muestra, aún tomada científicamente siempre tendrá una pequeña probabilidad de no reflejar la realidad poblacional.

Aún habiendo usado una metodología científica para tomar la mejor muestra posible, obtenido datos con muy poco error experimental, y tomado una decisión cónsona a los datos observados, es posible que se cometa el error de tomar la decisión de rechazar la hipótesis nula aún siendo cierta.

Este tipo de error se conoce como error tipo I. La probabilidad de cometer un error tipo I se puede controlar y reducir, pero sólo se puede eliminar si nunca se toma la decisión de rechazar la hipótesis nula. Esta última situación no es deseable ya que llevaría a nunca descartar premisa alguna, no importa cuán irracional sea la misma o cuánto los datos obtenidos contradigan esa premisa. El investigador es conservador cuando selecciona una probabilidad muy pequeña de cometer error tipo I, pues sólo rechazará el status quo, la hipótesis nula, si obtiene evidencia muy contundente en contra de esta hipótesis. La probabilidad máxima de cometer error tipo I se conoce como la significancia de la prueba y se denota usualmente por la letra griega alfa, . La probabilidad de cometer error tipo I se escribe de la siguiente manera:

= Prob( Rechazar H0 | H0 es cierta).

Los valores de uso más común para la significancia de una prueba son 0.01, 0.05 y 0.10. La significancia es en ocasiones presentada como un por ciento, tal como 1%, 5% o 10%. Esto quiere decir que con el fin de adelantar la ciencia, el investigador está dispuesto a permitir una probabilidad de 0.01, 0.05, o 0.10 de rechazar la hipótesis nula cuando es cierta, o de cometer un error tipo I.

El valor de la significancia es seleccionado antes de comenzar a hacer el experimento en una de varias formas. El valor de puede estar dictado por el uso y costumbre de la disciplina, por ejemplo, de los artículos que se publican en revistas científicas. Otra forma de seleccionarlo es que sencillamente sea impuesto por la persona o compañía para la cual se trabaja y que son quienes pagan el salario de los investigadores. Finalmente, puede ser seleccionado tomando en cuenta el costo de cometer un error tipo I. Mientras más alto el costo, más pequeña debe ser la probabilidad

de cometer error tipo I. El valor usual de en las ciencias naturales y sociales es de 0.05.

La probabilidad de error tipo I no puede ser igual a cero ya que si se desea = 0, nunca se podría tomar la decisión de rechazar la hipótesis nula. Siempre que se tome la decisión de rechazar la hipótesis nula, ya que la decisión se basa en una muestra y no en la población, existe una probabilidad positiva de cometer un error tipo I.

Como ilustración se puede pensar en la situación en que un individuo es acusado de cometer un delito. La hipótesis nula en este caso es H0: la persona es inocente, la alternativa es Ha: la persona es culpable. Ocurre un error tipo I cuando la evidencia muestra que el individuo es culpable cuando es realmente inocente. La sociedad entiende que esta situación es insostenible y aunque no se cuantifica, la probabilidad de error tipo I en estos casos debe ser muy pequeña. Esta es una de las razones por la cual a un acusado, al igual que a todos nosotros, nos asisten muchos derechos.

Page 8: Prueba de Hipotesis

Pruebas de Hipótesis página 8

© 2005-2009 PJ Rodríguez Esquerdo

La única forma en que se puede eliminar toda posibilidad de enviar una persona inocente a la cárcel es nunca rechazando la hipótesis nula, es decir, no importa la calidad y cantidad de la evidencia, ni la severidad del delito del que se le acusa, nunca se descarta la inocencia de la persona. En esta situación nadie iría a la cárcel, no importa lo que hubiera hecho. Claro, esto tendría algunos beneficios para la sociedad, por ejemplo, no existirían cárceles, jueces ni fiscales, los legisladores no tendrían que ocupar parte de su tiempo en revisar o redactar un código penal, y la policía se usaría para otras funciones. Pero nunca encontrar culpable a una persona tiene un costo que puede ser mucho más alto que los beneficios. Las personas podrían cometer cualquier tipo de fechoría impunemente.

2. Error tipo II

En el caso en que la hipótesis nula sea falsa, cuando el valor del parámetro es consistente con la hipótesis alternativa, puede surgir la situación de que los datos obtenidos llevan al investigador a no rechazarla, cometiendo entonces un error tipo II. Usualmente no se controla este tipo de error directamente. El Lema de Neyman-Pearson2 dice que una vez se decide el nivel de error tipo I aceptable para el problema, la probabilidad de cometer error tipo II asume su valor mínimo al usar las pruebas estadísticas que se estudian aquí. Este valor mínimo no es cero e incluso puede ser considerado muy alto por algunos. Es usual denotar la probabilidad de error tipo II por la letra griega . Entonces

P(error tipo II) = θ = P( No rechazar H0 | H0 es falsa).

Tabla I-3 Resumen de los tipos de error estadísticos

Estado de la realidad

H0 es cierta H0 es falsa

Decisión tomada

Rechaza H0 Error tipo I: Decisión correcta

No rechaza H0 Decisión correcta Error tipo II:

La cantidad (θ) = 1 - θ se conoce como el poder de la prueba, concepto que se esturará

más adelante, es función del valor del parámetro desconocido θ, sin limitarse a valores de θ que hacen la hipótesis nula cierta o falsa.. El poder de la prueba es la probabilidad de rechazar H0, cuando en realidad debe ser rechazada, lo que representa una situación deseada. Idealmente se quiere tener pruebas cuyo poder sea alto. Así el poder de la prueba se escribe:

(θ) = 1 - θ = P( Rechazar H0 | θ ).

II. Pruebas de hipótesis para la media poblacional Un estudio publicado en una revista profesional indica que la media del largo de las hojas adultas del árbol de Jobos es de 10 centímetros. El estudio también indica que la varianza del largo de esas hojas es de 1 centímetro. Un biólogo sospecha que por condiciones de clima y terreno particulares, las hojas del árbol de Jobos que crece en un bosque húmedo cercano son más largas en promedio que lo indicado en el estudio. Sin embargo, el biólogo no tiene razón para creer que la variabilidad del largo sea distinta a la indicada en el estudio, por lo que supone que aún para los

2 Véase la discusión en §6.1 de Bickel, Peter J. y Kjell Doksum, Mathematical Statistics: Basic Ideas and Selected Topics, Holden.Day, Inc., San Francisco 1977.

Page 9: Prueba de Hipotesis

Pruebas de Hipótesis página 9

© 2005-2009 PJ Rodríguez Esquerdo

árboles que desea estudiar, la varianza poblacional 2 es conocida e igual a 2 cm., igual que en el estudio publicado.

Ya que no cuenta con evidencia al contrario, el biólogo parte de la premisa de que la media poblacional de las hojas de los árboles que desea estudiar en idéntica al valor publicado en el estudio, = 10, es decir la media de las hojas de sus árboles no es distinta a la publicada. Así desea comprobar las siguientes hipótesis:

H0: = 10 cm. contra la hipótesis alternativa Ha: > 10 cm.

Para llevar a cabo este análisis el biólogo selecciona 20 hojas de estos árboles en la misma manera en que se seleccionaron para el estudio publicado. Luego mide su largo y calcula la media de esa muestra de largos. Ya que la media muestral es un excelente estimador de la media poblacional del largo de las hojas de los árboles que le interesan y es la única información que posee, debe comparar esa media obtenida de la muestra , con la media poblacional presumida de 10 centímetros. En realidad el biólogo desea rechazar su hipótesis nula a favor de la alternativa, lo cual demostrará su sospecha. Pero esta decisión dependerá exclusivamente de los datos que obtuvo.

Si la hipótesis nula H0 es cierta, la media muestral tendrá un valor cercano a = 10, aunque por la variabilidad natural de la naturaleza, por contar con una muestra y porque los instrumentos tienen una precisión fija, este valor calculado de sus datos puede ser un poco mayor de 10 o incluso menor de 10. Un valor observado de la media muestral mayor de 10 centímetros le dará alguna evidencia, que puede ser no muy contundente, para concluir que la media poblacional del largo de las hojas en ese lugar es mayor de 10 cm. En el caso en que la media muestral resulte ser menor de 10 cm. nunca podrá descartar la hipótesis nula, ya que la alternativa sólo incluye la posibilidad de que la media del largo de las hojas de la población de árboles en el bosque húmedo sea mayor de 10 cm.

Ahora, ¿cuánto mayor de 10 debe ser , el valor de la media muestral para concluir que la media poblacional del largo de la hojas en ese lugar es mayor de 10 cm.? Si presume que el largo de las hojas tiene una distribución normal como en el estudio, y si la media poblacional es realmente 10, ya que la distribución normal es simétrica alrededor de su media, la mitad de las veces observará valores de la media de la muestral que son mayores de 10. Es decir, aún si la hipótesis nula es cierta, es muy común observar datos con una media mayor de 10. El biólogo sólo rechazará la hipótesis nula en el caso que el valor calculado de sea suficientemente mayor de 10 cm.

Equivalentemente, para rechazar la hipótesis nula, debe ser mayor que un número seleccionado w que a su vez es suficientemente mayor de 10. Así el biólogo rechazará H0 si de sus datos, encuentra que > w > 10. Para encontrar el valor de w, el biólogo deberá seleccionar la significancia de la prueba, es decir, la probabilidad de error tipo I que es aceptable para su trabajo, y utilizar una tabla de la distribución estadística apropiada, en este caso, la distribución normal.

El biólogo lleva a cabo el estudio y obtiene un valor de la media muestral para el largo de las 20 hojas igual a 10.2 cm. Una diferencia de 2 décimas de 1 centímetro en el largo promedio de las hojas parece ser muy pequeña, lo que posiblemente inclinaría inicialmente al investigador a no rechazar H0. Pero se debe adelantar, pues la comparación tiene que tomar en cuenta la variabilidad de los datos.

Por ejemplo, si la varianza fuera muy pequeña y la hipótesis nula cierta, todas las hojas tendrían esencialmente el mismo largo por lo que sería extremadamente raro observar hojas que

Page 10: Prueba de Hipotesis

Pruebas de Hipótesis página 10

© 2005-2009 PJ Rodríguez Esquerdo

tuvieran un largo mucho mayor (o mucho menor) que 10 cm. En esta situación sería además

mucho más raro observar un valor de X̄ mayor de 10cm. pues el error estándar de la media muestral es mucho menor que la desviación estándar de cualquier dato particular. En el caso de que sea igual a 10.2 cm., y si hay poca variabilidad, lo más seguro es que se rechazaría la hipótesis nula de que el largo promedio de las hojas es 10 cm. a favor de la alternativa de que el largo promedio es mayor de 10 cm.

En el caso en que la varianza de los datos fuera muy grande y la hipótesis nula cierta, se podría observar hojas con una gran variedad de largos, por lo que obtener una media para el largo de 100 hojas mayor o igual a 10.2 sería un evento bastante común. En esta situación posiblemente no se rechazaría la hipótesis nula. La Gráfica II-1 muestra el significado que tiene el observar un valor de igual a 10.2 cm., aún cuando ambas distribuciones tienen la misma media poblacional según la hipótesis nula, = 10.2, y según las premisas o información previas sobre la varianza poblacional.

Si la varianza poblacional es 2 = 0.01, la distribución N(10, ) muestra poca variabilidad, por lo que observar un valor de igual o mayor a 10.2 cm. es un evento muy raro, tal como ilustra el área azul a la derecha del valor 10.2. El área bajo esa curva de densidad a la derecha de 10.2 es muy pequeña en comparación con el área bajo la densidad de una distribución normal con varianza poblacional 2 = 0.04., ilustrada por el área en rojo en la gráfica de abajo. En esta última, la probabilidad de observar valores mayores que 10.2 es mucho más alta.

Gráfica II-1 Comparación de dos distribuciones normales con distinta varianza

Para realizar esta comparación es necesario estandarizar el valor de , con los que se

obtiene un nuevo valor que representa un múltiplo del error estándar, indicando el número de errores estándar a los que se encuentra de su media . Luego de estandarizar, al realizar la prueba, ya no es necesario comparar el valor obtenido de con w, sino se compara el valor estandarizado de con el valor z obtenido de la tabla de la distribución normal estándar para el nivel de significancia deseado, 100%.

El valor z representa un número real tal que el área a su derecha bajo la distribución normal estándar es igual a ; es decir, el valor z cumple con la ecuación P( Z > z ) = , donde Z es una variable aleatoria estándar normal y es un número entre 0 y 1. Ese valor α es un número

Page 11: Prueba de Hipotesis

Pruebas de Hipótesis página 11

© 2005-2009 PJ Rodríguez Esquerdo

usualmente pequeño que representa el nivel de significancia preseleccionado por el investigador. Por ejemplo, si la significancia deseada es 2.5%, entonces = 0.025 y z.025.= 1.96.

La definición de probabilidad de error tipo I, α, se utiliza para obtener una estadística prueba que permite efectuar esta prueba de hipótesis con el nivel de significancia deseado:

P(error tipo I= = P( Rechazar H0 | H0 es cierta) = P( > w | = 10).

Se parte de esta ecuación y se estandariza la media muestral para obtener :

La estadística prueba, que se obtiene de las ecuaciones anteriores es . Si los datos

no tuvieran una distribución normal, pero la cantidad de datos es grande3, Z tendrá una distribución aproximadamente normal estándar. La última igualdad en el desarrollo anterior se obtiene al usar la propiedad de que el área a la derecha de zα bajo la distribución normal estándar es igual a α y notar que esa probabilidad es la probabilidad de que una variable aleatoria Z con distribución (aproximada) normal estándar sea mayor que es número zα, es decir , o equivalentemente. P(Z > zα) = .

Alternativamente, si se desea, se puede calcular el valor w con el cual se compararía el valor

de para efectuar la prueba. El valor de w se obtiene al resolver la ecuación por w, de

donde Debe notarse que el valor de w es mayor que la media propuesta en la

3 El tamaño de muestra suficientemente grande para que la aproximación normal a la distribución de la media de la muestra, sea buena no es un número fijo. En muchos casos, y dependiendo de la precisión que se desee, si los datos provienen de medidas de una variable continua, n = 30 puede ser suficientemente bueno. Por otro lado, si los datos originales provienen de observaciones de una variable discreta, podría requerirse un número mucho mayor que 30.

Figura II-1 Probabilidad de error tipo I, α

Page 12: Prueba de Hipotesis

Pruebas de Hipótesis página 12

© 2005-2009 PJ Rodríguez Esquerdo

hipótesis nula de 10. Esto último no es necesario pues solo basta comparar el valor de la estadística prueba Z con el valor correspondiente de zα, o equivalentemente, el valor p de la prueba con la significancia.

El procedimiento de prueba es el de calcular el valor de Z y compararlo con zα. Se rechaza la hipótesis nula H0 al nivel de significancia preseleccionado si Z > z . Para esta hipótesis alterna, el conjunto de valores reales Z mayores que z , es decir { Z; Z > z }, se conoce como la zona de rechazo o región crítica de la prueba. La zona de rechazo depende directamente de la hipótesis alternativa.

La estadística prueba se aplica ahora al presente problema. Según el estudio realizado por el biólogo, los valores que deben ser usados son:

= 10, 2 = 2, n = 20, = 0.05 y = 10.2. Los valores obtenidos del estudio son sustituidos en la estadística prueba y se obtiene que

Este resultado quiere decir que la media obtenida en la muestra se encuentra a 0.632

errores estándar a la derecha de = 10. Aún se debe comparar el valor obtenido de z con z con el fin de tomar la decisión. Como la hipótesis alternativa es Ha: > 10, se rechaza H0 si es suficientemente más grande que = 10; o equivalentemente, si el valor obtenido de la estadística prueba z es suficientemente mayor que z .

De la tabla de la distribución normal estándar se obtiene que z.05 = 1.645. Por lo tanto, al nivel de significancia del 0.05, o del 5%, se rechaza la hipótesis nula H0: = 10 cm. a favor de la hipótesis alternativa Ha: > 10 cm. si el valor estandarizado de x̄ se encuentra a más de 1.645 errores estándar de = 10. En este caso, como la hipótesis alternativa es que la media de la población de hojas de los árboles en el bosque húmedo es mayor de 10, esto equivale a rechazar H0 a favor de Ha si el valor obtenido para es suficientemente mayor que 10.

Como en esta situación z = 0.632 es un valor menor que z.05 = 1.645, no se puede rechazar la hipótesis nula al nivel de significancia del 5%. A pesar de que = 10.2 es mayor que 10, es necesario concluir que

no es significativamente mayor que 10 al nivel de significancia del 5%. Del estudio no se obtuvo evidencia suficientemente contundente en contra de la hipótesis nula, por lo cual no se puede descartar que la media poblacional del largo de las hojas de Jobos en el bosque húmedo es mayor de 10 cm. Este resultado dice que muy

Figura II-2 Comparación del valor obtenido de la estadística prueba con el valor crítico

Page 13: Prueba de Hipotesis

Pruebas de Hipótesis página 13

© 2005-2009 PJ Rodríguez Esquerdo

probablemente el valor observado de = 10.2 respondió a la mera operación del azar y no a que verdaderamente las hojas de los árboles en el bosque húmedo tengan una media poblacional mayor de 10 cm.

F. Valor p Hay otra manera de efectuar esta prueba estadística, la cual es usada cada vez con más

frecuencia en la literatura científica. Partiendo de la premisa que H0 es cierta, el biólogo puede tomar la decisión de rechazar o no la hipótesis nula H0 examinando si valores tan extremos de como el observado ocurren con una probabilidad muy pequeña. Si la hipótesis nula se presume cierta, mientras más pequeña sea esa probabilidad, más raro debe ser el obtener valores de como el obtenido y más sólida será la evidencia para rechazar la hipótesis nula. La probabilidad de observar valores tan extremos como el observado si la hipótesis nula es cierta se conoce como el valor p de la prueba.

El valor p depende directamente de la hipótesis alternativa. En el ejemplo del largo promedio de las hojas, la hipótesis alternativa es Ha: > 10. Por lo tanto, el valor p en este caso se encuentra al obtener la probabilidad de que si se hiciera el estudio nuevamente se obtuviera un valor de la estadística prueba Z mayor que z = 0.632, es decir,

Valor p = P ( Z > 0.632 ) = 0.2643.

Este resultado se ilustra por el área bajo la curva a la derecha de 0.632 y sombreada en rojo, que se extiende e incluye el área sombreada en azul. Esto quiere decir que si la hipótesis nula es cierta, se observaría un valor de Z tan grande o más como el obtenido más del 26% de las veces que se repitiera el estudio. Partiendo de la premisa de que la hipótesis nula es cierta, este evento ocurre muy comúnmente y es consistente con la hipótesis nula, por lo cual no se rechazaría. ¿Cuán pequeño debe ser el valor p para decidir entonces rechazar la hipótesis nula? En este caso es necesario comparar el valor p con una significancia que puede ser seleccionada luego de hacer la prueba.

Se rechaza H0 si al suponer que es cierta, el evento que observamos es lo suficientemente raro. Así se rechaza H0 para valores pequeños del valor p. Por otro lado, la significancia es la probabilidad de error tipo I más pequeña que se está dispuesto a permitir. Esto quiere decir que se rechaza la hipótesis nula si el valor p es menor que la significancia deseada.

G. Poder de la prueba

Figura II-3 Valor p de la prueba