Modulo I

9
Universidad Peruana Unión Ing. Edison Effer Apaza Tarqui 1 Modulo I Introducción La teoría del muestreo estudia la relación entre una población y las muestras tomadas de ella. Es de gran utilidad en muchos campos. Por ejemplo, para estimar magnitudes desconocidas de una población, tales como media y varianza, llamadas a menudo parámetros de la población o simplemente parámetros, a partir de conocimiento de esas magnitudes sobre muestras, que se llaman estadísticos de la muestra o simplemente estadísticos. Estamos interesados en presentar las definiciones de muestra y población, error de muestreo, muestreo probabilístico y muestreo no probabilístico, todos ilustrados por ejemplos sencillos. Veremos cómo se puede emplear la teoría del muestreo para recabar información acerca de muestras aleatorias tomadas de una población conocida. Desde un punto de vista práctico, suele resultar más importante ser capaz de inferir información sobre la población a partir de muestras. Con tal situación trata la inferencia estadística, que usa los principios de la teoría del muestreo. Un problema importante de la inferencia estadística es la estimación de parámetros de la población o brevemente parámetros (tales como la media o la varianza de la población), de los correspondientes estadísticos muéstrales, o simplemente estadísticos (tales como la media y la varianza de la muestra). En este curso también presentamos la media poblacional, proporción poblacional, varianza y desviación estándar, intervalos de confianza para muestras pequeñas y grandes. Uno de los temas más resaltantes es la interpretación y la construcción de los intervalos de confianza. Asimismo, aprenderemos acerca de la “prueba de hipótesis”, el tipo mas común de inferencia de estadística. En la prueba de hipótesis se comienza suponiendo un valor de un parámetro que, a juicio del investigador, sea el más adecuado de acuerdo con la información disponible, a esta suposición se le llama hipótesis nula y se representa con la Ho. A continuación se define otra hipótesis, llamada hipótesis alterna o alternativa, que es la opuesta de lo que se afirma en la hipótesis nula. La hipótesis alterna se representa como Ha. La prueba de hipótesis y la estimación del intervalo se llevan a cabo con diferente terminología, pero vemos que producen conclusiones y resultados comparables que fácilmente se convierten de uno al otro. La pregunta básica dirigida por ambos procedimientos está relacionada con que puede estipularse acerca de los parámetros de la población y cuál es el nivel de confianza. Otro tema resaltante en esta unidad es la interpretación de los resultados de la prueba de hipótesis.

description

Estadística General, para ciencias e ingeniería

Transcript of Modulo I

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    1

    Modulo I

    Introduccin

    La teora del muestreo estudia la relacin entre una poblacin y las muestras tomadas de ella.

    Es de gran utilidad en muchos campos. Por ejemplo, para estimar magnitudes desconocidas de

    una poblacin, tales como media y varianza, llamadas a menudo parmetros de la poblacin o

    simplemente parmetros, a partir de conocimiento de esas magnitudes sobre muestras, que se

    llaman estadsticos de la muestra o simplemente estadsticos.

    Estamos interesados en presentar las definiciones de muestra y poblacin, error de muestreo,

    muestreo probabilstico y muestreo no probabilstico, todos ilustrados por ejemplos sencillos.

    Veremos cmo se puede emplear la teora del muestreo para recabar informacin acerca de

    muestras aleatorias tomadas de una poblacin conocida. Desde un punto de vista prctico, suele

    resultar ms importante ser capaz de inferir informacin sobre la poblacin a partir de muestras.

    Con tal situacin trata la inferencia estadstica, que usa los principios de la teora del muestreo.

    Un problema importante de la inferencia estadstica es la estimacin de parmetros de la

    poblacin o brevemente parmetros (tales como la media o la varianza de la poblacin), de los

    correspondientes estadsticos mustrales, o simplemente estadsticos (tales como la media y la

    varianza de la muestra).

    En este curso tambin presentamos la media poblacional, proporcin poblacional, varianza y

    desviacin estndar, intervalos de confianza para muestras pequeas y grandes.

    Uno de los temas ms resaltantes es la interpretacin y la construccin de los intervalos de

    confianza. Asimismo, aprenderemos acerca de la prueba de hiptesis, el tipo mas comn de

    inferencia de estadstica. En la prueba de hiptesis se comienza suponiendo un valor de un

    parmetro que, a juicio del investigador, sea el ms adecuado de acuerdo con la informacin

    disponible, a esta suposicin se le llama hiptesis nula y se representa con la Ho. A continuacin

    se define otra hiptesis, llamada hiptesis alterna o alternativa, que es la opuesta de lo que se

    afirma en la hiptesis nula. La hiptesis alterna se representa como Ha.

    La prueba de hiptesis y la estimacin del intervalo se llevan a cabo con diferente terminologa,

    pero vemos que producen conclusiones y resultados comparables que fcilmente se convierten

    de uno al otro. La pregunta bsica dirigida por ambos procedimientos est relacionada con que

    puede estipularse acerca de los parmetros de la poblacin y cul es el nivel de confianza.

    Otro tema resaltante en esta unidad es la interpretacin de los resultados de la prueba de

    hiptesis.

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    2

    MUESTREO

    Definiciones:

    Muestreo: El muestreo es una herramienta de la investigacin cientfica. Su funcin bsica es

    determinar que parte de una realidad en estudio (poblacin o universo) debe examinarse con la

    finalidad de hacer inferencias sobre dicha poblacin.

    Muestra: Es una parte representativa de la poblacin. Para que una, muestra sea representativa,

    y por lo tanto til, debe reflejar las similitudes y diferencias encontradas en la poblacin,

    ejemplificar las caractersticas de la misma.

    Es representativa cuando contiene todos los sectores o aspectos de la poblacin en la misma

    proporcin en que se hallan en la totalidad del universo. La representatividad asegura la calidad

    de la muestra.

    Es adecuado cuando el tamao de la muestra tiene una magnitud suficiente que permita confiar

    en la estabilidad de las caractersticas presentes en la muestra. La adecuacin asegura la

    confiabilidad de la muestra.

    Poblacin: Es todo conjunto de elementos, finito o infinito, definido por una o mas caractersticas

    de las que gozan todos los elementos que lo componen y solo ellos. En muestreo se entiende

    por poblacin a la totalidad del universo que interesa considerar, y que es necesario que este

    bien definido para que se sepa en todo momento que elementos lo componen.

    No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre poblacin terica:

    conjunto de elementos a los cuales se quieren extrapolar los resultados, y poblacin estudiada:

    conjunto de elementos accesibles en nuestro estudio.

    Tcnicas de muestreo sobre una poblacin

    La teora del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la

    distribucin de un carcter en dicha poblacin y las distribuciones de dicho carcter en todas las

    muestras.

    Las ventajas de estudiar una poblacin a partir de sus muestras son principalmente:

    Coste reducido: Si los datos que buscamos los podemos obtener a partir de una pequea parte

    del total de la poblacin, los gastos de recogida y tratamiento de los datos sern menores. Por

    ejemplo, cuando se realizan encuestas previas a un referndum, es ms barato preguntar a 2

    mil personas su intencin de voto que a 28 millones.

    Mayor rapidez: Estamos acostumbrados a ver como los resultados del escrutinio de las primeras

    mesas electorales, se obtienen una aproximacin bastante buena del resultado final de una

    eleccin, muchas horas antes de que el recuento final de votos haya finalizado.

    Ms posibilidades: Para hacer cierto tipo de estudios, por ejemplo el de duracin de cierto tipo

    de bombillas, no es posible en la prctica destruirlas todas para conocer su vida media, ya que

    no quedara nada que vender. Es mejor destruir solo una pequea parte de ellas y sacar

    conclusiones sobre las dems.

    De este modo se ve que al hacer estadstica inferencial debeos enfrentarnos con dos problemas:

    Eleccin de la muestra (muestreo), que es a lo que nos dedicaremos en esta seccin.

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    3

    Extrapolacin de las conclusiones obtenidas sobre la muestra, al resto de la poblacin

    (inferencia).

    Tipos de muestreo

    Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en

    general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilstico y mtodos

    de muestreo no probabilstico.

    A. Muestreo probabilstico.

    Los mtodos de muestreo probabilstico son aquellos que se basan en el principio de

    equi-probabilidad. Es decir, aquellos en los que todos los individuos tienen la misma

    probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,

    todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas.

    Solo estos mtodos de muestreo probabilstico nos aseguran la representatividad de la

    muestra extrada y son, por lo tanto, los ms recomendables.

    El mtodo otorga una probabilidad conocida de integrar la muestra a cada elemento de

    la poblacin, y dicha probabilidad no es nula para ningn elemento.

    Los mtodos de muestreo no probabilstico no garantizan la representatividad de la

    muestra y, por los tanto, no permiten realizar estimaciones inferenciales sobre la

    poblacin.

    (En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten resolver

    los problemas de representatividad aun en situacin de muestreo no probabilstico, por

    ejemplo: los estudios de caso-control, donde los casos no son seleccionados

    aleatoriamente de la poblacin.)

    Entre los mtodos de muestreo probabilstico ms utilizados en investigacin

    encontramos:

    Muestreo aleatorio simple

    Muestreo estratificado

    Muestreo sistemtico

    Muestreo por conglomerados

    Muestro aleatorio simple

    El procedimiento empleado es el siguiente:

    1) Se asigna un numero a cada individuo de la poblacin y

    2) A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de

    nmeros aleatorios, nmeros aleatorios generadas con una calculadora

    u ordenador, etc) se eligen tantos sujetos como sea necesario para

    completar el tamao de muestra requerido.

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    4

    Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad

    prctica cuando la poblacin que estamos manejando es muy grande.

    Muestreo aleatorio sistemtico

    Cuando los elementos de la poblacin estn ordenados en fichas o en una lista,

    una manera de obtener la muestra consiste en:

    Sea = [

    ]

    Elegir aleatoriamente un numero i, entre 1 y k;

    Tomar como muestra los elementos de la lista:

    { , +, +2 +(1) }

    Esto es lo que se denomina muestreo sistemtico. Cuando el criterio de

    ordenacin de los elementos en la lista es tal que los elementos ms

    parecidos tienden a estar ms cercanos, el muestreo sistemtico suele ser

    ms preciso que el aleatorio simple, ya que recorre la poblacin de un modo

    uniforme. Por otro lado, es a menudo ms fcil no cometer errores con un

    muestreo sistemtico.

    El mtodo tal como se ha definido anteriormente es sesgado si

    no es

    entero, ya que los ltimos elementos de la lista nunca pueden ser escogidos.

    Un modo de evitar este problema consiste en considerar la lista como si

    fuese circular (el elemento N+1 coincide con el primero) y:

    Sea k el entero ms cercano a

    ;

    Se selecciona un numero al alzar i, entre 1 y N;

    Se toma como muestra los elementos de la lista que consisten en ir

    saltando de k , a partir de i, teniendo en cuenta que la lista es circular.

    Se puede comprobar que con este mtodo todos los elementos de la

    lista la misma probabilidad de seleccin.

    El riesgo en este tipo de muestreo esta en los casos en que se dan

    periodicidades en la poblacin ya que al elegir a los miembros de la

    muestra con una periodicidad constante k podemos introducir una

    homogeneidad que no se da en la poblacin. Imaginemos que estamos

    seleccionando una muestra sobre listas de 10 individuos en los que los

    5 primeros son varones y los 5 ltimos mujeres, si empleamos un

    muestreo aleatorio sistemtico con K = 10 siempre seleccionaremos o

    solo hombres o solo mujeres, no podra haber una representacin de los

    dos sexos.

    Muestreo aleatorio estratificado

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    5

    Un muestreo aleatorio estratificado es aquel en el que se divide la poblacin

    de N individuos en k sub poblaciones o estratos, atendiendo a criterios que

    puedan ser importantes en el estudio, de tamaos respectivos N1, N2,Nk.

    = 1 + 2 + +

    Y realizando en cada una de estas sub poblaciones muestreos aleatorios

    simples de tamao ni i = 1, ,k

    Es decir se considera categoras tpicas diferentes entre s (estratos) que

    poseen gran homogeneidad respecto a algunas caractersticas (se puede

    estratificar por ejemplo, segn la profesin, el municipio de residencia, el

    sexo, el estado civil, etc). Lo que se pretende con este tipo de muestreo es

    asegurarse de que todos los estratos de inters estarn representados

    adecuadamente en la muestra. Cada estrato funciona independientemente,

    pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el

    sistemtico para elegir los elementos concretos que formaran parte de la

    muestra. En ocasiones, las dificultades que plantean son demasiado grandes,

    pues exige un conocimiento detallado de la poblacin (tamao geogrfico,

    sexos, edades etc)

    A continuacin nos planteamos el problema de cuantos elementos de

    muestra se han de elegir de cada uno de los estratos. Puede ser de diferentes

    tipos:

    Asignacin simple:

    A cada estrato le corresponde igual nmero de elementos mustrales.

    Asignacin proporcional:

    Sea n el nmero de individuos de la poblacin total que dormn parte de

    alguna muestra: = 1 + 2 + +

    Cuando la asignacin es proporcional el tamao de la muestra de cada

    estrato es proporcional al tamao del estrato correspondiente con respecto a

    la poblacin total.

    =

    Donde: ni: Es el tamao de muestra del i-esimo estrato.

    Ni: Es la poblacin total de i-esimo estrato.

    N: Poblacin total.

    Asignacin optima

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    6

    Cuando se realiza un muestreo estratificado, los tamaos mustrales en cada

    uno de los estratos, ni, los elige quien hace el muestreo, y para ellos puede

    basarse en alguno de los siguientes criterios:

    Elegir los ni de tal modo que se minimice la varianza del estimador,

    para un coste especificado, o bien;

    Habiendo fijado la varianza que podemos admitir para el estimador,

    minimizar el coste en la obtencin de las muestras.

    As, en un estrato dado se tiende a formar una muestra ms grande cuando:

    El estrato es ms grande.

    El estrato posee mayor variabilidad interna (varianza).

    El muestreo es ms econmico en este estrato.

    Muestreo aleatorio por conglomerados:

    Los mtodos presentados hasta ahora estn pensados para seleccionar

    directamente los elementos de la poblacin, es decir que las unidades

    mustrales son los elementos de la poblacin.

    En el muestreo por conglomerados la unidad muestral es un grupo de elementos

    de la poblacin que forman una unidad, a la que llamamos conglomerado.

    Las unidades hospitalarias, los departamentos universitarios, una caja de

    determinado producto, etc. Son conglomerados naturales. En otras ocasiones se

    pueden utilizar conglomerados no naturales como, por ejemplo, las urnas

    electorales. Cuando los conglomerados son reas geogrficas suele hablarse de

    muestreo por areas.

    El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto

    nmero de conglomerados (el necesario para alcanzar el tamao muestral

    establecido) y en investigar despus todos los elementos pertenecientes a los

    conglomerados elegidos.

    B. Muestro no probabilstico.

    A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente

    costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no

    sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra

    extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma

    probabilidad de ser elegidos. En general, se selecciona a los sujetos siguiendo

    determinados criterios procurando que la muestra sea representativa.

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    7

    Entre los mtodos de muestreo no probabilstico en investigacin encontraremos:

    Muestreo casual o incidental.

    Muestreo intencional.

    Muestreo por cuotas.

    Muestreo de bola de nieve.

    Muestreo discrecional.

    Muestreo casual o incidental

    Se trata de un proceso en el que l investigador selecciona directa e intencionalmente

    los individuos de la poblacin. El caso ms frecuente de este procedimiento es el de

    utilizar como muestra a los individuos que se tienen fcil acceso (los profesores de

    universidad emplean con mucha frecuencia a sus propios alumnos).

    Muestreo intencional.

    Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras

    representativas mediante la inclusin en la muestra de grupos supuestamente tpicos.

    Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores

    votaciones han marcado tendencia de voto.

    Muestreo por cuotas

    Tambin denominado en ocasiones accidental. Se asienta generalmente sobre la base

    de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms

    representativos o adecuados para los fines de la investigacin. Mantiene, por tanto,

    semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de

    aleatoriedad de aquel.

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    8

    En este tipo de muestreo se fijan unas cuotas que consisten en un nmero de individuos

    que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos,

    de sexo masculino y residentes en el Callao. Una vez determinada la cuota se eligen los

    primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza

    mucho en las encuestas de opinin.

    Muestreo de bola de nieve (snowball sampling)

    Se localiza algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta

    conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se

    hacen estudios con poblaciones marginales, delincuentes, centros educativos,

    determinados tipos de enfermos, etc.

    Muestreo discrecional.

    A criterio del investigador los elementos son elegidos sobre los que l cree que pueden

    aportar al estudio. As, por ejemplo: muestreo por juicios, cajeros de una banco o

    supermercado, etc.

    Resumen:

    Una vez ledo este captulo, usted debera:

    Percatarse de que posee muchas habilidades cotidianas que sin duda le servirn en su

    investigacin

    Comprender claramente los distintos enfoques, tcnicas y mtodos de que dispone como

    investigador en pequea escala en el rea de las ciencias sociales.

    Tener decidido o casi decidido que mtodos utilizara y poder justificar esa eleccin.

    Estar reflexionando sobre distintas alternativas para obtener la muestra o seleccionar la

    poblacin (o poblaciones) que desea estudiar.

    Ejercicios.

    Cul es su estrategia de muestreo y porque razn?

    Cul de estas estrategias elegira si tuviera que investigar los siguientes temas? Justifique su

    eleccin en cada caso.

  • Universidad Peruana Unin Ing. Edison Effer Apaza Tarqui

    9

    1. Quiere estudiar la asistencia brindada a los enfermos causados por qumicos en una

    mina.

    2. Le encomendaron que averiguara las opiniones de los obreros de una fbrica sobre los

    cambios en la organizacin y distribucin del trabajo.

    3. Quiere investigar si el uso de las instalaciones deportivas locales vara segn la edad y

    el sexo.

    4. Quiere estudiar las cambiantes actitudes hacia la migracin en los ltimos cincuenta

    aos, tal como lo prueban los materiales y documentos de una gran biblioteca.

    5. Ripley desea dar una promocin por categora social.