Post on 14-Jun-2018
UNIVERSIDAD GRAN MARISCAL DE AYACUCHO
ESCUELA DE ADMINISTRACIOacuteN
NUacuteCLEO EL TIGRE ndash ANZOAacuteTEGUI
MUESTREO
PROFESOR HAMLET MATA MATA
PARTICIPANTE
YULISSA MEDINA GUZMAN
EL TIGRE
INTRODUCCIOacuteN
Partiendo de la importancia que tiene para cualquier profesional e
investigador conocer varios conceptos importantes de la estadiacutestica para poder
desarrollar exitosamente una investigacioacuten de cualquier iacutendole en el presente
trabajo nos proponemos dar tratamiento a algunos elementos de la estadiacutestica
matemaacutetica de la forma maacutes elemental posible para que pueda ser asimilada por
cualquier profesional sin tener en cuenta su especialidad ya sea de las ciencias
sociales como de las ciencias exactas En las actividades de investigacioacuten
cientiacutefica y tecnoloacutegica es muy uacutetil el empleo de muestras El anaacutelisis de una
muestra permite inferir conclusiones susceptibles de generalizacioacuten a la
poblacioacuten de estudio con cierto grado de certeza Una muestra puede ser de dos
tipos no probabilistica y probabilistica En la muestra no probabilistica la
seleccioacuten de las unidades de anaacutelisis dependen de las caracteriacutesticas criterios
personales etc del investigador por lo que no son muy confiables en una
investigacioacuten con fines cientiacuteficos o tecnoloacutegicos Este tipo de muestra adolece
de fundamentacioacuten probabilistica es decir no se tiene la seguridad de que cada
unidad muestral integre a la poblacioacuten total en el proceso de seleccioacuten de la
muestra El muestreo no probabiliacutestico comprende los procedimientos de
muestreo intencional y accidental
TEORIacuteA DE MUESTREO
El estudio de las relaciones existente entre una poblacioacuten y muestras
extraiacutedas de la misma se conoce como Teoriacutea del Muestreo Tiene gran intereacutes
en muchos aspectos de la estadiacutestica Permite estimar cantidades desconocidas
de la poblacioacuten (tales como la media poblacional la varianza etc)
frecuentemente llamada paraacutemetros poblacionales o brevemente paraacutemetros a
partir del conocimiento de las correspondientes cantidades mueacutestrales (tales
como la media muestral la varianza etc) a menudo llamadas estadiacutesticos
mueacutestrales o brevemente estadiacutesticos
Esta teoriacutea tambieacuten uacutetil para determinar si las diferencias que se puedan
observar entre dos muestras son debidas a la aleatoriedad de las mismas o si
por el contrario son solamente significativas Tales preguntas surgen por
ejemplo al ensayar un nuevo suero para el tratamiento de una enfermedad o al
decir si un proceso de produccioacuten es mejor que otro Estas decisiones envuelven
a los llamados ensayos e hipoacutetesis de significacioacuten que son de gran importancia
en la teoriacutea de la decisioacuten
Generalizando un poco un estudio de inferencias realizados sobre una
poblacioacuten mediante muestras extraiacutedas de la misma junto con las indicaciones
de la exactitud de tales inferencias aplicadas a la teoriacutea de la probabilidad se le
conoce como inferencia estadiacutestica
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes
factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
POBLACIOacuteN
En sociologiacutea y biologiacutea es un grupo de personas u organismos de una
especie particular que vive en un aacuterea o espacio y cuyo nuacutemero de habitantes
se determina normalmente por un censo
Para la demografiacutea centrada en el estudio estadiacutestico de las poblaciones
humanas la poblacioacuten es un conjunto renovado en el que entran nuevos
individuos -por nacimiento o inmigracioacuten- y salen otros -por muerte o emigracioacuten
Pero la evolucioacuten de la poblacioacuten y por tanto su reproduccioacuten no solamente estaacute
regida por el balance de nacimientos y muertes emigracioacuten e inmigracioacuten
tambieacuten por el nuacutemero de antildeos vividos de cada generacioacuten
Tambieacuten se conoce como el conjunto de todos los elementos que son
objeto del estudio estadiacutestico En estadiacutestica se denomina poblacioacuten al mundo
ideal teoacuterico cuyas caracteriacutesticas se quieren conocer y estudiar Las
poblaciones suelen ser muy extensas y es imposible observar a cada
componente por ello se trabaja con muestras o subconjuntos de esa poblacioacuten
Por eso podemos definir como muestra a una parte o subconjunto de una
poblacioacuten
En estadiacutestica el concepto de poblacioacuten va maacutes allaacute de lo que
comuacutenmente se conoce como tal En teacuterminos estadiacutesticos poblacioacuten es un
conjunto finito o infinito de personas animales o cosas que presentan
caracteriacutesticas comunes sobre los cuales se quiere efectuar un estudio
determinado En otras palabras la poblacioacuten se define como la totalidad de los
valores posibles (mediciones o conteos) de una caracteriacutestica particular de un
grupo especificado de personas animales o cosas que se desean estudiar en un
momento determinado
MUESTRA
Es un subconjunto extraiacutedo de la poblacioacuten (mediante teacutecnicas de
muestreo) cuyo estudio sirve para inferir caracteriacutesticas de toda la poblacioacuten
Las muestras se obtienen con la intencioacuten de inferir propiedades de la totalidad
de la poblacioacuten para lo cual deben ser representativas de la misma Para cumplir
esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir una teacutecnica
de muestreo En tales casos puede obtenerse una informacioacuten similar a la de un
estudio exhaustivo con mayor rapidez y menor coste (veacuteanse las ventajas de la
eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
Lo cual implica que contenga todos los elementos en la misma proporcioacuten
que existen en eacuteste de tal manera que sea posible generalizar los resultados
obtenidos a partir de la muestra a todo el universo
La muestra es en esencia un subgrupo de la poblacioacuten es un subconjunto
de elementos que pertenecen a ese conjunto definido en sus caracteriacutesticas al
que se llama poblacioacuten
LA INFERENCIA ESTADIacuteSTICA O ESTADIacuteSTICA INFERENCIAL
Comprende los meacutetodos y procedimientos para deducir propiedades
(hacer inferencias) de una poblacioacuten a partir de una pequentildea parte de la misma
(muestra) que se encarga del estudio de los meacutetodos para la obtencioacuten del
modelo de probabilidad (forma funcional y paraacutemetros que determinan la funcioacuten
de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten
a traveacutes de una muestra (parte de la poblacioacuten) obtenida de la misma
El Problema de la estimacioacuten y el Problema del contraste de hipoacutetesis
Cuando se conoce la forma funcional de la funcioacuten de distribucioacuten que
sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica
parameacutetrica por el contrario cuando no se conoce la forma funcional de la
distribucioacuten que sigue la variable aleatoria objeto de estudio estamos ante un
problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica
parameacutetrica donde la variable aleatoria objeto de estudio sigue una distribucioacuten
normal y soacutelo tendremos que tratar de estimar los paraacutemetros que la
determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a
menudo conocer la forma funcional de la distribucioacuten de probabilidad por
consideraciones teoacutericas quedando uacutenicamente indeterminados los paraacutemetros
que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada
variable aleatoria son grandes es muy caro o imposible estudiar a todos sus
individuos lo que se hace es estudiar una muestra ( una parte) de la poblacioacuten
En todos estos problemas que estudia la inferencia estadiacutestica juega un
papel fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de
las distribuciones de probabilidad) y la Teoriacutea de Muestras (procedimientos
para tomar muestras de manera apropiada)
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
Es el proceso que lleva a juzgar la credibilidad de
afirmaciones (hipoacutetesis) relativas a las poblaciones (habitualmente a sus
paraacutemetros) de las que fueron extraiacutedas las muestras
Es interesante tener en cuenta que la veracidad de una
hipoacutetesis no puede ser probada nunca Lo que se puede hacer es afirmar que
tiene tal o cual probabilidad de ser falsa Si esa probabilidad es muy alta (95
o 99) por ejemplo se concluye que la hipoacutetesis es poco creiacuteble y se
califica provisoriamente como falsa Si no se consigue falsar (rechazar) la
hipoacutetesis se acepta provisionalmente como verdadera Esta calidad de
provisorias de las conclusiones estadiacutesticas no deberiacutea sorprender a nadie toda
la ciencia es un constructo provisorio
Ejemplo
La Hipoacutetesis nula puede ser un paraacutemetro que tiene un valor k y
la Hipoacutetesis alternativa seraacute su negacioacuten
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
INTRODUCCIOacuteN
Partiendo de la importancia que tiene para cualquier profesional e
investigador conocer varios conceptos importantes de la estadiacutestica para poder
desarrollar exitosamente una investigacioacuten de cualquier iacutendole en el presente
trabajo nos proponemos dar tratamiento a algunos elementos de la estadiacutestica
matemaacutetica de la forma maacutes elemental posible para que pueda ser asimilada por
cualquier profesional sin tener en cuenta su especialidad ya sea de las ciencias
sociales como de las ciencias exactas En las actividades de investigacioacuten
cientiacutefica y tecnoloacutegica es muy uacutetil el empleo de muestras El anaacutelisis de una
muestra permite inferir conclusiones susceptibles de generalizacioacuten a la
poblacioacuten de estudio con cierto grado de certeza Una muestra puede ser de dos
tipos no probabilistica y probabilistica En la muestra no probabilistica la
seleccioacuten de las unidades de anaacutelisis dependen de las caracteriacutesticas criterios
personales etc del investigador por lo que no son muy confiables en una
investigacioacuten con fines cientiacuteficos o tecnoloacutegicos Este tipo de muestra adolece
de fundamentacioacuten probabilistica es decir no se tiene la seguridad de que cada
unidad muestral integre a la poblacioacuten total en el proceso de seleccioacuten de la
muestra El muestreo no probabiliacutestico comprende los procedimientos de
muestreo intencional y accidental
TEORIacuteA DE MUESTREO
El estudio de las relaciones existente entre una poblacioacuten y muestras
extraiacutedas de la misma se conoce como Teoriacutea del Muestreo Tiene gran intereacutes
en muchos aspectos de la estadiacutestica Permite estimar cantidades desconocidas
de la poblacioacuten (tales como la media poblacional la varianza etc)
frecuentemente llamada paraacutemetros poblacionales o brevemente paraacutemetros a
partir del conocimiento de las correspondientes cantidades mueacutestrales (tales
como la media muestral la varianza etc) a menudo llamadas estadiacutesticos
mueacutestrales o brevemente estadiacutesticos
Esta teoriacutea tambieacuten uacutetil para determinar si las diferencias que se puedan
observar entre dos muestras son debidas a la aleatoriedad de las mismas o si
por el contrario son solamente significativas Tales preguntas surgen por
ejemplo al ensayar un nuevo suero para el tratamiento de una enfermedad o al
decir si un proceso de produccioacuten es mejor que otro Estas decisiones envuelven
a los llamados ensayos e hipoacutetesis de significacioacuten que son de gran importancia
en la teoriacutea de la decisioacuten
Generalizando un poco un estudio de inferencias realizados sobre una
poblacioacuten mediante muestras extraiacutedas de la misma junto con las indicaciones
de la exactitud de tales inferencias aplicadas a la teoriacutea de la probabilidad se le
conoce como inferencia estadiacutestica
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes
factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
POBLACIOacuteN
En sociologiacutea y biologiacutea es un grupo de personas u organismos de una
especie particular que vive en un aacuterea o espacio y cuyo nuacutemero de habitantes
se determina normalmente por un censo
Para la demografiacutea centrada en el estudio estadiacutestico de las poblaciones
humanas la poblacioacuten es un conjunto renovado en el que entran nuevos
individuos -por nacimiento o inmigracioacuten- y salen otros -por muerte o emigracioacuten
Pero la evolucioacuten de la poblacioacuten y por tanto su reproduccioacuten no solamente estaacute
regida por el balance de nacimientos y muertes emigracioacuten e inmigracioacuten
tambieacuten por el nuacutemero de antildeos vividos de cada generacioacuten
Tambieacuten se conoce como el conjunto de todos los elementos que son
objeto del estudio estadiacutestico En estadiacutestica se denomina poblacioacuten al mundo
ideal teoacuterico cuyas caracteriacutesticas se quieren conocer y estudiar Las
poblaciones suelen ser muy extensas y es imposible observar a cada
componente por ello se trabaja con muestras o subconjuntos de esa poblacioacuten
Por eso podemos definir como muestra a una parte o subconjunto de una
poblacioacuten
En estadiacutestica el concepto de poblacioacuten va maacutes allaacute de lo que
comuacutenmente se conoce como tal En teacuterminos estadiacutesticos poblacioacuten es un
conjunto finito o infinito de personas animales o cosas que presentan
caracteriacutesticas comunes sobre los cuales se quiere efectuar un estudio
determinado En otras palabras la poblacioacuten se define como la totalidad de los
valores posibles (mediciones o conteos) de una caracteriacutestica particular de un
grupo especificado de personas animales o cosas que se desean estudiar en un
momento determinado
MUESTRA
Es un subconjunto extraiacutedo de la poblacioacuten (mediante teacutecnicas de
muestreo) cuyo estudio sirve para inferir caracteriacutesticas de toda la poblacioacuten
Las muestras se obtienen con la intencioacuten de inferir propiedades de la totalidad
de la poblacioacuten para lo cual deben ser representativas de la misma Para cumplir
esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir una teacutecnica
de muestreo En tales casos puede obtenerse una informacioacuten similar a la de un
estudio exhaustivo con mayor rapidez y menor coste (veacuteanse las ventajas de la
eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
Lo cual implica que contenga todos los elementos en la misma proporcioacuten
que existen en eacuteste de tal manera que sea posible generalizar los resultados
obtenidos a partir de la muestra a todo el universo
La muestra es en esencia un subgrupo de la poblacioacuten es un subconjunto
de elementos que pertenecen a ese conjunto definido en sus caracteriacutesticas al
que se llama poblacioacuten
LA INFERENCIA ESTADIacuteSTICA O ESTADIacuteSTICA INFERENCIAL
Comprende los meacutetodos y procedimientos para deducir propiedades
(hacer inferencias) de una poblacioacuten a partir de una pequentildea parte de la misma
(muestra) que se encarga del estudio de los meacutetodos para la obtencioacuten del
modelo de probabilidad (forma funcional y paraacutemetros que determinan la funcioacuten
de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten
a traveacutes de una muestra (parte de la poblacioacuten) obtenida de la misma
El Problema de la estimacioacuten y el Problema del contraste de hipoacutetesis
Cuando se conoce la forma funcional de la funcioacuten de distribucioacuten que
sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica
parameacutetrica por el contrario cuando no se conoce la forma funcional de la
distribucioacuten que sigue la variable aleatoria objeto de estudio estamos ante un
problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica
parameacutetrica donde la variable aleatoria objeto de estudio sigue una distribucioacuten
normal y soacutelo tendremos que tratar de estimar los paraacutemetros que la
determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a
menudo conocer la forma funcional de la distribucioacuten de probabilidad por
consideraciones teoacutericas quedando uacutenicamente indeterminados los paraacutemetros
que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada
variable aleatoria son grandes es muy caro o imposible estudiar a todos sus
individuos lo que se hace es estudiar una muestra ( una parte) de la poblacioacuten
En todos estos problemas que estudia la inferencia estadiacutestica juega un
papel fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de
las distribuciones de probabilidad) y la Teoriacutea de Muestras (procedimientos
para tomar muestras de manera apropiada)
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
Es el proceso que lleva a juzgar la credibilidad de
afirmaciones (hipoacutetesis) relativas a las poblaciones (habitualmente a sus
paraacutemetros) de las que fueron extraiacutedas las muestras
Es interesante tener en cuenta que la veracidad de una
hipoacutetesis no puede ser probada nunca Lo que se puede hacer es afirmar que
tiene tal o cual probabilidad de ser falsa Si esa probabilidad es muy alta (95
o 99) por ejemplo se concluye que la hipoacutetesis es poco creiacuteble y se
califica provisoriamente como falsa Si no se consigue falsar (rechazar) la
hipoacutetesis se acepta provisionalmente como verdadera Esta calidad de
provisorias de las conclusiones estadiacutesticas no deberiacutea sorprender a nadie toda
la ciencia es un constructo provisorio
Ejemplo
La Hipoacutetesis nula puede ser un paraacutemetro que tiene un valor k y
la Hipoacutetesis alternativa seraacute su negacioacuten
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
TEORIacuteA DE MUESTREO
El estudio de las relaciones existente entre una poblacioacuten y muestras
extraiacutedas de la misma se conoce como Teoriacutea del Muestreo Tiene gran intereacutes
en muchos aspectos de la estadiacutestica Permite estimar cantidades desconocidas
de la poblacioacuten (tales como la media poblacional la varianza etc)
frecuentemente llamada paraacutemetros poblacionales o brevemente paraacutemetros a
partir del conocimiento de las correspondientes cantidades mueacutestrales (tales
como la media muestral la varianza etc) a menudo llamadas estadiacutesticos
mueacutestrales o brevemente estadiacutesticos
Esta teoriacutea tambieacuten uacutetil para determinar si las diferencias que se puedan
observar entre dos muestras son debidas a la aleatoriedad de las mismas o si
por el contrario son solamente significativas Tales preguntas surgen por
ejemplo al ensayar un nuevo suero para el tratamiento de una enfermedad o al
decir si un proceso de produccioacuten es mejor que otro Estas decisiones envuelven
a los llamados ensayos e hipoacutetesis de significacioacuten que son de gran importancia
en la teoriacutea de la decisioacuten
Generalizando un poco un estudio de inferencias realizados sobre una
poblacioacuten mediante muestras extraiacutedas de la misma junto con las indicaciones
de la exactitud de tales inferencias aplicadas a la teoriacutea de la probabilidad se le
conoce como inferencia estadiacutestica
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes
factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
POBLACIOacuteN
En sociologiacutea y biologiacutea es un grupo de personas u organismos de una
especie particular que vive en un aacuterea o espacio y cuyo nuacutemero de habitantes
se determina normalmente por un censo
Para la demografiacutea centrada en el estudio estadiacutestico de las poblaciones
humanas la poblacioacuten es un conjunto renovado en el que entran nuevos
individuos -por nacimiento o inmigracioacuten- y salen otros -por muerte o emigracioacuten
Pero la evolucioacuten de la poblacioacuten y por tanto su reproduccioacuten no solamente estaacute
regida por el balance de nacimientos y muertes emigracioacuten e inmigracioacuten
tambieacuten por el nuacutemero de antildeos vividos de cada generacioacuten
Tambieacuten se conoce como el conjunto de todos los elementos que son
objeto del estudio estadiacutestico En estadiacutestica se denomina poblacioacuten al mundo
ideal teoacuterico cuyas caracteriacutesticas se quieren conocer y estudiar Las
poblaciones suelen ser muy extensas y es imposible observar a cada
componente por ello se trabaja con muestras o subconjuntos de esa poblacioacuten
Por eso podemos definir como muestra a una parte o subconjunto de una
poblacioacuten
En estadiacutestica el concepto de poblacioacuten va maacutes allaacute de lo que
comuacutenmente se conoce como tal En teacuterminos estadiacutesticos poblacioacuten es un
conjunto finito o infinito de personas animales o cosas que presentan
caracteriacutesticas comunes sobre los cuales se quiere efectuar un estudio
determinado En otras palabras la poblacioacuten se define como la totalidad de los
valores posibles (mediciones o conteos) de una caracteriacutestica particular de un
grupo especificado de personas animales o cosas que se desean estudiar en un
momento determinado
MUESTRA
Es un subconjunto extraiacutedo de la poblacioacuten (mediante teacutecnicas de
muestreo) cuyo estudio sirve para inferir caracteriacutesticas de toda la poblacioacuten
Las muestras se obtienen con la intencioacuten de inferir propiedades de la totalidad
de la poblacioacuten para lo cual deben ser representativas de la misma Para cumplir
esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir una teacutecnica
de muestreo En tales casos puede obtenerse una informacioacuten similar a la de un
estudio exhaustivo con mayor rapidez y menor coste (veacuteanse las ventajas de la
eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
Lo cual implica que contenga todos los elementos en la misma proporcioacuten
que existen en eacuteste de tal manera que sea posible generalizar los resultados
obtenidos a partir de la muestra a todo el universo
La muestra es en esencia un subgrupo de la poblacioacuten es un subconjunto
de elementos que pertenecen a ese conjunto definido en sus caracteriacutesticas al
que se llama poblacioacuten
LA INFERENCIA ESTADIacuteSTICA O ESTADIacuteSTICA INFERENCIAL
Comprende los meacutetodos y procedimientos para deducir propiedades
(hacer inferencias) de una poblacioacuten a partir de una pequentildea parte de la misma
(muestra) que se encarga del estudio de los meacutetodos para la obtencioacuten del
modelo de probabilidad (forma funcional y paraacutemetros que determinan la funcioacuten
de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten
a traveacutes de una muestra (parte de la poblacioacuten) obtenida de la misma
El Problema de la estimacioacuten y el Problema del contraste de hipoacutetesis
Cuando se conoce la forma funcional de la funcioacuten de distribucioacuten que
sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica
parameacutetrica por el contrario cuando no se conoce la forma funcional de la
distribucioacuten que sigue la variable aleatoria objeto de estudio estamos ante un
problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica
parameacutetrica donde la variable aleatoria objeto de estudio sigue una distribucioacuten
normal y soacutelo tendremos que tratar de estimar los paraacutemetros que la
determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a
menudo conocer la forma funcional de la distribucioacuten de probabilidad por
consideraciones teoacutericas quedando uacutenicamente indeterminados los paraacutemetros
que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada
variable aleatoria son grandes es muy caro o imposible estudiar a todos sus
individuos lo que se hace es estudiar una muestra ( una parte) de la poblacioacuten
En todos estos problemas que estudia la inferencia estadiacutestica juega un
papel fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de
las distribuciones de probabilidad) y la Teoriacutea de Muestras (procedimientos
para tomar muestras de manera apropiada)
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
Es el proceso que lleva a juzgar la credibilidad de
afirmaciones (hipoacutetesis) relativas a las poblaciones (habitualmente a sus
paraacutemetros) de las que fueron extraiacutedas las muestras
Es interesante tener en cuenta que la veracidad de una
hipoacutetesis no puede ser probada nunca Lo que se puede hacer es afirmar que
tiene tal o cual probabilidad de ser falsa Si esa probabilidad es muy alta (95
o 99) por ejemplo se concluye que la hipoacutetesis es poco creiacuteble y se
califica provisoriamente como falsa Si no se consigue falsar (rechazar) la
hipoacutetesis se acepta provisionalmente como verdadera Esta calidad de
provisorias de las conclusiones estadiacutesticas no deberiacutea sorprender a nadie toda
la ciencia es un constructo provisorio
Ejemplo
La Hipoacutetesis nula puede ser un paraacutemetro que tiene un valor k y
la Hipoacutetesis alternativa seraacute su negacioacuten
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
POBLACIOacuteN
En sociologiacutea y biologiacutea es un grupo de personas u organismos de una
especie particular que vive en un aacuterea o espacio y cuyo nuacutemero de habitantes
se determina normalmente por un censo
Para la demografiacutea centrada en el estudio estadiacutestico de las poblaciones
humanas la poblacioacuten es un conjunto renovado en el que entran nuevos
individuos -por nacimiento o inmigracioacuten- y salen otros -por muerte o emigracioacuten
Pero la evolucioacuten de la poblacioacuten y por tanto su reproduccioacuten no solamente estaacute
regida por el balance de nacimientos y muertes emigracioacuten e inmigracioacuten
tambieacuten por el nuacutemero de antildeos vividos de cada generacioacuten
Tambieacuten se conoce como el conjunto de todos los elementos que son
objeto del estudio estadiacutestico En estadiacutestica se denomina poblacioacuten al mundo
ideal teoacuterico cuyas caracteriacutesticas se quieren conocer y estudiar Las
poblaciones suelen ser muy extensas y es imposible observar a cada
componente por ello se trabaja con muestras o subconjuntos de esa poblacioacuten
Por eso podemos definir como muestra a una parte o subconjunto de una
poblacioacuten
En estadiacutestica el concepto de poblacioacuten va maacutes allaacute de lo que
comuacutenmente se conoce como tal En teacuterminos estadiacutesticos poblacioacuten es un
conjunto finito o infinito de personas animales o cosas que presentan
caracteriacutesticas comunes sobre los cuales se quiere efectuar un estudio
determinado En otras palabras la poblacioacuten se define como la totalidad de los
valores posibles (mediciones o conteos) de una caracteriacutestica particular de un
grupo especificado de personas animales o cosas que se desean estudiar en un
momento determinado
MUESTRA
Es un subconjunto extraiacutedo de la poblacioacuten (mediante teacutecnicas de
muestreo) cuyo estudio sirve para inferir caracteriacutesticas de toda la poblacioacuten
Las muestras se obtienen con la intencioacuten de inferir propiedades de la totalidad
de la poblacioacuten para lo cual deben ser representativas de la misma Para cumplir
esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir una teacutecnica
de muestreo En tales casos puede obtenerse una informacioacuten similar a la de un
estudio exhaustivo con mayor rapidez y menor coste (veacuteanse las ventajas de la
eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
Lo cual implica que contenga todos los elementos en la misma proporcioacuten
que existen en eacuteste de tal manera que sea posible generalizar los resultados
obtenidos a partir de la muestra a todo el universo
La muestra es en esencia un subgrupo de la poblacioacuten es un subconjunto
de elementos que pertenecen a ese conjunto definido en sus caracteriacutesticas al
que se llama poblacioacuten
LA INFERENCIA ESTADIacuteSTICA O ESTADIacuteSTICA INFERENCIAL
Comprende los meacutetodos y procedimientos para deducir propiedades
(hacer inferencias) de una poblacioacuten a partir de una pequentildea parte de la misma
(muestra) que se encarga del estudio de los meacutetodos para la obtencioacuten del
modelo de probabilidad (forma funcional y paraacutemetros que determinan la funcioacuten
de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten
a traveacutes de una muestra (parte de la poblacioacuten) obtenida de la misma
El Problema de la estimacioacuten y el Problema del contraste de hipoacutetesis
Cuando se conoce la forma funcional de la funcioacuten de distribucioacuten que
sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica
parameacutetrica por el contrario cuando no se conoce la forma funcional de la
distribucioacuten que sigue la variable aleatoria objeto de estudio estamos ante un
problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica
parameacutetrica donde la variable aleatoria objeto de estudio sigue una distribucioacuten
normal y soacutelo tendremos que tratar de estimar los paraacutemetros que la
determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a
menudo conocer la forma funcional de la distribucioacuten de probabilidad por
consideraciones teoacutericas quedando uacutenicamente indeterminados los paraacutemetros
que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada
variable aleatoria son grandes es muy caro o imposible estudiar a todos sus
individuos lo que se hace es estudiar una muestra ( una parte) de la poblacioacuten
En todos estos problemas que estudia la inferencia estadiacutestica juega un
papel fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de
las distribuciones de probabilidad) y la Teoriacutea de Muestras (procedimientos
para tomar muestras de manera apropiada)
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
Es el proceso que lleva a juzgar la credibilidad de
afirmaciones (hipoacutetesis) relativas a las poblaciones (habitualmente a sus
paraacutemetros) de las que fueron extraiacutedas las muestras
Es interesante tener en cuenta que la veracidad de una
hipoacutetesis no puede ser probada nunca Lo que se puede hacer es afirmar que
tiene tal o cual probabilidad de ser falsa Si esa probabilidad es muy alta (95
o 99) por ejemplo se concluye que la hipoacutetesis es poco creiacuteble y se
califica provisoriamente como falsa Si no se consigue falsar (rechazar) la
hipoacutetesis se acepta provisionalmente como verdadera Esta calidad de
provisorias de las conclusiones estadiacutesticas no deberiacutea sorprender a nadie toda
la ciencia es un constructo provisorio
Ejemplo
La Hipoacutetesis nula puede ser un paraacutemetro que tiene un valor k y
la Hipoacutetesis alternativa seraacute su negacioacuten
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
determinado En otras palabras la poblacioacuten se define como la totalidad de los
valores posibles (mediciones o conteos) de una caracteriacutestica particular de un
grupo especificado de personas animales o cosas que se desean estudiar en un
momento determinado
MUESTRA
Es un subconjunto extraiacutedo de la poblacioacuten (mediante teacutecnicas de
muestreo) cuyo estudio sirve para inferir caracteriacutesticas de toda la poblacioacuten
Las muestras se obtienen con la intencioacuten de inferir propiedades de la totalidad
de la poblacioacuten para lo cual deben ser representativas de la misma Para cumplir
esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir una teacutecnica
de muestreo En tales casos puede obtenerse una informacioacuten similar a la de un
estudio exhaustivo con mayor rapidez y menor coste (veacuteanse las ventajas de la
eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
Lo cual implica que contenga todos los elementos en la misma proporcioacuten
que existen en eacuteste de tal manera que sea posible generalizar los resultados
obtenidos a partir de la muestra a todo el universo
La muestra es en esencia un subgrupo de la poblacioacuten es un subconjunto
de elementos que pertenecen a ese conjunto definido en sus caracteriacutesticas al
que se llama poblacioacuten
LA INFERENCIA ESTADIacuteSTICA O ESTADIacuteSTICA INFERENCIAL
Comprende los meacutetodos y procedimientos para deducir propiedades
(hacer inferencias) de una poblacioacuten a partir de una pequentildea parte de la misma
(muestra) que se encarga del estudio de los meacutetodos para la obtencioacuten del
modelo de probabilidad (forma funcional y paraacutemetros que determinan la funcioacuten
de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten
a traveacutes de una muestra (parte de la poblacioacuten) obtenida de la misma
El Problema de la estimacioacuten y el Problema del contraste de hipoacutetesis
Cuando se conoce la forma funcional de la funcioacuten de distribucioacuten que
sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica
parameacutetrica por el contrario cuando no se conoce la forma funcional de la
distribucioacuten que sigue la variable aleatoria objeto de estudio estamos ante un
problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica
parameacutetrica donde la variable aleatoria objeto de estudio sigue una distribucioacuten
normal y soacutelo tendremos que tratar de estimar los paraacutemetros que la
determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a
menudo conocer la forma funcional de la distribucioacuten de probabilidad por
consideraciones teoacutericas quedando uacutenicamente indeterminados los paraacutemetros
que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada
variable aleatoria son grandes es muy caro o imposible estudiar a todos sus
individuos lo que se hace es estudiar una muestra ( una parte) de la poblacioacuten
En todos estos problemas que estudia la inferencia estadiacutestica juega un
papel fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de
las distribuciones de probabilidad) y la Teoriacutea de Muestras (procedimientos
para tomar muestras de manera apropiada)
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
Es el proceso que lleva a juzgar la credibilidad de
afirmaciones (hipoacutetesis) relativas a las poblaciones (habitualmente a sus
paraacutemetros) de las que fueron extraiacutedas las muestras
Es interesante tener en cuenta que la veracidad de una
hipoacutetesis no puede ser probada nunca Lo que se puede hacer es afirmar que
tiene tal o cual probabilidad de ser falsa Si esa probabilidad es muy alta (95
o 99) por ejemplo se concluye que la hipoacutetesis es poco creiacuteble y se
califica provisoriamente como falsa Si no se consigue falsar (rechazar) la
hipoacutetesis se acepta provisionalmente como verdadera Esta calidad de
provisorias de las conclusiones estadiacutesticas no deberiacutea sorprender a nadie toda
la ciencia es un constructo provisorio
Ejemplo
La Hipoacutetesis nula puede ser un paraacutemetro que tiene un valor k y
la Hipoacutetesis alternativa seraacute su negacioacuten
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
(muestra) que se encarga del estudio de los meacutetodos para la obtencioacuten del
modelo de probabilidad (forma funcional y paraacutemetros que determinan la funcioacuten
de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten
a traveacutes de una muestra (parte de la poblacioacuten) obtenida de la misma
El Problema de la estimacioacuten y el Problema del contraste de hipoacutetesis
Cuando se conoce la forma funcional de la funcioacuten de distribucioacuten que
sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica
parameacutetrica por el contrario cuando no se conoce la forma funcional de la
distribucioacuten que sigue la variable aleatoria objeto de estudio estamos ante un
problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica
parameacutetrica donde la variable aleatoria objeto de estudio sigue una distribucioacuten
normal y soacutelo tendremos que tratar de estimar los paraacutemetros que la
determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a
menudo conocer la forma funcional de la distribucioacuten de probabilidad por
consideraciones teoacutericas quedando uacutenicamente indeterminados los paraacutemetros
que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada
variable aleatoria son grandes es muy caro o imposible estudiar a todos sus
individuos lo que se hace es estudiar una muestra ( una parte) de la poblacioacuten
En todos estos problemas que estudia la inferencia estadiacutestica juega un
papel fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de
las distribuciones de probabilidad) y la Teoriacutea de Muestras (procedimientos
para tomar muestras de manera apropiada)
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
Es el proceso que lleva a juzgar la credibilidad de
afirmaciones (hipoacutetesis) relativas a las poblaciones (habitualmente a sus
paraacutemetros) de las que fueron extraiacutedas las muestras
Es interesante tener en cuenta que la veracidad de una
hipoacutetesis no puede ser probada nunca Lo que se puede hacer es afirmar que
tiene tal o cual probabilidad de ser falsa Si esa probabilidad es muy alta (95
o 99) por ejemplo se concluye que la hipoacutetesis es poco creiacuteble y se
califica provisoriamente como falsa Si no se consigue falsar (rechazar) la
hipoacutetesis se acepta provisionalmente como verdadera Esta calidad de
provisorias de las conclusiones estadiacutesticas no deberiacutea sorprender a nadie toda
la ciencia es un constructo provisorio
Ejemplo
La Hipoacutetesis nula puede ser un paraacutemetro que tiene un valor k y
la Hipoacutetesis alternativa seraacute su negacioacuten
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Es el proceso que lleva a juzgar la credibilidad de
afirmaciones (hipoacutetesis) relativas a las poblaciones (habitualmente a sus
paraacutemetros) de las que fueron extraiacutedas las muestras
Es interesante tener en cuenta que la veracidad de una
hipoacutetesis no puede ser probada nunca Lo que se puede hacer es afirmar que
tiene tal o cual probabilidad de ser falsa Si esa probabilidad es muy alta (95
o 99) por ejemplo se concluye que la hipoacutetesis es poco creiacuteble y se
califica provisoriamente como falsa Si no se consigue falsar (rechazar) la
hipoacutetesis se acepta provisionalmente como verdadera Esta calidad de
provisorias de las conclusiones estadiacutesticas no deberiacutea sorprender a nadie toda
la ciencia es un constructo provisorio
Ejemplo
La Hipoacutetesis nula puede ser un paraacutemetro que tiene un valor k y
la Hipoacutetesis alternativa seraacute su negacioacuten
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Si se toma una muestra y en ella se calcula
un estadiacutestico
cuya
distribucioacuten en el
muestreo en el caso de que Ho sea verdadera se conoce se puede
determinar queacute
probabilidad (P) hay de que si el verdadero valor del paraacutemetro es k se
obtenga un valor observado del estadiacutestico tan alejado ( o maacutes) de k
Si P es muy baja la probabilidad de que la muestra no pertenezca a una
poblacioacuten con k es muy alta por lo tanto se rechaza Ho
Consecuentemente se acepta H1
TEORIacuteA DE LA ESTIMACIOacuteN
Puede emplearse para obtener informacioacuten acerca de muestras obtenidas
aleatoriamente de una poblacioacuten conocida Sin embargo desde un punto de vista
praacutectico suele ser mas importante y ser capaz de inferir informacioacuten acerca de
una poblacioacuten a partir de muestras de ellas Dichos problemas son tratados por
la inferencia estadiacutestica que utiliza principios de muestreo Un problema
importante de la inferencia estadiacutestica es la estimacioacuten de paraacutemetros
poblacionales o simplemente paraacutemetros ( como la media y la varianza
poblacionales) a partir de los estadiacutesticos mueacutestrales correspondientes o
estadiacutesticos ( como la media y la varianza muestral
Estimados sin Sesgo
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Si la media de la distribucioacuten muestral de un estadiacutestico es igual al
paraacutemetro poblacional correspondiente el estadiacutestico se denomina estimador sin
sesgo del paraacutemetro de otra manera es denominado estimador sesgado Los
valores correspondientes de dichos estadiacutesticos se llaman estimados sin sesgo
o sesgados respectivamente
Estimados Eficientes
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas eficiente
estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
Estimados por Punto y Estimados por Intervalo su Confiabilidad
El estimado de un paraacutemetro poblacional dado por un solo numero se
denomina estimado puntual del paraacutemetro El estimado de un paraacutemetro
poblacional dado por dos nuacutemeros entre los cuales se considera esta el
paraacutemetro se denomina estimado por intervalo del paraacutemetro Los estimados
por intervalo indican la precisioacuten de un estimado y son por lo tanto preferibles a
los estimados por punto
Ejemplo
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Si se dice que una distancia medida es de 528 metros se esta dando un
estimado por punto Si por otro lado la distancia es de 528 mas menos
003metros (es decir la distancia esta entre 525m y 531 m ) se esta dando
un estimado por intervalo
La informacioacuten sobre el error o precisioacuten de un estimado se conoce como
confiabilidad
Estimados por Intervalo de Confianza de Paraacutemetros Poblacionales
Intervalos de Confianza para Proporciones
Si el estadiacutestico S es la proporcioacuten de ldquoeacutexitos ldquoen una muestra de tamantildeo
obtenida de una poblacioacuten binomial en la que p es la proporcioacuten de eacutexitos es
decir la probabilidad de eacutexito entonces los limites de confianza para p estaacuten
dados por la proporcioacuten de eacutexitos en la muestra de tamantildeo N Usando los valores
obtenidos ve que los limites de confianza para la proporcioacuten poblacional estaacuten
dados por
P plusmn Zc
Si el muestreo se efectuoacute de una poblacioacuten finita o de una poblacioacuten infinita con
reemplazamiento y estaacuten dados por
Pplusmn Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacioacuten de tamantildeo finito
Np Para calcular estos limites de confianza se puede usar el estimado muestral
P que por lo general mostrara ser satisfactorio si N es mayor o igual a 30
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadiacutesticos mueacutestrales con distribuciones de muestreo
aproximadamente normales entonces los limites de confianza se puede usar
para la diferencia de los paraacutemetros poblacionales correspondientes a S1 y S2
estaacuten dados por
Intervalos de Confianza para Desviaciones Estaacutendar
Estimados sin Sesgo y eficientes
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
1- De un ejemplo de estimadores y estimados que sean a)- sin sesgo y
eficientes b)- sin sesgo e ineficientes y c)- sesgados e ineficientes
Solucioacuten
a)- La media maestral x y la varianza maestral modificada
2 =( N N-1 ) s2
b)- La media muestral y el estadiacutestico muestral frac12 (Q1 + Q3) donde Q1 y Q3 son
los cuartiles inferior y superior son dos de dichos ejemplos Ambos estadiacutesticos
son estimados sin sesgo de la media poblacional ya que la media de sus
distribuciones mueacutestrales es la media poblacional
c)- La desviacioacuten estaacutendar muestral s la desviacioacuten estaacutendar modificada la
desviacioacuten media y el rango semi-intercuartilar son cuatro de dichos ejemplos
2- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 632 637 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera y b) la varianza
verdadera
2 = ( N N - 1 ) s2
(633 - 635 )2 + ( 637 - 635 ) 2 + ( 632 - 635 ) 2 + ( 637 - 635 )2 5 - 1 = 55
x 10 - 4 cm2
3- Suponga que las estaturas de 100 estudiantes hombres de la universidad
XYZ representan una muestral aleatoria de las estaturas del total de 1546
estudiantes de la universidad Determine los estimados sin sesgo y eficientes de
a) la media verdadera y b) la varianza verdadera
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la estatura media verdadera
es x = 6747 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = ( N N-1 ) s2 = (10099 ) 85275 = 86136
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Por lo tanto = ldquo86136 = 293 pulgadas Obseacutervese que dado que N es grande
esencialmente no existe diferencia entre y 2
4- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
5- En una muestra de cinco mediciones los registros de un cientiacutefico para el
diaacutemetro de una esfera fueron 633 637 633 638 centiacutemetros Determine
estimados sin sesgo y eficientes de a) la media verdadera
Solucioacuten
a)- el estimado sin sesgo y eficiente de la media verdadera es decir la media
poblacional es
6- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ
representan una muestral aleatoria de las estaturas del total de 100 estudiantes
de la universidad Determine los estimados sin sesgo y eficientes de
Solucioacuten
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es
2 = (N N-1 ) s2 = (109 ) 85275 = 947
7- De un estimado sin sesgo e ineficiente del diaacutemetro medio verdadero de la
esfera del problema 2
Solucioacuten
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media
poblacional Para las cinco mediciones ordenadas por magnitud la media es
636 cm
Intervalos de Confianza para Medias
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
8- Calcule los intervalos de confianza a) a 95 y b) 99 para estimar la estatura
media de los estudiantes de la universidad veracruzana del problema 3
Solucioacuten
Sin embargo se puede considerar el factor
= 0967
Es esencialmente 1 por lo tanto no seraacute necesario usarlo Si se utiliza los limites
de confianza anteriores se convierten en 6745 plusmn 056 pulgadas y 6745 plusmn 073
pulgadas respectivamente
9- Una empresa de aacuterboles navidentildeos tienen 5000 aacuterboles listos para cortarse
Se seleccionan aleatoriamente cien de estos aacuterboles y se mide su altura Las
alturas en pulgadas se muestran en la siguiente tabla Utilice minitab para
establecer un intervalo de confianza a 95 de la altura media a los 5000 aacuterboles
Si estos se venden a $ 240 por pie de un limite superior y uno inferior sobre el
valor de los 5000 aacuterboles
ESTADIacuteSTICO Y ESTIMADOR
En estadiacutestica un estimador es un estadiacutestico (esto es una funcioacuten de la
muestra) usado para estimar un paraacutemetro desconocido de la poblacioacuten Por
ejemplo si se desea conocer el precio medio de un artiacuteculo (el paraacutemetro
desconocido) se recogeraacuten observaciones del precio de dicho artiacuteculo en
diversos establecimientos (la muestra) y la media aritmeacutetica de las
observaciones puede utilizarse como estimador del precio medio
Para cada paraacutemetro pueden existir varios estimadores diferentes En
general escogeremos el estimador que posea mejores propiedades que los
restantes como insesgadez eficiencia convergencia y robustez (consistencia)
El valor de un estimador proporciona lo que se denomina en estadiacutestica
una estimacioacuten puntual del valor del paraacutemetro en estudio En general se suele
preferir realizar una estimacioacuten mediante un intervalo esto es obtener un
intervalo [ab] dentro del cual se espera esteacute el valor real del paraacutemetro con un
cierto nivel de confianza Utilizar un intervalo resulta maacutes informativo al
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
proporcionar informacioacuten sobre el posible error de estimacioacuten asociado con la
amplitud de dicho intervalo El nivel de confianza es la probabilidad de que a
priori el verdadero valor del paraacutemetro quede contenido en el intervalo
En la praacutectica en los intervalos suelen indicarse dando el valor del
estimador puntual utilizado como centro del intervalo y un valor que debe
sumarse y restarse para obtener el liacutemite superior e inferior
Ejemplo
Equivale a
ESTIMADOR
Un estimador de un paraacutemetro poblacional es una funcioacuten de los datos
mueacutestrales tambieacuten llamado estadiacutestico En pocas palabras es una foacutermula que
depende de los valores obtenidos de una muestra para realizar estimaciones3
Formalmente si θ es un paraacutemetro poblacional se dice que es un
estimador puntual de θ si dondex1x2xn son
las variables aleatorias que integran una muestra aleatoria de tamantildeo n de la
poblacioacuten en cuestioacuten
Ejemplo un estimador de la media poblacional μ puede ser la media
muestral seguacuten la siguiente foacutermula
donde (x1 x2 xn) seriacutea el conjunto de de datos de la muestra
El estimador es una variable aleatoria que asigna a cada posible valor de la
muestra un valor numeacuterico Como tal tiene sentido calcular su esperanza su
varianza y otras caracteriacutesticas propias de las variables aleatorias
UNIVERSO
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
En estadiacutestica es el nombre especifico que recibe particularmente en la
investigacioacuten social la operacioacuten dentro de la delimitacioacuten del campo de
investigacioacuten que tienen por objeto la determinacioacuten del conjunto de unidades de
observaciones del conjunto de unidades de observacioacuten que van a ser
investigadas Para muchos investigadores eacutel termino universo y poblacioacuten son
sinoacutenima En general el universo es la totalidad de elementos o caracteriacutesticas
que conforman el aacutembito de un estudio o investigacioacuten El teacutermino es empleado
generalmente como sinoacutenimo de poblacioacuten No obstante cuando se realiza un
trabajo puntual conviene distinguir entre universo ideal conjunto de elementos
a los cuales se quieren extrapolar los resultados y universo muestral conjunto
de elementos accesibles en nuestro estudio Todo universo o poblacioacuten debe
definirse sin ambiguumledades es decir debe ser posible decidir cuaacutendo un
individuo pertenece o no al universo bajo consideracioacuten
a Universo Pacientes asmaacuteticos con deficiente grado de conciencia de la
importancia de su enfermedad
b Universo Pacientes con EDA menores de 1 antildeo atendidos en el Hospital
Beleacuten
UNIDAD ESTADIacuteSTICA
En diferente estadiacutestico disciplinas unidad estadiacutestica es la fuente de
a variable al azar Hay diversas maneras de estudiar una unidad y diversos
nombres aplicados
Podemos estar interesados en a unidad porque nos preponemos
generalizar de observaciones respecto a algunas unidades a asamblea de
unidades Interrogacioacuten de la opinioacuten y muestreo del examen proporcione los
ejemplos bien conocidos de este tipo de investigacioacuten
Podemos estar interesados en la dinaacutemica de a unidad coacutemo sus
caracteriacutesticas observables cambian de vez en cuando Los estudios
econoacutemicos de las firmas del negocio proporcionan un ejemplo de este tipo de
investigacioacuten (Veacutease modelo dinaacutemico)
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Podemos estar interesados en el funcionamiento interno de a unidad cuaacutel
podemos caracterizar como a asamblea estadiacutestica Esta clase de investigacioacuten
implica a menudo interferencia con la unidad tal como sujetarla a un tratamiento
o auacuten a una diseccioacuten en algunos casos Experimentacioacuten del campo y ensayos
cliacutenicos son los ejemplos
UNIDADES DE INVESTIGACIOacuteN
La organizacioacuten de la investigacioacuten en IMDEA Energiacutea se estructuraraacute
utilizando el concepto de Unidad de Investigacioacuten como pieza baacutesica de la
misma definida en funcioacuten de su campo de especializacioacuten Se trata de una
organizacioacuten transversal que dotaraacute al Instituto de una alta versatilidad en el
tratamiento de los diferentes temas de investigacioacuten asiacute como de una gran
flexibilidad para adaptarse a los cambios en las prioridades de I+D que se precise
introducir a lo largo del tiempo
Con objeto de estructurar el Instituto IMDEA Energiacutea y cubrir el espectro
de temaacuteticas de I+D en energiacutea incluidas en el Programa Cientiacutefico se indican
a continuacioacuten las actividades que se desarrollan en el Instituto dentro de cada
Unidad de investigacioacuten
UNIDAD DE ANAacuteLISIS
La unidad de anaacutelisis corresponde a la entidad mayor o representativa
de lo que va a ser objeto especiacutefico de estudio en una medicioacuten y se refiere al
queacute o quieacuten es objeto de intereacutes en una investigacioacuten Por ejemplo
Debe estar claramente definida en un protocolo de investigacioacuten y el
investigador debe obtener la informacioacuten a partir de la unidad que haya sido
definida como tal aun cuando para acceder a ella haya debido recorrer pasos
intermedios Las unidades de anaacutelisis pueden corresponder a las siguientes
categoriacuteas o entidades
Personas
Grupos humanos
Poblaciones completas
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Unidades geograacuteficas determinadas
Eventos o interacciones sociales (enfermedades accidentes casos de
infecciones intrahospitalarias etc)
Entidades intangibles susceptibles de medir (exaacutemenes diacuteas camas)
El tipo de anaacutelisis al que se someteraacute la informacioacuten es determinante para elegir
la unidad de anaacutelisis Por ejemplo si el objetivo es dar cuenta de la satisfaccioacuten
del usuario de un servicio meacutedico la unidad de anaacutelisis natural es el paciente
atendido o la persona que se atiende en ese servicio meacutedico Estos son
fragmentos del universo pequentildeos nuacutecleos con significado propio los que
deben ser clasificados y contados con posterioridad Pueden ser determinados
en una respuesta global o en la divisioacuten de teacuterminos o expresiones La unidad de
anaacutelisis se puede clasificar de dos formas con base gramatical lo que implica
estudiar palabras paacuterrafos etc O en unidades sin base gramatical es decir
artiacuteculos editoriales titulares etc Estos uacuteltimos representan aacutetomos de
significado
- Unidad temaacutetica consiste en el tema del contenido que se va a analizar
- Categorizacioacuten del tema esta es una de las partes esenciales de la
metodologiacutea ya que establece y especifica las categoriacuteas dentro del anaacutelisis
- Unidades de registro en esta etapa se delimitan y dan curso al anaacutelisis de
categoriacuteas Aquiacute se cuentan las apariciones de las referencias las que estaraacuten
delimitadas seguacuten los objetivos
- Unidades de Enumeracioacuten Estas se encuentran dentro de las unidades de
registro son pequentildeas unidades de anaacutelisis que comprobaraacuten la presencia o
clasificacioacuten de los elementos que haraacuten posibles comprobar la hipoacutetesis
Las unidades de pueden definir de diversas formas
- Unidades fiacutesicas seguacuten el soporte de los contenidos
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
- Unidades sintaacutecticas tienen relacioacuten con la gramaacutetica del medio de
comunicacioacuten y no emite juicios sobre el significado
- Unidades referenciales toma puntos de referencia para identificar contextos
de la unidad
- Unidades proposicionales y nuacutecleos de significado unidades macutesa
complejas que se exige tengan una estructura determinada
- Unidades temaacuteticas son complejas se identifican por su correspondencia con
las estructuras de los contenidos
La unidad de anaacutelisis es el elemento del cual se predica una propiedad y
caracteriacutestica Puede ser una persona una familia un animal una sustancia
quiacutemica o un objeto como una dentadura o una mesa
La variable es la caracteriacutestica propiedad o atributo que se predica de la unidad
de anaacutelisis
Por ejemplo puede ser la edad para una persona el grado de cohesioacuten para
una familia el nivel de aprendizaje alcanzado para un animal el peso especiacutefico
para una sustancia quiacutemica el nivel de lsquo saludrsquo para una dentadura y el tamantildeo
para una mesa
Pueden entonces tambieacuten definirse poblacioacuten estadiacutestica (o simplemente
poblacioacuten) como el conjunto de datos acerca de unidades de anaacutelisis (individuos
objetos) en relacioacuten a una misma caracteriacutestica propiedad o atributo (variable)
Sobre una misma poblacioacuten demograacutefica pueden definirse varias poblaciones de
datos una para cada variable
Ejemplo
en el conjunto de habitantes de un paiacutes (poblacioacuten demograacutefica) puede definirse
una poblacioacuten referida a la variable edad (el conjunto de edades de los
habitantes) a la variable ocupacioacuten (el conjunto de ocupaciones de los
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
habitantes) a la variable sexo (el conjunto de condiciones de sexo de los
habitantes)
UNIDAD DE OBSERVACIOacuteN
Para la recoleccioacuten de datos en el terreno operativo se deberaacuten definir
unidades de observacioacuten que permitan captar la informacioacuten de las unidades de
anaacutelisis o explotaciones La ubicacioacuten de las unidades de observacioacuten se
realizaraacute a partir de las distintas formas de organizacioacuten de la actividad
productiva Se pueden distinguir dos situaciones extremas por un lado las
empresas agropecuarias y por el otro las unidades de produccioacuten en pequentildea
escala estrechamente vinculadas a la vida cotidiana de la unidad domeacutestica
Mientras que las empresas pueden ser localizadas a traveacutes de registros
administrativos de unidades productivas como la lista de productores o el registro
en las oficinas recaudadoras de impuestos las pequentildeas soacutelo pueden
detectarse a traveacutes de los hogares
Cabe destacar que la atencioacuten a las pequentildeas unidades ha cobrado
importancia recientemente y ello se asocia con la necesidad de conocer la
contribucioacuten de la mujer a la produccioacuten agropecuaria En las deacutecadas pasadas
el eacutenfasis de los censos agriacutecolas se centraba en la produccioacuten agriacutecola
comercial dado que los mayores voluacutemenes de produccioacuten se concentran en
esos establecimientos Si bien no siempre se excluiacutea a las pequentildeas unidades
tampoco se tomaron las medidas necesarias para captar la informacioacuten
pertinente sobre ellas
En algunas ocasiones el subregistro en los censos agropecuarios era
intencional pues se recomendaba que se omitieran las unidades cuya
produccioacuten fuera menor de una cierta cantidad Esto se puede justificar en paiacuteses
desarrollados donde la cantidad de estas unidades no es significativa
Probablemente en esos paiacuteses la subsistencia de la familia no estaacute supeditada
a la produccioacuten agropecuaria Sin embargo en los paiacuteses subdesarrollados
donde el sustento de un gran nuacutemero de las familias depende de las pequentildeas
unidades agriacutecolas y una parte significativa de la poblacioacuten vive en condiciones
miacutenimas de subsistencia no se pueden establecer normas miacutenimas para el
registro
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Cuando se tienen fines especiacuteficos o se quieren realizar anaacutelisis
particulares se pueden definir a posteriori categoriacuteas diferentes por volumen de
produccioacuten productividad extensioacuten de tierra nuacutemero miacutenimo de personal
ocupado etc Los anaacutelisis pueden recurrir a las categoriacuteas que deseen pero las
pequentildeas unidades no deben ser eliminadas de antemano en la recoleccioacuten de
la informacioacuten visto que su importancia frente a la necesidad de combatir la
pobreza extrema es indiscutible
Pese a que las pequentildeas unidades siempre han sido importantes
paradoacutejicamente en la eacutepoca actual de globalizacioacuten econoacutemica eacutestas han
adquirido una singular relevancia para la seguridad alimentaria En un contexto
en el que la poliacutetica econoacutemica neo-liberal es dominante la agudizacioacuten del
desempleo urbano ha causado que las alternativas no agropecuarias para
subsistir sean cada vez maacutes limitadas El aumentar la productividad de las
pequentildeas unidades agriacutecolas puede contribuir a disminuir la migracioacuten de la
poblacioacuten rural hacia las grandes ciudades evitando con ello agravar los
problemas urbanos ademaacutes de mejorar las condiciones de vida de los
campesinos
Auacuten cuando los maacutergenes de maniobra de los paiacuteses subdesarrollados
son reducidos es esencial que eacutestos desarrollen sus potencialidades para
alcanzar la autosuficiencia alimentaria Es preciso aumentar la productividad
para mejorar las condiciones de nutricioacuten de la poblacioacuten Para ello se requiere
conocer coacutemo actuacutean los productores (queacute cuaacutento y coacutemo producen) con el fin
de promover cambios positivos que favorezcan a las personas que dependen de
las pequentildeas unidades
En estas unidades estrechamente vinculadas a los hogares el trabajo es
efectuado principalmente por las mujeres los ancianos y los nintildeos
Desafortunadamente cuando se realizan los censos agropecuarios no
solamente se presentan sub-registros en las unidades pequentildeas sino que se
suele confundir la actividad de produccioacuten agropecuaria con el trabajo
domeacutestico
El conjunto de todas las unidades de observacioacuten consideradas en este
proyecto constituyen el universo de estudio
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Ejemplo
Para efectos de este estudio la unidad de observacioacuten se considera como el
lugar donde se captan los datos de las categoriacuteas o unidades de anaacutelisis en este
sentido
Categoriacutea o unidades de anaacutelisis Unidad de observacioacuten
Poblacioacuten Vivienda
Pacientes Unidad meacutedica
Valor de la produccioacuten Establecimiento manufacturero
LA UNIDAD DE MUESTREO
Corresponde a la entidad baacutesica mediante la cual se accederaacute a la unidad
de anaacutelisis En algunos casos ambas se corresponden Por ejemplo si se desea
estimar la prevalencia de dantildeo auditivo en relacioacuten con niveles de ruido
ambiental en una muestra de trabajadores de una faacutebrica la unidad de muestreo
puede corresponder a la entidad sujeto si se dispone de un registro detallado
de cada sujeto La unidad de anaacutelisis es por cierto el trabajador de la faacutebrica
Ejemplo
se conoce de secciones de la faacutebrica con distinto nivel de exposicioacuten al ruido
podriacutea obtenerse una muestra de cada seccioacuten (estratos) En este caso la
unidad de muestreo corresponde a la seccioacuten de donde se obtendraacute a los
sujetos a estudiar de acuerdo a algun procedimiento aleatorio de seleccioacuten La
unidad de anaacutelisis es tambieacuten en este caso el trabajador
En el caso de encuestas de morbilidad una tendencia claacutesica es trabajar con
hogares como unidad de muestreo e individuos de dichos hogares como unidad
de anaacutelisis
El muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica
es determinar que parte de una realidad en estudio (poblacioacuten o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
examinarse con la finalidad de hacer inferencias sobre dicha poblacioacuten El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error
de muestreo Obtener una muestra adecuada significa lograr una versioacuten
simplificada de la poblacioacuten que reproduzca de alguacuten modo sus rasgos baacutesicos
MUESTREO NO PROBABILIacuteSTICOS
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de ser elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
Los meacutetodos de muestreo no probabiliacutesticos no garantizan la representatividad
de la muestra y por lo tanto no permiten realizar estimaciones inferencia les sobre
la poblacioacuten
(En algunas circunstancias los meacutetodos estadiacutesticos y epidemioloacutegicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabiliacutestico por ejemplo los estudios de caso-control donde los casos no son
seleccionados aleatoriamente de la poblacioacuten)
MUESTREO PROBABILIacuteSTICO
Forman parte de este tipo de muestreo todos aquellos meacutetodos para los
que puede calcularse la probabilidad de extraccioacuten de cualquiera de las muestras
posibles Este conjunto de teacutecnicas de muestreo es el maacutes aconsejable aunque
en ocasiones no es posible optar por eacutel En este caso se habla de muestras
probabiliacutesticas pues no es en rigor correcto hablar de muestras
representativas dado que al no conocer las caracteriacutesticas de la poblacioacuten no
es posible tener certeza de que tal caracteriacutestica se haya conseguido
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Sin reposicioacuten de los elementos Cada elemento extraiacutedo se descarta para la
subsiguiente extraccioacuten Por ejemplo si se extrae una muestra de una
poblacioacuten de bombillas para estimar la vida media de las bombillas que la
integran no seraacute posible medir maacutes que una vez la bombilla seleccionada
Con reposicioacuten de los elementos Las observaciones se realizan con
reemplazamiento de los individuos de forma que la poblacioacuten es ideacutentica en
todas las extracciones En poblaciones muy grandes la probabilidad de repetir
una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten aunque realmente no lo sea
Con reposicioacuten muacuteltiple En poblaciones muy grandes la probabilidad de
repetir una extraccioacuten es tan pequentildea que el muestreo puede considerarse sin
reposicioacuten Cada elemento extraiacutedo se descarta para la subsiguiente extraccioacuten
Para realizar este tipo de muestreo y en determinadas situaciones es muy uacutetil
la extraccioacuten de nuacutemeros aleatorios mediante ordenadores calculadoras o
tablas construidas al efecto
MARCO MUESTRAL
Estaacute conformado entonces por unidades de muestreo Las unidades de la
poblacioacuten contenidas en las unidades de muestreo seraacuten encuestadas (objeto
de mediciones) sobre las caracteriacutesticas de intereacutes para el estudio de la
poblacioacuten objetivo y con base en los resultados de tales encuestas se
estableceraacuten conjeturas (pronoacutesticos predicciones estimaciones etc) sobre
caracteriacutesticas o propiedades de intereacutes en la poblacioacuten
Por lo anterior es necesario tomar especial cuidado en que el Marco Muestral
contenga todas las unidades de la poblacioacuten bajo estudio puesto que en
definitiva soacutelo las unidades de la poblacioacuten contenidas en alguna unidad de
muestreo pueden ser observadas y en consecuencia estudiadas
Ejemplo de la ENAHO una muestra seraacute un subconjunto de las viviendas
particulares del Peruacute En cada una de las viviendas de una particular muestra
seleccionada se tomaraacute a traveacutes de la encuesta informacioacuten relevante sobre la
propia vivienda y sobre todos los hogares y personas que en ella residen Con
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
base en tales observaciones se estiman caracteriacutesticas de interes para los todos
los hogares del Peruacute (poblacioacuten) tales como ingreso y gasto del hogar y para las
todas las personas (poblacioacuten) como es el caso de la ocupacioacuten educacioacuten
salud percepcioacuten de la seguridad ciudadana etc
El nuacutemero de unidades de unidades de muestreo contenidas en una muestra se
llama tamantildeo de muestra el cual como se veraacute mas adelante estaacute iacutentimamente
ligado a la confiabilidad de las estimaciones
Si la poblacioacuten consta de N unidades y la muestra posee n de tales unidades
entonces se llama fraccioacuten de muestreo
PARAacuteMETROS
Los paraacutemetros son valores que sustituyen variables en definiciones de
trabajos y secuencias de trabajos a medida que se crea el nuevo plan de
produccioacuten Las definiciones de paraacutemetros se entran utilizando el
comando composer modify Cuando se entra el comando Composer copia la
lista completa de definiciones de paraacutemetros en un archivo de edicioacuten e inicia un
editor en el que se puede modificar la lista
En estadiacutestica se llama paraacutemetro estadiacutestico a un valor representativo de
una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten tiacutepica
El paraacutemetro es el caacutelculo de valores en la poblacioacuten Un paraacutemetro es un
sumario descriptivo de alguna caracteriacutestica de una poblacioacuten por ejemplo la
media aritmeacutetica mediana desviacioacuten estaacutendar Tambieacuten se puede decir que es
el resultado que generaliza las caracteriacutesticas de la poblacioacuten se puede dar en
porcentaje o en promedio
Ejemplo
Un valor que ya estaacute incluido en una funcioacuten Si una funcioacuten que calcula
la altura de un aacuterbol es h(antildeos) = 20 times antildeos entonces antildeos es una variable y
20 es un paraacutemetro Los Paraacutemetros pueden ser cambiados para que la funcioacuten
pueda ser usada para otras cosas
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Ejemplo un aacuterbol diferente puede tener una tasa de crecimiento de 30 cm por
antildeo y su funcioacuten seriacutea h(antildeos) = 30 times antildeos Podriacuteamos hacerla auacuten maacutes
general escribiendo h(edad tasa) = tasa times edad y en este caso un punto y coma
() es usado para separar la(s) variable(s) de los paraacutemetros(s)
El teacutermino paraacutemetro puede hacer referencia a
Paraacutemetro estadiacutestico se trata de una funcioacuten definida sobre valores numeacutericos
de una poblacioacuten como la media aritmeacutetica una proporcioacuten o su desviacioacuten
tiacutepica
Argumento (informaacutetica) En Ciencias de la computacioacuten
un paraacutemetro o argumento es una variable que puede ser recibida por
una subrutina Un paraacutemetro estadiacutest ico es un nuacutemero que se obtiene
a partir de los datos de una distr ibucioacuten estadiacutestica
ESTADIacuteSTICO
Es una medida cuantitativa derivada de un conjunto de datos de
una muestra con el objetivo de estimar o inferir caracteriacutesticas de
una poblacioacuten o modelo estadiacutestico Maacutes formalmente un estadiacutestico es una
funcioacuten medible T que dada una muestra estadiacutestica de valores (X1X2Xn) les
asigna un nuacutemero T(X1X2Xn) que sirve para estimar determinado paraacutemetro
de la distribucioacuten de la que procede la muestra Asiacute por ejemplo la media de los
valores de una muestra (media muestral) sirve para estimar la media de la
poblacioacuten de la que se ha extraiacutedo la misma la varianza muestral podriacutea usarse
para estimar la varianza poblacional etc1 Esto se denomina como realizar
una estimacioacuten puntual
ERROR MUESTRAL DE ESTIMACIOacuteN ESTAacuteNDAR
Es el error a causa de observar una muestra en lugar de la poblacioacuten
completa La estimacioacuten de un valor de intereacutes como la media o el porcentaje
estaraacute generalmente sujeta a una variacioacuten entre una muestra y otra1 Estas
variaciones en las posibles muestras de una estadiacutestica pueden teoacutericamente
ser expresadas como errores mueacutestrales sin embargo normalmente en la
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
praacutectica el error exacto es desconocido El error muestral se refiere en teacuterminos
maacutes generales al fenoacutemeno de la variacioacuten entre muestras
El error muestral deseado generalmente puede ser controlado tomando
una muestra aleatoria de la poblacioacuten suficientemente grande2 sin embargo el
costo de esto puede ser limitante Si las observaciones son tomadas de una
muestra aleatoria la teoriacutea estadiacutestica brinda caacutelculos probabiliacutesticos del
tamantildeo deseado del error muestral para una estadiacutestica en particular o
estimacioacuten Estos usualmente son expresados en teacuterminos del error estaacutendar El
error muestral puede ser contrastado con el error no muestral el cual se refiere
al conjunto de las desviaciones del valor real que no van en funcioacuten de la muestra
escogida entre los cuales se encuentran varios errores sistemaacuteticos y algunos
errores aleatorios Resultan mucho maacutes difiacuteciles de cuantificar que el error
muestral El error estaacutendar de la estimacioacuten designado por sYX mide la
disparidad ldquopromediordquo entre los valores observados y los valores estimados de
Se utiliza la siguiente formula
Debemos entonces calcular los valores de para cada ciudad sustituyendo
en la ecuacioacuten los valores de los porcentajes de graduados de cada ciudad
estudiada
Y X
42 72 46 minus04 016
49 67 45 04 016
70 170 66 04 016
62 125 57 05 025
38 63 44 minus06 036
76 239 80 minus04 016
44 60 44 00 000
54 102 52 02 004
129
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Syx = 046 (decenas de miles $)
EL NIVEL DE CONFIANZA
Es la probabilidad a priori de que el intervalo de confianza a calcular
contenga al verdadero valor del paraacutemetro Se indica por 1-α y habitualmente se
da en porcentaje (1-α) Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraiacuteda la muestra el intervalo de confianza contendraacute al
verdadero valor del paraacutemetro o no lo que sabemos es que si repitieacutesemos el
proceso con muchas muestras podriacuteamos afirmar que el (1-α) de los intervalos
asiacute construidos contendriacutea al verdadero valor del paraacutemetro
Los valores que se suelen utilizar para el nivel de confianza son el 95 99 y
999
Ejemplo
Para un nivel de confianza del 88
1-α = 088
α = 012
α2 = 006
Z α 2 = Z 006
P(Z le Z 006) =094 (1-α2)
Z(094)=156
Para un nivel de confianza del 98
1-α=098
α=002
α2=001
Z α 2 = Z 001
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
P(Z le Z 001) =099 (1-α2)
Z(099)=235
La probabilidad asociada a un intervalo de confianza o a un intervalo estadiacutestico
de dispersioacuten(1 - a) se expresa frecuentemente como porcentaje
VARIANZAS POBLACIONALES
Cuando se contrasta la hipoacutetesis de igualdad de medias de dos poblaciones o
cuando se realiza un anaacutelisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza Este problema se resuelve a partir del anaacutelisis exploratorio
que proporciona los diagramas de caja y el estadiacutestico del contraste de Levene
Si la altura de las cajas y los bigotes correspondientes a los diagramas de caja
de cada una de las muestras son aproximadamente iguales se tiene un indicio
de que posiblemente las muestras provienen de poblaciones con igual varianza
Como complemento numeacuterico al graacutefico se realiza la prueba de Levene que
calcula un estadiacutestico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales Las hipoacutetesis del contraste son
La secuencia es
Analizar
Estadiacutesticos Descriptivos
Explorar
En el cuadro de diaacutelogo se indica la variable de intereacutes Dependiente y la variable
que define los grupos Factores EnGraacuteficos se debe activar la
opcioacuten Estimacioacuten de potencia
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
El contraste de Levene se realiza por defecto cuando se contrasta la diferencia
de dos o maacutes medias
EJEMPLO
Ejemplo 1
Para la variable Coste de la encuesta Enctransav contrastar si existe diferencia
significativa entre las varianzas del coste en transporte de los alumnos que viven
en Barcelona y de los que viven fuera
En el ejemplo 3 del epiacutegrafe Diferencia de medidas poblacionales se trataba de
verificar si existiacutea una diferencia significativa entre el coste esperado en
transporte de los alumnos que viven en Barcelona y el de los que viven fuera En
este caso es fundamental probar si las varianzas de ambos grupos pueden
considerarse o no iguales ya que de este supuesto depende que se deba
escoger uno u otro de los dos estadiacutesticos de prueba que aparecen en el cuadro
de resultados del contraste
Los resultados que se obtuvieron fueron los siguientes
Como puede verse bajo la hipoacutetesis nula de varianzas iguales el estadiacutestico de
Levene (F) toma el valor 37671 Este valor es
suficientemente grande como para rechazar la hipoacutetesis nula para cualquier nivel
de significacioacuten Si se observan los correpondientes diagramas de caja
SIGNIFICANCIA ESTADIacuteSTICA
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Un resultado se denomina estadiacutesticamente significativo cuando no es
probable que haya sido debido al azar Una diferencia estadiacutesticamente
significativa solamente significa que hay evidencias estadiacutesticas de que hay una
diferencia no significa que la diferencia sea grande importante o significativa
en el sentido estricto de la palabra
El nivel de significacioacuten de un test es un concepto estadiacutestico asociado a
la verificacioacuten de una hipoacutetesis En pocas palabras se define como la
probabilidad de tomar la decisioacuten de rechazar la hipoacutetesis nula cuando eacutesta es
verdadera (decisioacuten conocida como error de tipo I o falso positivo) La decisioacuten
se toma a menudo utilizando el valor P (o p-valor) si el valor P es inferior al nivel
de significacioacuten entonces la hipoacutetesis nula es rechazada Cuanto menor sea el
valor P maacutes significativo seraacute el resultado
En otros teacuterminos el nivel de significativita de un contraste de hipoacutetesis es
una probabilidad P tal que la probabilidad de tomar la decisioacuten de rechazar
la hipoacutetesis nula - cuando eacutesta es verdadera - no es mayor que P
VENTAJAS DEL MUESTREO
Hay dos formas de estudiar las poblaciones por censo o por muestreo
En el censo se analizan todos y cada una uno de los elementos de una poblacioacuten
y en el muestreo se analiza una parte de la poblacioacuten
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten
debido a los siguientes factores
c1 Volumen de trabajo reducido
c2 Puede existir mayor supervisioacuten en el trabajo
c3 Se puede dar maacutes entrenamiento al personal
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
c4 Menor probabilidad de cometer errores durante el procesamiento de la
informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas
destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
En estudios que implican teacutecnicas destructivas o de uso que imposibilidad
de utilizacioacuten posterior de lo analizado El trabajo con una muestra y no con el
universo implica eficiencia pues significa ahorro de recursos esfuerzos y tiempo
Con el uso del muestreo se pueden obtener resultados razonablemente
maacutes precisos que el estudio de todo el universo pues para el estudio de soacutelo
una muestra el personal miacutenimo necesario puede ser mejor preparado para
recoger informacioacuten maacutes detallada y elaborada
TIPOS DE MUESTREO
Los autores proponen diferentes criterios de clasificacioacuten de los
diferentes tipos de muestreo aunque en general pueden dividirse en dos
grandes grupos meacutetodos de muestreo probabiliacutestico y meacutetodos de muestreo no
probabiliacutestico
Muestreo aleatorio simple
Para obtener una muestra se numeran los elementos de la
poblacioacuten y se seleccionan al azar los n elementos que conti ene la
muestra
Muestreo aleatorio sistemaacutetico
Se el ige un individuo al azar y a part ir de eacutel a intervalos constantes
se eligen los demaacutes hasta completar la muestra
Ejemplo
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Si tenemos una poblacioacuten formada por 100 elementos y
queremos extraer una muestra de 25 elementos en primer lugar
debemos establecer el intervalo de seleccioacuten que seraacute igual a
10025 = 4 A continuacioacuten elegimos el elemento de arranque
tomando aleatoriamente un nuacutemero entre el 1 y el 4 y a partir de eacutel
obtenemos los restantes elementos de la muestra
Muestreo aleatorio estratificado
Se divide la poblacioacuten en clases o estratos y se escoge
aleatoriamente un nuacutemero de individuos de cada estrato
proporcional al nuacutemero de componentes de cada estrato
En una faacutebrica que consta de 600 trabajadores queremos tomar una
muestra de 20 Sabemos que hay 200 trabajadores en la seccioacuten A
150 en la B 150 en la C y 100 en la D
Un muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de
partida puede ser inf inita o f inita
MEacuteTODOS DE MUESTREO PROBABILIacuteSTICOS
Son aquellos que se basan en el principio de equiprobabilidad Es decir
aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y consiguientemente todas las
posibles muestras de tamantildeo no tienen la misma probabilidad de ser elegidas
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables
Los meacutetodos de muestreo probabiliacutestico son aquellos que se basan en el
principio de equiprobabilidad Es decir aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y consiguientemente todas las posibles muestras de tamantildeo n tienen la misma
probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutestico nos
aseguran la representatividad de la muestra extraiacuteda y son por tanto los maacutes
recomendables Dentro de los meacutetodos de muestreo probabiliacutestico encontramos
los siguientes tipos
MUESTREO ALEATORIO SIMPLE
MUESTREO ALEATORIO SISTEMAacuteTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROPIEDADES DEL MUESTREO PROBABILISTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1
M2 Mt mediante la aplicacioacuten del procedimiento a una poblacioacuten Esto significa
que podemos indicar cuales unidades de muestreo pertenecen a M1 M2 y asiacute
sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten
Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene
una probabilidad Pi de ser seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para
cualquiera de las posibles
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite
identificar a cada unidad de muestreo Por ejemplo una lista que contenga el
nombre de todos los proveedores de cantildea de azuacutecar de un ingenio Es
recomendable que ademaacutes de identificar a cada unidad muestral incluya
algunas otras caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada
proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como
unidades de muestreo en las que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten
Es importante considerar el tipo de variable a medir por ejemplo si se va a
estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si
interesa estimar la proporcioacuten de agricultores que utilizan herbicidas para el
control de malezas se mediraacute una variable de tipo binomial El tipo de variable a
medir ayuda a definir el esquema o tipo de muestreo
Los meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
TIPO O ESQUEMA DE MUESTREO
Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los mas usados
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
estaacuten muestreo simple aleatorio muestreo aleatorio estratificado muestreo
sistemaacutetico
DETERMINACIOacuteN DEL TAMANtildeO DE MUESTRA (N)
Este punto se describiraacute detalladamente maacutes adelante y depende de que
es lo que se desea estimar y el esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo
Consiste en extraer un nuacutemero n de unidades muestrales de una poblacioacuten de
tamantildeo N
USO DE LA TABLA DE NUacuteMEROS ALEATORIOS
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla
de formacioacuten ellas se pueden leer individualmente o en grupos y en cualquier
orden en columnas hacia abajo columnas hacia arriba en fila diagonalmente
si se desea formar nuacutemeros aleatorios en un determinado rango basta con
calcular la proporcioacuten otra forma de usarlo es sumando dos nuacutemeros tomados
de alguna posicioacuten o multiplicarlos
Para ser presentadas estas cifras se agrupan en nuacutemeros de 4 diacutegitos
formando bloques de 5 filas y 10 columnas facilitando de esta forma su lectura
que puede iniciarse desde cualquier parte de la tabla Una tabla de nuacutemeros
aleatorios es uacutetil para seleccionar al azar los individuos de una poblacioacuten
conocida que deben formar parte de una muestra
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
0 3485 0741 9069 5920 4326 7704 6525 1249
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO
SIMPLE ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relacioacuten
N Zsup2a2 Ssup2
n = ---------------
Ndsup2 + Zsup2a2 Ssup2
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
Za2 = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d = precisioacuten del muestreo
a = Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el
objetivo de hacer una primera estimacioacuten de Ssup2
Ejemplo
En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se
desea estimar la media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten
estaacutendar es de 2 centiacutemetros cuacutebicos Si queremos tener una precisioacuten 025 cms3
y un nivel de significancia del 5 De que tamantildeo debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms3 a = 005 (5)
Za2 = 196
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
N Zsup2a2 Ssup2 8000(196)sup2(2)sup2
n = -------------- = --------------------------- = 238 frascos
Ndsup2 + Zsup2a2 Ssup2 8000(025)sup2 + (196)sup2(2)sup2
Solo faltariacutea muestrear 203 frascos pues los datos de los 35 frascos del
premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON
MUESTRA ALEATORIA SIMPLE
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese
caso para calcular el tamantildeo de muestra bajo el muestreo simple aleatorio se hariacutea
de la siguiente manera
N Zsup2a2 pq
n = ---------------
Ndsup2 + Zsup2a2 pq
de donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
en este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo
En un estudio se desea determinar en que proporcioacuten los nintildeos de una regioacuten
toman incaparina en el desayuno Si se sabe que existen 1500 nintildeos y deseamos
tener una precisioacuten del 10 porciento con un nivel de significancia del 5 De que
tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
DATOS
N = 1500 d = 10 = 01 a = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Za2 = 196
N Zsup2a2 pq 1500 (196)sup2(05)(05)
n = ----------------- = -------------------------------- = 91
dsup2 + Zsup2a2 pq 1500(01)sup2 + (196)sup2(05)(05)
Se deben de muestrear 91 nintildeos
MUESTREO ALEATORIO SISTEMAacuteTICO
Este procedimiento exige como el anterior numerar todos los elementos
de la poblacioacuten pero en lugar de extraer n nuacutemeros aleatorios soacutelo se extrae
uno Se parte de ese nuacutemero aleatorio i que es un nuacutemero elegido al azar y los
elementos que integran la muestra son los que ocupan los lugares i i+k i+2k
i+3ki+(n-1)k es decir se toman los individuos de k en k siendo k
el resultado de dividir el tamantildeo de la poblacioacuten entre el tamantildeo de la muestra
k=Nn El nuacutemero i que empleamos como punto de partida seraacute un nuacutemero al
azar entre 1 y k
El riesgo de este tipo de muestreo estaacute en los casos en que se dan
periodicidades en la poblacioacuten ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5
uacuteltimos mujeres si empleamos un muestreo aleatorio sistemaacutetico con k=10
siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo del disentildeo de estudios por muestreo es maximizar la cantidad
de informacioacuten para un costo dado El muestreo simple aleatorio es el disentildeo
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
baacutesico de muestreo y suele suministrar buenas estimaciones de paraacutemetros
poblacionales a un costo bajo
En esta parte utilizaremos un segundo procedimiento de muestreo el
muestreo aleatorio estratificado el cual en muchas ocasiones incrementa la
cantidad de informacioacuten para un costo dado Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a
alguna caracteriacutestica (se puede estratificar por ejemplo seguacuten la profesioacuten el
municipio de residencia el sexo estado civil etc) Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona
independientemente pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formaraacuten parte
de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (Tamantildeo
geograacutefico sexos edades)
TAMANtildeO DE MUESTREO PARA ESTIMAR LA MEDIA CON MUESTREO
ALEATORIO ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua
se utiliza la siguiente relacioacuten
S Nsup2iSsup2iwi
n = ---------------
Nsup2D + S NiSsup2i
de donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
wi = importancia o peso del i eacutesimo estrato
Bsup2
D = ---- B = precisioacuten
4
Ejemplo
En un Ingenio desea hacer una estimacioacuten del promedio de grados Brix con que
llega la cantildea a la fabrica
Para el efecto desea realizar un muestreo aleatorio estratificado puesto que la
cantildea puede provenir de tres tipos de proveedores
Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma finca
Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio
De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de cada estrato
y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio De que
tamantildeo debe de ser la muestra total y de cada estrato
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
N = S Ni = 998
Con distribucioacuten proporcional
S Nsup2 i Ssup2 i w i
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
n = ---------------
Nsup2D + S N i Ssup2 i
S Nsup2 i Ssup2 i w i = Nsup2 1 Ssup2 1 w 1 + Nsup2 2 Ssup2 2 w 2 + Nsup2 3 Ssup2 3 w 3
S Nsup2 i Ssup2 i w i = (558)sup2(35)sup2056 + (190)sup2(54)sup2019 +
(250)sup2(62)sup2025 = 68110875 + 5540400 + 9610000
S Nsup2 i Ssup2 i w i = 21961875
S N i Ssup2 i = N 1 Ssup2 1 + N 2 Ssup2 2 + N 3 Ssup2 3
S N i Ssup2 i = 558(35)sup2 + (190)(54)sup2 + (250)(62)sup2
S N i Ssup2 i = 68355 + 55404 + 9610 = 219859
1sup2
D = ---- = 025
4
Nsup2D = (998)sup2(025) = 249001
S Nsup2 i Ssup2 i w i 219614875
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
n = --------------- = -------------------- = 81
Nsup2D + S N i Ssup2 i 249001 + 21985
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente
tamantildeo de muestra
n 1 = 81(558998) = 45 n 2 = 81(190998) = 15
n 3 = 81(250998) = 20
En muestreo aleatorio estratificado primero se particiona la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MUESTREO POLIETAPICO O POR CONGLOMERADOS
En muestreo aleatorio estratificado primero se particional la poblacioacuten en
estratos y entonces se selecciona una muestra aleatoria de cada estrato El
procedimiento en el muestreo por conglomerados es al reveacutes Despueacutes de dividir
la poblacioacuten en conglomerados se selecciona al azar algunos de ellos Dentro de
cada conglomerado escogido se registran todos los elementos mueacutestrales En
el muestreo aleatorio estratificado las unidades mueacutestrales son los elementos
individuales de la poblacioacuten mientras que en el muestreo por conglomerados las
unidades mueacutestrales son conglomerados de los elementos
MEacuteTODOS DE MUESTREO NO PROBABILIacuteSTICO
A veces para estudios exploratorios el muestreo probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun siendo
conscientes de que no sirven para realizar generalizaciones pues no se tiene
certeza de que la muestra extraiacuteda sea representativa ya que no todos los
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que la
muestra sea representativa
middot Muestreos No Probabiliacutesticos
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Muestreo por cuotas
Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los
individuos maacutes representativos o adecuados para los fines de la
investigacioacuten Mantiene por tanto semejanzas con el muestreo aleatorio
estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de
individuos que reuacutenen unas determinadas condiciones por ejemplo 20
individuos de 25 a 40 antildeos de sexo femenino y residentes en Gijoacuten Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Muestreo opinaacutetico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras representativas mediante la inclusioacuten en la muestra de grupos
supuestamente tiacutepicos Es muy frecuente su utilizacioacuten en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto
Muestreo casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene faacutecil
acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos)
Bola de nieve
Se localiza a algunos individuos los cuales conducen a otros y estos a otros y
asiacute hasta conseguir una muestra suficiente Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales
delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LA MUESTRA
Una muestra aleatoria es seleccionada de tal manera que cada muestra
posible del mismo tamantildeo tiene igual probabilidad de ser seleccionada de la
poblacioacuten Para obtener una muestra aleatoria cada elemento en la poblacioacuten
tenga la misma probabilidad de ser seleccionado el plan de muestreo puede
no conducir a una muestra aleatoria Por conveniencia este meacutetodo pude ser
reemplazado por una tabla de nuacutemeros aleatorios Cuando una poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
infinita es obvio que la tarea de numerar cada elemento de la poblacioacuten es
imposible Por lo tanto ciertas modificaciones del muestreo aleatorio son
necesarias Los tipos maacutes comunes de muestreo aleatorio modificado son
sistemaacuteticos estratificados y de conglomerados
TEOREMA CENTRAL DEL LIacuteMITE
Indica que en condiciones muy generales la distribucioacuten de la media (
) de variables aleatorias tiende a una distribucioacuten normal (tambieacuten
llamada distribucioacuten gaussiana curva de Gauss o campana de Gauss) cuando
la cantidad de variables es suficientemente grande1
Teorema Sea X1 X2 Xn una muestra aleatoria de una distribucioacuten con
media μ y varianza σ2 Entonces si n es suficientemente grande la variable
aleatoria
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Tiene aproximadamente una distribucioacuten normal con y
ESTIMACIOacuteN DE PARAacuteMETROS
En general de las variables experimentales u observacionales no
conocemos la fpd Podemos conocer la familia (normal binomial) pero no
los paraacutemetros Para calcularlos necesitariacuteamos tener todos los posibles
valores de la variable lo que no suele ser posible
La inferencia estadiacutestica trata de coacutemo obtener informacioacuten (inferir) sobre los
paraacutemetros a partir de subconjuntos de valores (muestras) de la variable
Estadiacutestico variable aleatoria que soacutelo depende de la muestra aleatoria elegida
para calcularla
Estimacioacuten Proceso por el que se trata de averiguar un paraacutemetro de la
poblacioacuten representado en general por a partir del valor de un estadiacutestico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la distribucioacuten muestral del
estadiacutestico que se use
iquestQueacute es esto Concretemos pe en la media ( Si para cada muestra posible
calculamos la media muestral ( ) obtenemos un valor distinto ( es un
estadiacutestico es una variable aleatoria y soacutelo depende de la muestra) habraacute por
tanto una fpd para llamada distribucioacuten muestral de medias La desviacioacuten
tiacutepica de esta distribucioacuten se denomina error tiacutepico de la media Evidentemente
habraacute una distribucioacuten muestral para cada estadiacutestico no soacutelo para la media y
en consecuencia un error tiacutepico para cada estadiacutestico
Si la distribucioacuten muestral de un estadiacutestico estuviera relacionada con alguacuten
paraacutemetro de intereacutes ese estadiacutestico podriacutea ser un estimador del paraacutemetro
Es el procedimiento utilizado para conocer las caracteriacutesticas de un
paraacutemetro poblacional a partir del conocimiento de la muestra Con una muestra
aleatoria de tamantildeo n podemos efectuar una estimacioacuten de un valor de un
paraacutemetro de la poblacioacuten pero tambieacuten necesitamos precisar un
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
INTERVALO DE CONFIANZA
Se llama asiacute a un intervalo en el que sabemos que estaacute un paraacutemetro con
un nivel de confianza especiacutefico
Nivel de confianza
Probabilidad de que el paraacutemetro a estimar se encuentre en el intervalo
de confianza
Error de estimacioacuten admisible
Que estaraacute relacionado con el radio del intervalo de confianza
LA INFERENCIA ESTADIacuteSTICA
Persigue la obtencioacuten de conclusiones sobre un gran nuacutemero de datos
basaacutendose en la observacioacuten de una muestra obtenida de ellos tambieacuten intenta
medir su significacioacuten es decir la confianza que nos merecen
Todo nuestro estudio se basa en la normalidad de las distribuciones que
empleamos por lo que conviene que antes de seguir adelante repases
la Distribucioacuten Normal
INFERENCIA INDUCTIVA
Cuando un argumento uacutenicamente asegura que la verdad de sus
premisas hace maacutes probable que la conclusioacuten sea verdadera estamos ante un
argumento que involucra una inferencia inductiva Un argumento inductivo tiene
eacutexito siempre que las premisas proporcionen alguna evidencia que legitime o
apoye la verdad de su conclusioacuten Aunque pueda ser razonable aceptar la verdad
de una conclusioacuten sobre una base inductiva no seriacutea completamente
inconsistente suspender el juicio (es decir no pronunciarse sobre la verdad o
falsedad de la conclusioacuten) o incluso llegar a negar la verdad de la conclusioacuten (a
pesar de la verdad de las premisas)
Los argumentos inductivos por lo tanto cumplen con su criterio de correccioacuten
en un mayor o menor grado dependiendo de la cantidad y calidad del apoyo que
reciban Ninguacuten argumento inductivo es completamente perfecto o enteramente
inuacutetil aunque se puede elegir cuaacutel de entre varias inducciones es relativamente
mejor o peor que otras en el sentido de que se asegure la verdad de la conclusioacuten
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
con un mayor o menor grado de probabilidad
Las inferencias inductivas proceden desde lo particular hacia lo general desde
lo menos general hacia lo maacutes general y no tienen un teacutermino medio que conecte
firmemente una verdad con otra
Ejemplo
De este tipo de inferencia permisas
Todos los delfines observados son azules Se puede deducir la conclusioacuten todos
los delfines observados o no son azules
CONFIANZA E INTERVALOS DE CONFIANZA
Se llama intervalo de confianza a un par de nuacutemeros entre los cuales se
estima que estaraacute cierto valor desconocido con una determinada probabilidad de
acierto Formalmente estos nuacutemeros determinan un intervalo que se calcula a
partir de datos de una muestra y el valor desconocido es un paraacutemetro
poblacional La probabilidad de eacutexito en la estimacioacuten se representa con 1 - α y
se denomina nivel de confianza En estas circunstancias α es el llamado error
aleatorio o nivel de significacioacuten esto es una medida de las posibilidades de
fallar en la estimacioacuten mediante tal intervalo1
El nivel de confianza y la amplitud del intervalo variacutean conjuntamente de
forma que un intervalo maacutes amplio tendraacute maacutes posibilidades de acierto (mayor
nivel de confianza) mientras que para un intervalo maacutes pequentildeo que ofrece una
estimacioacuten maacutes precisa aumentan sus posibilidades de error
Para la construccioacuten de un determinado intervalo de confianza es
necesario conocer la distribucioacuten teoacuterica que sigue el paraacutemetro a estimar θ Es
habitual que el paraacutemetro presente una distribucioacuten normal Tambieacuten pueden
construirse intervalos de confianza con la desigualdad de Chebyshov
En definitiva un intervalo de confianza al 1 - α por ciento para la
estimacioacuten de un paraacutemetro poblacional θ que sigue una determinada
distribucioacuten de probabilidad es una expresioacuten del tipo [θ1 θ2] tal que P[θ1 le θ
le θ2] = 1 - α donde P es la funcioacuten de distribucioacuten de probabilidad de θ
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
ESTIMACIOacuteN EFICIENTES
Si las distribuciones mueacutestrales de dos estadiacutesticos tienen la misma media
o esperanza matemaacutetica entonces el estadiacutestico con la menor varianza se
denomina estimador eficiente de la media mientras que el otro estadiacutestico se le
llama estimador ineficiente Los valores correspondientes de los estadiacutesticos se
conocen respectivamente como estimadores eficientes Si se consideran todos
los estadiacutesticos posibles cuyas distribuciones mueacutestrales tienen la misma
media aquel con la menor varianza suele denominarse el mejor o mas
eficiente estimador de dicha media
La distribucioacuten muestral de la media y la mediana tienen la misma media
a saber la media poblacional Sin embargo la varianza de la distribucioacuten muestral
de las medias es maacutes pequentildea que la varianza de la distribucioacuten muestral de las
medianas Por lo tanto la media muestral ofrece un estimado ineficiente de esta
De todos los estadiacutesticos que estiman la media poblacional la media muestral
ofrece el mejor o mas eficiente estimado En la practica suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos
de ellos
ESTIMACIOacuteN- GENERALIDADES
La estadiacutestica descriptiva incluye al conjunto de tratamientos de los datos
de una muestra de los que se extraen unos valores que sintetizan o resumen
sus caracteriacutesticas maacutes importantes y las teacutecnicas de representacioacuten de estos
valores de forma que se facilite su anaacutelisis Los valores que aportan gran
informacioacuten sobre los datos tomados son las medidas de centralizacioacuten
dispersioacuten y forma
Se conoce con el nombre de variable cuantitativa o simplemente variable
a aquella magnitud que toma valores mensurables Las variables se conocen
como discretas si toman valores enteros como el nuacutemero de alumnos en un aula
o el nuacutemero de defectos por metro en un cable eleacutectrico Las variables continuas
pueden variar de forma continua como por ejemplo el peso de una persona o la
longitud de una varilla
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Las variables cualitativas o atributos son aquellas cualidades que no son
mensurables por ejemplo si una determinada pieza es o no defectuosa
La Regresioacuten muestra la dependencia entre variables por medio de un
modelo matemaacutetico que contempla tanto la parte sistemaacutetica como la aleatoria
de la relacioacuten entre dichas variables El modelo obtenido se contrasta por medio
de unas pruebas estadiacutesticas con las que se comprueban las hipoacutetesis
formuladas y asiacute generalizar los resultados a la poblacioacuten
ESTIMACIOacuteN POR INTERVALO DE CONFIANZA
En este tema vamos a estudiar como estimar es decir pronosticar un
paraacutemetro de la poblacioacuten generalmente la media la varianza (en consecuencia
la desviacioacuten tiacutepica) y la proporcioacuten a partir de una muestra de tamantildeo n Pero
a diferencia de la estimacioacuten puntual donde tal estimacioacuten la efectuaacutebamos
dando un valor concreto en esta ocasioacuten el planteamiento es otro Lo que
haremos es dar un intervalo donde afirmaremos o pronosticaremos que en su
interior se encontraraacute el paraacutemetro a estimar con una probabilidad de acertar
previamente fijada y que trataremos que sea la mayor posible es decir proacutexima
a 1 Para ello vamos a establecer la notacioacuten a utilizar Paraacutemetro En la muestra
En la poblacioacuten Media X micro Varianza 2nS σ2
Desviacioacuten tiacutepica nS σ Cuasivarianza 2nminus1S σn-1
Es importante el uso de la calculadora para hallar estos valores en la
muestra Hemos dicho que vamos a proponer un intervalo donde se encontraraacute
el paraacutemetro a estimar con una probabilidad de acierto alta Al valor de esta
probabilidad la representaremos por 1-α y la llamaremos nivel de confianza A
mayor valor de 1- α maacutes probabilidad de acierto en nuestra estimacioacuten por tanto
eso implica que α tendraacute que ser pequentildeo proacuteximo a 0
DISTRIBUCIOacuteN DE MUEacuteSTRALES
El estudio de determinadas caracteriacutesticas de una poblacioacuten se efectuacutea a
traveacutes de diversas muestras que pueden extraerse de ella
El muestreo puede hacerse con o sin reposicioacuten y la poblacioacuten de partida
puede ser infinita o finita Una poblacioacuten finita en la que se efectuacutea muestreo con
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
reposicioacuten puede considerarse infinita teoacutericamente Tambieacuten a efectos
praacutecticos una poblacioacuten muy grande puede considerarse como infinita En todo
nuestro estudio vamos a limitarnos a una poblacioacuten de partida infinita o a
muestreo con reposicioacuten
Consideremos todas las posibles muestras de tamantildeo n en una
poblacioacuten Para cada muestra podemos calcular un estadiacutestico (media
desviacioacuten tiacutepica proporcioacuten) que variaraacute de una a otra Asiacute obtenemos una
distribucioacuten del estadiacutestico que se llama distribucioacuten muestral
Las dos medidas fundamentales de esta distribucioacuten son la media y la
desviacioacuten tiacutepica tambieacuten denominada error tiacutepico Hay que hacer notar que si
el tamantildeo de la muestra es lo suficientemente grande las distribuciones
mueacutestrales son normales y en esto se basaraacuten todos los resultados que
alcancemos
DISTRIBUCIOacuteN MUESTRAL DE MEDIAS
Si tenemos una muestra aleatoria de una poblacioacuten N( ) se sabe
(Teorema del liacutemite central) que la fdp de la media muestral es tambieacuten normal
con media y varianza 2n Esto es exacto para poblaciones normales y
aproximado (buena aproximacioacuten con ngt30) para poblaciones cualesquiera Es
decir es el error tiacutepico o error estaacutendar de la media
iquestCoacutemo usamos esto en nuestro problema de estimacioacuten
1ordm problema No hay tablas para cualquier normal soacutelo para la normal =0 y =1
(la llamada z) pero haciendo la transformacioacuten (llamadatipificacioacuten)
una normal de media y desviacioacuten se transforma en una z
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARAacuteMETROS DE
POBLACIOacuteN
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
En una poblacioacuten cuya distribucioacuten es conocida pero desconocemos alguacuten
paraacutemetro podemos estimar dicho paraacutemetro a partir de una muestra
representativa
Un estimador es un valor que puede calcularse a partir de los datos
muestrales y que proporciona informacioacuten sobre el valor del paraacutemetro Por
ejemplo la media muestral es un estimador de la media poblacional la proporcioacuten
observada en la muestra es un estimador de la proporcioacuten en la poblacioacuten
Una estimacioacuten es puntual cuando se obtiene un soacutelo valor para el
paraacutemetro Los estimadores maacutes probables en este caso son los estadiacutesticos
obtenidos en la muestra aunque es necesario cuantificar el riesgo que se asume
al considerarlos Recordemos que la distribucioacuten muestral indica la distribucioacuten
de los valores que tomaraacute el estimador al seleccionar distintas muestras de la
poblacioacuten Las dos medidas fundamentales de esta distribucioacuten son la media que
indica el valor promedio del estimador y la desviacioacuten tiacutepica tambieacuten
denominada error tiacutepico de estimacioacuten que indica la desviacioacuten promedio que
podemos esperar entre el estimador y el valor del paraacutemetro
Maacutes uacutetil es la estimacioacuten por intervalos en la que calculamos dos valores
entre los que se encontraraacute el paraacutemetro con un nivel de confianza fijado de
antemano Llamamos Intervalo de confianza al intervalo que con un cierto nivel
de confianza contiene al paraacutemetro que se estaacute estimando
Nivel de confianza es la probabilidad de que el intervalo calculado
contenga al verdadero valor del paraacutemetro Se indica por1-a y habitualmente se
da en porcentaje (1-a)100 Hablamos de nivel de confianza y no de
probabilidad ya que una vez extraiacuteda la muestra el intervalo de confianza
contendraacute al verdadero valor del paraacutemetro o no lo que sabemos es que si
repitieacutesemos el proceso con muchas muestras podriacuteamos afirmar que el (1-a)
de los intervalos asiacute construidos contendriacutea al verdadero valor del paraacutemetro
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIOacuteN
Se pueden tomar muestras de n elementos Cada una de estas muestras
tiene a su vez una media ( ) Se puede demostrar que la media de todas las
medias mueacutestrales coincide con la media poblacional2
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Pero ademaacutes si el tamantildeo de las muestras es lo suficientemente
grande3 la distribucioacuten de medias mueacutestrales es praacutecticamente
una distribucioacuten normal (o gaussiana) con media μ y una desviacioacuten tiacutepica dada
por la siguiente expresioacuten Esto se representa como
sigue Si estandarizamos se sigue
que
En una distribucioacuten Z ~ N(0 1) puede calcularse faacutecilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones esto es
es sencillo hallar z1 y z2 tales que P[z1 le z le z2] = 1 - α donde (1 - α)middot100 es el
porcentaje deseado (veacutease eluso de las tablas en una distribucioacuten normal)
Se desea obtener una expresioacuten tal que
En esta distribucioacuten normal de medias se puede calcular el intervalo de
confianza donde se encontraraacute la media poblacional si soacutelo se conoce una media
muestral ( ) con una confianza determinada Habitualmente se manejan valores
de confianza del 95 y del 99 por ciento A este valor se le llamaraacute 1 minus α (debido
a que α es el error que se cometeraacute un teacutermino opuesto)
Para ello se necesita calcular el punto Xα 2 mdasho mejor dicho su versioacuten
estandarizada Zα 2mdash junto con su opuesto en la distribucioacuten X minus α 2 Estos
puntos delimitan la probabilidad para el intervalo como se muestra en la
siguiente imagen
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Dicho punto es el nuacutemero tal que
Y en la versioacuten estandarizada se cumple que
z minus α 2 = minus zα 2
Asiacute
Haciendo operaciones es posible despejar μ para obtener el intervalo
De lo cual se obtendraacute el intervalo de confianza
Si no se conoce σ y n es grande (habitualmente se toma n ge 30)4
donde s es la desviacioacuten tiacutepica de una muestra
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Aproximaciones para el valor zα 2 para los niveles de confianza estaacutendar son
196 para 1 minus α = 95 y 2576 para 1 minus α = 995
ESTIMACIOacuteN DE LA DIFERENCIA ENTRE DOS MEDIAS
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y
22 respectivamente un estimador puntual de la diferencia entre 1 y 2 estaacute
dado por la estadiacutestica Por tanto Para obtener una estimacioacuten puntual
de
1- 2 se seleccionan dos muestras aleatorias independientes una de cada
poblacioacuten de tamantildeo n1 y n2 se calcula la diferencia de las medias
muestrales
Recordando a la distribucioacuten muestral de diferencia de medias
Al despejar de esta ecuacioacuten 1- 2 se tiene
En el caso en que se desconozcan las varianzas de la poblacioacuten y los
tamantildeos de muestra sean mayores a 30 se podraacute utilizar la varianza de la
muestra como una estimacioacuten puntual
Ejemplos
Se lleva a cabo un experimento en que se comparan dos tipos de motores
A y B Se mide el rendimiento en millas por galoacuten de gasolina Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B La gasolina que se
utiliza y las demaacutes condiciones se mantienen constantes El rendimiento
promedio de gasolina para el motor A es de 36 millas por galoacuten y el promedio
para el motor B es 24 millas por galoacuten Encuentre un intervalo de confianza de
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
96 sobre la diferencia promedio real para los motores A y B Suponga que las
desviaciones estaacutendar poblacionales son 6 y 8 para los motores A y B
respectivamente
Solucioacuten
Es deseable que la diferencia de medias sea positiva por lo que se
recomienda restar la media mayor menos la media menor En este caso seraacute la
media del motor B menos la media del motor A
El valor de z para un nivel de confianza del 96 es de 205
343lt B- Alt857
La interpretacioacuten de este ejemplo seriacutea que con un nivel de confianza del
96 la diferencia del rendimiento promedio esta entre 343 y 857 millas por
galoacuten a favor del motor B Esto quiere decir que el motor B da mas rendimiento
promedio que el motor A ya que los dos valores del intervalo son positivos
DISTRIBUCIOacuteN DE MUESTREO DE PROPORCIONES
La necesidad de encontrar la proporcioacuten porcentaje o porciento de una
situacioacuten dada en una poblacioacuten es tarea frecuente en estadiacutestica La distribucioacuten
muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamantildeo extraiacutedas de una poblacioacuten junto con el conjunto de todas las
proporciones mueacutestrales
Ejemplo
Existen 6 vendedores en una compantildeiacutea los vendedores ABC fuman y los
vendedores XYZ no fuman considerando los vendedores como poblacioacuten y el
fumar como tipo de porcentaje se pide
a) Proporcion de numeros de fumadores considerando los datos de poblacion
ltmgtP=n(A)n(Omega)ltmgt
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
donde
P =gt Proporcion Poblacional
n(A) =gt Cantidad de eventos pedidos
ltmgtn(Omega)ltmgt =gt Tamantildeo de poblacion
P = 36 = 050
b) Desviacion Estandar de Poblacion
ltmgtdelta P = sqrt(PQ)ltmgt
P = Proporcion poblacional
Q = 1 - P
ltmgtdelta P = sqrt(050 050) = 050ltmgt
c) Cantidad de muestras de tamantildeo 4
ltsubgtNltsubgtCltsubgtnltsubgt
N =gt Tamantildeo de Poblacion
n =gt Tamantildeo de Muestra
ltsubgt6ltsubgtCltsubgt4ltsubgt = 15 muestras
d) Distribucion Muestral de Proporcion
Recordar que es el cuadro de las muestras y las p mueacutestrales
Donde p es el numero de elementos en la muestra que cumplen la caracteriacutestica
pedida dividida entre el tamantildeo de la muestra
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
CONCLUSIOacuteN
El propoacutesito de esta investigacioacuten fue conocer a fondo los distintos puntos
en la materia de la estadiacutestica tratados en el presente trabajo
En estadiacutestica una muestra estadiacutestica (tambieacuten llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacioacuten
estadiacutestica Las muestras se obtienen con la intencioacuten de inferir propiedades de
la totalidad de la poblacioacuten para lo cual deben ser representativas de la misma
Para cumplir esta caracteriacutestica la inclusioacuten de sujetos en la muestra debe seguir
una teacutecnica de muestreo En tales casos puede obtenerse una informacioacuten
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (veacuteanse
las ventajas de la eleccioacuten de una muestra maacutes abajo)
Por otra parte en ocasiones el muestreo puede ser maacutes exacto que el
estudio de toda la poblacioacuten porque el manejo de un menor nuacutemero de datos
provoca tambieacuten menos errores en su manipulacioacuten En cualquier caso el
conjunto de individuos de la muestra son los sujetos realmente estudiados
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
El nuacutemero de sujetos que componen la muestra suele ser inferior que el
de la poblacioacuten pero suficiente para que la estimacioacuten de los paraacutemetros
determinados tenga un nivel de confianza adecuado Para que el tamantildeo de la
muestra sea idoacuteneo es preciso recurrir a su caacutelculo
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis Third Edition
Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for Experimenters John
Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores Introduccioacuten
al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de Modelos Ed Revertsbquo
SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner (McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias Sociales
y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H (1998)
Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial Limusa
SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la Varianza
Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y Meacutetodosrdquo Ed
McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and Medical
Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression and
Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data Mining
Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial Bourgeoacuten
Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis Multivariante 5ordf
Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II Categorical and
Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e inferencia
Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta edicioacuten
Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e Inferencia
Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB Caracas-
Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc (1999)
SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de wwwspssparatodoscom
2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten Cientiacutefica
Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications to
Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y Economiacutea
Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in agriculture
and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo Editorial
Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers John
Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial Reverte
Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones Editorial
Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of Variance
and Experimental Designs Library of Congress Cataloging Publication Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp RAMOS H
(1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos Lineales y
Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores Spain
SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial Mir
Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti Caracas ndash
Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y procedimientos
Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1 Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II Anaacutelisis
Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows Volumen I
Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea 2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros Editorial
Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8 Estimacioacutenrdquo
Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage Learning Editores p
364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea Editorial
Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de CV
Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-del-
software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpdf
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_datosyM
ultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED2080020A
nE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION_
LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LINEAL20
SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRESION
_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simplepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
httpeswikipediaorgwikiMuestra_estadC3ADstica
httpeswikipediaorgwikiEstadC3ADstica
httpwwwmonografiascomtrabajos11tebastebasshtml
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=
httpwwwgooglecovesearchhl=esampq=QuC3A920son20los20valor
es20de20kappaampum=1ampie=UTF-
8amptbo=uamptbs=bks1ampsource=ogampsa=Namptab=wp
httpwikimapiaorglat=81016817amplon=-635361833ampz=17ampl=3ampm=b
httpwwwgooglecovesearchhl=esamptbo=1amptbs=bks3A1ampq=uso+del+valor
+esperado+estadisticaampaq=fampaqi=ampaql=ampoq=ampgs_rfai=