Para tener

180
UNIVERSIDAD POLITECNICA ESTATAL DEL CARCHI Escuela de Desarrollo Integral Agropecuario. Estadística Descriptiva

Transcript of Para tener

Page 1: Para tener

UNIVERSIDAD POLITECNICA ESTATAL

DEL CARCHI

Escuela de Desarrollo Integral Agropecuario.

Estadística Descriptiva

Page 2: Para tener

ESTADÍSTICA DESCRIPTIVA

Objetivo:

Informar sobre los propósitos generales de la Estadística y de la experimentación agrícola destacando su importancia en la generación de conocimiento y tecnología

Page 3: Para tener

La experimentación es un método científico de

investigación que consiste en planear y hacer

operaciones prácticas, a nivel de campo y

laboratorio, destinadas a demostrar, comprobar o

descubrir la naturaleza de los fenómenos biológicos o

de los principios básicos que los rigen.

La investigación científica consiste en la búsqueda

permanente de la verdad de los hechos, mediante el

uso de métodos objetivos, adecuados y precisos.

Page 4: Para tener

El investigador agropecuario en su trabajocotidiano se enfrenta a dos tareas fundamentales:

• Descubrir y entender las complejas relaciones entre

variables

• Alcanzar este objetivo a pesar de que los datos estén

contaminados con error experimental

Sir Ronald Fisher mostró como los métodosestadísticos, y en particular el diseño deexperimentos, ayudan a resolver estosproblemas. El fue quien desarrolló y usó porprimera vez el análisis de varianza comoherramienta fundamental para el análisisestadístico.

Page 5: Para tener

El análisis estadístico de una población o universo de datos tiene

como objetivo final descubrir las características y propiedades de

aquello que generó los datos.

Por ejemplo, se tiene una población de plantas frutales y se les

mide la altura. El conjunto de datos de altura constituye una

población o universo estadístico. El análisis de estos datos de

altura sirve para caracterizar la población de plantas frutales.

Si un técnico controla un proceso agroindustrial y recoge una

serie de mediciones que luego las analiza, no es porque esté

interesado en jugar con los números, sino porque a través de los

datos numéricos puede evaluar el comportamiento del proceso,

que es lo que realmente le interesa.

Page 6: Para tener

El proceso de investigación y transferencia de tecnología

debe concebirse como un proceso continuo de demanda-

oferta-demanda de tecnología.

Los problemas agroproductivos, las alternativas de

solución y los métodos de investigación se definen

participativamente con los actores de la cadena

productiva: Investigadores, productores, organizaciones,

asesores técnicos, comercializadores, procesadores,

industriales y consumidores

Page 7: Para tener

Investigadores yLíderes de productores

Asesores técnicos-Capacitadores - Promotores

Organizaciones de productores

Dominio de recomendación

Dirección del proceso

Generación Validación Transferencia y

capacitaciónAdopción

Retroalimentación

Page 8: Para tener

La generación de tecnología es un proceso de obtención de

conocimientos, información y recomendaciones útiles para

resolver uno o más factores limitantes de la producción

agropecuaria, mediante la experimentación científica.

GENERACIÓN DE TECNOLOGÍA

Ejemplo: Efecto de la fertilización nitrogenada y del riego

sobre el rendimiento del Cacao de la variedad

Nacional, en la zona de Jipijapa, provincia de

Manabí.

Page 9: Para tener

Investigadores

Extensionistas

Docentes

Asesorestécnicos

Lideresdel sector

Promotores comunitarios

Agricultores(as)

Conocimiento científico+

Conocimiento localComunidades

Organizaciones

Conocimiento científico y conocimiento local

Page 10: Para tener

La validación de tecnología es una fase de la investigación

agrícola aplicada que se orienta a probar la validez de las

recomendaciones técnicas en diversos ambientes y confirmar

los resultados experimentalmente.

Este proceso de verificación permite, además, incrementar la

confianza en la recomendación técnica, adaptar los

procedimientos a las particulares circunstancias socio

económicas y ecológicas de las fincas de los productores y

demostrar sus bondades en condiciones comerciales.

VALIDACIÓN DE TECNOLOGÍA

Page 11: Para tener

Una alternativa tecnológica es aplicable a un Dominio de

Recomendación.

Este término se refiere al grupo de agricultores que tienen sus fincas en

un área geográfica con condiciones agro climáticas y socio económicas

similares y aplican prácticas agrícolas con un parecido nivel

tecnológico, de modo que la recomendación probada en una localidad

puede aplicarse, con una alta confianza, en las fincas de esa zona de

influencia.

Ejemplo: Comportamiento del clon de Cacao Nacional ETP-

103, en la zona de Archidona, provincia de Napo.

Page 12: Para tener

La transferencia de tecnología es una fase

complementaria de la investigación agrícola aplicada

que se orienta a difundir las bondades -en términos

productivos, económicos, sociales y ambientales- de

las recomendaciones técnicas, para promover su

adopción por parte de los productores.

La transferencia de tecnología y capacitación debe

planificarse de manera articulada a un sistema

integrado a otros instrumentos para el desarrollo y la

participación de actores institucionales y gremiales.

TRANSFERENCIA DE TECNOLOGÍA Y CAPACITACIÓN

Page 13: Para tener

• Generar información útil para innovar los procesos deproducción vegetal y animal

• Adquirir conocimientos sobre las relaciones entre lasplantas cultivadas, los animales y hombre, y de estos conel ambiente biofísico donde se desarrollan

• Identificar alternativas tecnológicas para corregir ycontrolar los factores que limitan la obtención de losniveles óptimos de producción agropecuaria

• Aprovechar racionalmente los recursos naturales,económicos y tecnológicos

• Contribuir al desarrollo sostenible del sector agropecuario ydel país.

OBJETIVOS DE LA EXPERIMENTACIÓN AGRÍCOLA

Page 14: Para tener

VARIACIÓN BIOLÓGICA

Objetivo:

Analizar los principios de la variabilidad biológica, cuantitativa y cualitativa, las escalas de medición y su importancia en la experimentación científica

Page 15: Para tener

La variación biológica es la tendencia de todos los seres vivos

a diferenciarse unos de otros. Es una propiedad de los seres

vivos (vegetales y animales).

En la naturaleza no existen individuos exactamente iguales,

cuando mucho son parecidos.

Los gemelos idénticos, los clones y los híbridos tienden a ser

similares en sus características genotípicas y fenotípicas. Sin

embargo, por los condiciones del ambiente (entorno) tienden a

diferenciarse.

Page 16: Para tener

Factor genético (G)

Influencia del medio ambiente (A)

Interacción del genotipo y el medio ambiente (G.A)

Efectos mutacionales

La variación biológica se debe a los siguientes factores:

Todo carácter o rasgo fenotípico de un individuo que presenta

variación se conoce como variable.

Estas variaciones pueden ser medidas usando instrumentos de

medición o mediante apreciaciones subjetivas.

Page 17: Para tener

La variación continua es aquella donde se observa una continuidad de

los efectos que determinan un carácter fenotípico de un individuo o de

los individuos de una población.

La variación continua se asocia un carácter de herencia cuantitativa

(intervienen gran cantidad de genes) y se puede representar en la

denominada distribución normal.

Esta variación se mide usando instrumentos de medición (por ejemplo:

balanza, regla graduada, calibrador de Vernier, espectrofotómetro) y

en base de escalas de intervalo constante.

TIPOS DE VARIABILIDAD BIOLOGICA

La variación biológica puede ser continua o discontinua.

VARIACIÓN CONTINUA

Page 18: Para tener

A la variación continua se asocian los caracteres cuantitativos o métricos

como: Altura de planta y Peso de los frutos.

La variación continua se manifiesta en el fenotipo de los seres vivos

(variables cuantitativas) y depende del genotipo, ambiente e interacción

genotipo x ambiente.

Fenotipo de un individuo = Genotipo + Ambiente + Interacción genotipo x ambiente

F= f (G + A + G.A)

Page 19: Para tener

La variación discontinua es la tendencia, que se observa en los individuos

y las poblaciones vegetales y animales, a presentar discontinuidad en sus

rasgos o caracteres; es decir, que los fenotipos son fácilmente diferenciables

en forma visual.

En este caso las diferencias entre los individuos son de naturaleza

cualitativa.

Ejemplo: Color de los

frutos

1. Rojos

2. Amarillos

VARIACIÓN DISCONTINUA

Page 20: Para tener

Los efectos mutacionales se expresan en la variación cualitativa de un rasgo o

carácter fenotípico.

Un caso de mutación podría describirse si en una población de plantas de porte

alto, de manera casual se encuentra una planta enana que en las generaciones

posteriores reproduce esta característica.

Los efectos mutacionales se expresan en una variación de naturaleza

discontinua de los caracteres fenotípicos.

Page 21: Para tener

La medición de la variación constituye el acto de registrar la

información (toma de datos) de cada variable, en los individuos que

conforman una muestra o población, empleando escalas.

A cada escala de medición le corresponde un cierto conjunto de

operaciones admisibles.

ESCALAS DE MEDICIÓN DE LA VARIABILIDAD

Page 22: Para tener

Las escalas de medición pueden ser:

Nominal,

Ordinal,

De intervalo constante sin cero real; y,

De intervalo constante con cero real.

Page 23: Para tener

La medición de variables discontinuas en escala nominal se da en un

nivel elemental por clasificación cualitativa, sin relación entre sí.

Las medidas en escala nominal simplemente nombran o etiquetan los

caracteres cualitativos.

ESCALA NOMINAL

Page 24: Para tener

Las letras, solo tienen el propósito de etiquetar un listado de

cultivos o variedades, respectivamente.

Las principales características de la escala nominal se

representan en los siguientes elementos:

Relaciones definidas: Equivalencia

Técnicas estadísticas: No paramétricas

Operaciones admisibles: Moda, distribución de frecuencias y coeficiente de

contingencia

Page 25: Para tener

Ejercicio: Clasificar las variedades de café cultivadas en el Ecuador, según el color de los frutos

Page 26: Para tener

La medición en escala ordinal de individuos u objetos considera la relación entre

categorías, estableciendo un orden o rango.

Ejemplo: Escala para clasificar las variedades de café por su grado de resistencia a la roya

ESCALA ORDINAL

Page 27: Para tener

Relaciones definidas: Equivalencia de mayor a menor

Técnicas estadísticas: No paramétricas

Operaciones admisibles: Moda, Frecuencias, mediana,

percentiles, Correlaciones rs de

Sperman; R y W de Kendall.

La escala ordinal se caracteriza por los

siguientes elementos:

Page 28: Para tener

Ejercicio: Clasificación de las variedades de café cultivadas en el

Ecuador en relación a los diferentes grados de resistencia a

la roya.

Page 29: Para tener

La escala de intervalo constante sin cero real tiene los elementos de la escala

ordinal y, además, permite conocer la distancia entre dos números

consecutivos de la medición, a partir de un cero arbitrario.

ESCALA DE INTERVALO CONSTANTE SIN CERO REAL

Ejemplos de escalas de intervalo constante sin cero real:

• Medición de la temperatura (grados centígrados o grados Fahrenheit:

• F0 = 9/5 C0 + 32).

• Medición del tiempo en horas (cero horas = 24HOO).

• Medición de la latitud geográfica (la línea equinoccial es latitud 0°).

Page 30: Para tener

Relaciones definidas: Equivalencia de mayor a menor, proporción conocida de

intervalo en la escala de medición.

Técnicas estadísticas: Paramétricas y no paramétricas

Operaciones admisibles: Media, correlación r de Pearson, correlaciones múltiples,

desviación estándar y todas las pruebas no

paramétricas.

Esta escala de medición tiene las siguientes características:

Page 31: Para tener

La escala de intervalo constante con cero real tiene en su origen un punto

0; los datos son obtenidos mediante mediciones empleando instrumentos

(p.e.: cinta métrica, balanza), de esta manera se conoce la distancia entre

dos números consecutivos de la medición y se consideran como verdaderos

números.

ESCALA DE INTERVALO CONSTANTE CON CERO REAL-RAZÓN OPROPORCIÓN

Ejemplos: * Altura de planta (m)

* Peso del fruto /planta (g).

Page 32: Para tener

Relaciones definidas: Equivalencia de mayor a menor, proporción

conocida de intervalo en la escala de medición,

valores reales de la escala.

Técnicas estadísticas: Paramétricas y no paramétricas

Operaciones admisibles: Media, correlación r de Pearson, correlaciones,

múltiples, media geométrica, desviación

estándar, coeficiente de variación y todas las

pruebas no paramétricas.

La escala de intervalo constante con cero real se caracteriza por los

siguientes elementos:

Page 33: Para tener

• Datos Discretos. Son los que resultan de hacer conteos y por lo general

son números enteros.

• Datos Continuos. Son los que resultan de hacer mediciones y pueden

asumir cualquier valor de la recta real.

Son aquellos que resultan de hacer mediciones o conteos. Seclasifican en dos subtipos:

TIPOS DE DATOS

• Cuantitativos; o,

• Cualitativos

Los datos obtenidos mediante el uso de las escalas demedición, pueden ser:

DATOS CUANTITATIVOS

Page 34: Para tener

• Datos Nominales. Son aquellos datos categóricos que pueden ser

codificados numéricamente pero donde hay una relación arbitraria

entre los números asignados y el valor de la variable.

• Datos Ordinales. Son aquellos que al ser codificados numéricamente

deben guardar una correspondencia entre los números asignados y el

verdadero valor de la variable.

Son aquellos que expresan atributos o categorías. Para facilitar el

análisis estadístico de este tipo de datos frecuentemente se codifican

a números. Esta codificación da lugar a dos subtipos de datos

categóricos:

DATOS CUALITATIVOS O CATEGÓRICOS

Page 35: Para tener

FORMAS DE RECOLECCIÓN DE DATOS

Datos existentes

• Fuentes primarias (encuesta, censo)

• Fuentes secundarias (literatura)

Datos no existentes

• Entrevista (personal, telefónica, por correo)

• Observación directa

• Ensayos

RECOLECCIÓN DE DATOS

Page 36: Para tener

CARACTERÍSTICAS DE UN INSTRUMENTO DE MEDICIÓN

Se refiere al grado de precisión en que un instrumento mide loque se desea medir.

Validez:

Confiabilidad:

Se refiere al grado en que su aplicación repetida, almismo sujeto u objeto, produce el mismo resultado.

Los factores que afectan la confiabilidad y la validez son: la improvisación,instrumentos no validados, lenguaje del instrumento y condiciones deambiente

Page 37: Para tener

ESTADÍSTICA DESCRIPTIVA

Objetivo: Conocer las aplicaciones del análisis de frecuencias,la descripción de una variable cuantitativa, estadística Descriptiva bidimensional y el análisis multivariado.

Page 38: Para tener

La estadística descriptiva tiene el propósito de describir los rasgos o caracteres

fenotípicos de las poblaciones vegetales o animales; así como, las características

de los objetos que son medibles mediante diferentes escalas, en determinadas

condiciones de tiempo y espacio.

Como parte de la estadística descriptiva se mencionan: el análisis de

frecuencias, las medidas de tendencia central y las medidas de dispersión y

diferentes técnicas de análisis bivariado y multivariado.

Page 39: Para tener

El análisis de frecuencias es una técnica NO PARAMÉTRICA que

permite interpretar los fenómenos biológicos. Este análisis puede ser en

uno o dos sentidos. El investigador deberá planear cuidadosamente la

recolección de datos para asegurar la calidad de la información

resultante.

Para el análisis de frecuencias se debe iniciar con una graficación de las

distribuciones para valorar los resultados y facilitar la interpretación.

ANÁLISIS DE FRECUENCIAS

Page 40: Para tener

En la investigación agropecuaria, normalmente se planea, registra y

analiza una variable que se define como la de mayor interés. Los datos

de la variable en estudio deben ser sometidos a un riguroso análisis para

poder generar información confiable.

El análisis de frecuencias, involucra cálculos y graficaciones de los datos

obtenidos en el muestreo.

DISTRIBUCIÓN DE FRECUENCIAS DE UNAVARIABLE

Page 41: Para tener

Ejercicio: Realizar un análisis de frecuencias de los siguientes datos de producción de café cereza:

7601228030

7501046029

730930028

6501155027

650850026

650148025

640735024

580625023

550275022

500267021

4802513620

4602911519

4501845018

4501440017

4501335016

450543015

4301545014

4001745013

400476012

3502465011

3501675010

33037309

300286508

280306407

250235806

25024505

136204004

115193303

7021250250226501

gramosN° observación(gramos)N° observación

Producción café cerezaPlantaProducción cafécereza

Planta

Datos OrdenadosDatos de campo

Page 42: Para tener

8Variabilidad relativa (%)

46Coeficiente de variación (%)

36Error estándar

197Desviación estándar

38823Varianza

450Moda

450Mediana

430Media

710Rango

Cálculo de estadísticos

Page 43: Para tener

Análisis de frecuencias

10030TOTAL

100103III700<

90206IIIIII501 – 700

704313IIIIIIIIIIIII

301 – 500

27206IIIIII101 – 300

772II< 100

acumulada%absolutadatosGramos /planta

Frecuencia relativa

Frecuencia relativa

FrecuenciaControl deIntervalo de clase

10030TOTAL

100103III700<

90206IIIIII501 – 700

704313IIIIIIIIIIIII

301 – 500

27206IIIIII101 – 300

772II< 100

acumulada%absolutadatosGramos /planta

Frecuencia relativa

Frecuencia relativa

FrecuenciaControl deIntervalo de clase

Page 44: Para tener

Histograma

0

2

4

6

8

10

12

14

<100 101 - 300 301 - 500 501 - 700 700<

Producción/planta (g)

Fre

cu

en

cia

0

2

4

6

8

10

12

14

<100 101 - 300 301 - 500 501 - 700 700<

Producción/planta (g)

Fre

cu

en

cia

Polígono de frecuencias

Histograma

0

2

4

6

8

10

12

14

<100 101 - 300 301 - 500 501 - 700 700<

Producción/planta (g)

Fre

cu

en

cia

0

2

4

6

8

10

12

14

<100 101 - 300 301 - 500 501 - 700 700<

Producción/planta (g)

Fre

cu

en

cia

Polígono de frecuencias

Page 45: Para tener

Ojiva:Graficación lineal de la frecuencia relativa acumulada

Categorías (gramos)

Por

ciento

7

27

70

100

90

Categorías (gramos)

Por

ciento

7

27

70

100

90

Page 46: Para tener

Método STEM & LEAF

Es un método de representación de un histograma de distribución dibujando los datos.

6050307

5050406

8050005

806050505030004

505030003

8050502

36151

70500

Tallo Hojas

6050307

5050406

8050005

806050505030004

505030003

8050502

36151

70500

6050307

5050406

8050005

806050505030004

505030003

8050502

36151

70500

Tallo Hojas

Ejercicio: S & L de la producción de café cereza (gramos / planta)

Page 47: Para tener

Cuartiles

El análisis de los cuartiles es una técnica de análisis de la

distribución de datos. Para ello se procede de la

siguiente manera:

• Ordenar las observaciones en orden creciente y localizar lamediana.

• El primer cuartil Q1 es la mediana de las observaciones situadas ala izquierda de la mediana de la distribución.

• El tercer cuartil Q3 es la mediana de las observaciones situadas a laderecha de la mediana de la distribución

Page 48: Para tener

Los cuartiles son medidas de tendencia no central de una distribución.

Los datos ordenados se dividen en 4 cuartos iguales:

El segundo cuartil de una distribución es su mediana.

El Rango Intercuartil es la diferencia entre el tercer y el primer cuartil (Q3-Q1).

25% 25% 25% 25%

Q1 Q2 Q3

25% 25% 25% 25%

Q1 Q2 Q3

290 450 610Gramos café cereza/planta

610 – 290 = 320 gramos café cereza/planta

Page 49: Para tener

Percentiles

Los percentiles son otro conjunto de medidas detendencia no central de una distribución.

Dividen los datos ordenados en 100 partes iguales.

Percentil 25 = 290 gramos café cereza/planta

Percentil 50 = 450 gramos café cereza/planta

Percentil 75 = 610 gramos café cereza/planta

Page 50: Para tener

Diagrama de caja

Los cinco números que resumen una distribución dedatos son representados gráficamente por undiagrama de caja.

L = Observación máxima

Q3 = Tercer cuartil

Q2 = Mediana

Q1 = Primer cuartil

S = Observación mínima

Page 51: Para tener

Los lados inferior y superior de la caja van del primer al tercercuartil. Por tanto, la altura de la caja es la amplitud del 50% delos datos centrales.

El segmento del interior de la caja indica la mediana. Losextremos de los segmentos perpendiculares a los lados superiore inferior indican, respectivamente, los valores máximo ymínimo de la distribución de datos.

S LQ1 Q2Q3

50 g 760 g290 g 450 g 610 g

S LQ1 Q2Q3

50 g 760 g290 g 450 g 610 g

Page 52: Para tener

DISTRIBUCIÓN DE FRECUENCIAS DE DOSVARIABLES

La distribución de frecuencias de dos variables, también denominada en

dos sentidos, significa que se analizan dos variables de manera simultánea.

Por ejemplo, analizar la producción de frutos y la altura de las plantas; la

producción de frutos y el área foliar, la producción de frutos y el diámetro

del tallo.

Page 53: Para tener

876012528030

1075010846029

117309630028

9650111455027

46508750026

86501848025

66407935024

1158061225023

145502745022

75002637021

848025613620

846029511519

15450181545018

1045014640017

945013835016

44505543015

5430151045014

640017945013

84004876012

935024965011

8350161075010

43303117309

63002846508

52803066407

1225023115806

10250244505

61362084004

51151943303

37021102502

4502286501

gramos

Porcentaje degrano vano

Producción café cereza

gramosPlantaN° observación

Porcentaje de grano vanoProducción café cerezaPlanta

N° observación

Ejercicio: Considerando los datos de producción por planta (gramos de café cereza) y del porcentaje de grano

vano, realizar un análisis de frecuencias en dos sentidos.

Page 54: Para tener

Cálculo de estadísticos

78Variabilidad relativa (%)

3846Coeficiente de variación (%)

0,5536Error estándar

3197Desviación estándar

938823Varianza

8450Moda

8450Mediana

8430Media

12710Rango

Grano vano (%)Producción (g)Estadísticos

78Variabilidad relativa (%)

3846Coeficiente de variación (%)

0,5536Error estándar

3197Desviación estándar

938823Varianza

8450Moda

8450Mediana

8430Media

12710Rango

Grano vano (%)Producción (g)Estadísticos

Page 55: Para tener

Análisis de frecuencias de dos variables

10036,736,726,7POR CIENTO

1003011118TOTAL

103210700<

206321501 – 700

4313463301 – 500

206222101 – 300

72002< 100

8 <5 a 8< 5

TOTAL

PRODUCCIONGramos /planta

FRECUENCIARELATIVA

(%)

PROCENTAJE DE GRANO VANO

10036,736,726,7POR CIENTO

1003011118TOTAL

103210700<

206321501 – 700

4313463301 – 500

206222101 – 300

72002< 100

8 <5 a 8< 5

TOTAL

PRODUCCIONGramos /planta

FRECUENCIARELATIVA

(%)

PROCENTAJE DE GRANO VANO

Page 56: Para tener

Una variable cuantitativa puede describirse mediante

diferentes medidas que se clasifican en:

DESCRIPCIÓN DE UNA VARIABLE CUANTITATIVA

Medidas de tendencia central

Medidas de dispersión

Page 57: Para tener

Las medidas de tendencia central son:

Media (simple, aritmética, geométrica, ponderada)

Mediana

Moda

MEDIDAS DE TENDENCIA CENTRAL

Page 58: Para tener

Xi Máxima = 80

Xi Mínima = 54

Media simple = (80 + 54)/2 = 67

Ejercicio: En un registro de datos se tiene los siguientes valores de

peso: 54, 55, 55, 55, 56, 56, 57, 57, 58,58, 58, 59, 60,

60, 60, 60, 60, 62, 63, 64, 65, 65, 66, 67, 69, 70, 70, 71,

75, 77, 80.

Media simple

(Xi Máxima + Xi Mínima)

2X =

(Xi Máxima + Xi Mínima)

2

(Xi Máxima + Xi Mínima)

2

(Xi Máxima + Xi Mínima)

22X =

Page 59: Para tener

Media aritmética

Ejercicio: Con los datos indicados para la media simple, calcular la media aritmética:

x = 1942/31 = 62.6

n

Xi

X = n

Xi

X =

31

(54+55+55+55+56+56+57+57+58+58+58+59+60+60+60+60+60+62+63+64+65+65+66+67+69+70+70+71+75+77+80)

X =

31

(54+55+55+55+56+56+57+57+58+58+58+59+60+60+60+60+60+62+63+64+65+65+66+67+69+70+70+71+75+77+80)

31

(54+55+55+55+56+56+57+57+58+58+58+59+60+60+60+60+60+62+63+64+65+65+66+67+69+70+70+71+75+77+80)

X =

Page 60: Para tener

Clase Límite inferior Límite superior Media (M) Frecuencia (F) M.F

1 50 59 54,5 12 654,0

2 60 69 64,5 13 838,5

3 70 79 74,5 5 372,5

4 80 89 84,5 1 84,5

31 1949,5Suma

Cálculo de la media a partir de datos agrupados

A partir de datos agrupados en clases, se puede calcular la media con la fórmulasiguiente:

Media = M.F/n

Media = 1949.5/31 =62.89

Page 61: Para tener

Media geométrica

Ejercicio: Un clon de cacao produce un promedio de 10 mazorcas/año y otro clon de cacao produce un

promedio de 60 mazorcas/año. Si estos dos clones se cruzan ¿Cuál es la media de producción

esperada en la primera descendencia?

X =n

(X1 . X2 . Xn)1 2 . nX =

n

(X1 . X2 . Xn)1 2 . n

n

(X1 . X2 . Xn)1 2 . n

X1 = 10

X2 = 60

Media geométrica = (10 x60)0.5

= 24.49 unidades

Page 62: Para tener

La media ponderada es un estadístico que se usa cuando hay diferentes frecuencias de datos. La

fórmula para el cálculo de este tipo de media es la siguiente:

Media ponderada

X =

W i

[ Wi Xi]

X =

[ Wi Xi][ Wi Xi]

X =

[ Wi Xi][ Wi Xi]

X =

[ Wi Xi] WiX

i

X =

W i

[ Wi Xi][ Wi Xi]

X =

[ Wi Xi][ Wi Xi]

X =

[ Wi Xi][ Wi Xi]

X =

[ Wi Xi] WiX

i

0.282000Septiembre

0.453600Agosto

0.251500Julio

Precio (X)dólares/litro

Producción mensual (W)litros

Mes

0.282000Septiembre

0.453600Agosto

0.251500Julio

Precio (X)dólares/litro

Producción mensual (W)litros

Mes

Ejercicio: En una finca, por tres meses consecutivos, venden su producción mensual de

leche (litros), a diferentes precios (dólares/litro) según la siguiente descripción:

¿Cuál es el precio promedio/litro?

X = 2555/7100 = 0.36 dólares/litro

Media ponderada= 1500x0.25 + 3600x0.45 + 2000x0.28

1500+3600+2000

Page 63: Para tener

La Mediana (Md) es el valor central de un grupo

ordenado de datos.

Mediana

Ejercicio: Determinar la mediana en la serie de datos expuestos para

el cálculo de las medias simple y aritmética.

El valor central en la serie de datos referida es el 60.

Md = 60

Page 64: Para tener

Ejercicio: En la serie de datos referidos para el cálculo de la media simple y

aritmética, estimar la moda

Moda

La Moda (Mod) es el valor mas frecuente en una serie ordenada de

datos.

En la serie de datos mencionada, el valor mas frecuente corresponde

al número 60.

Mod = 60

Page 65: Para tener

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión son:

Rango o amplitud

Varianza

Desviación estándar

Error estándar

Intervalo de confianza

Variabilidad relativa

Coeficiente de variación de la muestra.

Page 66: Para tener

El rango o amplitud (Rn) es la diferencia de valores extremos deuna serie de datos. Es una medida que permite definir cuanto se

alejan los puntos extremos con respecto a la media de una

muestra.

Rango o Amplitud

Rn = 80 – 54 = 26

Rn = Xi Máxima – Xi Mínima

Ejercicio: En la serie de datos expuesta para el cálculo de la media simple y

media aritmética, calcular el rango:

Page 67: Para tener

La varianza es una medida de dispersión que permite conocer la variabilidad de

un carácter o rasgo de objetos de una muestra o población, expresada en unidades

cuadráticas.

El estadístico correspondiente es la media de los cuadrados.

Varianza

Xi2 - (Xi)

2

nS2 =

n – 1

Xi2 - (Xi)

2

nS2 =

n – 1

Page 68: Para tener

Ejercicio: Considerando los siguientes datos, calcular la varianza

28.56Media

7.491257Suma

1.156349

1.089338

961317

900306

900305

784284

676263

625252

400201

X2Producción gramos/planta (X)Datos

Page 69: Para tener

Reemplazando los datos en la fórmula de la varianza, se tiene:

7491 - 9S2 = 152.22/8 =19.03

8

66049

7491 - 9S2 = 152.22/8 =19.03

8

66049

7491 - 9S2 = 152.22/8 =19.03

8

66049

7491 - 9S2 = 152.22/8 =19.03

8

66049

Datos: n = 9

Σ X = 257

(Σ X)2 = (257)2 = 66049

Σ X2 = 7491

Xi2 - (Xi)

2

nS2 =

n – 1

Xi2 - (Xi)

2

nS2 =

n – 1

Page 70: Para tener

La desviación estándar se expresa en las mismas unidades en que fueron

medidas las variables (kilos, libras, gramos, metros, centímetros, etc.) y se

define como la raíz cuadrada de la varianza. Matemáticamente es la

distancia sobre el eje de abscisas desde la media hasta el punto de inflexión

de una curva normal

Desviación estándar

S = S2S = S2

Page 71: Para tener

Muestreo de una distribución normal

Page 72: Para tener

Ejercicio: A partir de la varianza del ejercicio anterior,

calcular la desviación estándar.

La fórmula para calcular la desviaciónestándar es la siguiente:

S = 19.03 = 4.36 S = 19.03 = 4.36

S = S2S = S2

S2 = 19.03

Por lo tanto:

Page 73: Para tener

El error estándar permite conocer el campo probable de localización de la media de

la población μ. Cuando los datos provienen de un censo, el error estándar de la

media es igual a cero. En un muestreo siempre existe un margen de error en la

estimación de la media de la muestra que es un estimador de la media de la

población. El error estándar constituye la desviación estándar de las medias.

Error estándar

χ

EEx EE x

χ

EEx EE x

Page 74: Para tener

La fórmula para el cálculo del error estándar es la siguiente:

Ejercicio: Calcular el error estándar empleando los datos de la desviación

estándar (S = 4.36), y n = 9, del ejercicio anterior

S

nEE=

S

nEE=

4.36= 1.45 EE=

9

4.364.36= 1.45 EE=

9

Page 75: Para tener

El intervalo de confianza es un estadístico que se asocia con el nivel de significación fijado por

el investigador. En la agricultura se acepta un 95% de confianza; es decir, un máximo del 5%

como probabilidad de equivocarse, en una prueba de dos colas.

El intervalo de confianza permite estimar los límites superior e inferior de confianza, donde se

encontraría la media de la población, con la seguridad prefijada (95%). Como la curva de

distribución normal está asociada con el estadístico “Z”, cuando el nivel de significación es del

5%, se tiene:

α = 0.05

Z = 1.96 ≈ 2.0

Definido el nivel de significación estadística en 5%, el cálculo del intervalo de confianza (IC)

se reduce a la siguiente fórmula: IC = 1.96 (EE) ≈ 2 EE

Intervalo de confianza

Page 76: Para tener

Ejercicio: Considerando los datos del ejercicio de la varianza, calcular los límites superior e inferior de

confianza con una confianza del 95 por ciento.

Esto significa, que la media de la población μ puede encontrase, con el 95 % de confianza, entre los límites superior e inferior:

X ± 2 EE: 28.56 ± 2.9

Límite inferior de confianza LIC = 25.66Límite central o media LC = 28.56 Límite inferior de confianza LSC = 31.46

X = 28.56X = 28.56

EE = 1.45IC = 2 EE IC = 2 (1.45) = 2.9

Page 77: Para tener

La variabilidad relativa es un estadístico que también permite medir la variabilidad biológica

intrínseca y es muy empleada en estudios entomológicos y de dinámica de poblaciones (ecología

cuantitativa)

6.2.2.6. Variabilidad relativa

Ejercicio: Con los datos del Error estándar y media del ejercicio anterior, calcular la variabilidad

relativa.

EEVR % = . 100EEEE

x

EEEEVR % = . 100EEEE

x

1.45VR % =

28.56

. 1001.451.45

VR % =28.56

. 100

VR % = 5.08

X = 28.56

EE = 1.45

X = 28.56

EE = 1.45

Page 78: Para tener

DEFINICIONES BASICAS DE ESTADISTICA

ESTADISTICA

DESCRIPTIVA INFERENCIAL

POBLACIONESNo de personas UPEC

MUESTRANo de personas 1er año.

VARIABLES

CUALITATIVAS

CUANTITATIVAS

CONTINUAS

DISCRETAS

Page 79: Para tener

PRESENCIA DE UNA MARCA A NIVEL MUNDIAL

POBLACION•El Mundo entero

MUESTRA•Ciudades más representativas

VARIABLE•No de sucursales

TIPO DE VARIABLE

•Cuantitativa discreta

Page 80: Para tener

PESO REPORTADO POR LA POBLACIÓN INFANTIL DE TULCÁN

POBLACION•Niños que viven en la ciudad

MUESTRA•Edad entre 5 y 9 años

VARIABLE•Peso reportado en Kg

TIPO DE VARIABLE

•Cuantitativa continua.

Page 81: Para tener

GUSTOS MUSICALES EN LA COMUNIDAD JUVENIL DE LA UPEC

POBLACION• Jóvenes de la UPEC

MUESTRA• Comunidad juvenil entre 20 y 22 años

VARIABLE•Genero musical preferido

TIPO DE VARIABLE

• Cualitativa

Page 82: Para tener

FRECUENCIA ABSOLUTA Y FRECUENCIA ABSOLUTA ACUMULADA

VARIABLE DATOS No de Individuos

REPETICIONES

CUANTITATIVA FRECUENCIA

CUALITATIVA

Page 83: Para tener

ABSOLUTA n

FRECUENCIA

ABSOLUTA ACUMULADA N

PRENDAS DE VESTIR n N

CORBATA 10 10

N= 20 CASUAL 5 15

INFORMALMENTE 5 20

Page 84: Para tener

CONTEO DE DATOS

Se reportan los datos

correspondientes a la edad de

20 estudiantes, en el curso de Estadística

19 17 18 20 17

20 21 18 18 19

18 20 19 18 18

19 18 16 17 20

N= 20

Xi ni Ni

16 1 1

17 3 4

18 7 11

19 4 15

20 4 19

21 1 20

Page 85: Para tener

Se presentan los géneros musicales

preferidos por 15 habitantes de una misma cuadra

Rock Jazz Clásica Latina Latina

Jazz ClásicaClásica Rock Rock

Clásica Latina Rock Jazz Rock

N= 15

Xi ni Ni

Rock 5 5

Jazz 3 8

Clásica 4 12

Latina 3 15

Page 86: Para tener

FRECUENCIA RELATIVA Y FRECUENCIA RELATIVA ACUMULADA

FRECUENCIA

ABSOLUTA RELATIVA

(ni)

fi= ni/N (%) (fi)

ABSOLUTA ACUMULADA

RELATIVA ACUMULADA

(Ni) (Fi)=100%

Fi=Ni/N (%)

Page 87: Para tener

Se presentan los géneros musicales

preferidos por 15 habitantes de una misma cuadra

Rock JazzClásic

a Latina Latina

JazzClásic

aClásic

a Rock Rock

ClásicaLatina Rock Jazz Rock

N= 15

Xi ni Ni

Rock 5 5

Jazz 3 8

Clásica 4 12

Latina 3 15

Xi ni Ni fi Fi

Rock 5 5 33% 33%

Jazz 3 8 20% 53%

Clásica 4 12 27% 80%

Latina 3 15 20% 100%

Page 88: Para tener

CONSTRUCCION DE UNA TABLA DE FRECUENCIAS

Se reportan los datos correspondientes a la

edad de 20 estudiantes, en el curso de Estadística

19 17 18 20 17

20 21 18 18 19

18 20 19 18 18

19 18 16 17 20

XiCATEGORIAS DE DATOS

Xi ni Ni fi Fi

16 1 1 5% 5%

17 3 4 15% 20%

18 7 11 35% 55%

19 4 15 20% 75%

20 4 19 20% 95%

21 1 20 5% 100%

Page 89: Para tener
Page 90: Para tener
Page 91: Para tener
Page 92: Para tener
Page 93: Para tener
Page 94: Para tener
Page 95: Para tener
Page 96: Para tener
Page 97: Para tener
Page 98: Para tener

ESTADISTICA

DESCRIPTIVA

Page 99: Para tener

ESTADISTICA

DESCRIPTIVA

Page 100: Para tener

ESTADISTICA

DESCRIPTIVA

Page 101: Para tener

ESTADISTICA

DESCRIPTIVA

Page 102: Para tener

ESTADISTICA

DESCRIPTIVA

Page 103: Para tener

ESTADISTICA

DESCRIPTIVA

Page 104: Para tener

ESTADISTICA

DESCRIPTIVA

Page 105: Para tener

ESTADISTICA

DESCRIPTIVA

Page 106: Para tener

ESTADISTICA

DESCRIPTIVA

Page 107: Para tener

ESTADISTICA

DESCRIPTIVA

Page 108: Para tener

ESTADISTICA

DESCRIPTIVA

Page 109: Para tener

ESTADISTICA

DESCRIPTIVA

Page 110: Para tener

ESTADISTICA

DESCRIPTIVA

Page 111: Para tener

ESTADISTICA

DESCRIPTIVA

Page 112: Para tener

ESTADISTICA

DESCRIPTIVA

Page 113: Para tener

ESTADISTICA

DESCRIPTIVA

Page 114: Para tener

ESTADISTICA

DESCRIPTIVA

Page 115: Para tener

ESTADISTICA

DESCRIPTIVA

Page 116: Para tener

ESTADISTICA

DESCRIPTIVA

Page 117: Para tener
Page 118: Para tener
Page 119: Para tener
Page 120: Para tener
Page 121: Para tener
Page 122: Para tener
Page 123: Para tener
Page 124: Para tener
Page 125: Para tener
Page 126: Para tener
Page 127: Para tener
Page 128: Para tener
Page 129: Para tener
Page 130: Para tener
Page 131: Para tener
Page 132: Para tener
Page 133: Para tener
Page 134: Para tener
Page 135: Para tener
Page 136: Para tener
Page 137: Para tener
Page 138: Para tener
Page 139: Para tener
Page 140: Para tener
Page 141: Para tener
Page 142: Para tener
Page 143: Para tener
Page 144: Para tener
Page 145: Para tener
Page 146: Para tener
Page 147: Para tener
Page 148: Para tener
Page 149: Para tener
Page 150: Para tener
Page 151: Para tener
Page 152: Para tener
Page 153: Para tener
Page 154: Para tener
Page 155: Para tener
Page 156: Para tener
Page 157: Para tener
Page 158: Para tener
Page 159: Para tener
Page 160: Para tener
Page 161: Para tener
Page 162: Para tener
Page 163: Para tener
Page 164: Para tener
Page 165: Para tener
Page 166: Para tener
Page 167: Para tener
Page 168: Para tener
Page 169: Para tener
Page 170: Para tener
Page 171: Para tener
Page 172: Para tener
Page 173: Para tener
Page 174: Para tener
Page 175: Para tener
Page 176: Para tener
Page 177: Para tener
Page 178: Para tener
Page 179: Para tener
Page 180: Para tener