Bioestadistica tabala de frecuencia

28
Tabla de Frecuencia según tipo de tipo de variables BIOESTADISTI CA Gialina Toledo Méndez Maestría en Salud Pública con mención en Epidemiología gialina27@ gmail.com

Transcript of Bioestadistica tabala de frecuencia

Page 1: Bioestadistica tabala de frecuencia

Tabla de Frecuencia según

tipo de tipo de variables

BIOESTADISTICA

Gialina Toledo Méndez

Maestría en Salud Pública con mención en Epidemiología

gialina27@ gmail.com

Page 2: Bioestadistica tabala de frecuencia

Población o universo: Es un conjunto grande y completo de individuos, elementos o unidades que presentan características comunes y observables.EJM: Todos los pacientes atendidos con cancer en el año 1992 en el hospital “ x”.

Page 3: Bioestadistica tabala de frecuencia

Muestra: Es un subconjunto de la población:

Ejm: Si la población consiste en un total de pacientes atendidos con cancer en el año 1992, una muestra sería el número de pacientes atendidos con cancer en el mes de febrero año 1992.

Observaciones: Estadísticamente son los datos que se recolectan para un estudio.

Unidades de observación: constituyen los elementos o cosas observadas.

Page 4: Bioestadistica tabala de frecuencia

Variables: Se definen las variables, como magnitudes que tienden a sufrir modificaciones o cambio dentro de un dominio determinado.

Es decir las características que varían de individuo a individuo o de objeto a objeto se llaman variables mientras que las que permanecen inalterables se llaman constantes.

Page 5: Bioestadistica tabala de frecuencia

Clasificación de las variables según su naturaleza

variables

CUALITATIVAS

CUANTITATIVAS

-DISCRETAS

- CONTINUAS

ESCALA DE MEDICION

NOMINAL

INTERVALO

RAZON O PROPORCION

ORDINAL

Page 6: Bioestadistica tabala de frecuencia

a) Variables cualitativas Nominales:

Aquellas cuyo dominio de variación son objeto de clasificación

Ejm: VARIABLE DOMINIO DE VARIACION

sexo masculino

femenino

Distrito de Lima

residencia San Isidro

Miraflores

Villa el Salvador

b) Variables ordinales:

Son aquellas cuyo dominio de variación son objeto de clasificación y orden.

Ejm: V. Nivel de Instrucción: Analfabeto, Primaria, Secundaria, Superior

Page 7: Bioestadistica tabala de frecuencia

C) V. Cuantitativas: Son aquellas cuyos valores de dominio de variación son contados o medidos, se clasifican en:

Cuantitativa Discreta: Cuando los valores del dominio de variación son contados; y por lo tanto solo pueden asumir valores enteros.

Ejm: Numero de nacidos vivos: 100 niños

150 niños

200 niños

Cuantitativa Continua : Cuando los valores del dominio de variación son susceptibles de ser medidos. Pueden asumir valores decimales.

Ejm: Peso: 56.5Kgs.

58.7 Kgs.

60.0 Kgs.

Page 8: Bioestadistica tabala de frecuencia

CLASIFICACION DE DATOS

La clasificación tiene por objeto organizar los datos en categorías, pero teniendo en cuenta la escala de medición de las variables:

Clasificación de los datos medidos a nivel nominal u ordinal ( V. cualitativas):

Para elaborar datos que pertenecen a variables nominales y ordinales, es necesario conocer como se clasifica la variable, y luego se procede a la tabulación.

Page 9: Bioestadistica tabala de frecuencia

Ejemplo:GRADO DE INSTRUCCION

FRECUENCIA O CANTIDAD

( )

FRECUENCIA RELATIVA

( )

FRECUENCIA RELATIVA %

ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

TOTAL

GRADO DE DESNUTRICION

FRECUENCIA O CANTIDAD

( )

FRECUENCIA RELATIVA

( )

FRECUENCIA RELATIVA %

GRADO I GRADO II GRADO III

TOTAL

CATEGORIA OCUPACIONAL

FRECUENCIA O CANTIDAD

( )

FRECUENCIA RELATIVA

( )

FRECUENCIA RELATIVA %

EMPLEADO OBRERO INDEPENDIENTE

TOTAL

DISTRIBUCION DE INGRESOS

FRECUENCIA O CANTIDAD

( if )

FRECUENCIA RELATIVA

( ih )

FRECUENCIA RELATIVA %

%ih

ALIMENTACION VIVIENDA SALUD RECREACION Y CULTURA

TOTAL

Page 10: Bioestadistica tabala de frecuencia

CLASIFICACION DE LOS DATOS MEDIDOS A NIVEL DE INTERVALO O DE RAZON

VARIABLE CUANTITATIVA

La elaboración de datos cuyas variables pertenecen a la escala de intervalo o de razón, tienen otro tipo de tratamiento, ya que para su organización y posterior análisis, es necesario agruparlos en clases o intervalos. Esta forma de organización se conoce con el nombre DISTRIBUCION DE FRECUENCIAS.

Page 11: Bioestadistica tabala de frecuencia

EjemploConsumo de proteínas (medido en gr.) en una muestra de 20 niños entre 1 a 6 años de edad, y que corresponden al estudio de los niños desnutridos de la comunidad “x” San Martín de Porres. Los datos son los siguientes:

21 25 35 22 18 24 21 23 16 23 27 17 26 19 29 20 19 20 23 22

Al observar los datos podemos apreciar su variabilidad y también el desorden en que se encuentra, haciéndose difícil el análisis lo cual no permite destacar los hechos más importantes para obtener conclusiones acertadas que ayuden en la toma de decisiones. De allí que se hace necesario ordenar los datos en TABLA DE DISTRIBUCION DE FRECUENCIAS.

Page 12: Bioestadistica tabala de frecuencia

Para elaborar una tabla de distribución de Frecuencias, se debe seguir los siguientes pasos:

a ) Cálculo de Rango o recorrido (R)

El Rango se define como la distancia entre el dato máximo y el dato mínimo.

Se halla restando el dato mayor ( ) con el dato menor ( )

maxX

minX

minmax XXR −=

RANGO DATO MAYOR

DATO MENOR

Page 13: Bioestadistica tabala de frecuencia

maxX

Para el ejemplo que nos ocupa:

= 35

minX = 16

Luego: R = 35 – 16 = 19

b ) Determinación del Numero de Clase ( K)Numero de clases, es el número de categorías o intervalos en el que se va a dividir la información.

REGLA DE STURGES:

K = 1+3.32 Log( n)

NUMERO DE CLASES

LOGARITMO

NUMERO DE DATOS

Page 14: Bioestadistica tabala de frecuencia

• Para el ejemplo propuesto:• K = 1 + 3.3Log (20)• K = 1+(3.3) (1.30)• K = 1+ 4.29• K= 5.29 K =5 (*) • Esto significa que la información se dividirá en 5 clases:

•(*) = El valor de K debe redondearse siempre al entero mas próximo

i

1 2 3 4 5

K

Page 15: Bioestadistica tabala de frecuencia

c) Determinación de la amplitud intervalica (w) = ( c )

• Llamado también ancho de clase, la amplitud es la cantidad de datos que están comprendidos en un intervalo de clase.

• Un intervalo se forma por dos límites que van a definir una clase.• Limites son los valores extremos de un intervaloy son de dos tipos:

limite superior y limite inferior. Cuando un intervalo no tiene límite superior o inferior, se llama intervalo de clase abierto.

• En tonces se define la amplitud del intervalo (w) como la distancia entre el límite inferior y superior de un intervalo:

Amplitud del Intervalo

W = R

K

Rango

Número de clases

Page 16: Bioestadistica tabala de frecuencia

Para el ejemplo: w = 19 = 3.8

5W = 4

d) Formación de los intervalos de Clase: )( Ii

(*)

(*)= El valor W, se redondea al entero sólo si los datos son enteros o discretos. Si los datos proporcionados están en decimales, W se redondea de acuerdo al número de decimales de la información

Formar los intervalos de clase, significa hallar los límites inferior y superior de cada intervalo; y para ello se parte del dato menor

Y se le suma la amplitud del intervalo( W = 4), de la siguiente manera:

)16( min =X

W: 1 2 3 4

16 17 18 19

Limite Inferior

Limite Superior

Intervalo

Primera Clase : 16 – 19

Page 17: Bioestadistica tabala de frecuencia

Luego 16 constituye el LIMITE INFERIOR Y 19 EL LIMITE SUPERIOR de la primera clase. Igual procedimiento se sigue con la segunda y hasta la quinta; de tal forma que se obtiene lo siguiente:

i

1 2 3 4 5

16 - 19 20 - 23 24 - 27 28 - 31 32 - 35

Una forma práctica de determinar los intervalos de clase, consiste en hallar primero todos los límites inferiores de cada clase, sumando al 1er. Límite inferior la amplitud del intervalo.

Así: 16 = Límimite inferior de la primera clase.

16+4 = 20 Límimite inferior de la segunda clase

20+4 = 24 Límimite inferior de la tercera clase

24+4 = 28 Límimite inferior de la cuarta clase

28+4 = 32 Límimite inferior de la quinta clase

Page 18: Bioestadistica tabala de frecuencia

Al límite inferior de la 2 da clase, se le resta una (01) unidad (*) para obtener el límite superior de la 1era clase; obtenido este, se le suma la amplitud del intervalo para obtener los límites superiores de cada clase.

Así:

20 – 1 = 19 Límite superior de la Primera clase

19 + 4 = 23 Límite superior de la segunda clase

23 + 4 = 27 Límite superior de la tercera clase

27 + 4 = 31 Límite superior de la cuarta clase

31 + 4 = 35 Límite superior de la quinta clase

Con lo cual nuevamente obtenemos:

i

1 2 3 4 5

16 - 19 20 - 23 24 - 27 28 - 31 32 - 35

(*)= Cuando se trata de números decimales se le resta un decimo ( 0.1), un centecimo( 0.01),un milesimo ( 0.001), según corresponda al número de decimales que contenga la información.

Page 19: Bioestadistica tabala de frecuencia

NOTA: Los intervalos no siempre vana a tener la misma amplitud. De acuerdo a la investigación y a la necesidad de presentar la información para su análisis correspondiente, es posible tener tres tipos de intervalos:

INTERVALOS DE IGUAL AMPLITUD

INTERVALOS DE DIFERENTE AMPLITUD

INTERVALOS ABIERTOS

Proteínas en grs.

Grandes grupo de edad

Peso de pacientes en Kgs.

16 -19

20-23

24 -27

28 -31

32 - 35

0 -1415-6465 -85

Menos de 5555 – 5960 – 6465 – 6970 y mas.

Page 20: Bioestadistica tabala de frecuencia

e) Frecuencia absoluta simple:

Es el numero de veces que se repiten los valores dentro de los diferentes intervalos en que ha dividido la información.

Para obtener la frecuencia absoluta de cada clase, se efectua la tabulación o conteo mediante el sistema de palotes. Por ejm: hay 5 valores ( 16, 17, 18, 19,19) que se encuentran en el intervalo de 16 a 19 y así sucesivamente… hasta obtener las frecuencias absolutas simples para todas las clases, de la siguiente manera:

)(if

∑ )(if = 20

Page 21: Bioestadistica tabala de frecuencia

f) Frecuencia absoluta acumulada )(FiSe obtiene sumando y acumulando los valores absolutos clase por clase en orden ascendente.

Se representa por :

En la 1era clase: F1 = f1

En la 2da clase: F2 = f1 + f2

En la 3era clase: F3 = f1 + f2 + f3

En la clase i : Fi = f1+ f2 + f3 + f4…………… if

Para nuestro ejemplo tendríamos:

F1 = 5F2 = 5+9 = 14F3 = 5+9+4 = 18F4 = 5+9+4+1 = 19F5 = 5+9+4+1+1 = 20

Page 22: Bioestadistica tabala de frecuencia

g) Frecuencia Relativa Simple )( ih

Es el valor que resulta al dividir cada una de las frecuencias absolutas simples entre el total de frecuencias o datos. Así:

En la 1era clase: h1 = f1

N

En la 2da clase: h2 = f2

N

En general : hi = fi

N

En nuestro ejemplo:h1 = 5 = 0.25 h2 = 9 = 0.45 h3 = 4 = 0.20 h4 = 1 = 0.05 20 20 20 20 20 20

h5 = 1 = 0.05

20

Page 23: Bioestadistica tabala de frecuencia

h) Frecuencia Relativa Acumulada )(HiSe obtiene sumando y acumulando los valores relativos clase por clase en orden ascendente.

Así:

En la 1era clase: H1 = h1

En la 2da clase: H2 = h1 + h2

En la 3era clase: H3 = h1 + h2 + h3

En la clase i :Hi = h1+ h2 + h3 + h4………… … ih

Para nuestro ejemplo tendríamos:

H1 = 0.25H2 = 0.25+0.45 = 0.70H3 = 0.25+0.45+0.20 = 0.90H4 = 0.25+0.45+0.20+0.05 = 0.95H5 = 0.25+0.45+0.20+0.05+0.05 = 1.00

Nota: Por lo general, a las frecuencias relativas las multiplicamos por 100, con el fin de obtener los valores expresados en porcentajes

Page 24: Bioestadistica tabala de frecuencia

i) Punto medio o marca de clase )(Xi

Se define como la semi suma de los limites inferiores y superiores de cada intervalo de clase.

X i = LIMITE INFERIOR + LIMITE SUPERIOR

2

Para nuestro ejemplo: X1 = 16+19 = 17.5

2

X2 = 20+23 = 2

Luego la tabla completa de distribución de frecuencias sería la siguiente:

continúa…

..etc

Page 25: Bioestadistica tabala de frecuencia

∑if = N = 20

∑ih= 1.00 ∑ ih = 100

EJEMPLO: TABLA DE FRECUENCIA PARA VARIABLE CUANTITATIVA

Page 26: Bioestadistica tabala de frecuencia

Al averiguar el grado de instrucción en una muestra de 120 pacientes que sufren de tuberculosis pulmonar que fueron atendidos durante el mes de Enero de 1992 en el Hospital Loayza, se obtuvieron los siguientes resultados :

Analfabetos 38, primaria 63, secundaria 16, superior 3.

Solución:

Primero Ordenando la información proporcionada en un cuadro de frecuencia

EJEMPLO: TABLA DE FRECUENCIA PARA VARIABLE CUALITATIVA

Page 27: Bioestadistica tabala de frecuencia

Importante análisis:

Además observamos que la variable grado de instrucción es una variable que por su medición pertenece a escala ordinal. Por lo tanto aquí no existen intervalos numéricos. Por lo que se organizaron los datos y se presento la tabla como se vio en la diapositiva anterior.

hi = fi

N

Para el caso de dar solución al ejercicio anterior se utilizo la formula:

Para este caso

h1 = 38 = 0.317

120

h2 = 63 = 0.525

120

h3 = 16 = 0.133

120h4 = 03 = 0.025

120

El se ha obtenido multiplicando por 100 cada frecuencia relativa simple.%ih

Page 28: Bioestadistica tabala de frecuencia

Gracias