Estadistica - Colegio 24hs
-
Upload
absoluto06 -
Category
Documents
-
view
284 -
download
14
Transcript of Estadistica - Colegio 24hs
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 1/113
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 2/113
2
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 3/113
3
Matemática
Estadística
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 4/113
4
ÍNDICE
1. Población y muestra.............................................. 6 2. Estadística Descriptiva ......................................... 9
Ejercicios 2-1 ........................................................ 12
Hoja de respuestas 2-1 ........................................ 16 3. Amplitud de una variable................................... 21 4. Intervalos de clase...............................................25 5. Gráficos. Histogramas, polígonos defrecuencia, tortas, barras.........................................30 6. Medidas de centralización ( de posición o detendencia central).....................................................39 7. Moda..................................................................... 44 8. estadística. Ejercicios ......................................... 47
Hoja de respuestas ............................................... 50 9. Medidas de dispersión (o de desviación) ......... 53 10. Desviación Media..............................................56 11. Desviación estándar (s) .................................... 61
12. Varianza..............................................................64 13. Distribución normal - curva de Gauss.......... 69
Ejercicios 13-1......................................................75 Hoja de respuestas 13-1 ...................................... 78
14. Correlación.........................................................80 14.1 ¿Cómo se calcula el coeficiente de
correlación lineal? ............................................... 92
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 5/113
5
14.2 Ejercicios ......................................................98 15. Media, Moda y Mediana................................. 103
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 6/113
6
1. POBLACIÓN Y MUESTRA
Para hacer el estudio de los caracteres que sedesea conocer se hacen observaciones. Si las ob-servaciones se realizan sobre el total de un grupo,
a ese grupo se lo denomina población o universo ycada observación se llama individuo.
Por ejemplo:Si se efectúa un censo ganadero
población el conjunto deanimales
individuo cada animal
Si se efectúa un censo sobre viviendaspoblación el total de
viviendas
individuo cada vivienda
Si en una empresa se toman los salarios decada empleado
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 7/113
7
población el conjunto desalarios
individuo cada salario
Muchas veces es muy difícil estudiar elnúmero total (N) de los individuos de una pobla-ción debido al costo económico, el tiempo que
llevaría o por ser muy difícil de delimitar ese nú-mero total.Por ejemplo, si se desea saber la diferencia
de presión sanguínea entre hombres y mujeres,sería imposible determinar la presión se todos loshombres y de todas las mujeres. El problema seresuelve recurriendo a las muestras.
Se llama muestra al conjunto de n indivi-duos (n < N) elegidos al azar entre los N de unapoblación dada.
Si en el ejemplo anterior se toma la pre-sión a 200 personas elegidas al azar:
Población Total depersonas existentes
Muestra Los 200personas escogidas
Individuo Cada persona
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 8/113
8
Para que los estudios realizados sobre lapoblación sean válidos, la muestra debe ser repre-
sentativa de la población. Por ejemplo, si se quiereestudiar la incidencia del mal de Chagas en la Pro- vincia del Chaco, y se toma una muestra de pobla-ción perteneciente sólo a la ciudad de Resistencia,el estudio estadístico no es válido, ya que se estáestudiando sólo individuos de la zona metropoli-
tana, dejando de lado la zona rural. En este caso sedice que la muestra no es representativa de la po-blación.
E JERCICIOS
1. Se quiere realizar un estudio para determi-nar la cantidad promedio de huevos que ponen lospingüinos hembras en el período reproductivo enPuerto Madryn. Determiná población y muestradel estudio.
2. Se quiere determinar la audiencia de ciertoprograma televisivo de televisión de aire. Deter-miná muestra y población.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 9/113
9
2. ESTADÍSTICA DESCRIPTIVA
Actualmente es difícil leer un informe de cual-quier actividad humana con repercusión públicaque no esté acompañada por tablas ó gráficos
estadísticos: el periodista los utiliza para enrique-cer su comentario escrito; el empresario, para ex-plicar su cuenta de resultados; el publicista, paratransmitir un mensaje visualmente concreto; ytodos, para facilitar la comprensión de una infor-mación generalmente densa y con datos de com-plicada presentación.
Ante tal cúmulo de información y de datos,muchas veces el lector termina leyendo solamenteel gráfico y la tabla adjunta. Por lo tanto, es im-prescindible aprender a leer e interpretar este mo-do de comunicación y también aprender a confec-
cionarlos para que los demás la entiendan conclaridad.
La definición matemática de la estadísticaes:
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 10/113
10
El lenguaje de la estadística Vamos precisar algunos términos propios del
lenguaje estadístico:
Población: se denomina población al con-junto de todos los elementos que cumplen unadeterminada característica, que deseamos medir óestudiar.
Muestra: Se denomina muestra a cualquiersubconjunto de la población. El número de ele-mentos de la muestra se llama tamaño de la mis-
ma. Cuando el tamaño de la muestra coincide conla población, se llama censo.
Individuo (objeto): Se considera individuo acada uno de los elementos de la población.
Ciencia que utiliza conjuntos de datosnuméricos para obtener a partir de ellosinferencias basadas en el cálculo de pro-babilidades.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 11/113
11
Carácter estadístico: Cada una de las propie-dades (aspectos) que pueden estudiarse en los
individuos de una población recibe el nombre decarácter.
Un carácter puede ser cuantitativo si se puedemedir.
Un carácter es cualitativo si no se puede me-dir, o sea se puede comparar.
Variables estadísticas: Una variable estadís-tica se llama discreta cuando sólo se pueden tomardeterminados valores de ella. En cambio la varia-ble se llama continua cuando puede tomar todoslos valores de un intervalo
Intervalos de clase: Se llama intervalos declase a cada uno de los intervalos en que puedenagruparse los datos de una variable estadística
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 12/113
12
EJERCICIOS 2-1
E JERCICIO 1
Dados los siguientes datos de longitud de vari-
llas:52, 80, 65, 82, 77, 60, 72, 83, 63
78, 84, 75, 53, 73, 70, 86, 55, 88
85, 59, 76, 86, 73, 89, 91, 76, 92
66, 93, 84, 62, 79, 90, 73, 58, 71
a- Agrupá los datos en clases y establecé la
frecuencia y frecuencia relativa
b- Calculá la media, mediana y moda
c- Graficá los datos en grafico de barras.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 13/113
13
E JERCICIO 2
Se ha realizado en EE.UU. una estadística so-bre la capacidad matemática de los alumnos de 14
años los resultados son los siguientes:
Resultados 30-32 33-35 36-38 39-41 42-44 45-47 48-50
F (EE.UU.) 5 5 10 15 40 15 10
a- Halla los puntos medios de cada intervalo de
clase.
b- Graficá los polígonos de frecuencias.
c- Calculá la desviación estándar y la varianza
E JERCICIO 3
La siguiente tabla muestra los pesos en Kg. de
luchadores de Sumo
KG. 140-144 145-149 150-154 155-159 160-164 165-169
Frecuencia 5 7 10 16 8 4
Frecuencia
relativa
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 14/113
14
a- Completá la tabla dada
b- Calculá la moda, media y mediana
c- Graficá
E JERCICIO 4
Del campeonato local de fútbol se han elegidopartidos, en la tabla se muestran el número de
goles:
Números de goles 1 2 3
Números de
partidos
8 8 x
a- Si la media de goles es de 2,04; hallá x
b- Si la moda de goles es 3, determiná el me-
nor valor que puede tener x.
c- Si la mediana es de 2 goles, hallá el mayor
valor positivo de x.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 15/113
15
E JERCICIO 5
En una encuesta, se pregunta a 50 personassobre el número se libros que se leen al año. Los
resultados se muestran en la tabla:
Nº de
libros
0 1 2 3 4 5 6 7 8
Frecuencia 5 5 6 9 11 7 4 2 1
Frecuencia
relativa
a- Completá la tabla
b- Calculá la media de los libros leídos por per-
sonac- Calculá la varianza y desvío estándar.
d- Realizá el grafico de tortas o circular.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 16/113
16
HOJA DE RESPUESTAS 2-1
E JERCICIO 1
a-
Longitud delas varillas
(en m)
Marca ointervalo
de clase
Frecuencia FrecuenciaRelativa
Marca declase x
frecuencia
50-59 54,5 4 0,111 218
60-69 64,5 6 0,166 387
70-79 74,5 12 0,333 894
80-89 84,5 10 0,277 845
90-99 94,5 4 0,111 378 Total 36 0,998 2722
b-
La media aritmética es 75,6 m
La mediana se encuentra en el intervalo 70-79;es exactamente 76 m
La moda es la longitud de varillas de 70-79
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 17/113
17
c-
0
5
10
15
50-59 60-69 70-79 80-89 90-99
Gráfico de barras de longitud devarillas
E JERCICIO 2
a-
Resultados 30-32 33-35 36-38 39-41 42-44 45-47 48-50F (EE.UU.) 5 5 10 15 40 15 10
Punto medio 31 34 35 40 43 46 49
b-
Poligono de frecuencia (Capacidad de alumnos
de matemática)
0
5
10
15
20
25
30
35
4045
30-32 33-35 36-38 39-41 42-44 45-47 48-50
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 18/113
18
c- La varianza es 13,3 m y el desvío estándar
es 3,6 m
E JERCICIO 3
a-
KG. 140-144 145-149 150-154 155-159 160-164 165-169
Frecuencia 5 7 10 16 8 4
Frecuencia
relativa
0,1 0,14 0,2 0,32 0,16 0,08
b-
La moda es el intervalo 155-159
La media aritmética es 154,7 Kg.La mediana es 155,75 Kg.
c-
0
5
10
15
20
140-144 145-149 150-154 155-159 160-164 165-169
Gráfico de barras (Pesos de
luchadores de Sumo)
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 19/113
19
E JERCICIO 4
a- X=9b- El valor menor valor que puede tomar x es
9
c- El mayor valor positivo de x es 15
E JERCICIO 5
a-
Nº de
libros
0 1 2 3 4 5 6 7 8
Frecuencia 5 5 6 9 11 7 4 2 1Frecuencia
relativa
0,1 0,1 0,12 0,18 0,22 0,14 0,08 0,04 0,02
b- La media es 3,38
c- La varianza es 1,26 y el desvío estándar es
1,12
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 20/113
20
d-
Gráfico de tortas (Nº de libros leídos) 1
2
3
4
5
6
78
9
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 21/113
21
3. AMPLITUD DE UNA VARIABLE
! Cuando la variable es continua
E JEMPLO 1
El cuadro muestra la cantidad de hijos que tie-
nen ciertas mujeres.
Amplitud:
Es la diferencia entre el valor máximo y
mínimo que puede tomar la variable
Amplitud = xmáx - xmin
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 22/113
22
Amplitud = xmáx - xmin
= 5 – 0
A = 5
! Cuando la variable es continua
E JEMPLO 2
El siguiente cuadro muestra las temperaturas
registradas durante dos primaveras, en un obser-
vatorio.
Nº de hijos
xi
f i
0 2
1 5
2 7
3 4
4 1
5 1
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 23/113
23
Temperaturas f i
15º 12
16,5º 5
17,2º 8
17,5º 7
18,2º 1
Amplitud = xmáx - xmin
Amplitud = 18,2º - 15º
Amplitud = 3,2º
! Cuando la variable viene dada en in-
tervalos
E JEMPLO 3:
En la tabla se muestran los salarios en pesos,de los empleados de la compañía “S&S”
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 24/113
24
Amplitud = xmáx - xmin
Amplitud = $189,99 - $50 Amplitud = $139, 99.-
Salarios ($) Frecuencias
50 – 69,99 5
70 – 89,99 12
90 – 109,99 10
110 – 129,99 15
130 – 149,99 18
150 – 169,99 31
170 – 189,99 35
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 25/113
25
4. INTERVALOS DE CLASE
Si tenemos un gran número de datos de una
variable continua (cuando puede tomar cualquier
valor real), es conveniente agruparlos en intervalos
consecutivos, de manera que cada dato pertenezca
a un solo intervalo.
E JEMPLO 1
Los siguientes datos corresponden a las alturas
(en cm) de un grupo de 24 alumnos de cuarto
grado:
125 130 132 140 128 132128 132 139 133 142 130
138 133 142 136 145 124
126 147 138 134 128 132
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 26/113
26
Primer paso:
! Calculamos la amplitud
A = xmax - xmin
A= 147 –124
A= 23
Segundo paso:!
Determinamos el número de intervalos
Como la muestra tiene 24 individuos, se de-
terminarán 6 intervalos de amplitud 4 ya que
46
23!
Tercer paso:
! Determinamos los intervalos.
El primer intervalo se toma a partir del valor
mínimo. Para evitar que los extremos del intervalo
coincidan con un valor de la variable se los define
restando media unidad del último decimal.
El primer intervalo se toma a partir del
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 27/113
27
124 – 0,5=123, 5
El segundo intervalo se toma a partir de
123,5 + 4 = 127,5
Intervalo de clase Frecuencia
123,5-127,5 3
127,5-131,5 5
131,5-135,5 7
135,5-139,5 4
139,5-143,5 3
143,5-147,5 2
Valor mínimo Limite inferior de la clase
Amplitud del intervalo (Calculado en
el paso 2)
Cantidad de alumnos quetienen una altura pertene-
ciente al intervalo de cada
clase
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 28/113
28
E JEMPLO 2
El puntaje de la evaluación de matemática de32 estudiantes se registran en la siguiente tabla:
68 84 75 82 96 78 89 61
79 62 67 97 73 79 88 73
61 65 75 87 66 78 82 75
65 80 73 57 86 67 73 81
Primer paso:
! Calculamos la amplitud.
A = xmax - xmin
A = 97 – 57
A = 40
Segundo paso:
!
Determinamos el número de intervalos
85
40" . Formamos 5 intervalos de ampli-
tud 8.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 29/113
29
Tercer paso:
! Determinamos los intervalos.
El primer intervalo se toma a partir del 57 – 0,5=
56,5
El segundo intervalo se toma a partir 56,5 + 8 =
64,5
Intervalos de clase Frecuencias
56,5 – 64,5 4
64,5 – 72,5 6
72,5 – 79,5 11
79,5 –87,5 7
87,5 – 95,5 2
95,5 - 103,5 2
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 30/113
30
5. GRÁFICOS. HISTOGRAMAS, PO-LÍGONOS DE FRECUENCIA, TOR-
TAS, BARRAS
HISTOGRAMAS
E JEMPLO:
La siguiente tabla muestra la altura de ciertos
árboles (en metros) y su frecuencia. Graficá en un
histograma.
Un histograma consiste en una serie
de rectángulos que tienen:
-Sus bases sobre un eje horizontal (eje
x) con centros en los puntos medios de los
intervalos de clase y la longitud a igual altamaño de los intervalos de clase.
-Superficies proporcionales a las fre-
cuencias de clase.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 31/113
31
Altura Cantidad de árboles60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
Determinamos los puntos medios de los in-
tervalos de clase.
mediopuntoinferior limitesuperior Limite
"#2
Altura Cantidad de
árboles
Punto medio Tamaño de los
intervalos60-62 5 61 62- 60= 2
63-65 18 64 65-63= 2
66-68 42 67 68-66= 2
69-71 27 70 71-69= 2
72-74 8 73 74-72= 2
Total 100
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 32/113
32
POLÍGONOS DE FRECUENCIAS
Polígono de frecuencias:
Es un gráfico de línea trazado sobre los pun-
tos medios. Se obtiene uniendo los puntos me-
dios de los lados opuestos a las bases de los rec-
tángulos en el histograma; incluyendo el anterior
al primero y el posterior al segundo.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 33/113
33
E JEMPLO:
La tabla muestra el tiempo (medido en horas)que tardan en fundirse 50 lámparas halógenas de
larga duración.
A continuación encontrarás el polígono de
frecuencia correspondiente.
Tiempo (en horas) Lámparas Puntos medios de los
intervalos500 -1750 2 1125
1750 - 3000 7 2375
3000 - 4250 9 3625
4250 - 5500 12 4875
5500 - 6750 7 61256750 - 8000 6 7375
8000 - 9250 5 8625
9250 - 10500 2 9875
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 34/113
34
GRAFICO DE TORTA
E JEMPLO:
En la siguiente tabla se muestra la superficie
de distintas zonas del mundo en millones de millas
cuadradas.
Gráfico de torta: Los ángulos deben ser
proporcionales a las respectivas frecuencias, por
lo tanto:total
absoluta f .
º
º"
360
$
A la cantidad total de la muestra le corres-ponden los 360º del círculo.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 35/113
35
El total de la superficie es 51,5 millones, en-
tonces le corresponden los 360º del círculo.
Para calcular el ángulo que le corresponde acada sector haremos regla de tres simple:
51,5 millones 360º
11, 7 millones x = 81º 47´
(África)
51,7 millones 360º
10,4 millones x = 72º 25´
(Asia)
Zonas Superficies
África
11,7
Asia 10,4
Europa 1,9
Norteamérica 9,4
Oceanía 3,3
Sudamérica 6,9
Centroamérica 7,9
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 36/113
36
51,7 millones 360º
1,9 millones x = 13º 13´
(Europa)
51, 7 millones 360º
9,4 millones x = 65º 27´
(Norteamérica)
51,7 millones 360º
3,3 millones x = 22º 58´
(Sudamérica)
51, 7 millones 360º
6,9 millones x = 48º 2´
(Centroamérica)
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 37/113
37
GRAFICO DE BARRAS
E JEMPLO:
En la tabla se muestran las velocidades orbita-les de los planetas del sistema solar. A continua-ción encontrarás el gráfico de barras correspon-diente.
Planeta Velocidades (milla /seg)
Mercurio29,7
Venus 21,8
Tierra 18,5
Marte 15,0 Júpiter 8,1
Saturno 6,0
Urano 4,2
Neptuno 3,4
Plutón 3,0
Gráfico de barras: Las anchuras de las barrasson todas iguales, puede elegirse cualquier tamaño
adecuado con tal de que las barras no se super-
pongan.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 38/113
38
Gráfico de barras
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 39/113
39
6. MEDIDAS DE CENTRALIZA-CIÓN ( DE POSICIÓN O DE TEN-
DENCIA CENTRAL)
Son una serie de valores que tratan de re-
presentar o resumir una distribución de fre-cuencias dada. Además, se utilizan para compa-
rar distintas distribuciones de frecuencias.
Estas medidas son:
! la media aritmética (o promedio)
!
la mediana
! la moda (o modo)
! La variable no viene dada en intervalos
Mediana: de una serie de datos ordenados (en
forma creciente o decreciente) es el valor que tie-
ne tantas observaciones anteriores como posterio-
res a él.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 40/113
40
E JEMPLO 1
Se tira un dado 50 veces. Cada número y lafrecuencia con que han aparecido está indicado en
la tabla. Calculá la mediana.
La mediana corresponde a la observación cuya
frecuencia acumulada contenga a2
n.
Como 252
50
2""
nla frecuencia acumulada 25
contiene a 25.
Número del dado Frecuencia Frecuencia acumu-
lada
1 11 11
2 9 20
3 5 25
4 10 35
5 12 47
6 3 50
Total 50
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 41/113
41
Como la frecuencia acumulada es 25 le co-
rresponde el número de dado 3. Entonces la me-
diana es 3.
! Cuando la variable está dada en forma
de intervalos
E JEMPLO 2
La tabla muestra una distribución de frecuen-
cias de los salarios en pesos de 65 empleados de
la Compañía P & R.
Salarios (en pesos) Nºde empleados
Frecuencia acumulada
50 – 59,99 8 8
60 – 69,99 10 18
70 – 79,99 16 34
80 – 89,99 14 48
90 – 99,99 10 58
100 – 109,99 5 63
110 – 119, 99 2 65
Total 65
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 42/113
42
Como 5322
65
2,""
n.
Como 32,5 está contenido en la frecuencia
acumulada 34, la mediana está en el intervalo 70 –
79,99.
Para obtener exactamente el valor utilizaremos
la siguiente fórmula: c f
F n
L M mediana
.
%%%%
&
'
((((
)
* +
#"1
12
donde L1= límite inferior del intervalo que
contiene a la mediana
n = número total de datos.
F1= Frecuencia acumulada anterior al interva-
lo que contiene a la mediana.
C = tamaño del intervalo que contiene a la
mediana.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 43/113
43
Reemplazando en la fórmula:
067999916
182
65
7021
1 ,$,.. ",
%%%%
&
'
((((
)
* +
#"
%%%%
&
'
((((
)
* +
#" M c f
F n
L M mediana
Gráficamente
En un histograma
0
5
10
15
20
empleados
1
sueldos
Sueldos de empleados
50 – 59,99
60 – 69,99
70 – 79,99
80 – 89,99
90 – 99,99
100 – 109,99
110 – 119, 99
La mediana es la abscisa correspondiente a larecta lm que divide al histograma en dos partes de
igual área.
l
m
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 44/113
44
7. MODA
MEDIDAS DE CENTRALIZACIÓN (DE
POSICIÓN O DE TENDENCIA CENTRAL)
Son una serie de valores que tratan de repre-sentar o resumir una distribución de frecuencias
dada.
Además, se utilizan para comparar distintas
distribuciones de frecuencias.
Estas medidas son:
- la media aritmética (o promedio)
- la mediana
- la moda (o modo)
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 45/113
45
Moda
El dato que se repite más veces, es decir, el de
mayor frecuencia, es la moda. Tiene la ventaja de
que es una medida que también es válida para
datos no numéricos. Es muy común y se utiliza
cotidianamente para describir la tendencia en el
vestuario de cada año.
Ejemplo
En la siguiente tabla, x i = 2 tiene la mayor
frecuencia, f i = 7.
xi f i
0 2
1 5
2 7
3 4
La moda es el valor de la variable al
que le corresponde la mayor frecuencia.
La moda es 2
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 46/113
46
4 1
5 1
/ 20
Cuando en el conjunto de observaciones hay
una sola moda, se dice que la distribución es
unimodal.
Si hay dos variables con la misma frecuencia
máxima la distribución se llama bimodal.
Ejemplos
1. En la serie 5, 8, 5, 9, 6 la moda es 5 (f =2)
La distribución es unimodal
2. En la serie 3, 6, 9, 4, 4, 8, 9, 4, 9, las modas
son 4 y 9 (f = 3)
La distribución es bimodal.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 47/113
47
8. ESTADÍSTICA. EJERCICIOS
E JERCICIO 1
En un curso de estadística de 15 alumnos
se registraron las siguientes notas:2, 4, 8, 7, 9, 6, 6, 6, 5, 7, 8, 9, 6, 4, 2.Ordená los datos y hallá:
a- La media aritmética.b- La mediana.c- La moda.d- El rango.
E JERCICIO 2
En la primera semana del mes de enero se
registraron, en la ciudad de Buenos Aires, lassiguientes temperaturas:
25, 28, 27, 33, 31, 28, 29.Ordená los datos y hallá:
a- La media aritmética.
b- La mediana.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 48/113
48
c- La moda.d- El rango
E JERCICIO 3
En el curso de estadística del problema 1)se tomaron las alturas de los alumnos y los
datos fueron los siguientes:1,79; 1,69; 1,72; 1,63; 1,67; 1,59; 1,69; 1,68;1,78; 1,72; 1,65; 1,61; 1,70; 1,57; 1,72.
Ordená los datos y hallá:
a- La media aritmética.b- La mediana.c- La moda.d- El rango.
E JERCICIO 4
El dueño de un negocio, con el fin de im- plementar un nuevo plan de márketing, estu-dia la cantidad de clientes que ingresan allocal, en el término de una semana, y los da-tos fueron:
52, 20, 34, 83, 15, 21, 38, 42, 29, 18
Ordená los datos y hallá
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 49/113
49
a- La media aritmética.b- La mediana.
c- La moda.
E JERCICIO 5
En la guardia de un hospital se tomaron
las medias aritméticas mensuales de los in-gresos a la guardia, en el año 2000. Los regis-tros fueron los siguientes:
2400, 2056, 3245, 2890, 2113, 3560, 2456,3654, 2432, 2012, 1967, 1056.
Hallá:
a- La media aritmética.b- La mediana.c- El rango.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 50/113
50
HOJA DE RESPUESTAS
E JERCICIO 1
Los elementos ordenados quedan: 2, 2, 4, 4, 5,
6, 6, 6, 6, 7, 7, 8, 8, 9, 9a- = 5.933 b- Mediana = 6 c- Moda = 6 d- Rango = 7
E JERCICIO 2
Los elementos ordenados quedan: 25, 27, 28,28, 29, 31, 33
a- = 28, 71
b- Mediana = 28c- Moda = 28
d- Rango = 8
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 51/113
51
E JERCICIO 3
Los elementos ordenados quedan: 1,57; 1,59;1,61; 1,63; 1,65; 1,67, 1,68; 1,69; 1,69; 1,70; 1,72;1,72; 1,72; 1,78; 1,81
a- = 1,682
b- Mediana = 1,68
c- Moda = 1,72
d- Rango = 0,24
E JERCICIO 4
Los elementos ordenados quedan: 15, 18, 20,21, 29, 34, 38, 42, 52, 83
a- 35,2
b- 29
c- 83
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 52/113
52
E JERCICIO 5
Los elementos ordenados son: 1056, 1967,2012, 2056, 2113, 2400, 2432, 2456, 2890, 3245,
3560, 3654
a- = 2486,75
b- Mediana = 2416
c- Rango = 2598
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 53/113
53
9. MEDIDAS DE DISPERSIÓN (ODE DESVIACIÓN)
Las medidas de centralización (la moda, la
media y la mediana) tratan de representar o resu-
mir una distribución de frecuencias dada en un
solo valor.
Las medidas de dispersión tienen como
objetivo estudiar lo “concentrada” que está la
distribución en torno a la media.
Podría suceder que dos distribuciones de fre-
cuencias sean muy diferentes pero tener la misma
media.
Me
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 54/113
54
Las medidas de dispersión completan el análi-
sis numérico de un conjunto de datos. Determi-nan la mayor o menor variación de los datos, y
dan una idea de su dispersión respecto a las medi-
das de centralización.
Las más importantes son:
!
la desviación media
n
x xmedia Desviación
0 +"
! la desviación estándar o desvío típico
1 2n
f x x s
ii0 +"
2
Me
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 55/113
55
! la varianza
1 2n
f x x s ii
0 +"
2
2
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 56/113
56
10. DESVIACIÓN MEDIA
Hemos estudiado varias medidas de centrali-
zación, por lo que podemos hablar de desviación
con respecto a cualquiera de ellas, sin embargo, la
más utilizada es con respecto a la media. La media
es la medida de tendencia central más útil y exacta.
Recordá que:
Desviación
Es la diferencia que se observa entre el valor
de la variable y la media aritmética. La denotare-
mos por di .
La media aritmética o promedio es el cociente
que se obtiene dividiendo la suma de los valores de
la variable por el número de observaciones.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 57/113
57
La desviación no es una medida, son muchas
medidas, pues cada valor de la variable lleva aso-
ciada su correspondiente desviación, por lo que
precisaremos una medida que resuma dicha in-
formación. Si sumamos las desviaciones con res-
pecto de la media podríamos obtener una estima-
ción de la cantidad característica de desviación conrespecto a la media. Entonces,dividiendo por n
(número de observaciones), tendríamos una me-
dida análoga a la medid aritmética, excepto que
representaría la dispersión promedio de las califi-
caciones con respecto a la media.
Pero, teniendo en cuenta las características
de la media, encontramos una seria dificultad: la
suma de las desviaciones de todos los valores ob-
tenidos con respecto a la media, debe valer cero.
Así, si definimos la desviación media como esta
suma dividida por n, la desviación media tendría
que ser cero.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 58/113
58
Recordá que:
Este inconveniente se soluciona sumando to-
das las desviaciones sin considerar el signo y dividien-do por n, es decir tomamos los valores absolutos
de las desviaciones.
Desviación media
Es la media de los valores absolutos de las
desviaciones, y la denotaremos por dm.
La fórmula que utilizaremos en una serie sim-
ple es:
n
xxd
m
+"
La media es el punto en una distribución
de medidas respecto del cual la suma de las
desviaciones es igual a cero: 0xx "+
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 59/113
59
Referencias:
/: sumatoria
x : media aritmética
n: número de observaciones
Si k x ,... x , x 21 se presentan con frecuencias, la
fórmula que utilizaremos para datos agrupados en
forma de distribución de frecuencias es:
f
n
xxd
m
+"
Ejemplo!
Hallá la desviación media de los nú-
meros 2, 3, 6, 8, 11.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 60/113
60
Media aritmética = x =5
118632 ####= 6
Desviación media =
dm =5
61168666362 +#+#+#+#+
dm =5
52034 ###+#+
dm =5
52034 ####
dm = 2,8
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 61/113
61
11. DESVIACIÓN ESTÁNDAR (S)
La fórmula que nos permite hallarla es:
1 2n
x xi
2
+/"
s
Para datos presentados en forma de distribu-
ción de frecuencia, la fórmula de la desviación
estándar es:
1 2
n
f . x xi
2
+/"
s
Recordá que:
Llamamos varianza a la media de los
cuadrados de los desvíos (s2 )
La desviación estándar es la raízcuadrada de la varianza.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 62/113
62
Observación:
Dos distribuciones de datos pueden tener la mis-
ma media y ser muy diferentes.
Ejemplo
!
Tené en cuenta la siguiente tabla yhallá la desviación estándar
x x x + 1 22 x x +
9 4 16
8 3 97 2 47 2 47 2 45 0 05 0 05 0 05 0 0
4 -1 14 -1 13 -2 43 -2 42 -3 91 -4 16
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 63/113
63
! Con estos datos recopilamos la siguiente
información:
1 2 5 15n 72
0 75
2
"""+/
"+/"/
x x x
x x x
! Como sabemos, la desviación estándar se
calcula con la siguiente fórmula:
1 2n
x xi
2
+/"
s
!
Entonces sólo resta reemplazar los datosobtenidos en la fórmula y hallar la desvia-
ción:
192
804
15
72
,
,
""
"s
! De esta manera podemos concluir que la
desviación estándar es igual a 2,19.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 64/113
64
12. VARIANZA
Para evitar los valores negativos de los desvíos
suelen tomarse los cuadrados de los desvíos.
Cálculo de la Varianza en una serie simple
En símbolos, la varianza queda expresada co-
mo la suma de los cuadrados de los desvíos divi-
dida por el número de observaciones.
1 2n
x xi
2
2 +/"
s
Llamamos varianza a la media de los cua-
drados de los desvíos, y la denotaremos
por s2
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 65/113
65
Cálculo de la Varianza en una serie de fre-
cuencias
Para calcular la varianza se suman los produc-
tos de los cuadrados de los desvíos por la frecuen-
cia, y se divide la suma por el número de observa-
ciones.
1 2n
f . x xi s
2
2 +/"
Cálculo de la Varianza en una distribución
en intervalos de clase
Se suman los productos de los desvíos de cada
intervalo por la frecuencia del intervalo y se divide
la suma por el número de observaciones.
1 2n
f . x x im s
2
2 +/"
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 66/113
66
Este dato estadístico tiene el inconveniente de
ser poco significativo, pues se mide en el cuadrado
de la unidad de la variable, por ejemplo, si la va-
riable viene dada en cm la varianza vendrá dada en
cm
2
.
Pero al elevar al cuadrado las diferencias de los
datos respecto de la media, hace que los valores
más alejados de la media tengan mayor contribu-
ción. Como consecuencia, distingue mejor que la
amplitud la variabilidad de dos conjuntos de datos.
En todos los casos: xi: es el i-ésimo dato
: es la media aritmética para datos no agru-
pados
n: es el número de datos
: sumatoria
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 67/113
67
E JEMPLO 1
!
Calculá la varianza para el siguienteconjunto de datos
5 9 12 7 15 3
SOLUCIÓN
! Aplicamos la definición (primera fórmula).
!
Primero hay que calcular la media
= (5+9+12+7+15+3)/6 = 51/6 = 8.5
! Ahora procedemos al cálculo de la varian-
za:S 2 = [(5-8.5)2+(9-8.5)2+(12-8.5)2+(7-8.5)2+(15-
8.5)2+(3-8.5)2 ]/6 = 99.5/6 = 16.58
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 68/113
68
! Llegando entonces a que la varianza para
este conjunto de datos es 16.58.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 69/113
69
13. DISTRIBUCIÓN NORMAL -CURVA DE GAUSS
El matemático Karl Friedrich Gauss, (1777-
1855) estudiando los errores que se producen al
medir reiteradas veces una misma magnitud, pro-
bó que éstos se distribuyen según una ecuación
exponencial cuya grafica es:
La distribución normal es simétrica y el valor máximo de la
función corres onde a la media.
Media
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 70/113
70
Este gráfico se denomina campana de Gauss
(debido a su forma acampanada) o distribución
normal. La distribución de muchas variables pa-
rece seguir la curva normal. Por ejemplo, caracte-
res de individuos (personas, animales, plantas) de
una misma especie (altura, peso). También hay
variables discretas que tienen una distribuciónparecida, como el número de caras al lanzar un
cierto número de monedas.
Hay una gran cantidad de variables aleatorias
continuas que se presentan en las situaciones más
variadas y que, a pesar de ello, son de un mismo
tipo. Todas ellas tienen en común la forma de su
función de densidad. Para estas variables aleato-
rias, si la media es 3 y la desviación típica es 4 la
función densidad es:
2
2
1
2
1 % &
'()
* ++
" 4
3
5 4
x
e x f )(
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 71/113
71
La gráfica de estas funciones tiene forma de
campana con un eje de simetría. Las funciones de
este tipo están completamente determinadas por
su media 3, y su desviación típica, 4.
! La media 3 indica la posición de la cam-
pana (parámetro de centralización)
! La desviación típica 4 será el parámetro de
dispersión. Cuanto menor sea, mayor can-
tidad de masa de probabilidad habrá con-
centrada alrededor de la media y cuanto
mayor sea ``más aplastado" será.
Su gran importancia se debe al hecho de que el
área debajo de cualquier campana de Gauss entrelos valores 4 4 2211 k xk x #"#" y es la
misma que el área bajo la N (0;1) entre
2211 k z k z "6"
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 72/113
72
E JEMPLO
Un estudiante consigue un 72 % de aproba-
ción en Historia y lo mismo en Inglés. La media
para todos los alumnos es 65 %. La desviación
estándar es del 3% para Inglés y 15% para Histo-
ria.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 73/113
73
En inglés
En Historia
Los mejores resultados
72 puntos3=65
Los mejores resultados
72 puntos3=65
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 74/113
74
En Inglés, muy pocos superaron el 72 %, por
lo tanto, se trata de un resultado muy bueno.
En Historia, el 72 % lo superaron muchos. La
media no es muy válida puesto que la dispersión
de los resultados fue muy grande, como nos indica
la desviación típica.
Luego, ese 72 % no es muy bueno.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 75/113
75
EJERCICIOS 13-1
E JERCICIO 1
Dada la variable aleatoria Z de distribu-
ción normal N(0,1)
! Calculá las siguientes probabilidadesa- P(Z 7 -1,3)b- P(Z 8 1)c- P(-0,5 7 Z 7 1,47)
E JERCICIO 2
! En una variable aleatoria X con distribu-ción normal N(8,4) calculá P(3 7 X 7 10)
E JERCICIO 3
Las notas de Historia de una clase se distribu-
yen según una distribución normal N(6,4;1,5) y el
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 76/113
76
profesor quiere poner sobresaliente a un 15% de
la clase
! ¿A partir de qué nota debe poner sobresa-liente?
E JERCICIO 4
Las alturas de los empleados de una empresa
de transportes se toman redondeando al centíme-
tro más próximo. Se sabe que están distribuidos
normalmente con la función N(172,5). Se toma
una muestra de 1000 empleados al azar.
! Calculá cuántos miden :
a- No más de 180 cm.b- 175 cm o más.c- Entre 160 y 184 cm
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 77/113
77
E JERCICIO 5
El coeficiente intelectual (C.I.)de los alumnosde la universidad de Berdaguer sigue una distribu-
ción normal N(115,12).
! Calculá la probabilidad de que un alumno
tenga un C.I. superior a 138.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 78/113
78
HOJA DE RESPUESTAS 13-1
E JERCICIO 1
a- 0,0968b- 0,1587c- 0,6207
E JERCICIO 2
0,5859
E JERCICIO 3
P(Z 7 z )=0,85 ,
5,1
4,6' +
" z
z , z = 7,96,
por lo tanto la nota debe ser 8.
E JERCICIO 4
a- 955
b- 308
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 79/113
79
c- 988
E JERCICIO 5
0,0281
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 80/113
80
14. CORRELACIÓN
DOS TIPOS DE RELACIONES
A menudo, un investigador o nosotros mis-
mos, nos vemos en la necesidad de saber si existe
alguna relación entre dos variables que necesita-
mos medir. Por ejemplo:
#
Cantidad de kilowatts consumidos y su costo.
#
Posición de un cuerpo lanzado hacia arriba y su ve-
locidad.
# Cantidad de cierta población de bacterias en un de-
terminado momento.
# Altura de las personas y su peso.
# Altura de los padres y la de sus hijos
#
Calificación de un curso en física y en matemática.
Entre estas situaciones hay algunas entre las
que podemos establecer una relación que llama-
remos funcional.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 81/113
81
Para que exista este tipo de relación debe
haber una función que, conocida una de las varia-
bles, me permite calcular aproximadamente la
otra, esto se cumple en los tres primeros ejemplos,
cuando exista dicha relación diremos que las va-
riables están correlacionadas o que hay correla-
ción entre ellas.
En cambio no existe una función que nos
permita conocer la nota de física de un alumno
conociendo la de matemática; o la altura de los
hijos conociendo la de sus padres.
Llamaremos a la relación existente entre estas
variables relación estadística
DIAGRAMAS DE DISPERSIÓN
Para estudiar la relación entre dos variables, se
comienza por obtener un conjunto de datos.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 82/113
82
Formamos con ellos pares ordenados ( x , y ), la
primera coordenada corresponde a una variable y
la segunda a la otra, por ejemplo, las x correspon-
derán a las alturas de los padres y las y a las de sus
hijos; o las x a la nota de matemática y la y a la de
física; etc.
Tendremos entonces un conjunto de datos
( x 1 , y 1 ), ( x 2 , y 2 ),..., ( x n , y n ). que podemos re-
presentar en un par de ejes, formando lo que se
conoce como diagrama de dispersión, en este
caso se dice que los datos forman una nube de
puntos.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 83/113
83
E JEMPLOS
1.
Relación entre población y vivienda por
provincia (censo 1991)
0
200.000400.000
600.000
800.000
1.000.000
1.200.000
En este ejemplo, cada punto representa una provincia, los
valores de X indican la población y los de Y la cantidad
de viviendas. Vemos que los puntos se alinean por lo que
decimos que existe una correlación lineal. Además a
mayores valores de una variable corresponden mayores
de la otra, por lo que decimos que la correlación es dire-
cta. Por otra parte, como esta alineación es muy marcada
decimos que se trata de una correlación fuerte.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 84/113
84
2.
Puntos obtenidos y partidos perdidos.
Torneo de fútbol local
0
5
10
0 10 20 30 40Puntos
Para este ejemplo, cada punto representa un equipo de
fútbol de primera división. Acá también notamos unacorrelación lineal, aunque más débil que en el ejemplo
anterior. Como a mayores valores de x (puntos) corres-
ponden menores de y (perdidos) decimos que la correla-
ción es inversa.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 85/113
85
3.
Relación entre población y superficie de
una provincia(censo 1991)
0
50.000
100.000
150.000
200.000
250.000
300.000
En este caso también cada punto representa una pro-
vincia argentina, pero acá no es clara la relación que
existe entre las variables. Decimos que no hay corre-
lación.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 86/113
86
COVARIANZA Y COEFICIENTE DE CORRELA-
CIÓN
Para estudiar con más detalle la correlación
definiremos los siguientes parámetros estadísticos:
Desvío típico
2
n
1i
2
i
x xn
x
+"0"
4
2
n
1i
2
i
y yn
y
+"0"
4
Donde xi e yi son cada uno de los datos de ca-
da variable y x e y son las medias de dichos da-
tos. Al punto ( x , y ) se lo conoce como centro
medio o centro de gravedad de la muestra.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 87/113
87
Covarianza
n
)yy)(xx(n
1i
ii
xy
0"
++"4
Notemos, a partir de la fórmula, que si la ma-
yoría de los valores de x e y son, para cada par de
datos, superiores los dos o inferiores los dos a las
respectivas medias, esto implica que:
1. El signo de la covarianza será positivo.
2. La mayoría de los valores pequeños de x
se corresponden con valores pequeños dey, cosa que también ocurre con los mayo-
res.
Esto nos dice que si la correlación es directa la
covarianza será positiva. De forma análoga sepuede ver que a una correlación inversa se corres-
ponde una covarianza negativa.
Sin embargo, la covarianza es un indicador
que se ve afectado por la escala considerada para
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 88/113
88
cada variable, o por algún dato demasiado alejado
del centro de gravedad. Para corregir estas defi-
ciencias se define el coeficiente de correlación
lineal.
COEFICIENTE DE CORRELACIÓN LINEAL
yx
xy
4 4
4 9 "
Observaciones:
# está siempre entre –1 y 1, es decir:
- 1 7 7 1
# Si es próximo a –1 se trata de una corre-
lación inversa, más fuerte cuanto más
próximo a –1 sea su valor.
# Si es próximo a 1 se trata de una corre-
lación directa, más fuerte cuanto más
próximo a 1 sea su valor.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 89/113
89
# Si es muy próximo a cero no hay corre-
lación lineal entre los datos.
CORRELACIÓN NO LINEAL
El coeficiente nos indica si hay o no corre-
lación lineal entre las variables y que tan fuerte es.
Sin embargo, las variables pueden estar
fuertemente correlacionadas pero dicha
correlación no ser lineal; un próximo a cero
indica que no hay (o es muy débil) la correlación
lineal, pero nada nos dice de otro tipo de
correlación.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 90/113
90
R ECTA DE REGRESIÓN
Si la nube de puntos del diagrama de disper-
sión adopta una forma muy definida (como es elcaso del ejemplo 1 o del gráfico anterior) los pun-
tos se pueden aproximar mediante alguna curva
conocida que ajuste lo mejor posible los puntos de
la nube. Dicha curva se conoce como línea de
regresión y poder determinarla nos ofrece la po-sibilidad de estimar los valores de una variable
conocidos los de la otra.
Si entre las variables existe una fuerte correla-
ción lineal, una recta se ajusta satisfactoriamente a
El siguiente gráfico muestra la relación entre la in- versión en publicidad de una empresa y sus ventas.
Se observa que la publicidad hace aumentar las ven-
tas, pero no indefinidamente ni de forma lineal.
Las variables están fuertemente relacionadas pero la
nube no se ajusta a una recta: se trata de un caso de
correlación no lineal.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 91/113
91
los puntos de la muestra. Esta recta se conoce
como recta de regresión y su ecuación es :
)xx(yyx
xy +"+4
4
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 92/113
92
14.1 ¿CÓMO SE CALCULA EL CO-EFICIENTE DE CORRELACIÓN
LINEAL?
Recordá que:
- Es un valor que está siempre entre 1 y
–1.
- El coeficiente de correlación, r no varía
con los cambios de escala y mide efi-
cazmente el grado de correlación entre
dos variables.
y x
y x
.r
44
4"
- Si r es 1 (o próximo a 1), la depen-dencia es funcional (o casi funcional):los puntos están alineados (o casi ali-neados).
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 93/113
93
Cálculo de r
Ejemplo
En un experimento sobre la distancia de fre-
nado de un auto dependiendo de su velocidad, se
obtuvieron los siguientes datos:
Velocidad
(km/h)
70 50 45 120 85 65
Distancia
(m)
32 18 19 43 35 34
$ Representá los valores en un diagrama o
nube de puntos y calculá el coeficiente de
regresión entre la velocidad y la distancia.
Solución 1º Paso: Antes, debemos calcular previamente
xyyx !,!,!,y,x
1 21 2 00""
+"++"n
i
ii
n
i
ii y x y. x y xn
y y x xn
!
11
11
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 94/113
94
0 +" 221 x x
n! i x
0 +" 221 y y
n! i y
Si llamamos x a la velocidad e y a la distan-
cia . Entonces, obtenemos que:
1630
572
, y
, x
""
2º Paso: Reemplazando en las fórmulas los
datos y los promedios, calculamos
$ Desviación típica de x:
0 +" 221 x x
n! i x
9524 ," x4
$ Desviación típica de y:
0 +" 221 y yn
! i y
938," y4
$ La covarianza es:
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 95/113
95
1 21 2 00""
+"++"n
i
ii
n
i
ii y x y. x y xn
y y x xn
!
11
11
91201," xy4
3º Paso: El coeficiente de correlación en este
cada caso es:
910
8222
91201
9389524
91201
,
,
,
,,
,
.
""
:"
"
r
r
r
r y x
y x
4 4
4
Representamos los datos en un diagrama de
nubes. Este gráfico obtiene este nombre pues
cuando existe una gran cantidad de datos, los
mismos se agrupan formando una “nube” de pun-
tos.
Esta nube toma una forma que, a veces, la
puede caracterizar relacionándola con una función
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 96/113
96
determinada, generando así el criterio intuitivo de
correlación con una recta, parábola, exponencial,
etc.
Estas correlaciones son confirmadas o no por
el cálculo de los coeficientes en cada caso.
0
5
10
15
20
25
30
35
40
45
50
0 20 40 60 80 100 120 140
Rectas de regresión
Cuando existe correlación entre dos variables
–cuanto más fuerte mejor- es útil trazar la rectaque “mejor se ajuste” a los puntos de la nube.
Esta recta llamada recta de regresión de y sobre x,
tiene la siguiente ecuación:
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 97/113
97
1 2 x x y y x
y x +
4
4"+
2
Para el ejemplo anterior, la recta de regresión
lineal viene dada por la siguiente ecuación:
1 21 2
1 2
966320
1630223320
5723201630
5729524
912021630
2
,,
,,,
,,,
,,
,,
#"
#+"
+"+
+"+
x y
x y
x y
x y
Gráfico de la recta de regresión lineal.
0
5
10
15
20
25
30
35
40
45
50
0 20 40 60 80 100 120 140
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 98/113
98
14.2 EJERCICIOS
E JERCICIO 1
Las notas de los alumnos de 5º año en Mate-
mática y Física se muestran en la tabla:
Matemática
X
2 2 4 4 4 5 6 6 7 8 9 9
Física
Y
2 4 3 4 6 7 5 6 8 7 7 10
a- Calculá el coeficiente de correlación
b- Graficá la nube de datos.
c- Determiná y graficá la ecuación de la recta
de regresión lineal
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 99/113
99
E JERCICIO 2
En el Parque Nacional Nahuel Huapi se tala-ron ejemplares de robles para determinar su edad
(contando el número de anillos del tronco), y se ha
medido su diámetro. Los datos que se obtuvieron
son:
Diámetro
(cm)
10 15 16 21 30 25 30 35
Edad
(años)
4 8 12 18 22 26 30 32
a- Hallá el coeficiente de correlación.
b- Graficá la nube de datos.
c- Hallá la recta de regresión.
d- Determiná la edad correspondiente a 18 y
40 cm de diámetro.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 100/113
100
E JERCICIO 3
En la tabla se muestran los datos de la longi-
tud corporal y el peso de un bebé durante las pri-
meras 24 semanas de vida.
a- Representá la nube de puntos.
b- Calculá el coeficiente de correlación lineal.
c- Explicá el significado obtenido en el coefi-
ciente.
d- Hallá la recta de regresión lineal.
E JERCICIO 4
En el colegio de Mariana los alumnos han me-
dido sus alturas y se han pesado para realizar un
Longitud
(cm)
50 52 55 58 61 62 65
Peso (Kg.) 3,3 3,9 4,5 5,2 5,6 6,2 6,7
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 101/113
101
trabajo de Ciencias Naturales. En la tabla, se en-
cuentran los datos:
Peso
(Kg.)
42 43 47 50 55 60 65 70
Altura
(cm)
140 155 158 145 150 155 162 160
a- Representá la nube de puntos.
b- Determiná el coeficiente de correlación
c- Hallá y graficá la recta de regresión lineal.
E JERCICIO 5
El astrónomo Kepler investigó los movimien-
tos de los planetas y descubrió tres leyes que lle-
van su nombre. En el siglo XVII, obtuvo datos
para los planetas conocidos en la época que se
volcaron a este cuadro:
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 102/113
102
Planeta Distancia (106
Km.)
Período (años)
Mercurio 58 0,24
Venus 108 0,62
Tierra 150 1
Marte 228 1,88
Júpiter 778 11,86
Saturno 1429 29,42
a- Elaborá una tabla de con dos columnas:
En la primera (x) escribí los cuadrados de
los períodos; y en la segunda, (y) los cubos
de las distancias.
b- Calculá el coeficiente de correlación entre
los valores obtenidos en el punto a.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 103/113
103
15. MEDIA, MODA Y MEDIANA
La Estadística se ocupa de tomar datos reales,
analizarlos y presentarlos organizadamente para
poder explicar ciertas cuestiones de la realidad.
Entre los resultados que se obtienen de un estudio
estadístico existen tres valores que dan informa-
ción específica y que suelen ser muy utilizados:
Media, Moda y Mediana
M M e e d d i i a a a a r r i i t t m m é é t t i i c c a a o o p p r r o o m m e e d d i i o o
Cuando queremos saber la nota que figurará
en el boletín luego de un trimestre calculamos el
promedio de las notas que hemos calificado du-
rante ese período
La media aritmética, o promedio de una se-
rie de datos, se obtiene dividiendo la suma de los
valores por la cantidad que de ellos hay.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 104/113
104
E JEMPLO
Un comerciante obtuvo las siguientes ventas: lunes, $
750; martes, $ 600; miércoles, $ 720; jueves, $ 680;
viernes, $ 840, y sábado $ 910. ¿Cuál fue la media de las
ventas en la semana?
Media =
750 + 600 + 720 + 680 + 840 + 910 = 4500 = 750
6 6
Media = $ 750 diarios
La media puede no coincidir con ninguno
de los valores registrados.
M M o o d d a a
Al dato que más veces se repite en una serie de
mediciones, es decir, el de mayor frecuencia se lo
denomina moda. Tiene la ventaja de ser una me-
dida que vale también para datos no numéricos.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 105/113
105
Por ejemplo, si evaluamos estadísticamente los
colores de los autos que salen de una concesiona-
ria podremos ver cual de ellos tiene mas frecuen-
cia de venta, lo que establecerá lo que denomina-
mos moda.
E JEMPLO
El profesor de Matemática tomó en 7º B lamisma evaluación que en 7º A.
Las notas de 7º A fueron éstas:
2;2;2;3;3;3;3;5;7;7;8;8;8;8;8;8;9;9;10;10;10 y 10.
Las notas de 7º B fueron éstas:
5;5;5;5;5;6;6;6;6;6;6;7;7;7;7;7;7;7;8;8;8 y 9.
¿Cuál es la moda en cada uno de los cursos?
Realicemos las tablas correspondientes a cadacurso:
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 106/113
106
Moda A = 6
Moda B = 7
Notas Frecuencia2 33 45 17 28 69 210 4Total 22
B
Notas Frecuencia
5 56 67 78 39 1
total 22
A
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 107/113
107
- La moda siempre es uno de los valores
registrados.- Cuando en el conjunto de observaciones
hay una sola moda, se dice que la distribu-
ción es unimodal.
- Si hay dos valores con la misma frecuencia
máxima la distribución se llama bimodal
- La moda no necesariamente coincide con
la media aritmética.
MEDIANA
En un estudio estadístico siempre se obtiene
una lista de datos o resultados.
En una lista con un número impar de datos, la
mediana es el valor central, cuando el número de
casos resulta par, la mediana se determina divi-
diendo a la mitad la suma de los dos datos centra-
les.
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 108/113
108
Dicho de otra manera, es el valor donde por
encima de él se encuentra el 50% del total y por
debajo el otro 50%.
Ejemplo
De acuerdo con los sueldos que ganan mensualmente
los 26 trabajadores de un taller, calcular la mediana. Ya que se trata de 26 trabajadores, se divide
entre 2. La mediana se localiza contando entonces
13 frecuencias.
.
Sueldos Frecuencias $ 7.000 1
$ 6.750 2
$ 6.250 6
$ 5.000 8
$ 4.000 4
$ 3.500 3
$ 2.000 2
Total 26
Mediana = $ 5 000
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 109/113
109
HOJA DE RESPUESTAS
E JERCICIO 1
a- El coeficiente de correlación es r = 0, 84
b- La ecuación de la recta es y = 0, 78 x +1,
46
Su representación gráfica es:
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7 8 9 10
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 110/113
110
E JERCICIO 2
a- El coeficiente de correlación es r = 0, 957b- La ecuación de la recta de regresión lineal
es y = 1, 13 x – 6,77
c- La edad correspondiente al roble de 18 cm
de diámetro es 13 años aprox. La edad del
roble de 40 cm de diámetro es 38 años
aprox.
E JERCICIO 3
a- La representación de la nube de puntos es:
0
1
2
3
4
5
6
7
8
0 10 20 30 40 50 60 70
longitud
p e s o
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 111/113
111
b- r = 0, 995
c- Como r > 0 la nube es ascendente y la co-
rrelación positiva. Por lo tanto es los pun-
tos están alineados o casi alineados.
d- La ecuación de la recta es y = 0, 22 x – 7,
772
e- Grafica de la ecuación lineal:
0
1
2
3
4
5
6
7
8
0 10 20 30 40 50 60 70
longitud
p e s o
E JERCICIO 4
a- El coeficiente de correlación es r = 0, 639
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 112/113
112
b- La recta de regresión lineal es y = 0, 47 x
– 127, 7. Su grafica es:
135
140
145
150
155
160
165
0 10 20 30 40 50 60 70 80
peso
a l t
u r
a
E JERCICIO 5
a- La tabla es la siguiente:
Cuadrados de los Periodo Cubos de las distancias
0,3844 195112
0,3844 1259712
1 3375000
3,5344 11852352
7/25/2019 Estadistica - Colegio 24hs
http://slidepdf.com/reader/full/estadistica-colegio-24hs 113/113
140,6596 470910952
865,5364 2918076589
b- El coeficiente de correlación es r = 0, 99