Estatistica Nocoes Estatistica
-
Upload
padme-vader -
Category
Travel
-
view
93.130 -
download
3
description
Transcript of Estatistica Nocoes Estatistica
NOÇÕES DE ESTATÍSTICA (RESUMO)
Frequentemente assistindo à televisão, lendo jornais ou revistas, nos deparamos com gráficos, tabelas que nos dão muitas informações, como índices de inflação, consumo de água, taxa de desemprego, taxa de mortalidade infantil.
A todas essas informações devemos inicialmente colher dados, em seguida organizá-los e analisá-los.
Para chegarmos ao resultado desejado utilizamos a Estatística.
A estatística pode ser entendida como sendo um campo da matemática aplicada que tem por objetivo: coletar, organizar, descrever, analisar e
interpretar dados.
POPULAÇÃO É o conjunto de objetos, de indivíduos ou de ocorrência na observação de grupos. Exemplos:
• Conjunto de estudantes do ensino fundamental de uma escola. • Conjunto de pessoas que moram num condomínio fechado.
AMOSTRA É uma parte dessa população; isto é, um subconjunto do universo estudado. FREQÜÊNCIA ABSOLUTA Freqüência absoluta de uma variável é dada pelo número de vezes que essa variável aparece no conjunto considerado. FREQÜÊNCIA RELATIVA É a razão entre a freqüência absoluta e o número total de elementos do conjunto. A freqüência relativa é dada em porcentagem.
FREQÜÊNCIA ABSOLUTA ACUMULADA A freqüência absoluta acumulada é obtida adicionando-se a cada freqüência absoluta os valores das freqüências anteriores. Exemplo: A tabela mostra a distribuição das idades dos jogadores de um time de futebol.
Número de jogadores
Idade (em anos)
Freqüência absoluta
Freqüência absoluta acumulada
Freqüência relativa
4 18 4 4 14 % 6 20 6 10 20 % 3 21 3 13 10 % 7 23 7 20 24 % 2 24 2 22 6 % 8 25 8 30 26 % TOTAL 30 30 100 %
GRÁFICOS Podemos representar graficamente a distribuição de freqüências de um levantamento estatístico. As representações gráficas mais utilizadas são: Gráfico de segmentos. É representado pela união dos segmentos de reta.
Gráficos de setores
0
50
100
150
200
1°Trim
2°Trim
3°Trim
4°Trim
NorteOesteLeste
1° Trim2° Trim3° Trim4° Trim
Gráficos de barras Gráficos de colunas
0
20
40
60
80
100
1° Trim 2° Trim 3° Trim 4° Trim
LesteOesteNorte
0 50 100
1° Trim
2° Trim
3° Trim
4° Trim
Norte
OesteLeste
DISTRIBUIÇÃO DE FREQÜÊNCIAS COM DADOS AGUPADOS Observando-se as “mesadas” dos alunos da Turma A do colégio X, foram obtidos os seguintes valores em reais: 800 500 700 400 200 400 800 200 800 200 400 700 400 800 700 500 700 300 900 1000 Com esses dados, vamos construir uma tabela de freqüências absoluta e relativa. Para determinarmos a distribuição absoluta, organizaremos as mesadas em ordem crescente (rol). 200 200 200 300 400 400 400 400 500 500 700 700 700 700 800 800 800 800 900 1000 Observamos que a menor mesada é de 200 reais e a maior é 1 000 reais. A variação de mesadas é 1 000 – 200 = 800. Esse valor é chamado de amplitude total. Podemos agrupar esses valores em intervalos de classe (são intervalos de variação dos dados observados) da seguinte forma:
Como a menor mesada é de 200 reais e a maior é de 1 000 reais, podemos agrupá-los em intervalos de amplitude 200, ou seja: 200 ├── 400 4 alunos
400 ├── 600 6 alunos 600 ├── 800 4 alunos 800 ├──┤1000 6 alunos
Nesse caso, 200 é o limite inferior e 1 000 é o limite superior da classe. A diferença entre o limite superior e o limite inferior é igual à amplitude da classe. No intervalo 400 ├── 600, por exemplo, podemos determinar o ponto médio do intervalo.
(400 + 600) ÷ 2 = 500. Assim, podemos construir a tabela de freqüência com classes.
Mesadas (reais) Freqüência absoluta
Freqüência absoluta
acumulada
Freqüência relativa
Freqüência relativa
acumulada
200 ├── 400
4
4
20 %
20 %
400 ├── 600
6
10
30 %
50 %
600 ├── 800
4
14
20 %
70 %
800 ├──┤1 000
6
20
30 %
100 %
20
100 %
REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS
Uma distribuição de freqüências, ao ser representada graficamente, tem por objetivo fornecer informações analíticas de uma maneira mais rápida. A sua representação gráfica se faz através do histograma, ou polígono de freqüência.
HISTOGRAMA
É formado por um conjunto de retângulos justapostos, onde no eixo das abscissas temos os intervalos de classes e no eixo das ordenadas, as freqüências.
Exemplo:
Consideremos a tabela que representa as médias de 100 alunos do 3º ano do ensino médio do Colégio Alfa, em Matemática.
Classes fi fa
0 ├── 2 2 ├── 4 4 ├── 6 6 ├── 8
8 ├── 10
40 30 10 15 5
40 70 80 95
100
Fonte: Secretaria do Colégio
fi: freqüência absoluta. fa: freqüência acumulada. POLÍGONO DE FREQÜÊNCIA
È o gráfico em linha, sendoperpendiculares ao eixo horizontal, leintervalos de classe.
as freqüências marcadas sobre vantadas pelos pontos médios dos
MEDIDAS DE TENDÊNCIA CENTRAL (OU DE POSIÇÃO) As medidas de posição nos mostram a localização dos elementos da amostra quando esta é disposta em rol. MÉDIA ARITMÉTICA (X )
Considerando um grupo de 20 pessoas com 22, 20, 21, 24 e 20 anos, observamos que:
21,45107
52024212022x ==
++++=
Calcular a média aritmética ponderada de um aluno que obteve no bimestre 8,0 (peso 2), 7,0 na pesquisa (peso 3), 9,0 no debate (peso 1) e 5,0 no trabalho de equipe (peso 2).
7856
85x29x17x38x2x ==
+++=
LEMBRETE: SOMATÓRIO Exemplo:
1) Calcular o somatório . ∑=
5
1nn²
Resolução:
= 1² + 2² + 3² + 4² + 5² = 55 ∑=
5
1nn²
ATENÇÃO !
Usa-se também o símbolo de somatório para representar média aritmética.
1. Para valores discretos:
n
xix
n
1i∑
==
Exemplo:
1) As alturas dos jogadores de um time de basquete são 1,98 m; 2,02 m; 2,08 m; 1,92 m e 1,95 m. Qual é a média de altura desse time?
Resolução:
m1,995
1,951,922,082,021,985
xix
5
1i =++++
==∑
=
2 . Para valores agrupados em classes.
Quando os dados estão agrupados, aceita-se, por convenção, que as freqüências se distribuem uniformemente ao longo da classe e que, portanto, o ponto médio da classe é o valor representativo do conjunto.
Nesse caso, a média é calculada partindo-se do ponto médio da classe.
∑
∑
=
== n
1i
n
1i
fi
fi.xix
Onde: fi: freqüência da classe. xi: ponto médio da classe.
Exemplo: Consideremos a tabela que representa as notas de 45 alunos do
3º Colegial em Física, no Colégio Alfa.
∑
∑
=
== n
1i
n
1i
fi
fi.xix
Classes Xi fi 0 ├── 2 1 3 2 ├── 4 3 9 4 ├── 6 5 106 ├── 8 7 158 ├── 10 9 8
5,7145
8.915.710.59.33.1x =++++
= MODA ( Mo)
Define-se como moda de uma série de números ao valor que ocorre com a maior freqüência.
Exemplo:
15, 17, 15, 18, 17, 16, 18, 17, 14, 17, 15
Mo = 17. ATENÇÃO:
Amodal: Distribuição que não tem moda. Exemplo:
4, 8, 7, 13, 12, 21
Bimodal: Distribuição que apresenta duas ou mais modas. Exemplo:
1, 3, 3, 3, 4, 4, 4, 5, 6, 7, 7, 8,
Mo = 3 e 4
Distribuições com intervalos de classe:
A classe de maior freqüência é a classe modal. Moda bruta é a média aritmética dos extremos da classe modal.
Exemplo:
Consideremos a tabela que representa as notas de 45 alunos do 3º Colegial em Física, no Colégio Alfa. Classes Xi fi 0 ├── 2 1 3 2 ├── 4 3 9 Classe modal: 6├── 8 4 ├── 6 5 10 Moda bruta: (6 + 8) ÷ 2 = 7 6 ├── 8 7 15 8├── 10 9 8
MEDIANA (Md)
Considerando-se um conjunto de dados dispostos em ordem crescente, define-se como mediana ao valor que ocupa a posição central.
1. O número de dados é ímpar:
Exemplo: 3, 4, 4, 2, 5, 3, 4, 6, 5 (9 elementos)
A posição ocupada pela mediana é : 2k + 1 = 9 ⇒ k = 4.
Posição: k + 1 ⇒ k = 5.
Colocando em ordem crescente: 2, 3, 3, 4, , 4, 5, 5, 6
Md = 4.
2. O número de termos é par:
Neste caso a mediana será a média entre os valores centrais.
Exemplo: 2, 3, 3, 4, 4, 5, 5, 5, 6, 6.
Md = (4 + 5) ÷ 2
Md = 4,5
Aplicações:
01) Foi analisada uma amostra com 10 latas de um determinado refrigerante e registrados os volumes em mililitros dos líquidos dessas latas, obtendo-se os valores:
298, 300, 302, 303, 299, 301, 297, 300, 300, 300
Calcular a média, a moda e a mediana dessa amostra. Resolução: Ordem crescente: 297, 298, 299, 300, 300, 300, 300, 301, 302, 303 Média Aritmética.
300103000
103033023013004299298297
==++++++
=.x
Mediana. Md: (300 + 300) ÷ 2 = 300. Moda. Mo: 300.
02) (UFBA) De acordo com o Boletim do Serviço de Meteorologia de 07 de
junho de 2000, o quadro abaixo representa a temperatura máxima, em graus Celsius, registrada em Fernando de Noronha e nas capitais da Região Nordeste do Brasil.
Aracaju Fernando de
Noronha Fortaleza João Pessoa Maceió
27ºC 30ºC 31ºC 30ºC 27ºC Natal
Recife Salvador São Luís Teresina
30ºC 30ºC 26ºC 32ºC 32ºC
Com base nessas informações, pode-se afirmar: (01) O gráfico ao lado representa a distribuição de freqüência das temperaturas.
(02) A freqüência relativa da temperatura de 31ºC é igual a 10%. (04) Representando-se a freqüência relativa por meio de um gráfico de setores, a região correspondente à temperatura de 27ºC tem ângulo de 36º. (08) A média aritmética das temperaturas indicadas no quadro corresponde a 29,5ºC. (16) A mediana das temperaturas registradas é igual à temperatura modal. (32) A amplitude das temperaturas é de 32 ºC.
Resolução: (01) Verdadeira. Freqüência é o número de vezes que ocorre cada
observação. Logo, podemos resumir o quadro acima na seguinte tabela:
Temperatura Freqüência 26ºC 1 (Salvador) 27ºC 2 (Aracaju e Maceió) 30ºC 4 (Fernando de Noronha, João Pessoa, Natal e
Recife) 31ºC 1 (Fortaleza) 32ºC 2 (São Luís e Teresina)
Total de observações 10 (02) Verdadeira. Freqüência relativa é a razão entre a freqüência e o
número total de observações (10). Para a temperatura de 31ºC, temos 1/10, ou seja, 10%.
(04) Falsa. A freqüência relativa, para a temperatura de 27ºC, é 2/10, isto
é, 20%. Para determinar o ângulo da região corresponde à temperatura de 27ºC usaremos a seguinte regra de três:
100 360 ⇒ x = 72. 20 x
(08) Verdadeira. Temos: (26 + 2.27 + 4.30 + 31 + 2.32) ÷ 10 = 29,5 A média aritmética das temperaturas é igual a 29,5ºC
(16) Verdadeira. A mediana (Md):
26 27 27 30 30 30 30 31 32 32
(Md) = (30 + 30) ÷ 2 = 30
Md = 30ºC A temperatura modal (Mo) é a mais freqüente entre os valores
observados. Mo = 30ºC (4 observações)
(32) Falsa. A amplitude (A): 32 – 6 = 6 A amplitude das temperaturas é 6ºC. MEDIDAS DE DISPERSÃO As medidas de dispersão indicam o quanto os dados se apresentam dispersos em torno da região central. Consideremos os conjuntos A = {6, 6, 6, 6, 6, 6, 6}, B = {3, 4, 5, 6, 7, 8, 9}, C = {1, 2, 3, 6, 9, 10, 11} As médias aritméticas dos elementos desses conjuntos são iguais a 6. Entretanto nota-se que a dispersão dos elementos de A em relação à média (valores mais ou menos espalhados em relação à média) é nula. A dispersão dos elementos de C é maior que a dispersão B, isto é, B é mais homogêneo que C. As principais medidas de dispersão são: DESVIO (Di) O desvio é definido como sendo a medida do grau de dispersão de cada valor da variável em relação à média. Exemplo:
Seja o conjunto B = {3, 4, 5, 6, 7, 8, 9}
6742
==x
D1 = 3 – 6 = – 3 D2 = 4 – 6 = – 2 D3 = 5 – 6 = – 1 D4 = 6 – 6 = 0 D5 = 7 – 6 = 1 D6 = 8 – 6 = 1 D7 = 9 – 6 = 3 VARIÂNCIA
Define-se por variância como sendo a média aritmética dos quadrados dos desvios.
n
)²x(xiV
n
1i∑
=
−=
No exemplo anterior:
47
3²2²1²(0)²1)²(2)²(3)²(v =++++−+−+−
= DESVIO PADRÃO
O desvio padrão é definido com sendo a raiz quadrada da variância.
Dp = V . Exemplo: Vamos comparar o desvio padrão dos Conjuntos B e C. B = {3, 4, 5, 6, 7, 8, 9}, C = {1, 2, 3, 6, 9, 10, 11} Conjunto B V = 4 (exemplo anterior)
Dp = 24 = Conjunto C 642x ==
7 V
14,297
6)²(116)²106)²(96)²(66)²(36)²(26)²(1=
−+−+−+−+−+−+−=
3,7814,29Dp ==
Comparando o desvio padrão de B (2,00) com o de C (3,78) nota-se que o conjunto B é mais homogêneo em relação à média.
O conjunto B é menos disperso que o conjunto C.
Aplicações: 01) Numa pequena ilha, há 100 pessoas que trabalham na única empresa ali existente. Seus salários (em moeda local) têm a seguinte distribuição de freqüências:
Salários Freqüência $ 50,00 30 $ 100,00 60 $ 150,00 10
Qual o desvio padrão dos salários? Resolução: Média aritmética:
x = (30.50 + 60.100 + 10. 150) ÷ 100 = 90. Variância: [30.(50 – 90)2 + 60.(100 – 90)2 + 10.(150 – 90)2] ÷ 100 = 900. Desvio padrão:
Dp = 30900 = O desvio padrão dos salários é $ 30,00
03) Dois jogadores de futebol de times diferentes marcaram os seguintes números de gols em 5 partidas seguidas:
Partida Jogador A Jogador B
1 0 3 2 1 3 3 2 2 4 6 4 5 6 3
Qual dos jogadores teve o desempenho mais regular? Resolução: Média aritmética: Jogador A:
x = (0 + 1 + 2 + 6 + 6) ÷ 5 = 3 Jogador B:
x = (3 + 3 +2 + 4 + 3) ÷ 5 = 3
Variância: Jogador A: V = [(0 – 3)2 + (1 – 3)2 + (2 – 3)2 +(6 – 3)2 + (6 – 3)2] ÷ 5 = 6,4 Jogador B: V = [(3 – 3)2 + (3 – 3)2 + (2 – 3)2 + (4 – 3)2 + (3 – 3)2] ÷ 5 = 0,4 Desvio Padrão: Jogador A:
Dp = 2,536,4 =
Jogador B:
Dp = 0,630,4 =
O jogador B teve o desempenho mais regular.