Princípios da estatística experimental
Transcript of Princípios da estatística experimental
Princípios da Estatística Experimental
Prof. Adriana Dantas
As estatísticas
1. ESTATÍSTICA DESCRITIVA• Parte da Estatística que apenas coleta,descreve, organiza e analisa um conjunto dedados. Nela não são tiradas conclusões.
2. ESTATÍSTICA INDUTIVA• Também é chamada de inferência estatística.A partir da análise de dados são tiradasconclusões.
DIVISÕES DA ESTATÍSTICA Estatística Descritiva: coleta, elaboração, tabulação, análise,
interpretação e apresentação dos dados.
Inferência Estatística: procura obter informações a respeito de uma população a partir de amostras.
Teoria de Probabilidade: procura descrever e prever as características de populações infinitas. Essa teoria permite avaliar (e controlar) o tamanho do erro que ele estará cometendo ao fazer generalizações (inferências).
Teoria da Amostragem: técnicas que auxiliam na obtenção de amostras representativas de populações.
Considerações gerais
Experimentos e ensaios são pesquisas planejadas para obter novos fatos, negar ou confirmar hipóteses ou resultados obtidos anteriormente.
Ensaio – absoluto – 1 tratamento Comparativo – 2 ou + tratamento
Hipóteses Suposição admissível; teoria provada mas não
demonstrada; suposição.
Suposição que se faz de alguma coisa possível ou não, e da qual se tiram as conseqüências à verificar;
Conjunto de condições que se toma como ponto de partida para desenvolver o raciocínio;
Suposição, conjectura.• Objetivo:– Meta, alvo que se quer atingir;– Fim que se quer atingir, objeto de uma ação.
Formulação de hipóteses Construção de hipótese é a analogia Depende do conhecimento do pesquisador Apropriada para explicar um fenômeno Conduzir o experimento através da qual será testada Permite uma decisão relativa aos resultados Meio confiável de predição de eventos desconhecidos Mais simples possível entre as diversas hipóteses que
possam ser formuladas A base da análise estatística do estudo experimental é o
teste de hipótese Uma hipótese deve ser formulada formalmente e dados
coletados durante o curso do estudo são utilizados para, se possível, rejeitar a hipótese
Declaração de hipóteses:
Hipótese nula: afirma que não há tendência ou padrão real no estudo experimental; as razões para diferenças na observação são coincidências;
Hipótese alternativa: é a hipótese em favor da qual a hipótese nula é rejeitada
Plano de experimento
Depende das variáveis respostas, explanatórias e estranhas
Define: estrutura das respostas, fatores experimentais e unidades experimentais
Tratamento É o objeto da pesquisa Condição imposta a parcela cujo efeito
desejamos medir ou comparar
Parcela
É a unidade em que é feita a aplicação casualizada do tratamento
Fornece os dados experimentais A parcela reflete o efeito do tratamento É a menor porção do material experimental Ex: única planta, uma área, um lote de sementes, uma
placa de petri, um animal, uma levedura, parte de uma árvore, etc.
Cuidado especial com a parcela
O número de indivíduos ou área de uma parcela depende do grau de heterogeneidade do material a ser pesquisado.
Quanto maior a heterogeneidade maior o número de indivíduos, a fim de bem representar o experimento.
Classificação dos experimentos Aleatórios – planejamento ao acaso Três tratamentos encontram na mesma
condição, ex.: mesma faixa de fertilidade
A C B
B A C
A B C
A C B
B A C
A B C
Delineamentos:
-Inteiramente casualizado
-Blocos casualizados
-Quadrado Latino
+F
-F
Sistêmicos – não entra ao caso, os experimentos são colocados em conjunto.
Tratamento A é favorecido e o tratamento C prejudicado
A A A
B B B
C C C
A A A
B B B
C C C
Delineamentos:
-Princípios básicos da repetição
-Levam a erros experimentais
-Fatores aleatórios
+F
-F
Tipos de experimentos A) preliminar – conduzidos dentro de estações
experimentais para obtenção de novos fatos. Apresenta baixa precisão. Ensaios de introdução de variedades Triagem para escolha de tratamentos
1 2 3 4 5 6 7 8 100
................................................
1 2 3 4 5 6 7 8 100
................................................
Introdução de 100 variedades de milho
B) crítico – objetivo é negar ou confirmar hipóteses obtidas no experimento preliminar.
Conduzido dentro ou fora das estações. Científico com mais precisão. Compara vários tratamentos. Uso de técnicas estatísticas específicas
7 89 2 34 54 29 15
29 7 89 15 2 34 54
BLOCO 1
BLOCO 2
Selecionadas 7 variedades de milho
C) Demonstrativo – lançamento pela rede de extensão rural, a produtores, empresários, empresas de pesquisa, etc.
Demonstrar os melhores resultados do experimento crítico
VL V54 V2
Duas melhores cultivares comparadas com variedades locaisDuas melhores cultivares comparadas com variedades locais
Tipos de variações experimentais Variação premeditada – originada dos diferentes
tratamentos introduzidos pelo pesquisador
Variação externa – não intencionaisnão intencionais (heterogeneidade de solo, condições de temperatura, umidade)
Variação acidental – causa desconhecidacausa desconhecida, de natureza aleatório, não está sob o controle do pesquisador
(constituição genética, profundidade de semeadura, quantidade de ração administrada) – erro experimental
Variação ao acaso• Considerando clones idênticos– Planta de batata A (100 gramas)– Planta de batata B (120 gramas)
• Existe a possibilidade de indicar a planta mais produtiva???
• Efeitos controláveis – irrigação, nutrição, luz . . • Efeitos não controláveis – capacidade de absorção,estresses, posicionamento etc ...
Qual a razão de não podermos indicar a planta mais produtiva nesse caso?
Diferenças ao acaso pequenas Diferenças ao acaso não tão pequenas
Como saber se as diferenças são devido ao acaso ou devido a diferenças reais entre tratamentos?
Vaca 1 Vaca 2 . . . Vaca nVaca em lactação H – 12,5 11,8 ??Vaca em lactação G – 8,0 7,5 ??
A variação ao acaso (presença dos efeitos não controlados) causa “confusão” Exige que seja feita uma análise estatística que irá informar se as diferenças entre os tratamentos serão devidos ao acaso ou não. Serão consideradas - significativas (*, **, ***) ou - não significativas (ns).
Princípios básicos da experimentação
RepetiçãoCasualizaçãoControle local
Repetição Corresponde ao número de vezes que o tratamento
aparece no experimento Quanto maior o numero de repetições, menos a
probabilidade de erro Testar hipótese (Anova)(Anova) Estimar o erro experimental Avaliar de forma mais precisa cada tratamento Melhoria na precisão das estimativas das médias Melhora o poder dos testes estatísticos
Então cada tratamento que se quer avaliar necessita de quantas repetições ? Normalmente, usa-se de 4 a 6
Depende de fatores
Variabilidade do meio em que se realiza o experimento
Numero de tratamentos em estudo Recursos de pessoal Equipamentos Custos de implantação do experimento
Casualização
Distribuição aleatória dos tratamentos na parcela
Assegura a validade da estimativa do erro experimental
Erros independentes Estimativa das médias de forma
imparcial
Controle Local
Usado quando as parcelas, antes de receberem os tratamentos, apresentam diferenças entre si
Faz-se agrupamento das parcelas homogêneas em blocos
Finalidade diminuir os erros Agrupamento: idade, pesos, sexo, textura de
solo, localização geográfica, etc...
Amostra A amostra é um subconjunto finito, supostamente
representativo, de elementos de uma população
Utilizada para estudo de propriedades da população
As técnicas para colher amostras devem deixar total ou parcialmente ao acaso a indicação dos elementos da população a incluir na amostra
Planejamento de uma pesquisa
Fixação de LIMITES: custo, tempo disponível, tipo de informação, precisão dos resultados, etc
MÉTODO DE COLETA dos dados: delineamento de pesquisa
- censo ou amostragem
- estudos experimentais e não experimentais
MÉTODO DE COLETA dos dadosAmostragem x Recenseamento
Vantagens e desvantagens Menor tempo e custo Viabilidade _ tamanho da população, observações destrutivas Qualidade e precisão dos resultados (treinamento) Necessidade de elaboração do plano amostral Necessidade de cadastro Erros de amostragem podem ser grandes para alguns
segmentos de interesse Mais difícil corrigir viés de cobertura
Exemplos de delineamentos de pesquisaDELINEAMENTOS EXPERIMENTAIS
Experimento: avaliação de dois métodos de treinamento de funcionários, registrando a produtividade dos funcionários de 2 grupos selecionados aleatoriamente
ESTUDOS NÃO EXPERIMENTAIS (observacionais) Levantar diversos atributos e medidas sobre o sistema
de trabalho de funcionários respondentes através de um questionário
Pesquisas por amostragem (Surveys)
Planejamento de uma pesquisa
PROCEDIMENTO de coleta dos dados: Observação, entrevista. Instrumento de coleta. Pré-teste. Treinamento. Sistemas de controle e supervisão da coleta Tipo de TRATAMENTO a ser realizado com os
dados
EXECUÇÃO DA PESQUISA
COLETA dos dados APURAÇÃO dos dados: captura dos dados,
crítica, imputação APRESENTAÇÃO dos dados: tabelas, gráficos,
medidas adequadas ANÁLISE e INTERPRETAÇÃO DOS DADOS:
utilizar métodos estatísticos necessários,como os de inferência, se for o caso.
TOMADA DE DECISÃO frente aos resultados obtidos.
Fontes de erros nas pesquisas poramostragem
Erro de amostragem:– sempre existe– controlado pelo plano amostral
(Somente com amostragem probabilística !)
Erros não-amostrais (ou sistemáticos)– difícil de ser controlado e mensurado
Erros não-amostrais (ou sistemáticos)
– Não-respostadecidir se poderá ser corrigido
– Erros de mensuração: os dados levantadosdiferem da realidade, pode ocorrer por problemas com o entrevistador, respondente, instrumento ou procedimento de coleta
– Erros de cobertura: os elementos amostradoscompreendem parte da população alvo.
COMO OBTER ESSA AMOSTRA?
DELINEAMENTO AMOSTRAL a ser utilizado DADA UMA AMOSTRA, COMO SABER SE A
AMOSTRA É “BOA”? COMO SE FAZER INFERÊNCIA?
Somente o conhecimento das probabilidades de seleção permite o cálculo de indicadores da qualidade da inferência (erro de amostragem).
População é o conjunto de pessoas ou organismos
de mesma espécie que habitam uma determinada área num espaço definido de tempo.
Qual a razão de realizarmos a amostragem?Qual a razão de realizarmos a amostragem?
•Redução de Custos
•Redução de Mão-de-obra
•Melhoria da qualidade dos dados (redução da fadiga)
•Redução da precisão (???)
Erro experimental Promove diferenças entre parcelas que recebem o mesmo
tratamento
Não podem ser conhecidos individualmente e alteram, pouco ou muito os experimentos
Deve-se reduzir o erro experimental
Não podem ser conhecidos individualmente e alteram, pouco ou muito os experimentos
Deve-se reduzir o erro experimental – inferências de significâncias, análises dos tratamentos são potencialmente diferentes, se forem não significativas, os tratamentos são semelhantes
A Relação entre Erros, Precisão e Exatidão
• Erros sistemáticos –ameaçam exatidão
Contribuídos por:
– O observador– O participante– O instrumento
Erros aleatórios - ameaçam precisão
Contribuídos por:
– O observador– O participante– O instrumento
Planejamento:– Condição do pesquisador – Controle
– Projeto – registrado segurança eventuais trocasde coordenador do projeto...– Possibilidade de repetição do experimento• Fatores controláveis e não controláveis (Erro
experimental)• Fatores aleatórios e não aleatórios• Objetivo de obtermos um resultado único sem
condições de repetição (comum) ou resultados que possibilitem a repetição de resultados (inovação) ?
Experimento livre de variações acidentais Condições uniformes de solo, plantas com
constituição genética, mesmo numero de plantas por parcela, irrigação uniforme, ausência de pragas e doenças, mesmo numero de animais por parcela, animais com mesmo peso e idade
Minimizar as variações
Redução do efeito da variação acidental Forma de parcela Tamanho da parcela Orientação das parcelas Efeito bordadura Falhas de plantas Número de repetições dos tratamentos Delineamento experimentais Forma e condução do experimento
Modalidades experimentaisSão as situações em que se pode encontrar umindivíduo em relação a determinado atributo
Qualitativasescala nominal. Ex: homem, mulherescala ordinal. Ex: trab estudo primário, secundário
Quantitativasescala de razões. Ex: Graus Celsius escala de intervalos. Ex: Graus Fahrenheit
Dado estatísticoInformação obtida de um indivíduo acerca dedeterminado atributo
Objetivo da estatística:
Inferir sobre a população com base na informação contida na amostra.
Variáveis estatísticas
Campo de variação
Conjunto de modalidades ou valores possíveispara a variável
Variável discretaPossui campo de variação numerável, finito ouinfinito, (ex: nº de quartos, nº de acidentes porapólice)
Variável contínuaPossui campo de variação dado por umintervalo contínuo (ex: superfície agrícola, taxa dejuro)
Escala Nominal
Valores numéricos numa escala nominal apenas dão nome a uma categoria ou classe; os números são utilizados somente para diferenciar objetos, categorias ou nomes.
Por exemplo, numa pesquisa de mercadorealizada nas regiões sul e sudeste doBrasil, a variável estado de nascimentodo entrevistado foi codificada da seguinteforma: 1=Rio Grande do Sul, 2=SantaCatarina, 3=Paraná, 4=São Paulo e 5=Riode Janeiro.
Escala Ordinal
Valores numa escala ordinal dão nome e ordem a um objeto, categoria ou classe; os números são utilizados para diferenciar em ordem de superioridade, seguindo algum critério de hierarquia.
Por exemplo, numa pesquisa, a variável instrução do entrevistado foi codificada assim:
1=Sem Instrução, 2=Primeiro Grau,3=Segundo Grau, 4=Terceiro Grau,5=Mestre e 6=Doutor.
Escala de Intervalos
Valores numa escala de intervalos eliminam a limitação da escala ordinal
estabelecendo intervalos iguais em que é possível ordenar as medições e, ao mesmo tempo, explicar quanto uma observação difere da outra.
Por exemplo, o aumento da temperatura de ontem para hoje é de cinco graus, de 20 para 25 graus centígrados.
Outras escalasOutras escalas
NOTASVariam de 0 a 5; 0 a 10; 0 a 100, ou em qualquer outro
intervalo definido pelo pesquisador.
Ex:Notas obtidas em provas ou competições esportivas;Pacientes que expressam suas preferências em relaçãoa dois ou mais tratamentosPacientes que expressam suas situação emrelação ao sintoma de determinada doença
PORCENTAGENSPORCENTAGENS
Ex:Porcentagem de água de um animal
experimentalPeso corporal relativo (peso corporalobservado dividido pelo peso corporalrelativo)Obs: quando trabalhamos com % é semprebom guardar os dados que deram origem asessas %, para discussões dos resultados
TAXAS OU COEFICIENTESÉ a razão entre o número de indivíduos que apresentamOu apresentaram, determinada característica no cursode certo período e o total de indivíduos na população.
A taxa pode ser dada em porcentagem, mas é maiscomum que seja dada por 1.000 ou por 10.000
indivíduos
Ex: Taxa de Mortalidade Infantil: é a razão entre o total de óbitos de menores de um ano de idade (excluídos os
nascidos mortos) e o total de nascidos vivos em determinado período de tempo (geralmente um ano).
Projeto de experimentação
• Definição do Problema – hipóteses, objetivos, qual o caminho até conseguir o resultado.
• Delinear o experimento – tratamentos, repetições, variáveis, número de amostras, tempo, custo. • Condução do ensaio e coleta dos dados. • Tabulação e análise dos dados • Discussão dos resultados e conclusões (Esperados)
Variabilidade dos dados
Definir quais as características que irá utilizar para avaliar os tratamentos, para atingir os objetivos da pesquisa.
Ex. Estudo de comportamento das variedades de feijão, define:
- resistência a antracnose - período de maturação de vagens e rendimento
(Kg/ha) Essas características é medida nas parcelas e é
denominada variável.
Análise de Variância
Avaliar se duas ou mais amostras diferem significativamente com relação a alguma variável.
É necessário um método estatístico para solicionar o problema.
A analise de variância foi introduzida por Fisher.
Análise da variância (PROVA) Processo baseado na decomposição da variação total
existente entre uma série de observações.
São atribuídas a causas conhecidas e numa parte devida as desconhecidas ou não suscetíveis de controle.
Ex.: Efeito de diferentes inseticidas no controle de pulgão da batata. Causas desconhecidas, diferenças existentes entre as plantas (parcelas), condicionando um tipo diferente de resposta a um mesmo inseticida.
O efeito das causas desconhecidas contribuem para uma porção da variação total, que é isolada na análise de variância, recebendo a denominação de Erro ou Resíduo.
Variações que contribuem para o erro experimental Inerente a própria variabilidade do
material experimental;
Proveniente da falta de uniformidade do ambiente em que é conduzido o experimento.
Somatório Simples ( Somatório Simples ( Σ ) )Considere X uma variável que assume as determinações:
Xi (i = 1, 2, ..., N).
A soma dos valores de Xi é x1 + x2 + ... + xN
que pode ser sintetizada por:
Σ= x1 + x2 + ... + xN
O símbolo Σ (sigma) indica soma é denominado “somatório”.
Decomposição da Variação
Causas conhecidas
Variação entre amostragens (tratamentos)
Causas desconhecidas
Variação dentro das amostragens (erro ou resíduo)
Medições em termos de variância
Calculada a soma dos quadrados (SQ) Número de graus de liberdade (GL) SQ/GL = Quadrados médio (QM)
– são as variâncias entre as amostras
Estas são confrontadas através de um teste de hipótese (Teste F)
– avalia-se sua significância
Quadro da Análise da Variância
Causas da variação
Graus de liberdade
(GL)
Soma dos quadrados (SQ)
Quadrados médios (QM)
F calculado
Entre amostras t - 1 SQ 1 QM 1 = SQ 1/t-1 F= QM 1 / QM 2 Dentro das amostras
T (r-1) SQ 2 = SQ total – SQ 1 QM 2 =SQ 2/t (r – 1)
Total t.r - 1 SQ total